ClickHouse가 더 게을러지고 더 빨라집니다 -

▲

GN⁺ 12달전 | parent | ★ favorite | on: ClickHouse가 더 게을러지고 더 빨라집니다 - 지연 로딩 최적화 도입(clickhouse.com)

Hacker News 의견

이 최적화는 대규모 데이터 세트에서 무작위 샘플을 추출할 때 특히 원하는 열에 큰 값이 포함될 수 있는 경우 극적인 속도 향상을 제공할 것임
- 기본 SQL 레시피는 LIMIT 절을 사용하여 샘플에 포함될 행을 결정함
- 새로운 최적화는 LIMIT 절이 데이터 세트를 소수의 행으로 필터링할 때까지 큰 열을 읽는 것을 연기할 것을 약속함
- ClickHouse에서 이 최적화가 이러한 쿼리의 속도를 높이는지 확인할 수 있는 사람이 있는지 궁금함
ClickHouse를 정말 좋아함
- 최근에 발견했는데, 분석을 위한 비효율적인 솔루션에 비해 신선한 공기 같은 느낌임
- 매우 빠르고 CLI도 사용하기 즐거움
스크롤할 수 없는 웹사이트는 이해할 수 없음
- 조금 스크롤하면 위로 튀어 올라가 사용이 불가능함
늦은 물질화, 19년 후
- 관련 링크 제공
새로운 물질화 옵션과 관련이 없지만, 이 부분이 눈에 띔
- 쿼리가 150백만 개의 값을 정렬하고 상위 3개를 반환하는데 70밀리초가 걸림
- 현대 하드웨어와 소프트웨어에 대한 느린 쿼리에 대한 정신 모델을 업데이트해야 함
- 150백만 개의 정수를 70밀리초 안에 정렬하는 것이 놀랍지 않음
- 피크 메모리 사용량이 3.59 MiB임
- 매우 훌륭한 기사임, 명확하게 설명되어 있고 좋은 다이어그램이 포함되어 있음
ClickHouse가 WSL이나 Linux 가상 머신이 필요 없는 Windows 네이티브 릴리스가 있었다면 DuckDB보다 더 인기가 있었을 것임
- MySQL이 PostgreSQL보다 더 인기가 있었던 이유 중 하나는 MySQL이 Windows 설치 프로그램을 가지고 있었기 때문임
공항 드라마에도 불구하고 해변 휴가를 계획 중임
- 기술 정보와 다이어그램이 최고 수준이었지만, 이야기가 포함되어 있어 더욱 좋았음
ClickHouse는 현대 엔지니어링의 걸작임
- 성능에 절대적인 주의를 기울임
ClickHouse와 StarRocks를 비교한 사람이 있는지 궁금함
- 몇 달 전 StarRocks의 조인 성능이 더 나아 보였음
이러한 데이터베이스가 모든 행 기반 데이터베이스가 잘못된 것을 보여주는 것이 놀라움
- btree 인덱스 구조로 이러한 속도에 접근할 수 없음
- 현대 기계가 얼마나 빠른지 보는 것이 놀라움
- 데이터 세트를 제대로 압축하지 않았을 것 같음
- 데이터 읽기가 압축 해제보다 느림
- Cloudflare 기사를 상기시킴, 암호화가 무료라는 아이디어가 있었음
- 컴퓨팅 엔진(chdb)을 사용하는 것이 놀라움