▲GN⁺ 12달전 | parent | ★ favorite | on: ClickHouse가 더 게을러지고 더 빨라집니다 - 지연 로딩 최적화 도입(clickhouse.com)Hacker News 의견 이 최적화는 대규모 데이터 세트에서 무작위 샘플을 추출할 때 특히 원하는 열에 큰 값이 포함될 수 있는 경우 극적인 속도 향상을 제공할 것임 기본 SQL 레시피는 LIMIT 절을 사용하여 샘플에 포함될 행을 결정함 새로운 최적화는 LIMIT 절이 데이터 세트를 소수의 행으로 필터링할 때까지 큰 열을 읽는 것을 연기할 것을 약속함 ClickHouse에서 이 최적화가 이러한 쿼리의 속도를 높이는지 확인할 수 있는 사람이 있는지 궁금함 ClickHouse를 정말 좋아함 최근에 발견했는데, 분석을 위한 비효율적인 솔루션에 비해 신선한 공기 같은 느낌임 매우 빠르고 CLI도 사용하기 즐거움 스크롤할 수 없는 웹사이트는 이해할 수 없음 조금 스크롤하면 위로 튀어 올라가 사용이 불가능함 늦은 물질화, 19년 후 관련 링크 제공 새로운 물질화 옵션과 관련이 없지만, 이 부분이 눈에 띔 쿼리가 150백만 개의 값을 정렬하고 상위 3개를 반환하는데 70밀리초가 걸림 현대 하드웨어와 소프트웨어에 대한 느린 쿼리에 대한 정신 모델을 업데이트해야 함 150백만 개의 정수를 70밀리초 안에 정렬하는 것이 놀랍지 않음 피크 메모리 사용량이 3.59 MiB임 매우 훌륭한 기사임, 명확하게 설명되어 있고 좋은 다이어그램이 포함되어 있음 ClickHouse가 WSL이나 Linux 가상 머신이 필요 없는 Windows 네이티브 릴리스가 있었다면 DuckDB보다 더 인기가 있었을 것임 MySQL이 PostgreSQL보다 더 인기가 있었던 이유 중 하나는 MySQL이 Windows 설치 프로그램을 가지고 있었기 때문임 공항 드라마에도 불구하고 해변 휴가를 계획 중임 기술 정보와 다이어그램이 최고 수준이었지만, 이야기가 포함되어 있어 더욱 좋았음 ClickHouse는 현대 엔지니어링의 걸작임 성능에 절대적인 주의를 기울임 ClickHouse와 StarRocks를 비교한 사람이 있는지 궁금함 몇 달 전 StarRocks의 조인 성능이 더 나아 보였음 이러한 데이터베이스가 모든 행 기반 데이터베이스가 잘못된 것을 보여주는 것이 놀라움 btree 인덱스 구조로 이러한 속도에 접근할 수 없음 현대 기계가 얼마나 빠른지 보는 것이 놀라움 데이터 세트를 제대로 압축하지 않았을 것 같음 데이터 읽기가 압축 해제보다 느림 Cloudflare 기사를 상기시킴, 암호화가 무료라는 아이디어가 있었음 컴퓨팅 엔진(chdb)을 사용하는 것이 놀라움
Hacker News 의견
이 최적화는 대규모 데이터 세트에서 무작위 샘플을 추출할 때 특히 원하는 열에 큰 값이 포함될 수 있는 경우 극적인 속도 향상을 제공할 것임
ClickHouse를 정말 좋아함
스크롤할 수 없는 웹사이트는 이해할 수 없음
늦은 물질화, 19년 후
새로운 물질화 옵션과 관련이 없지만, 이 부분이 눈에 띔
ClickHouse가 WSL이나 Linux 가상 머신이 필요 없는 Windows 네이티브 릴리스가 있었다면 DuckDB보다 더 인기가 있었을 것임
공항 드라마에도 불구하고 해변 휴가를 계획 중임
ClickHouse는 현대 엔지니어링의 걸작임
ClickHouse와 StarRocks를 비교한 사람이 있는지 궁금함
이러한 데이터베이스가 모든 행 기반 데이터베이스가 잘못된 것을 보여주는 것이 놀라움