Hacker News 의견
  • 이 최적화는 대규모 데이터 세트에서 무작위 샘플을 추출할 때 특히 원하는 열에 큰 값이 포함될 수 있는 경우 극적인 속도 향상을 제공할 것임

    • 기본 SQL 레시피는 LIMIT 절을 사용하여 샘플에 포함될 행을 결정함
    • 새로운 최적화는 LIMIT 절이 데이터 세트를 소수의 행으로 필터링할 때까지 큰 열을 읽는 것을 연기할 것을 약속함
    • ClickHouse에서 이 최적화가 이러한 쿼리의 속도를 높이는지 확인할 수 있는 사람이 있는지 궁금함
  • ClickHouse를 정말 좋아함

    • 최근에 발견했는데, 분석을 위한 비효율적인 솔루션에 비해 신선한 공기 같은 느낌임
    • 매우 빠르고 CLI도 사용하기 즐거움
  • 스크롤할 수 없는 웹사이트는 이해할 수 없음

    • 조금 스크롤하면 위로 튀어 올라가 사용이 불가능함
  • 늦은 물질화, 19년 후

    • 관련 링크 제공
  • 새로운 물질화 옵션과 관련이 없지만, 이 부분이 눈에 띔

    • 쿼리가 150백만 개의 값을 정렬하고 상위 3개를 반환하는데 70밀리초가 걸림
    • 현대 하드웨어와 소프트웨어에 대한 느린 쿼리에 대한 정신 모델을 업데이트해야 함
    • 150백만 개의 정수를 70밀리초 안에 정렬하는 것이 놀랍지 않음
    • 피크 메모리 사용량이 3.59 MiB임
    • 매우 훌륭한 기사임, 명확하게 설명되어 있고 좋은 다이어그램이 포함되어 있음
  • ClickHouse가 WSL이나 Linux 가상 머신이 필요 없는 Windows 네이티브 릴리스가 있었다면 DuckDB보다 더 인기가 있었을 것임

    • MySQL이 PostgreSQL보다 더 인기가 있었던 이유 중 하나는 MySQL이 Windows 설치 프로그램을 가지고 있었기 때문임
  • 공항 드라마에도 불구하고 해변 휴가를 계획 중임

    • 기술 정보와 다이어그램이 최고 수준이었지만, 이야기가 포함되어 있어 더욱 좋았음
  • ClickHouse는 현대 엔지니어링의 걸작임

    • 성능에 절대적인 주의를 기울임
  • ClickHouse와 StarRocks를 비교한 사람이 있는지 궁금함

    • 몇 달 전 StarRocks의 조인 성능이 더 나아 보였음
  • 이러한 데이터베이스가 모든 행 기반 데이터베이스가 잘못된 것을 보여주는 것이 놀라움

    • btree 인덱스 구조로 이러한 속도에 접근할 수 없음
    • 현대 기계가 얼마나 빠른지 보는 것이 놀라움
    • 데이터 세트를 제대로 압축하지 않았을 것 같음
    • 데이터 읽기가 압축 해제보다 느림
    • Cloudflare 기사를 상기시킴, 암호화가 무료라는 아이디어가 있었음
    • 컴퓨팅 엔진(chdb)을 사용하는 것이 놀라움