이 논문에는 여러 가지 내용이 있지만, OLAP 처리를 개선하여 관련 벤치마크를 개선했다는 부분을 구체적으로 어떻게 했는지 궁금하여 원문을 잠시 읽어봤습니다.
결론적으로 해당 개선 내용은 데이터 분석을 위해 사용되는 쿼리의 join 처리를 개선하기 위해 블룸 필터를 도입했다는 것이었습니다.
SQLite에서 OLAP 벤치마크에 사용한 쿼리를 프로파일링한 결과, 실제 최종 결과에 전혀 포함되지 않는 부분까지 B-tree 자료구조를 탐색하고 있었다는군요. 따라서 최종 결과에 포함되지 않을 부분을 미리 골라내고 처리하기 위해, 특정 요소가 존재하지 않는다는 것을 확실하게 알 수 있는 확률적 자료구조인 블룸 필터를 추가했다는 것이 해당 개선의 주요 내용이었습니다.
이 논문에는 여러 가지 내용이 있지만, OLAP 처리를 개선하여 관련 벤치마크를 개선했다는 부분을 구체적으로 어떻게 했는지 궁금하여 원문을 잠시 읽어봤습니다.
결론적으로 해당 개선 내용은 데이터 분석을 위해 사용되는 쿼리의 join 처리를 개선하기 위해 블룸 필터를 도입했다는 것이었습니다.
SQLite에서 OLAP 벤치마크에 사용한 쿼리를 프로파일링한 결과, 실제 최종 결과에 전혀 포함되지 않는 부분까지 B-tree 자료구조를 탐색하고 있었다는군요. 따라서 최종 결과에 포함되지 않을 부분을 미리 골라내고 처리하기 위해, 특정 요소가 존재하지 않는다는 것을 확실하게 알 수 있는 확률적 자료구조인 블룸 필터를 추가했다는 것이 해당 개선의 주요 내용이었습니다.
이쯤에서 보는 블룸 필터 소개글 몇 가지.
그리고 요즘은 Xor Filter라는 것도 나왔다고 합니다.