- 새로운 브라우저 기반 위키백과 검색 엔진에 대한 기사, 오프라인 검색 가능
- 검색 엔진의 실시간 위키백과 페이지 백만 개 검색 기능, 모바일 기기에서 10ms마다 결과 반환
- 검색 엔진 데이터베이스의 작은 크기, 특별한 처리 없이 백만 개의 임베딩을 지원하는 캐주얼 사용 사례
- 문장 변환기를 이용한 문서 임베딩, 제품 양자화를 통한 임베딩 압축, 그리고 브라우저에서 거리 계산을 실행하는 pq.js 사용하는 검색 엔진
- 검색 엔진에서 쿼리를 위한 브라우저 내 문장 변환기 실행을 위해 transformers.js 사용
- 압축된 페이지 크기에 따라 임베딩을 정렬하는 검색 엔진, 정보 밀도가 높은 페이지가 먼저 분석되고 상위 10개 순위에 반환
- 고성능을 위해 JSON 대신 Arrow를 사용하는 검색 엔진, Arrow는 8비트 정수 제품 양자화 배열을 간결하게 저장 가능
- 웹어셈블리에서 실행되는 ONNX 모델을 사용하는 검색 엔진, 아직 GPU 가속화 없음
- 문장 변환기로 위키백과 전체를 임베딩하고, 제품 양자화로 임베딩을 압축하며, ONNX를 수동으로 작성하는 검색 엔진
- 임베딩과 메타데이터를 저장하기 위해 numpy를 Arrow로 내보내는 검색 엔진, 메모리와 디스크에서 훨씬 간결
- 제품 하위 카테고리에서 실시간 검색을 허용하는 다면 검색을 지원하는 검색 엔진
- 저자는 피드백 및 개선 제안을 초대, 특히 다른 양자화 수준과 다른 임베딩 차원 지원에 대해