▲GN⁺ 2023-11-27 | parent | ★ favorite | on: VectorDB - Kagi Search가 개발한 벡터 데이터베이스(vectordb.com)Hacker News 의견 개발자의 의견: 이 제품은 실제 데이터베이스가 아니라, 로컬에서 실행되는 임베딩과 FAISS/mrpt를 기반으로 한 래퍼(wrapper)임. 지연 시간을 최소화하기 위해 많은 벤치마킹을 통해 합리적인 기본값을 제공함. 사용자의 관심사에 따라 Kagi Small Web RSS 피드의 내용을 필터링하는 예시 Colab 노트북을 공유함. FAISS에 대한 의견: FAISS는 벡터 검색 라이브러리로 간단한 API를 제공함. VectorDB가 필요로 하는 PyTorch, Tensorflow, Transformers 같은 무거운 라이브러리가 필요 없는 경우 FAISS가 더 적합할 수 있음. Postgres와의 통합에 대한 의견: 이미 Postgres를 운영 저장소로 사용 중인 팀은 PGVector 확장을 사용하는 것이 좋음. 데이터와 벡터 검색 기능이 함께 있어 기술 스택에서 관리해야 할 부분이 줄어듦. Kagi 검색에 대한 긍정적인 피드백: Kagi 검색을 몇 달 동안 사용해본 결과 놀라움. 이 기술이 Kagi 검색의 원동력이라면 낙관적임. 데이터 저장과 한계에 대한 질문: 데이터는 어디에 저장되는지, 어떻게 영속화되는지 궁금함. 이 기술에는 어떤 제한이 있는지, 500-1000 단어의 텍스트와 문장이 아닌 텍스트 컬렉션에도 잘 작동하는지 질문함. Crystal 언어 사용에 대한 궁금증: Crystal 언어가 사용되지 않은 이유에 대해 궁금해함. 벡터 데이터베이스 비교에 대한 질문: 다양한 벡터 DB들을 비교한 자료가 있는지, 다른 사용 사례에 따라 어떤 것을 선택할지, 어떻게 다른지에 대한 질문이 있음. "최소한" 프레임워크에 대한 관심: HF 트랜스포머에 대한 의존성을 없애고, 청킹을 맞춤화하는 것이 흥미로움. 이 프로젝트에 대한 비판이 아니라, 도움이 될 수 있는 부분을 보는 것임. 임베딩 생성에 대한 질문: 실제로 임베딩을 생성하는 데 사용되는 것이 무엇인지에 대한 질문이 있음. 벡터 데이터베이스에 대한 블로그 링크 공유: 벡터 데이터베이스가 필요하지 않다는 내용의 블로그 링크가 공유됨.
Hacker News 의견
개발자의 의견:
FAISS에 대한 의견:
Postgres와의 통합에 대한 의견:
Kagi 검색에 대한 긍정적인 피드백:
데이터 저장과 한계에 대한 질문:
Crystal 언어 사용에 대한 궁금증:
벡터 데이터베이스 비교에 대한 질문:
"최소한" 프레임워크에 대한 관심:
임베딩 생성에 대한 질문:
벡터 데이터베이스에 대한 블로그 링크 공유: