- 개발자가 데이터를 활용하여 Retrieval Augmented Generation (RAG)을 통해 대규모 언어 모델을 컨텍스트화할 수 있도록 지원하는 데이터 플랫폼
- 문서 저장소 및 NoSQL과 같은 기존 데이터 소스에서 데이터를 추출
- 콘텐츠를 벡터 임베딩으로 처리
- 유사성 검색을 위해 벡터 데이터베이스에 벡터 임베딩을 수집
- 애플리케이션에 따라 확장할 수 있고 데이터 커넥터, 임베딩 모델, 벡터 데이터베이스와 같은 서비스를 통합하는 데 소요되는 시간을 줄일 수 있는 포괄적인 RAG 솔루션
특징
-
수십억 개의 데이터 포인트를 처리가능한 고성능 분산 아키텍처: 고도의 병렬화를 통해 임베딩 생성 및 수집을 최적화
- 공통 데이터 소스, 임베딩 서비스 및 벡터 스토어를 지원 하는 내장 데이터 커넥터
- 데이터 소스를 실시간으로 동기화하여 데이터를 항상 최신 상태로 유지
- 로드, 청킹, 선택 등의 형태로 사용자 지정 가능한 데이터 전처리
- 메타데이터를 통한 하이브리드 검색을 지원하는 일관된 데이터 관리 : 메타데이터를 자동으로 보강하고 추적하여 풍부한 검색 경험을 제공