txtai - 시맨틱 검색, LLM 오케스트레이션, 언어모델 워크플로우를 위한 올인원 임베딩 DB
(github.com/neuml)- 임베딩 DB는 벡터 인덱스(Sparse 및 고밀도), 그래프 네트워크, 관계형 데이터베이스를 결합한 것
- 이를 통해 SQL, 토픽 모델링, 검색 증강 생성(RAG) 등을 통한 벡터 검색이 가능
- 독립적으로 사용하거나 대규모 언어 모델(LLM) 프롬프트에 대한 강력한 지식 소스로 사용
- txtai 의 기능
- SQL, 객체 스토리지, 토픽 모델링, 그래프 분석 및 멀티모달 인덱싱을 통한 벡터 검색
- 텍스트, 문서, 오디오, 이미지 및 비디오용 임베딩 생성
- LLM 프롬프트, 질문 답변, 라벨링, 전사, 번역, 요약 등을 실행하는 언어 모델 기반의 파이프라인
- 파이프라인을 함께 연결하고 비즈니스 로직을 집계하는 워크플로우
- txtai 프로세스는 단순한 마이크로서비스 또는 다중 모델 워크플로우일 수 있음
- Python 또는 YAML로 빌드
- JavaScript, Java, Rust, Go 용 API 바인딩 제공
- 로컬로 실행하거나 컨테이너 오케스트레이션으로 스케일아웃