10P by xguru 4달전 | favorite | 댓글과 토론
  • 임베딩 DB는 벡터 인덱스(Sparse 및 고밀도), 그래프 네트워크, 관계형 데이터베이스를 결합한 것
    • 이를 통해 SQL, 토픽 모델링, 검색 증강 생성(RAG) 등을 통한 벡터 검색이 가능
    • 독립적으로 사용하거나 대규모 언어 모델(LLM) 프롬프트에 대한 강력한 지식 소스로 사용
  • txtai 의 기능
    • SQL, 객체 스토리지, 토픽 모델링, 그래프 분석 및 멀티모달 인덱싱을 통한 벡터 검색
    • 텍스트, 문서, 오디오, 이미지 및 비디오용 임베딩 생성
    • LLM 프롬프트, 질문 답변, 라벨링, 전사, 번역, 요약 등을 실행하는 언어 모델 기반의 파이프라인
    • 파이프라인을 함께 연결하고 비즈니스 로직을 집계하는 워크플로우
      • txtai 프로세스는 단순한 마이크로서비스 또는 다중 모델 워크플로우일 수 있음
    • Python 또는 YAML로 빌드
      • JavaScript, Java, Rust, Go 용 API 바인딩 제공
    • 로컬로 실행하거나 컨테이너 오케스트레이션으로 스케일아웃