14P by davespark 6시간전 | ★ favorite | 댓글 2개

구글 Gemini API에 새로 출시된 File Search 도구는 RAG(Retrieval-Augmented Generation) 시스템 구축을 혁신적으로 단순화합니다:

  • 기존 복잡한 청킹, 임베딩, 벡터 DB 설정 대신 파일 업로드 한 번(코드 2줄)으로 자동 처리되며, 쿼리 시 관련 문서를 검색해 모델에 주입.
  • 저장소와 쿼리 임베딩은 무료, 초기 인덱싱 비용만 $0.15/100만 토큰.
  • 지원 파일: PDF, DOCX, TXT 등.
  • 실전 예로 3,000개 파일 검색이 2초 만에 처리되며, 프로토타입 개발 시간을 대폭 단축.
  • 추가로 자동 인용, 메타데이터 필터링 등 기능 제공.
  • 한계: 프로젝트당 10개 스토어 제한, 무료 티어 1GB.
  • 평가: RAG 개발의 진입 장벽을 낮춰 애플리케이션에 집중.

공유 감사합니다. 품질! 정말 궁금하네요

notebooklm을 서비스로 제공하는 거 보고 언젠가 notebooklm api 형태같은 걸로 나오지 않을까 싶었는데, File Search라는 API 서비스로 출시했네요 ㄷㄷ

RAG 잘 해 보려고 파이프라인/워크플로우 구축하고 올라마 키고 모델도 이거 저거 바꿔보고 확실히 허들이 좀 있었는데 (써봐야 알긴 하겠지만) 품질만 어느정도 보장된다면 정말 편하게 쓰겠네요