🔥Flamehaven FileSearch

  • Flamehaven FileSearch는 문서 기반 RAG(Retrieval-Augmented Generation) 시스템을 누구나 5분 만에 구축할 수 있게 해주는 셀프호스팅 가능한 오픈소스 시맨틱 검색 엔진입니다.
  • Python, FastAPI, SQLite 기반으로 동작하며, Google Gemini Embedding을 활용 PDF/DOCX/TXT/MD 등 다양한 문서에서 자연어 질의 응답을 수행합니다.

왜 만들었나?

  • 대부분의 오픈소스 RAG 구현체가 Colab이나 Jupyter 환경에서는 잘 돌아가지만, 실제 서버에 올려서 운영하기엔 구조가 복잡하거나 안정성이 부족합니다.
  • Flamehaven FileSearch는 “실제로 돌아가는 경량 RAG 스택” 을 목표로, 연구자·스타트업·개인 개발자가 누구나 자신의 데이터로 시맨틱 검색을 즉시 실험할 수 있도록 설계되었습니다.

왜 주목해야 할까?

  • 완전한 자율성: 외부 서버나 클라우드에 의존하지 않으며, 데이터는 모두 로컬에 저장됩니다.
  • 개발자 중심 구조: Python SDK + REST API, FastAPI 기반 Swagger 문서 자동 제공.
  • PyPI 패키지 배포: PyPI에서 바로 설치 가능 — pip install flamehaven-filesearch[api] 한 줄로 완전 자동 설치.
  • 즉시 실행: 설치 후 flamehaven-api 명령어로 바로 서버 구동, 브라우저에서 /docs로 API 테스트 가능.
  • 확장성: SQLite 저장소, 플러그인 아키텍처, Docker 배포 지원.
  • 교육/연구 친화성: Gemini 임베딩을 사용하여 최신 LLM 기반 시맨틱 검색 실습에 이상적.

무엇이 들어 있나? (하이라이트)

  • Python SDK: from flamehaven_filesearch import FlamehavenFileSearch

    → 문서 업로드 / 검색 / 스토어 관리 전 기능 제공.

  • REST API: /upload, /search, /stores 엔드포인트 + Swagger UI.

  • Docker 지원: docker run -e GEMINI_API_KEY=... -p 8000:8000 flamehaven/filesearch:latest

  • 구조: core(엔진) / api(FastAPI) / data(SQLite) / examples / docs


빠르게 써보기

1️⃣ PyPI 패키지

Flamehaven FileSearch는 PyPI를 통해 바로 설치할 수 있습니다.

최신 버전 확인: https://pypi.org/project/flamehaven-filesearch

pip install flamehaven-filesearch[api]  

2️⃣ 설치

pip install flamehaven-filesearch[api]  
export GEMINI_API_KEY="your-google-gemini-key"  
flamehaven-api  
  

3️⃣ 문서 업로드 & 검색

curl -X POST "http://localhost:8000/upload"; -F "file=@handbook.pdf"  
curl "http://localhost:8000/search?q=vacation+policy";  
  

4️⃣ SDK 사용 예시

from flamehaven_filesearch import FlamehavenFileSearch  
fs = FlamehavenFileSearch()  
fs.upload_file("handbook.pdf")  
print(fs.search("vacation policy")["answer"])  
  

성능 & 스펙

  • 환경: Ubuntu 22.04 / 2vCPU / 4GB RAM / SSD
  • 업로드 10MB PDF → 약 5초
  • 검색 응답 평균 → 2초 (소스 5개 인용 시)
  • 스토어 삭제/생성 → 1초 이내
  • 스토리지 오버헤드 → 문서 크기의 약 5 %

로드맵

  • v1.1 : 캐싱 및 쿼터 관리
  • v1.2 : 배치 검색 + WebSocket 스트리밍
  • v2.0 : 다국어 문서 지원, 분석 대시보드
  • 향후 : Pinecone/Weaviate 벡터DB 통합, OCR, 협업 스토어

라이선스

  • MIT License (완전 오픈소스)

🛡️ Flamehaven Github 보안 및 계정 공지

최근 Flamehaven GitHub 계정(본 계정)에서 의심스러운 로그인 시도가 감지되면서 계정이 정지 상태에 놓였습니다. 현재 GitHub 보안팀과 협력하여 문제를 확인 중입니다.

이번 사건을 통해 - dir2md, flashrecord, crom-efficient, Arr-medic-cyp3a4 등이 포함된 계정은 당분간 사용 중단된 상태입니다.

이용자 여러분께 불편을 드려 진심으로 사과드리며, 보안 점검이 완료될 때까지 조금만 양해 부탁드립니다.

오늘 v1.1.0을 릴리즈했습니다.

이번 버전은 주로 경로 탐색 취약점 패치, FastAPI/Starlette 보안 업데이트, 요청 ID 트레이싱, 레이트 리미트, 캐싱(<10ms hit), Prometheus 메트릭 추가 등이 포함돼 있습니다. 이전 버전보다 훨씬 안정적으로 동작합니다.

이번 업데이트도 여전히 가볍고 자체 호스팅 가능한 구조에 초점을 맞췄습니다. 감사합니다.