FLAMEHAVEN FileSearch는
👉 *“문서 검색용 RAG를 가볍고, 재현 가능하며, 완전히 self-hosted로 만들 수 없을까?”*라는 질문에서 시작한 오픈소스 프로젝트입니다.

현재 ⭐ Star 81 / 🍴 Fork 11로, 소규모이지만 릴리즈마다 명확한 개선을 지속해온 프로젝트입니다.

이번 v1.3.1 릴리즈는 단순한 기능 추가가 아니라,
👉 “시맨틱 검색 = 무거운 ML 스택”이라는 전제를 깨는 업데이트입니다.


🔍 프로젝트 한 줄 요약

  • Self-hosted RAG 검색 엔진

  • 문서(PDF/DOCX/MD/TXT)를 업로드하면 키워드 + 시맨틱 + 하이브리드 검색

  • 외부 벡터 DB 없이 로컬에서 동작

  • Docker 한 줄로 3분 내 실행 가능


✨ v1.3.1 핵심 업데이트 (개발자가 좋아할 포인트)
1️⃣ ML 의존성 완전 제거 (가장 큰 변화)

  • sentence-transformers / torch 완전 제거

  • 자체 구현한 DSP v2.0 (Deterministic Semantic Projection) 도입

  • ✔️ 벡터 생성 < 1ms

  • ✔️ 초기화 지연 없음 (기존 2분 → 즉시)

  • 시맨틱 검색이지만, ML 프레임워크 없이 결정론적으로 동작


2️⃣ 메모리 & 성능 최적화

  • int8 벡터 양자화
    → 메모리 사용량 75% 감소

  • 코사인 유사도 계산 30% 이상 속도 개선

  • 메타데이터 90% 이상 압축 (Gravitas-Pack)

  • 개인 서버 / 사내 VM에서도 부담 없이 운영 가능


3️⃣ 검색 모드 확장

  • keyword / semantic / hybrid 검색 모드 지원

  • typo correction + query refinement 포함

  • 기존 API와 완전 backward-compatible


4️⃣ 안정성 & 신뢰성

  • 테스트 프레임워크를 pytest → unittest로 전환

  • 19/19 테스트 통과 (0.33s)

  • 타임아웃, CI 불안정성 제거


🔐 여전히 유지되는 프로덕션 기능들

  • API Key 기반 인증 & 권한 관리

  • Rate limiting / Audit log

  • Batch search (1~100 queries)

  • Optional Redis 캐시

  • Prometheus 메트릭


👀 이런 분들께 특히 적합합니다

  • 사내 문서 검색용 로컬 RAG가 필요한 팀

  • 외부 SaaS(Pinecone 등)에 데이터 올리기 어려운 환경

  • “PoC는 됐는데, 운영은 어떻게 하지?” 단계에 있는 개발자

  • 재현 가능성 / 비용 / 통제권을 중시하는 엔지니어


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---사용해보시고 도움이 되었다면 ⭐ 한 번 눌러주셔도 큰 힘이 됩니다.
의견·피드백·PR 모두 환영합니다.