Show GN: FLAMEHAVEN FileSearch v1.3.1 – ML 의존성 제거 및 시맨틱 검색 엔진 대폭 개편
(github.com/flamehaven01)FLAMEHAVEN FileSearch는
👉 *“문서 검색용 RAG를 가볍고, 재현 가능하며, 완전히 self-hosted로 만들 수 없을까?”*라는 질문에서 시작한 오픈소스 프로젝트입니다.
현재 ⭐ Star 81 / 🍴 Fork 11로, 소규모이지만 릴리즈마다 명확한 개선을 지속해온 프로젝트입니다.
이번 v1.3.1 릴리즈는 단순한 기능 추가가 아니라,
👉 “시맨틱 검색 = 무거운 ML 스택”이라는 전제를 깨는 업데이트입니다.
🔍 프로젝트 한 줄 요약
-
Self-hosted RAG 검색 엔진
-
문서(PDF/DOCX/MD/TXT)를 업로드하면 키워드 + 시맨틱 + 하이브리드 검색
-
외부 벡터 DB 없이 로컬에서 동작
-
Docker 한 줄로 3분 내 실행 가능
✨ v1.3.1 핵심 업데이트 (개발자가 좋아할 포인트)
1️⃣ ML 의존성 완전 제거 (가장 큰 변화)
-
sentence-transformers / torch 완전 제거
-
자체 구현한 DSP v2.0 (Deterministic Semantic Projection) 도입
-
✔️ 벡터 생성 < 1ms
-
✔️ 초기화 지연 없음 (기존 2분 → 즉시)
-
시맨틱 검색이지만, ML 프레임워크 없이 결정론적으로 동작
2️⃣ 메모리 & 성능 최적화
-
int8 벡터 양자화
→ 메모리 사용량 75% 감소 -
코사인 유사도 계산 30% 이상 속도 개선
-
메타데이터 90% 이상 압축 (Gravitas-Pack)
-
개인 서버 / 사내 VM에서도 부담 없이 운영 가능
3️⃣ 검색 모드 확장
-
keyword / semantic / hybrid 검색 모드 지원
-
typo correction + query refinement 포함
-
기존 API와 완전 backward-compatible
4️⃣ 안정성 & 신뢰성
-
테스트 프레임워크를 pytest → unittest로 전환
-
19/19 테스트 통과 (0.33s)
-
타임아웃, CI 불안정성 제거
🔐 여전히 유지되는 프로덕션 기능들
-
API Key 기반 인증 & 권한 관리
-
Rate limiting / Audit log
-
Batch search (1~100 queries)
-
Optional Redis 캐시
-
Prometheus 메트릭
👀 이런 분들께 특히 적합합니다
-
사내 문서 검색용 로컬 RAG가 필요한 팀
-
외부 SaaS(Pinecone 등)에 데이터 올리기 어려운 환경
-
“PoC는 됐는데, 운영은 어떻게 하지?” 단계에 있는 개발자
-
재현 가능성 / 비용 / 통제권을 중시하는 엔지니어
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---사용해보시고 도움이 되었다면 ⭐ 한 번 눌러주셔도 큰 힘이 됩니다.
의견·피드백·PR 모두 환영합니다.