GN⁺: 실패한 스타트업 Buzee 오픈 소스화 – 파일 검색 애플리케이션
(github.com/gsidhu)- Buzee는 Mac과 Windows에서 사용할 수 있는 전체 텍스트 검색 애플리케이션
- 사용자가 모든 문서,이미지,오디오,비디오,폴더 및 브라우저 기록에서 빠른 Full-Text 검색을 하게 해주는 도구
- 키워드, 시간, 유형 또는 이들의 조합으로 로컬 문서와 폴더 검색 가능
- 특정 파일이나 폴더를 인덱싱에서 제외하거나 내용만 제외 가능
- 전역 단축키를 사용하여 앱을 표시/숨김 가능 (
⎇ / Alt + Space
). - 앱 내에서 검색 바로 이동 (
⌘ / Ctrl + F or K
), 스크래치패드로 이동 (⌘ / Ctrl + Shift + S
). - 파일에 대한 통계 보기 및 고유 문서 프로필 제공
- 서브 기능: PDF와 이미지에서 텍스트 추출, 스크래치패드 사용, 파일 시스템 변경 자동 동기화
- 가벼운 설치 패키지와 낮은 메모리 사용량
- 지원 파일 포맷
- 문서: csv, docx, key, md, numbers, pages, pdf, pptx, txt, xlsx, xls
- 이미지: jpg, jpeg, png, gif
- 책: epub, mobi, azw3, pdf
- 오디오: mp3, wav, aac, flac, ogg
- 비디오: mp4, mkv, avi, mov, wmv
- Rust + NodeJS + Tauri 기반 오픈소스
시맨틱 검색
검색 포함/제외
- 파일 유형 필터 사용 또는 검색어에 직접 입력 가능 (예:
invoice pdf
). - 정확한 구문 검색을 위해 키워드에 따옴표 사용 (예:
"annual report"
). - 검색에서 제외할 키워드 앞에 하이픈 사용 (예:
"annual report" -2022 -pdf
).
시간으로 검색
- 날짜 범위 필터 사용 또는 검색어에 날짜/시간 기간 명시 가능.
- 예:
**last month** pdf invoice
,annual report ppt **this year**
.
소스에서 빌드하기
- Buzee는 Mac에서 최적의 성능을 발휘하며, Windows와 Linux에서는 테스트가 충분히 이루어지지 않음.
- Rust와 NodeJS 설치 후,
npm install
및cargo install
명령어 사용하여 개발 모드에서 앱 실행 가능.
TODO / 알려진 문제
- 검색 결과에 일치하는 텍스트 표시, 브라우저 기록 검색에서 복잡한 쿼리 지원 등 다양한 기능 개선 필요.
- 문서에 '태그' 추가, '대시보드' 뷰 생성, 코드베이스에 테스트 추가 등 새로운 기능 개발 필요.
기술 스택
- 백엔드: Rust, Tauri v2, SQLite, Tantivy.
- 프론트엔드: Svelte 4, TypeScript, TailwindCSS.
아키텍처
- 모든 파일 메타데이터는 SQLite의
document
테이블에 저장됨. -
metadata
테이블에 전체 텍스트 인덱스 생성 및 Tantivy에 저장됨. - Firefox, Chrome, Arc의 기록은 각각의 기록 데이터베이스를 통해 검색됨.
라이선스
- MIT 라이선스.
0.1.1 버전이라 약간 망설여졌지만...일단 문제 없이 동작합니다.
다만, pc 사용 중이라 리소스를 적게 사용하도록 설정한 것인지 몰라도 인덱싱 속도가 느리게 느껴지네요.
아울러 이미지를 포함해 파일 내 텍스트를 찾아주니 편하긴 합니다. 구글 데스크탑 향기가 약간 납니다.
Hacker News 의견
-
한 사용자는 실패한 이유와 현재 시작한다면 어떻게 다르게 할 것인지에 대한 여정을 공유해달라고 요청함. 여러 유니버설 검색 스타트업이 실패하는 이유에 대해 시장 부족이나 적응 문제를 제기함
-
오픈 소스로 만들어줘서 감사하다는 의견과 함께 AI 검색 기능이 없다는 점을 지적함. 앱에 견고한 기반이 있지만 실용성을 위해 더 다듬어야 한다고 생각함
-
Recoll이라는 프로그램을 사용하여 다양한 파일을 검색할 수 있다고 설명함. Thunderbird 폴더에 저장된 MS-Word 문서를 검색하고 PDF 파일을 두 번 클릭으로 열 수 있는 기능을 강조함
-
다운로드가 안 되는 문제를 언급하며, 전자 기록이 너무 방대해 Windows 검색이 작동하지 않는 환경에서 유용할 것이라고 함. 전자 파일 관리의 필요성을 강조함
-
Labrador Retriever 이름의 프로그램을 사용하지 않겠다는 농담과 함께 자신의 강아지 사진을 공유함
-
Microsoft SharePoint와 유사한 기능을 구현하려는 시도였다고 언급하며, MS 중심의 기업을 설득하는 것이 비즈니스 측면에서의 문제라고 지적함. SharePoint 위에 제품을 구축할 수 있는지에 대한 질문을 던짐
-
다운로드 링크가 작동하지 않는 문제를 지적하며, GUI가 주요 가치인 프로젝트는 스크린샷을 포함해야 한다고 제안함
-
복잡한 파일 검색을 위해 duckdb의 확장을 사용하여 파일 시스템에서 SQL을 실행할 수 있는 옵션을 제안함
-
Google Drive, GitHub, GitLab, Box.com 및 로컬 파일을 검색할 수 있는 앱에 대한 추천을 요청함
-
오픈 소스로 만들어줘서 감사하다는 의견과 함께 문서화가 부족하다는 점을 지적함. AI 문서화 시스템을 구축 중이며, 문서를 작성하고 PR을 만들 수 있는지 허락을 요청함. AkiraDocs 프로젝트를 소개함