# 실패한 스타트업 Buzee 오픈 소스화 – 파일 검색 애플리케이션

> Clean Markdown view of GeekNews topic #18282. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=18282](https://news.hada.io/topic?id=18282)
- GeekNews Markdown: [https://news.hada.io/topic/18282.md](https://news.hada.io/topic/18282.md)
- Type: GN+
- Author: [neo](https://news.hada.io/@neo)
- Published: 2024-12-16T09:52:09+09:00
- Updated: 2024-12-16T09:52:09+09:00
- Original source: [github.com/gsidhu](https://github.com/gsidhu/buzee-tauri)
- Points: 11
- Comments: 3

## Summary

Buzee는 Mac과 Windows에서 사용할 수 있는 전체 텍스트 검색 애플리케이션으로, 다양한 파일 형식에서 빠른 검색을 지원하며, 키워드, 시간, 유형을 조합하여 로컬 문서와 폴더를 검색할 수 있습니다. 이 애플리케이션은 Rust, NodeJS, Tauri를 기반으로 하며, PDF와 이미지에서 텍스트 추출, 파일 시스템 변경 자동 동기화 등의 기능을 제공합니다. MIT 라이선스로 오픈 소스화되어 있으며, Mac에서 최적의 성능을 발휘하지만 Windows와 Linux에서는 충분한 테스트가 이루어지지 않았습니다.

## Topic Body

- Buzee는 Mac과 Windows에서 사용할 수 있는 전체 텍스트 검색 애플리케이션  
- 사용자가 모든 문서,이미지,오디오,비디오,폴더 및 브라우저 기록에서 빠른 Full-Text 검색을 하게 해주는 도구   
- 키워드, 시간, 유형 또는 이들의 조합으로 로컬 문서와 폴더 검색 가능  
- 특정 파일이나 폴더를 인덱싱에서 제외하거나 내용만 제외 가능  
- 전역 단축키를 사용하여 앱을 표시/숨김 가능 (`⎇ / Alt + Space`).  
- 앱 내에서 검색 바로 이동 (`⌘ / Ctrl + F or K`), 스크래치패드로 이동 (`⌘ / Ctrl + Shift + S`).  
- 파일에 대한 통계 보기 및 고유 문서 프로필 제공  
- 서브 기능: PDF와 이미지에서 텍스트 추출, 스크래치패드 사용, 파일 시스템 변경 자동 동기화  
- 가벼운 설치 패키지와 낮은 메모리 사용량  
- 지원 파일 포맷   
  - 문서: csv, docx, key, md, numbers, pages, pdf, pptx, txt, xlsx, xls  
  - 이미지: jpg, jpeg, png, gif  
  - 책: epub, mobi, azw3, pdf  
  - 오디오: mp3, wav, aac, flac, ogg  
  - 비디오: mp4, mkv, avi, mov, wmv  
- Rust + NodeJS + Tauri 기반 오픈소스   
  
### 시맨틱 검색  
  
#### 검색 포함/제외  
  
- 파일 유형 필터 사용 또는 검색어에 직접 입력 가능 (예: `invoice pdf`).  
- 정확한 구문 검색을 위해 키워드에 따옴표 사용 (예: `"annual report"`).  
- 검색에서 제외할 키워드 앞에 하이픈 사용 (예: `"annual report" -2022 -pdf`).  
  
#### 시간으로 검색  
  
- 날짜 범위 필터 사용 또는 검색어에 날짜/시간 기간 명시 가능.  
- 예: `**last month** pdf invoice`, `annual report ppt **this year**`.  
  
### 소스에서 빌드하기  
  
- Buzee는 Mac에서 최적의 성능을 발휘하며, Windows와 Linux에서는 테스트가 충분히 이루어지지 않음.  
- Rust와 NodeJS 설치 후, `npm install` 및 `cargo install` 명령어 사용하여 개발 모드에서 앱 실행 가능.  
  
### TODO / 알려진 문제  
  
- 검색 결과에 일치하는 텍스트 표시, 브라우저 기록 검색에서 복잡한 쿼리 지원 등 다양한 기능 개선 필요.  
- 문서에 '태그' 추가, '대시보드' 뷰 생성, 코드베이스에 테스트 추가 등 새로운 기능 개발 필요.  
  
### 기술 스택  
  
- 백엔드: Rust, Tauri v2, SQLite, Tantivy.  
- 프론트엔드: Svelte 4, TypeScript, TailwindCSS.  
  
### 아키텍처  
  
- 모든 파일 메타데이터는 SQLite의 `document` 테이블에 저장됨.  
- `metadata` 테이블에 전체 텍스트 인덱스 생성 및 Tantivy에 저장됨.  
- Firefox, Chrome, Arc의 기록은 각각의 기록 데이터베이스를 통해 검색됨.  
  
### 라이선스  
  
- MIT 라이선스.

## Comments



### Comment 32430

- Author: dhlee0305
- Created: 2024-12-16T15:54:58+09:00
- Points: 1

0.1.1 버전이라 약간 망설여졌지만...일단 문제 없이 동작합니다.  
다만, pc 사용 중이라 리소스를 적게 사용하도록 설정한 것인지 몰라도 인덱싱 속도가 느리게 느껴지네요.  
아울러 이미지를 포함해 파일 내 텍스트를 찾아주니 편하긴 합니다. 구글 데스크탑 향기가 약간 납니다.

### Comment 32381

- Author: xguru
- Created: 2024-12-16T09:59:47+09:00
- Points: 1

[recoll - 데스크탑용 풀텍스트 검색 도구 ](https://news.hada.io/topic?id=18281)

### Comment 32377

- Author: neo
- Created: 2024-12-16T09:52:09+09:00
- Points: 1

###### [Hacker News 의견](https://news.ycombinator.com/item?id=42417330) 
- 한 사용자는 실패한 이유와 현재 시작한다면 어떻게 다르게 할 것인지에 대한 여정을 공유해달라고 요청함. 여러 유니버설 검색 스타트업이 실패하는 이유에 대해 시장 부족이나 적응 문제를 제기함

- 오픈 소스로 만들어줘서 감사하다는 의견과 함께 AI 검색 기능이 없다는 점을 지적함. 앱에 견고한 기반이 있지만 실용성을 위해 더 다듬어야 한다고 생각함

- Recoll이라는 프로그램을 사용하여 다양한 파일을 검색할 수 있다고 설명함. Thunderbird 폴더에 저장된 MS-Word 문서를 검색하고 PDF 파일을 두 번 클릭으로 열 수 있는 기능을 강조함

- 다운로드가 안 되는 문제를 언급하며, 전자 기록이 너무 방대해 Windows 검색이 작동하지 않는 환경에서 유용할 것이라고 함. 전자 파일 관리의 필요성을 강조함

- Labrador Retriever 이름의 프로그램을 사용하지 않겠다는 농담과 함께 자신의 강아지 사진을 공유함

- Microsoft SharePoint와 유사한 기능을 구현하려는 시도였다고 언급하며, MS 중심의 기업을 설득하는 것이 비즈니스 측면에서의 문제라고 지적함. SharePoint 위에 제품을 구축할 수 있는지에 대한 질문을 던짐

- 다운로드 링크가 작동하지 않는 문제를 지적하며, GUI가 주요 가치인 프로젝트는 스크린샷을 포함해야 한다고 제안함

- 복잡한 파일 검색을 위해 duckdb의 확장을 사용하여 파일 시스템에서 SQL을 실행할 수 있는 옵션을 제안함

- Google Drive, GitHub, GitLab, Box.com 및 로컬 파일을 검색할 수 있는 앱에 대한 추천을 요청함

- 오픈 소스로 만들어줘서 감사하다는 의견과 함께 문서화가 부족하다는 점을 지적함. AI 문서화 시스템을 구축 중이며, 문서를 작성하고 PR을 만들 수 있는지 허락을 요청함. AkiraDocs 프로젝트를 소개함
