- 완전히 오프라인에서 작동하는 무료 오픈소스 음성 → 텍스트 앱으로 Rust + React/TypeScript 기반의 Tauri 데스크톱 앱
- 단축키 누르면 녹음 시작 → 말 하면 클라우드 전송 없이 로컬 변환 → 텍스트로 자동 입력
-
Whisper 및 Parakeet V3 모델을 활용해 GPU 가속 또는 CPU 최적화 방식으로 동작하며, Windows, macOS, Linux를 지원
- 프로젝트의 목표는 “가장 완벽한 음성 인식 앱”이 아니라, 누구나 쉽게 수정·확장할 수 있으며 오픈소스, 무료, 오프라인 지원하는 가장 포크하기 좋은 앱을 만드는 것
-
기술 스택
-
프런트엔드: React + TypeScript + Tailwind CSS
-
백엔드: Rust 기반, 오디오 처리 및 머신러닝 추론 담당
-
핵심 라이브러리:
-
whisper-rs
(Whisper 기반 음성 인식)
-
transcription-rs
(Parakeet CPU 최적화 모델)
-
cpal
(크로스 플랫폼 오디오 I/O)
-
vad-rs
(음성 활동 감지)
-
rdev
(글로벌 단축키 및 이벤트 처리)
-
rubato
(오디오 리샘플링)
- 공식사이트 : https://handy.computer/