Handy – Rust로 작성된 무료 오픈소스 음성 인식 앱
(github.com/cjpais)- 완전히 오프라인에서 작동하는 무료 오픈소스 음성 → 텍스트 앱으로 Rust + React/TypeScript 기반의 Tauri 데스크톱 앱
- 단축키 누르면 녹음 시작 → 말 하면 클라우드 전송 없이 로컬 변환 → 텍스트로 자동 입력
- Whisper 및 Parakeet V3 모델을 활용해 GPU 가속 또는 CPU 최적화 방식으로 동작하며, Windows, macOS, Linux를 지원
- 프로젝트의 목표는 “가장 완벽한 음성 인식 앱”이 아니라, 누구나 쉽게 수정·확장할 수 있으며 오픈소스, 무료, 오프라인 지원하는 가장 포크하기 좋은 앱을 만드는 것
-
기술 스택
- 프런트엔드: React + TypeScript + Tailwind CSS
- 백엔드: Rust 기반, 오디오 처리 및 머신러닝 추론 담당
-
핵심 라이브러리:
-
whisper-rs(Whisper 기반 음성 인식) -
transcription-rs(Parakeet CPU 최적화 모델) -
cpal(크로스 플랫폼 오디오 I/O) -
vad-rs(음성 활동 감지) -
rdev(글로벌 단축키 및 이벤트 처리) -
rubato(오디오 리샘플링)
-
- 공식사이트 : https://handy.computer/
GeekNews Weekly에 포함된 글입니다.
에디터 코멘트 보기