13P by xguru 1일전 | ★ favorite | 댓글과 토론
  • 완전히 오프라인에서 작동하는 무료 오픈소스 음성 → 텍스트 앱으로 Rust + React/TypeScript 기반의 Tauri 데스크톱 앱
  • 단축키 누르면 녹음 시작 → 말 하면 클라우드 전송 없이 로컬 변환 → 텍스트로 자동 입력
  • WhisperParakeet V3 모델을 활용해 GPU 가속 또는 CPU 최적화 방식으로 동작하며, Windows, macOS, Linux를 지원
  • 프로젝트의 목표는 “가장 완벽한 음성 인식 앱”이 아니라, 누구나 쉽게 수정·확장할 수 있으며 오픈소스, 무료, 오프라인 지원하는 가장 포크하기 좋은 앱을 만드는 것
  • 기술 스택
    • 프런트엔드: React + TypeScript + Tailwind CSS
    • 백엔드: Rust 기반, 오디오 처리 및 머신러닝 추론 담당
    • 핵심 라이브러리:
      • whisper-rs (Whisper 기반 음성 인식)
      • transcription-rs (Parakeet CPU 최적화 모델)
      • cpal (크로스 플랫폼 오디오 I/O)
      • vad-rs (음성 활동 감지)
      • rdev (글로벌 단축키 및 이벤트 처리)
      • rubato (오디오 리샘플링)
  • 공식사이트 : https://handy.computer/