9P by vulcanidic 19일전 | favorite | 댓글 1개

Voice-Pro는 음성인식, 번역, 음성합성을 지원하는 Gradio WebUI 입니다.

주요 기능:

  • 제로샷 보이스 클로닝. 15초 분량의 음성 샘플만 있으면 됩니다. 50인 이상의 셀럽 보이스 제공
  • YouTube 오디오 다운로드
  • 보컬 분리
  • 다국어 텍스트-음성 변환 (Edge-TTS, F5-TTS)
  • 다국어 번역
  • 다양한 Whisper 엔진 지원 (Whisper, Faster-Whisper, Whisper-Timestamped)

비디오 데모:

GitHub:
https://github.com/abus-aikorea/voice-pro

한국분이 만드셨나봐요