Show GN: Voice-Pro – 음성인식, 번역, 음성합성을 지원하는 Gradio WebUI
(github.com/abus-aikorea)Voice-Pro는 음성인식, 번역, 음성합성을 지원하는 Gradio WebUI 입니다.
주요 기능:
- 제로샷 보이스 클로닝. 15초 분량의 음성 샘플만 있으면 됩니다. 50인 이상의 셀럽 보이스 제공
- YouTube 오디오 다운로드
- 보컬 분리
- 다국어 텍스트-음성 변환 (Edge-TTS, F5-TTS)
- 다국어 번역
- 다양한 Whisper 엔진 지원 (Whisper, Faster-Whisper, Whisper-Timestamped)
비디오 데모:
-
Voice-Pro 사용 튜토리얼: https://youtu.be/z8g8LMhoh_o
-
Voice-Cloning 팟캐스트 제작 데모: https://youtu.be/Wfo7vQCD4no
-
데모 및 샘플영상들: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq