VibeVoice - Microsoft의 차세대 오픈소스 음성 합성 모델
긱뉴스에는 초반에 바로 공개되었는데, 이슈가 있어서 VibeVoice-TTS코드는 제거되었네요.
TTS는 VibeVoice-Realtime 만 이용가능한 상태인듯.
요 몇일 VibeVoice-ASR 때문에 다시 인기를 끄는지 여기저기서 보이네요
https://simonwillison.net/2026/Apr/27/vibevoice/
Simon Willison이 ASR을 테스트 했는데, 맥에서 uv와 mlx-audio를 활용해 한 줄 명령으로 실행 가능하고
1시간 분량의 오디오를 128GB M5 Max MacBook Pro에서 약 8분 45초만에 처리했다네요. 화자 분리 잘되는 Whisper 라고 보면 된다고
VibeVoice - Microsoft의 차세대 오픈소스 음성 합성 모델
긱뉴스에는 초반에 바로 공개되었는데, 이슈가 있어서 VibeVoice-TTS코드는 제거되었네요.
TTS는 VibeVoice-Realtime 만 이용가능한 상태인듯.
요 몇일 VibeVoice-ASR 때문에 다시 인기를 끄는지 여기저기서 보이네요
https://simonwillison.net/2026/Apr/27/vibevoice/
Simon Willison이 ASR을 테스트 했는데, 맥에서
uv와 mlx-audio를 활용해 한 줄 명령으로 실행 가능하고1시간 분량의 오디오를 128GB M5 Max MacBook Pro에서 약 8분 45초만에 처리했다네요.
화자 분리 잘되는 Whisper라고 보면 된다고