OpenVoice v2 - 다재다능한 인스턴트 음성 복제

(github.com/myshell-ai)

v2 출시되면서 더 나은 오디오 품질, 한국어를 포함한 다국어 지원, 상업적 사용도 무료
화자의 짧은 오디오 클립만으로 음성을 복제하고 여러 언어로 음성을 생성 가능
레퍼런스 화자의 음색을 복제할 뿐만 아니라 감정, 억양, 리듬, 일시 정지, 억양 등 음성 스타일을 세밀하게 제어
훈련 세트에 포함되지 않은 언어에 대해서도 제로 샷(zero-shot) 교차 언어 음성 복제를 실현
상업적으로 사용 가능한 API보다 수십 배 더 적은 계산 비용으로 우수한 성능을 제공
V1의 모든 기능이 포함된 V2 의 변경점 (2024/04 출시)
- 더 나은 오디오 품질: V2는 더 나은 오디오 품질을 제공하는 다른 트레이닝 전략을 채택
- 기본 다국어 지원: 영어, 스페인어, 프랑스어, 중국어, 일본어, 한국어가 OpenVoice V2에서 기본적으로 지원
- 무료 상업적 사용 가능: 2024년 4월부터 V2와 V1은 모두 MIT 라이선스 하에 출시되어 상업적 사용도 무료

GN+를 통해서 몇번 올라왔는데, 이번에 V2가 나오면서 다국어가 지원되고 한국어도 추가되었습니다.