OpenVoice v2 - 다재다능한 인스턴트 음성 복제
(github.com/myshell-ai)- v2 출시되면서 더 나은 오디오 품질, 한국어를 포함한 다국어 지원, 상업적 사용도 무료
- 화자의 짧은 오디오 클립만으로 음성을 복제하고 여러 언어로 음성을 생성 가능
- 레퍼런스 화자의 음색을 복제할 뿐만 아니라 감정, 억양, 리듬, 일시 정지, 억양 등 음성 스타일을 세밀하게 제어
- 훈련 세트에 포함되지 않은 언어에 대해서도 제로 샷(zero-shot) 교차 언어 음성 복제를 실현
- 상업적으로 사용 가능한 API보다 수십 배 더 적은 계산 비용으로 우수한 성능을 제공
- V1의 모든 기능이 포함된 V2 의 변경점 (2024/04 출시)
- 더 나은 오디오 품질: V2는 더 나은 오디오 품질을 제공하는 다른 트레이닝 전략을 채택
- 기본 다국어 지원: 영어, 스페인어, 프랑스어, 중국어, 일본어, 한국어가 OpenVoice V2에서 기본적으로 지원
- 무료 상업적 사용 가능: 2024년 4월부터 V2와 V1은 모두 MIT 라이선스 하에 출시되어 상업적 사용도 무료
GN⁺: OpenVoice : 다재다능한 즉각적인 음성 복제 기술
GN⁺: OpenVoice - 다재다능한 인스턴트 음성 복제 기술
GN+를 통해서 몇번 올라왔는데, 이번에 V2가 나오면서 다국어가 지원되고 한국어도 추가되었습니다.