32P by xguru 17일전 | favorite | 댓글 1개
  • v2 출시되면서 더 나은 오디오 품질, 한국어를 포함한 다국어 지원, 상업적 사용도 무료
  • 화자의 짧은 오디오 클립만으로 음성을 복제하고 여러 언어로 음성을 생성 가능
  • 레퍼런스 화자의 음색을 복제할 뿐만 아니라 감정, 억양, 리듬, 일시 정지, 억양 등 음성 스타일을 세밀하게 제어
  • 훈련 세트에 포함되지 않은 언어에 대해서도 제로 샷(zero-shot) 교차 언어 음성 복제를 실현
  • 상업적으로 사용 가능한 API보다 수십 배 더 적은 계산 비용으로 우수한 성능을 제공
  • V1의 모든 기능이 포함된 V2 의 변경점 (2024/04 출시)
    • 더 나은 오디오 품질: V2는 더 나은 오디오 품질을 제공하는 다른 트레이닝 전략을 채택
    • 기본 다국어 지원: 영어, 스페인어, 프랑스어, 중국어, 일본어, 한국어가 OpenVoice V2에서 기본적으로 지원
    • 무료 상업적 사용 가능: 2024년 4월부터 V2와 V1은 모두 MIT 라이선스 하에 출시되어 상업적 사용도 무료

GN⁺: OpenVoice : 다재다능한 즉각적인 음성 복제 기술
GN⁺: OpenVoice - 다재다능한 인스턴트 음성 복제 기술

GN+를 통해서 몇번 올라왔는데, 이번에 V2가 나오면서 다국어가 지원되고 한국어도 추가되었습니다.