Bark - 트랜스포머 기반의 Text-To-Audio 모델
(github.com/suno-ai)- 매우 사실적인 다국어 음성 생성 가능
- 음악, 배경 소음 및 간단한 음향 효과 포함
- 웃음, 한숨, 울음 같은 비언어적 커뮤니케이션도 연출 가능
- 영어/한국어 및 독일어/프랑스어/일본어/중국어 등을 지원
- 페이스북의 EnCodec 코덱을 사용
- Bark는 CC-BY 4.0 NC 라이센스 이며, Suno 모델 자체는 상업용도로 이용 가능
Bark's generations sometimes differ from my prompts. What's happening?
Bark is a GPT-style model. As such, it may take some creative liberties in its generations, resulting in higher-variance model outputs than traditional text-to-speech approaches.
이 부분이 무섭네요 ㄷㄷ 가끔 프롬프트와 다르게 생성되는 이유가 모델의 창의적 자유?를 위해서라고..