Bark - 트랜스포머 기반의 Text-To-Audio 모델

xguru · 2023-04-24T09:35:19+09:00

매우 사실적인 다국어 음성 생성 가능 음악, 배경 소음 및 간단한 음향 효과 포함 웃음, 한숨, 울음 같은 비언어적 커뮤니케이션도 연출 가능 영어/한국어 및 독일어/프랑스어/일본어/중국어 등을 지원 페이스북의 EnCodec 코덱을 사용 Bark는 CC-BY 4.0 NC 라이센스 이며, Suno 모델 자체는 상업용도로 이용 가능

(github.com/suno-ai)

24P by xguru 2023-04-24 | ★ favorite | 댓글 2개

매우 사실적인 다국어 음성 생성 가능
음악, 배경 소음 및 간단한 음향 효과 포함
웃음, 한숨, 울음 같은 비언어적 커뮤니케이션도 연출 가능
영어/한국어 및 독일어/프랑스어/일본어/중국어 등을 지원
페이스북의 EnCodec 코덱을 사용
Bark는 CC-BY 4.0 NC 라이센스 이며, Suno 모델 자체는 상업용도로 이용 가능

dlehals2 2023-04-24 [-]

Bark's generations sometimes differ from my prompts. What's happening?
Bark is a GPT-style model. As such, it may take some creative liberties in its generations, resulting in higher-variance model outputs than traditional text-to-speech approaches.

이 부분이 무섭네요 ㄷㄷ 가끔 프롬프트와 다르게 생성되는 이유가 모델의 창의적 자유?를 위해서라고..

답변달기

kuroneko 2023-04-24 [-]

한국어 생성을 꽤 잘 하는게 신기하네요.

답변달기

Bark - 트랜스포머 기반의 Text-To-Audio 모델

함께 보면 좋은 글 β

댓글과 토론