16P by xguru 2023-08-03 | favorite | 댓글 2개
  • 텍스트 기반 사용자 입력에서 고품질 오디오와 음악을 생성하는 Generative AI
  • MusicGen + AudioGen + EnCodec 디코더로 구성되어 각각 음악, 오디오 생성 및 오디오 압축을 담당
  • 연구 목적 및 사람들에게 기술에 대한 이해를 높이기 위한 용도로 사용 가능
  • 전문 음악가가 악기에서 한개의 음도 연주하지 않고 새로운 곡을 작곡하거나, 인디 게임 개발자가 실제와 같은 음향 효과 및 배경 소음을 저 비용으로 구현 가능

공개된 소스로 가능한지는 모르지만, Digital Audio Workstation 소프트웨어에 악기별 트랙으로 얹을 수 있다면 정말 활용도가 엄청 나겠네요.

소식 감사해요

Hacker News 의견
  • 광고에 사용되는 AudioCraft와 같은 생성적 AI 모델은 A/B 테스트를 쉽게 만들어주고 창의적인 인력이 필요하지 않게 합니다.
  • Meta는 특허된 데이터를 사용하고 지불하지 않은 데이터는 사용하지 않는다고 강조하여 OpenAI와 구별하고 있습니다.
  • AudioCraft에서 사용하는 CC-BY-NC 라이선스는 오픈 소스 정의에 따라 오픈 소스 라이선스로 간주되지 않습니다.
  • AI로 생성된 콘텐츠의 쇄도로 인해 과거가 사라질 우려가 있으며, 진짜와 가짜 정보를 구분하기 어려워질 수 있습니다.
  • 기존 음악 라이브러리를 기반으로 음악을 생성할 수 있는 능력에 대한 추측이 있습니다.
  • 일부 사람들은 저작권 소유자가 AI 모델 데이터 입력을 통제하는 것은 "생각당당" 사회로 이어질 수 있다고 믿습니다.
  • Meta가 이러한 모델을 오픈 소스로 선택한 이유는 명확하지 않습니다.
  • 일부 사용자들은 설치와 모델 사용 방법에 대한 문서를 찾는 데 어려움을 겪고 있습니다.
  • AudioCraft의 MBD와 EnCodec 변형 사이에는 음질 차이가 눈에 띕니다.
  • 한 댓글러는 Spotify가 AudioCraft와 같은 생성적 AI 모델을 사용하여 자체 음악을 생성하고 수익성을 위해 레이블에 의존성을 줄일 수 있다고 제안합니다.