7P by xguru 3달전 | favorite | 댓글과 토론
  • 간단한 텍스트 프롬프트에서 최대 47초 분량의 고품질 오디오 데이터를 생성할 수 있게 해줌
  • 특화된 훈련 덕분에 드럼 비트, 악기 리프, 앰비언트 사운드, 폴리 녹음 및 음악 제작과 사운드 디자인을 위한 기타 오디오 샘플을 만드는 데 이상적
  • 이 오픈 소스 릴리스의 주요 장점은 사용자가 자신의 커스텀 오디오 데이터에 모델을 미세 조정할 수 있다는 것
    • 예를 들어, 드러머는 자신의 드럼 녹음 샘플에 미세 조정하여 새로운 비트를 생성할 수 있음
  • Stable Audio와 어떻게 다른가?
    • 상용 제품인 Stable Audio는 최대 3분 길이의 일관된 음악 구조를 가진 고품질 풀 트랙과 오디오-오디오 생성 및 일관된 다중 파트 음악 작곡과 같은 고급 기능을 제공
    • 반면에 Stable Audio Open은 오디오 샘플, 사운드 효과 및 프로덕션 요소에 특화되어 있음
      • 짧은 음악 클립을 생성할 수는 있지만, 전체 노래, 멜로디 또는 보컬에는 최적화되어 있지 않음
      • 이 오픈 모델은 창작 커뮤니티와 함께 책임감 있는 개발을 우선시하면서 사운드 디자인을 위한 생성적 AI에 대한 통찰력을 제공
  • Stable Audio Open 모델 가중치는 Hugging Face에서 사용할 수 있음
    • 사운드 디자이너, 뮤지션, 개발자, 오디오 애호가들이 모델을 다운로드하고 그 기능을 탐구하며 피드백 권장