23P by xguru 10시간전 | ★ favorite | 댓글 2개
  • Suno 같은 상용 수준의 음악 생성 품질을 일반 소비자 하드웨어에서도 구현한 오픈소스 음악 생성 모델
  • 10초 이내(RTX 3090) 로 전체 곡 고속 생성
  • 4GB VRAM 이하 환경에서도 로컬 실행 가능하며, LoRA 기반 개인화 학습으로 사용자의 음악 스타일 반영 지원
  • 커버 생성, 리페인트(부분 재생성) , 보컬→BGM 변환, 트랙 분리 및 멀티트랙 합성 지원
  • 50개 이상 언어의 가사 프롬프트로 구조·스타일 제어 가능
  • 성능 및 품질 특징
    • 상용 모델(Suno v4.5~v5 수준) 이상의 음질과 스타일 다양성 제공
    • 1000개 이상 악기·장르 지원, 세밀한 음색 제어 가능
    • 최대 10분(600초) 길이의 오디오 생성 및 8곡 동시 배치 생성 지원
  • LoRA 학습 기능 내장
    • Gradio UI에서 원클릭 주석·학습 가능
    • RTX 3090(12GB) 기준 8곡·1시간 내 학습 완료
    • Side-Step 모듈을 통한 고급 LoRA/LoKR 미세조정 및 VRAM 최적화 지원
  • 멀티플랫폼 호환성 : Mac(MLX) , AMD ROCm, Intel XPU, CUDA GPU, CPU 모두 지원하며 자동 환경 감지 및 설정 스크립트 제공
  • 다양한 인터페이스 제공
    • Gradio Web UI: 직관적 웹 기반 음악 생성 인터페이스
    • Studio UI: DAW 유사한 고급 편집 환경
    • Python API / REST API / CLI: 서비스 통합 및 자동화 지원
  • 영어·중국어·일본어·한국어로 제공되는 다국어 문서 세트 제공
  • MIT License : 창작·교육·엔터테인먼트 목적의 사용을 권장, 저작권 및 문화적 민감성 준수
  • 공식 사이트: acemusic.ai
  • 기술 보고서: arXiv:2602.00744
  • 샘플 들어보기

오늘 한 번 써봐야겠네요

샘플중에 kpop도 있는데 이정도를 로컬모델에서 생성하는거면 꽤 좋네요.
개인이 만드는 게임이나 영상의 배경 음악 정도는 이제 정말 간단할듯