▲GN⁺ 2023-09-14 | parent | ★ favorite | on: Stable Audio - 빠른 타이밍 조절형 Latent Audio Diffusion(stability.ai)Hacker News 의견 본 기사는 빠른 타이밍 조건의 잠재 오디오 확산 기술인 'Stable Audio'에 대해 논의한다. 일부 사용자들은 생성된 솔로 피아노 음악이 깔끔하고 흥미롭다고 평가하며, 이를 보다 유연하게 활용하기 위한 악보로 쉽게 변환될 수 있을 것이라는 제안을 했다. 오디오와 비주얼 분야에서 AI가 이미지의 레이어나 브러시 스트로크, 음악의 구성 트랙과 같은 보다 구조적이거나 상징적인 출력을 생성하는 것에 대한 요구가 있다. 특히 음악적 배경을 가진 일부 사용자들은 생성된 음악 작품에 감동받지 못했으며, 이들은 반복적이고 상상력이 부족하다고 평가했다. 이 기술은 게임이나 고품질 음악이 우선적이지 않은 다른 애플리케이션에서 배경 음악을 생성하는 데 사용될 수 있다는 잠재력이 있다. 한 사용자는 이 기술이 Spotify에서 개인의 취향에 맞는 음악을 생성하는 데 사용될 수 있을 것이라고 제안했다. 모델이 공간 오디오 개념을 지원하거나 "이해"하는지에 대한 관심이 있다. 예를 들어, 알람 소리가 원형으로 움직이는 소리 등이다. 일부 사용자들은 멜로디, 코드 진행, 또는 공연 데이터와 같은 입력을 받아들일 수 있는 기술에 대한 요구를 표현하며, 이는 새로운 세대의 오디오 도구에 대한 잠재력을 제안한다. 일부 사용자들은 오디오 예제에서 "불쾌한 계곡" 효과를 주목했으며, 이는 소리가 혼합되어 깔끔한 음악적 목소리가 부족하다는 것을 의미한다. 이러한 비판에도 불구하고, 일부 사용자들은 이러한 기술의 존재에 대해 감사의 의미를 표현하며, 이를 Google과 Meta와 같은 회사들의 이전 조롱과 대비시켰다.
Hacker News 의견