1P by GN⁺ 1시간전 | ★ favorite | 댓글 1개
  • Spotify의 AI DJ 기능이 클래식 음악을 제대로 인식하지 못하는 사례를 통해 AI의 한계와 음악 메타데이터의 문제를 드러냄
  • 사용자가 “Beethoven의 7번 교향곡”을 요청했을 때, AI는 작품의 구조나 악장 순서를 이해하지 못하고 엉뚱한 악장이나 다른 작곡가의 곡을 재생함
  • “모든 악장을 순서대로 재생하라”는 구체적 명령에도 불구하고, AI는 잘못된 교향곡이나 순서 뒤섞인 녹음을 선택하며 일관성 없는 결과를 보임
  • 이러한 오류의 근본 원인은 디지털 음악 메타데이터가 팝 음악 중심으로 설계되어 작곡가·작품·악장 개념을 반영하지 못하기 때문임
  • 글은 AI의 “지능”에 대한 기대와 현실의 괴리를 지적하며, 서양 음악 전통의 보존이 기업 이익과 무관하다는 냉소적 결론으로 마무리됨

AI DJ 사용 경험과 문제 인식

  • 글은 “AI가 정말로 지능적인가?”라는 질문으로 시작하며, AI의 오류에 대한 책임이 프로그래머에게 있는지를 묻는 문제의식 제시
  • Spotify 앱의 AI DJ 기능을 사용해 클래식 음악 검색을 시도하며, 기존의 Spotify 검색 구조의 한계를 다시 확인함
  • 필자는 팝 음악이 아닌 500년간의 서양 음악 전통을 즐겨 듣는 사용자로서, Tallis부터 Shaw까지 이어지는 작곡가들을 예시로 제시

디지털 음악 메타데이터의 구조적 한계

  • 디지털 음악 파일의 메타데이터는 Artist, Album, Song 세 가지 태그로 구성되어 있으며, 이는 팝 음악 중심의 설계
  • “Song”이라는 용어가 기악곡에도 사용되는 비문학적 표현이라 지적하며, 클래식 음악에서는 “composition”이나 “work”가 적절하다고 설명
  • 클래식 음악의 핵심 구조인 ‘악장(movement)’ 개념이 메타데이터에 반영되지 않아, Spotify가 작품의 전체 구성을 인식하지 못함

Beethoven 7번 교향곡 재생 실험

  • “Play Beethoven’s 7th Symphony” 명령 시, AI는 2악장 Allegretto만 재생하고 이후 전혀 관련 없는 곡들을 이어서 재생함
  • “Play Beethoven’s 7th Symphony in its entirety” 요청에도 AI는 “9분짜리 전곡”이라 잘못 인식하고 2악장만 재생
  • “Play Beethoven’s 7th Symphony from beginning to end” 명령에서도 동일하게 2악장만 재생, 이후 John Field의 곡으로 전환
  • “Play all four movements” 요청 시에는 1악장부터 시작하지만 서로 다른 오케스트라의 녹음이 섞여 순서가 뒤바뀜
  • “Play all four movements in numerical order” 명령에서는 3번 교향곡 1악장으로 시작하는 등 완전히 잘못된 결과 발생

AI의 음악 이해 부족

  • AI가 작품의 악장 구조나 순서 개념을 전혀 이해하지 못함을 지적
  • Beethoven의 교향곡이 4악장으로 구성된다는 사실은 Wikipedia 첫 문장만 읽어도 알 수 있음에도 불구하고, AI는 이를 반영하지 못함
  • 필자는 이러한 오류를 오디오북의 마지막 장을 먼저 읽는 것에 비유하며, AI의 무지함을 풍자

결론: AI와 음악 전통의 단절

  • AI가 음악을 “작곡할 수 있다”는 주장에 회의적 시각을 제시하며, 기본 개념조차 이해하지 못하는 AI가 창작을 논할 수 없다고 비판
  • Spotify DJ가 아직 베타 단계임을 인정하면서도, 기업이 서양 음악 전통을 보존할 동기가 없다는 현실적 비관으로 글을 마무리
  • 전체적으로 AI 기술의 한계, 메타데이터 설계의 편향, 문화적 무관심이 결합된 문제로 제시됨
Hacker News 의견들
  • 글쓴이가 기술적 배경을 가진 사람인데도 이상한 글을 썼다고 느낌
    이건 AI 문제가 아니라 제품 설계 문제임. Spotify DJ는 사실상 “셔플 + 음성 멘트” 수준이고, 일부러 앨범 전체를 재생하지 못하게 만든 코드가 있을 가능성이 큼
    AI를 하나의 개념으로 일반화하는 건 잘못된 접근임. “이 기능이 안 되면 AI는 쓸모없다”는 식의 논리는 범주 오류(category error) 에 해당함
    글 전체가 여러 의견을 뒤섞어 혼란스럽고, 절반은 클래식 곡 이름 나열에 불과함. Spotify DJ가 별로라는 데는 동의하지만, 설득력 있는 비판 방식은 아님
    • Charles Petzold는 단순한 기술자가 아니라 Win32와 MFC의 정석서 저자임. 그를 “기술자”라고만 부르는 건 Donald Knuth를 “강사”라고 부르는 수준임
    • Spotify의 제품 조직이 심각하게 비효율적임. 데스크톱과 모바일 앱의 기능이 제각각이고, CarPlay에서는 단순한 작업조차 폰으로 직접 하는 게 훨씬 빠름
    • 글쓴이가 일부러 분노 유도(ragebait) 를 한 것 같음. “AI가 음악을 작곡할 수 없다”는 논리는 “LLM이 R의 개수를 못 세니 문법적으로 올바른 문장을 못 만든다”는 말만큼 터무니없음
    • 오히려 반대로 봄. 기술적으로 충분히 가능한데도 이런 결과가 나온다는 점에서 “이건 변명의 여지가 없다”는 메시지를 잘 전달했다고 생각함
    • “범주 오류”라기보다는 논점 일탈(begging the question) 에 가까움. DJ 기능과 작곡 능력을 동일선상에 두고 결론을 미리 가정한 논리임
  • AI DJ를 직접 써보진 않았지만, 글쓴이의 비판에는 공감하기 어려움
    기술의 장단점을 탐구하려는 시도가 없고, 좁은 사례로 전체 AI를 폄하하는 전형적인 패턴임. AI는 인간이 아니므로 한계가 있음은 당연함
    AI 코딩 보조에서도 비슷한 현상을 봤음. 보안 문제를 이유로 전면 부정하지만, “한 문장으로 네이티브 Mac 앱을 만드는” 가능성은 무시함
    • “AI가 할 수 있는 것”과 “AI 전도사들이 주장하는 것”은 전혀 다름. 그들은 한계에 대한 질문에 “AI를 더 쓰면 된다”거나 “5년 뒤엔 다 해결된다”는 식으로 답함. 이런 과장된 약속이 신뢰를 무너뜨림
    • “한 문장으로 앱을 만든다”는 예시는 품질이 확률적(probabilistic) 이기 때문에 실제로는 신뢰하기 어려움
    • 실제로는 “Hello World” 수준이 아니라면 한 문장으로 완성된 앱을 만드는 건 불가능함. 수정과 보완이 필수임
    • Spotify 제품 비판을 무시하고 “Mac 앱 한 문장” 얘기로 새는 건 이상한 논리 전개임
    • 글쓴이의 AI 일반화에는 동의하지 않지만, Spotify DJ는 정말 형편없는 제품임. Claude Code와는 비교 불가임
  • AI DJ는 AI가 식당 리뷰를 쓰는 것과 비슷한 느낌임. 가능은 하지만, 사람들은 기계의 의견보다 전문가 인간의 취향을 원함
    Hör Berlin 같은 유튜브 DJ 믹스의 매력은 DJ의 선택과 해석, 그리고 그들의 문화적 배경임. AI가 최적화된 리스트를 뽑는 건 그 본질을 잃게 함
    • 미래는 큐레이션의 시대가 될 것임. 깊은 지식과 감각을 가진 인간 큐레이터가 오히려 더 가치 있게 평가받을 것임
    • Spotify의 믹스는 10년 전부터 큰 차이가 없음. DJ가 어떤 믹스를 고르고 LLM이 멘트를 붙이는 정도임. 결국 ML 추천 시스템일 뿐임
    • SoundCloud의 자동 리스트로 새 음악을 발견하는 걸 좋아함. 완벽하진 않지만 의도적 탐색의 재미가 있음
    • 실제 공연장에서 관객 반응을 읽는 인간 DJ와 Spotify DJ는 완전히 다름. 후자는 단순 셔플에 LLM 멘트를 덧붙인 수준임
    • 물론 예술을 작품 자체로 소비하는 사람도 있음. 인간 큐레이터의 존재가 필수는 아님
  • 문제의 핵심은 음악 라이선스 구조임. 라디오형 라이선스는 사용자가 트랙을 직접 선택할 수 없고, 앨범 전체 재생도 제한됨
    Spotify는 비용 절감을 위해 라디오형과 인터랙티브형 라이선스를 혼합 사용함. AI가 만든 재생목록은 사용자 선택이 아니므로 라디오형으로 처리될 가능성이 큼
  • 클래식 음악 중심이라면 Apple Music Classical로 옮기는 게 훨씬 나음. PDF 북클릿 제공, 연주자별 비교, 탐색 기능 등 모든 면에서 우수함
    • Apple Music Classical이나 Idagio가 훨씬 낫다고 생각함. Spotify는 클래식 시장이 작아서 신경 쓰지 않음
  • Spotify 같은 추천형 서비스는 지루함. 인간 DJ의 선곡이 훨씬 흥미로움
    dublab, NTS1, NTS2 같은 방송을 즐겨 듣는데, 예상치 못한 음악을 접할 수 있음
    • AI 큐레이션의 가장 큰 문제는 입력 데이터의 질임. 유사성 기반, 무작위성, 패턴 기반 모두 한계가 있음. 결국 인간의 취향 다양성을 포착하지 못함
      수억 달러를 투자해도 완벽한 추천은 불가능했고, 인간 DJ의 사회적 신뢰(social proof) 를 대체하지 못함
    • 추천 시스템 연구에서는 이를 세렌디피티(serendipity) 문제라고 부름. 관련성과 놀라움을 동시에 높이는 건 매우 어려운 과제임
    • 나는 직접 믹스테이프를 만들거나 CD에서 추출한 MP3를 섞어 듣는 걸 선호함. 외국어 유지용으로 유럽 라디오도 듣고, YouTube나 KEXP, Tiny Desk 같은 채널도 즐김
    • NTS는 정말 훌륭함. 스트리밍 알고리즘은 대체로 배경 소음용으로만 설계된 느낌임
    • 추천 고마움. NTS를 틀어봤는데 계속 듣게 됨. 다른 추천도 환영임
  • 글의 초반부터 클래식 작곡가 나열이 너무 과시적으로 느껴져서 흥미를 잃었음. DJ라는 단어 자체가 현대 전자음악과 더 어울림
    • “that moste illustriouse of musical traditionnes” 같은 표현에서 과한 허세가 느껴졌음
    • DJ라면 결혼식이나 클럽에서 팝이나 댄스곡을 트는 사람이지, 바흐나 비발디를 믹스하진 않음
    • 마치 AI가 작곡가 목록을 자동으로 생성한 듯한 인상임
    • 나도 그렇게 느꼈음. 게다가 “사람들이 잘 모를 거란 걸 안다”고 굳이 덧붙이는 게 웃김
    • 처음엔 농담인 줄 알았는데 끝까지 진지해서 당황했음. Petzold의 책으로 Windows 프로그래밍을 배웠는데, Transformer 모델의 기본 원리조차 모르는 듯한 발언이라 놀랐음
      음악도 팝과 서양 클래식만이 전부인 듯한 시각이 아쉬움
  • “서양 문명의 기둥” 운운하는 문장에서 읽기가 힘들어졌음. 결국 결론은 뻔함 — Spotify는 클래식에 맞지 않음, 다른 서비스를 쓰면 됨
  • 글의 핵심 질문은 “AI가 멍청하게 행동할 때 책임은 누구에게 있는가?”였음
    나는 이걸 프롬프트 설계 실패로 봄. 같은 요청을 ChatGPT 예시로 테스트하면 AI가 올바르게 반응함
    즉, Spotify의 모델이 약하거나, 내부 프롬프트가 잘못된 방향으로 유도했을 가능성이 큼
    “AI가 음악을 작곡할 수 없다”는 주장도 잘못된 비교임. 이미 AI는 음악 이론을 이해하고 작곡 가능성을 보여줬음. 결국 품질과 취향의 문제임
    • 만약 프롬프트가 “유사 아티스트 곡으로 이어가라”는 식이라면, 로열티가 낮은 곡으로 유도하는 비즈니스 논리일 수도 있음
    • 사용자에게 책임을 돌리는 건 불쾌함. 프롬프트는 명확했음. 이런 식의 AI 산업의 확산이 세상을 더 멍청하고 단조롭게 만들고 있음
  • 이 글은 언어가 사고를 규정한다는 언어상대성의 좋은 예시임
    사람들이 LLM을 “AI”라고 부를 때마다 인식이 왜곡됨.
    이는 마케팅 업계의 최대 성공이자, 세상에 끼친 가장 큰 피해 중 하나임