GN⁺ 2023-12-06 | parent | ★ favorite | on: 샤잠 작동 원리 (2022)(cameronmacleod.com)
Hacker News 의견
  • Shazam의 효율적인 해시 기반 접근 방식

    2008년 Shazam이 출시될 때, 노래를 계산적으로 효율적으로 해시로 변환하는 방법을 개발하는 것이 현명한 접근이었음. 오늘날 같은 서비스를 출시한다면 기본적으로 모델을 훈련시키는 R&D 방식을 취할 것이지만, 이는 비효율적이고 비용이 많이 들 수 있음. 노래의 수가 유한하기 때문에 해시 기반 접근이 훨씬 더 성능이 좋을 수 있음.

  • Shazam의 지속적인 마법 같은 매력

    Shazam은 20년이 넘도록 마법 같은 느낌을 주는 드문 제품 중 하나로, 기술자들이 지향해야 할 대상임.

  • Shazam의 작동 원리를 설명하는 Wall Street Journal 비디오

    Wall Street Journal이 제작한 Shazam의 독특한 오디오 지문을 만드는 방법을 설명하는 아름다운 비디오가 있음.

  • Chromaprint와 AcoustID에 대한 설명

    Chromaprint는 스펙트럼의 최대값 대신 음높이 변화 패턴을 기반으로 작동하며, AcoustID라는 대규모 오픈 데이터베이스에 사용되어 MusicBrainz 녹음과 오디오 지문을 연결함. Shazam만큼 상업적 지원을 받지 않았음에도 불구하고 데이터베이스에 많은 음악이 포함되어 있어 놀라움.

  • Shazam과 디지털 신호 처리에 대한 흥미로운 글

    Shazam의 작동 방식과 디지털 신호 처리에 대한 훌륭한 입문서로, 오디오 지문 인식이 어떻게 작동하는지 이해하고자 하는 사람들에게 필독임.

  • 다른 미디어에도 적용 가능한 유사 알고리즘

    오디오 지문 인식뿐만 아니라 다른 미디어에도 적용 가능한 유사한 근사 알고리즘이 있으며, 실제 세계의 해싱을 이해하고자 하는 사람들은 이 글을 천천히 공부해야 함.

  • Every Noise At Once 웹사이트의 중요성

    Every Noise At Once는 음악 장르 분류와 새로운 노래 서명이 도입하는 분기 서브 장르에 알고리즘 매칭을 적용하는 놀라운 사이트로, 호스팅 문제로 인해 서비스가 중단될 위험이 있으며, 이는 월드 와이드 웹에 큰 손실이 될 것임.

  • 음악 인식 과정의 직관성

    이 시스템은 우리의 인식 과정과 매우 유사하게 멜로디 조각을 식별하고 이를 순서대로 매칭하는 방식으로, 우리가 몇 개의 음표를 듣고 노래를 인식하는 방식과 일치함.

  • 음악 인식에 사용되는 푸리에 변환

    음악 인식에 자주 사용되는 푸리에 변환에 대한 언급이 있으며, 이는 Echoprint라는 오픈 소스 버전에서도 사용되었지만, Spotify에 인수된 후 서비스가 중단됨.