Shazam은 어떻게 동작하는가?
(cameronmacleod.com)- 노래 인식앱 Shazam 창업자들의 2003년 논문을 그대로 구현한 오픈소스 abracadabra 개발자가 정리한 내용
- 논문에서 설명 안된 부분에 대해서 자신이 채운 방법을 소개하고 파이썬 코드와 연결
- 왜 노래 인식은 어려운가?
- Spectrogram 계산하여 Peak들 찾고, 그 Peak들을 해쉬해서 핑거프린트 생성
- 핑거프린트와 DB의 해쉬들 매칭
흥미로운 내용 공유해주셔서 감사합니다
pure technological magic 이라는 표현이 와닿네요
본문에 포함되어 있는 푸리에 변환을 설명해주는 유튜브도 재밌게 봤어요 :)