나는 이 앱을 정말 좋아하는 사람임. 한 달 전쯤 큰 소리로 지저귀는 새가 누구인지 궁금해서 사용하기 시작했는데 Tufted Titmouse였음(지금은 내가 가장 좋아하는 새 중 하나, 엄청 멋진 외형임)과 Carolina Wren이었음(외형은 좀 덜하지만 노래로 충분히 매력 있음)
최근 한 달간 아침 일상이 완전히 바뀌어서 실내가 아닌 뒷마당에서 보내게 됨
새 모이통 채우고 청소하고, 다람쥐를 위해 땅콩도 두고, 커피와 아침 식사를 deck에 앉아 MerlinID 앱과 함께하는 루틴임
새로운 인간 언어는 공부 못하지만, 이 앱을 꾸준히 쓰면서 이제는 새 종뿐 아니라 개별 새의 독특한 울음소리나 목소리까지 구별 가능해진 상태임
유일하게 바라는 점은, 개별 새를 기록하고 해당 새의 녹음과 사진을 함께 저장하는 기능이 있었으면 하는 바람임
이 앱 개발자들에게 박수를 보내고, 오랜만에 써본 최고의 앱이라는 말 전하고 싶음
내가 무슨 뜻인지 잘 모르겠음 — "Explore" 탭과 Life List에서 사진과 울음소리를 함께 볼 수 있음
정말 좋은 앱인데, 개인적으로 아쉬운 점은 Life List에 새를 추가하는 UX가 너무 별로라는 점임
소리나 사진으로 식별하면, 언제 어디서 만났는지 묻는데 기본값이 정말 별로임 — 지금 위치랑 시간을 알고 있으면서도, 몇 달 전에 있던 예전 위치나 시간을 랜덤하게 불러오기도 함
바로 전에 현재 위치로 몇 마리나 입력했는지도 무시함
내게 Merlin은 "모두의 주머니 속 컴퓨터"가 진짜 뭘 할 수 있는지 제대로 보여 주는 예시임
엄청난 앱이고, 많은 사람들이 자연과 더 가까워지게 해줌
가끔 운영 단체에 후원하라는 안내가 오긴 하지만, 명확하고 직접적인 요청이고, 이상한 꼼수 마케팅이나 다크 패턴은 보이지 않음
정말 동감임! 보통 앱들은 사용자를 가상의 세상에 가둬두려 하기 십상인데, Merlin은 오히려 진짜 세상(자연)으로 사용자의 관심을 돌려주는 보기 드문 사례임
특히 소리 식별 기능은 누구든 쓸 수 있지만, 실제로는 불가능했던 경험을 가능케 해주고(귀로만 종을 구분), 자연 속에서 소리에 더 집중하도록 안내함
개인적으로 Merlin, 특히 eBird가 조류 관찰을 점수 경쟁처럼 유도하는 경향이 아쉽다고 생각함 — 새 개체수 감소 현상을 고려할 때, 전 세계를 돌며 최대한 많은 종을 보는 걸 독려하는 건 문제일 수도 있음
하지만 아주 작은 불만이고, Merlin은 누구에게나 자신 있게 추천할 수 있는 몇 안 되는 앱임
iNaturalist도 또 다른 보석 같은 앱임
해킹에 관심 있는 사람은 이런 앱들이 AllTrails, Couchsurfing처럼 상업화되지 않게 적극적으로 지원해줬으면 좋겠음
이런 앱이 주목받는 게 정말 반가운 현상임
개발자나 PM이 이 글 보고 피드백도 챙겼으면 하는 바람임
특히 sound ID가 콜롬비아 정글이나 숲처럼 네트워크가 전혀 없는 현장에서 기대 이상으로 잘 작동함
다만 앱의 다른 부분은 많이 미흡함
버튼이 자주 먹통이고 화면마다 일관성이 없으며 결과가 사라지는 등 여러 문제가 있음
iNaturalist와 연동 같은 기능도 있으면 좋겠고, 예전 녹음을 다시 열면 정작 당시 식별이 떴던 새가 "No matches"로 나옴
자연에서 여러 명이 그룹으로 다니다가 식별에 성공했는데, 누군가에게 보여주려 할 때 이미 사라진 경우가 많음
간편 피드백 버튼 정도만 추가되어도 과정을 크게 개선할 수 있을 것 같음
이 앱의 모든 개발자와 참여자들에게 깊은 감사의 마음을 전함
버튼이 안 먹고, 화면 일관성, 결과 날아감 등 문제
궁금해서 묻는데 어떤 기기 쓰는지? 난 여러 세대의 Google Pixel에서 몇 달간 매일 사용 중인데, 이런 문제는 단 한 번도 겪은 적 없음
"식별했는데, 나중에 보여줄 땐 결과가 사라짐"이 무슨 뜻인지도 잘 모르겠음 — 녹음 도중 식별이 떴는데, 중지하면 결과가 사라진다는 말인지?
내 경험으론 10분 넘는 긴 녹음을 할 때만 약간 렉이 생기는데, 그냥 끊고 새로 녹음 시작하는 팁을 쓰고 있음
콜롬비아 정글/숲에서도 sound ID가 잘 됨
흥미로운 경험임
내 경우 sound ID가 잘 되려면 (1) 폰을 주머니에 넣지 않고 공기 중에 두고(마이크 막히면 인식 안 됨), (2) 직접 움직이지 않아야 하며(내 발소리가 아무리 작은 새 소리도 다 방해), (3) Merlin 앱을 "초점모드"로 해야 됨 — 앱이 백그라운드에 있으면 아예 안 잡히는 느낌임(이건 단순 나만의 착각일 수도 있음)
가끔 큰 새를 바로 머리 위에서 들어도 인식 못 하다가, 멀리서 희미하게 들리는 건 아주 정확히 집음
개인적으로 sonogram(음향 스펙트로그램)에서 AI가 식별에 활용한 부분을 눈에 띄게 표시해줬으면 좋겠음
여러 새가 동시에 노래하면 이 sonogram을 해석하기가 특히 어려움
앱 나머지 부분은 많이 미흡
난 오히려 전혀 못 느꼈고, 이건 아마 폰 기기 차이일 수도 있음
어쨌든 좋은 앱임
앱 정말 사랑하는 사용자임
하지만 Android에서 시작 후 정확히 255초가 지나면 항상 크래시가 남(직접 시간까지 재봄)
버그 리포트를 남길 방법이 있는지 궁금함
내가 유럽에 있을 때 2번째 지역을 추가하려다가 앱이 완전 멈춤
재설치해야만 다시 쓸 수 있었음
iOS에선 지역 정보 추가가 완전히 고장난 상태임
내 친구들이 Sound ID 부분 연구팀에 참가 중임
팀이 정말 많은 노력을 들여 머신러닝 모델과 평가가 제대로 동작하게 만들었음
Sound ID는 흔히 볼 수 있는 "적당히 데이터만 넣어서 대충 훈련시키는" 접근이 아니라, 도메인 전문가의 세밀한 연구가 더 신뢰할 만한 결과를 줄 수 있음을 보여준 좋은 예임
Sound ID 기술이 매우 인상적임
언젠가 내 집 밖에서 여러 거리에서 새들이 동시에 엄청나게 시끄럽게 지저귀고 있었는데, 이 앱이 30초 만에 6종류를 정확히 집어냄
나름대로 저 6가지 다 합리적으로 보였음
"Fred", "Bertha", "Kevin" 이런 식으로 개별 새마다 고유 이름을 자동 할당해주는 기능도 있었으면 함
내 정원에 자주 오는 새들은 다 종류를 알고 있으니, 이제는 어떤 새가 계속오는지, 짝이 바뀌는지, 좀 떨어진 곳에서도 "아 이 Kevin이구나"라는 식으로 구분하고 싶음
검은새 같이 비슷한 개체가 많은 종은 어려울 수도 있겠지만, 어떤 종은 AI로 충분히 가능할 것 같음
오픈 API가 있었으면 함
나는 새소리로 새를 식별하는 몇 가지 아이디어가 있는데, Merlin의 인식 기술이 외부에 API 형태로 공개된다면 활용에 최고일 것 같음
내 집 근처에 매일 아침 울어주는 수탉이 있음
매번 앱에서 수탉 ID가 찍히나 기대해도 매번 안 뜸
연구팀 친구들에게 꼭 “수탉도 새다! 세계 최고의 알람이니 식별 대상에 넣어 달라”는 메시지 전달해줬으면 함
정말 놀라운 앱이지만, 종종 false positive(잘못된 식별)도 많이 나오긴 함
아마 이건 기술적으로 어쩔 수 없는 한계일 것 같음
새 노래를 앱으로 재생할 땐 정말 조심해야 함
며칠 전 식별 목록에 떴던 cardinal 노래를 우연히 눌렀더니, 내 울타리 근처에 둥지 튼 수컷 cardinal이 엄청난 반응을 보이고, 그날 이후 두 마리 모두 한 번도 안 보임
매일 보던 새인데, territory(영역) 의식이 강해서 그런지 단순히 앱으로 노래 재생한 것 때문에 둥지를 떠난 것 아닌지 걱정임
몇 번이나 "엉뚱하게 Merlin 앱을 주머니에서 무심코 켜짐" 상황을 겪은 적 있음
항상 그럴 때마다 “어 저 새 진짜 가까이 있는데?” → “폰 꺼내서 Merlin으로 알아볼까?” 하는 순간 벌어짐
조류 관찰하면서 "calling back"이라는 용어를 들었음
앱에서도 이런 경고를 더 강조할 필요가 있다고 생각함 — "새를 부르기 위해 이 기능 쓰지 마세요, 본인 참고용으로만 들으세요" 같은 문구
만약 내가 새인데, 낯선 새소리가 일정 감정이나 의미를 직접 내 포유류 인간이 큰 덩치로 근처에서 트는 모습을 보면 내 가족을 이주시키는 게 당연한 반응일 것 같음
Cardinal은 특히 territory 성향이 강해서 둥지 시기에 서로 내쫓음
휘파람, "pishing", 폰 사용 등 모두가 자연스러운 행동을 방해함
자동차, 트럭, 잔디깎기, 오토바이 등 온갖 소음도 새들에 큰 영향임
"Sibley Guides"의 playback proper use 자료를 참고하면,
특정 세력권에서 노래를 재생하면 그 소리에 이웃 새와 암컷 전부가 주의 깊게 반응하고, 실제 익명의 침입자를 쫓아내지 못하면 그 개체의 서열이 하락됐다라는 연구 결과도 있음
기술적으로 우리가 그들의 언어를 복제하고 재생 가능해졌고, 실제로 새 가족 해체 같은 영향이 있음
흥미로운 점 하나 소개함
Sound ID는 오디오를 비주얼 스펙트로그램으로 변환한 다음, 컴퓨터 비전 도구(Photo ID에 쓰인 기술과 유사)로 분석함
즉 앱 최상단에 스크롤되는 스펙트로그램은 단순한 장식이 아니라 실제 인식 메커니즘임
멋진 사실임
나는 오래전에 언어학 실험실에서 스펙트로그램을 분석해서 음소의 조음 위치를 파악하곤 했음
따라서 다른 음향표현보다 이를 모형 학습에 쓰는 게 당연하게 느껴짐
스펙트로그램은 실제 수동 식별이나, 개별 울음소리를 기억하는 데도 실용적임(최소한 내 경우엔)
오디오 신경망 대부분이 스펙트로그램을 기반으로 동작함
난 몇 년째 새 관찰을 꾸준히 해왔지만, 올해 처음 사운드 식별 앱을 쓰게 됨
덕분에 소리만으로 새로운 종을 12개 넘게 찾았고, 일부는 나 혼자서도 울음소리만 들어서 알아낼 수 있게 됨
이런 기술 덕에 이 취미를 완전히 다르게 즐길 수 있게 됨
적어도 이 분야에서 기계학습/AI가 분명히 긍정적인 영향을 준 사례임
나도 이 앱을 엄청 애용하는 팬임
하지만 불편한 점 하나는 컴퓨터 PC에서 이미지를 웹으로 올릴 수 없는 부분임
DSLR로 새 사진을 찍는 이용자 입장에선, 이미지 전송만 해도 너무 번거로움
이건 치명적이진 않지만, 결국 나는 다른 방식으로 새를 식별할 수밖에 없음
비 모바일 UX 옵션이 추가된다면 정말 유용할 것임
나는 Birder Framework(조류 분류 컴퓨터 비전 툴킷) 저자임 — https://gitlab.com/birder/birder
아직 초기 알파지만, DSLR 촬영사진 워크플로에 도움될 수 있음
웹 기반 대안이 필요하다면, Hugging Face 데모 공간도 있으니 바로 브라우저로 이미지를 업로드해서 써볼 수 있음
다만 이건 모델 시연용이고, 사용 경험 자체보단 각 지역(유럽, 아라비안 반도 등)에 따라 수동으로 모델을 고르는 불편함이 있음
아직 지역 커버리지가 한정적이지만 점점 더 추가될 예정임
나도 DSLR로 새 사진을 찍음
식별이 필요할 땐 그냥 모니터를 스마트폰으로 찍어서 Merlin에 넣음
48MP 사진은 필요 없고, 그냥 스크린샷으로도 충분함
나도 이 방법 씀
개인적으로 게시해도 좋다 생각되는 사진만 식별하고, 올리고 나면 폰으로 접근 가능(Flickr, IG 등)하니 쉽게 가져와서 앱에 쓰면 됨
나는 일반적인 조류 관찰자 입장에서 이 기술에 엄청난 감명을 받고 거의 다 신뢰하는 편임
단지 아주 비슷한 종이 등장하는 경우만 약간 의심가는 판단이 있을 수 있음
예를 들면, 집 주변에 Purple Finch가 실제로 존재하는지는 미심쩍음(맨날 House Finch만 보이니까)
그래도 Merlin의 신뢰성 덕분에 내가 틀렸을 수도 있다 생각할 만큼 믿게 됨
확실히 비슷한 종은 가끔 잘못 잡아내는 경우가 있음 — 최근엔 까마귀, Warbler에서 눈에 띄었음
그래도 대부분 정확한 결과고, 의심갈 땐 직접 새를 봐도 그만임
내 집 주변에 Blue Jay가 항상 많은데, 이 새들이 특정 매 종류의 울음소리를 기가 막히게 흉내내서 Merlin에서도 종종 매라고 식별하는 현상이 있었음
실제 매 소리를 들어도 Jay의 흉내와 거의 구분 못 했음
이론상 진짜 매일 수도 있겠지만, "bald eagle" 식별은 동네 애들이 소리 지른 걸 헷갈렸다는 게 더 설득력 있음
내가 영국에 살면서 Merlin의 일반적인 오류는 핀치류(특히 greenfinch의 "at rest" 트위터)를 goldfinch로 착각하는 경우였음
두 종은 외관으로는 확연히 구별 가능하지만, 귀로는 나조차도 구분 어렵기 때문에 Merlin을 탓하긴 힘듦
Hacker News 의견
최근 한 달간 아침 일상이 완전히 바뀌어서 실내가 아닌 뒷마당에서 보내게 됨
새 모이통 채우고 청소하고, 다람쥐를 위해 땅콩도 두고, 커피와 아침 식사를 deck에 앉아 MerlinID 앱과 함께하는 루틴임
새로운 인간 언어는 공부 못하지만, 이 앱을 꾸준히 쓰면서 이제는 새 종뿐 아니라 개별 새의 독특한 울음소리나 목소리까지 구별 가능해진 상태임
유일하게 바라는 점은, 개별 새를 기록하고 해당 새의 녹음과 사진을 함께 저장하는 기능이 있었으면 하는 바람임
이 앱 개발자들에게 박수를 보내고, 오랜만에 써본 최고의 앱이라는 말 전하고 싶음
정말 좋은 앱인데, 개인적으로 아쉬운 점은 Life List에 새를 추가하는 UX가 너무 별로라는 점임
소리나 사진으로 식별하면, 언제 어디서 만났는지 묻는데 기본값이 정말 별로임 — 지금 위치랑 시간을 알고 있으면서도, 몇 달 전에 있던 예전 위치나 시간을 랜덤하게 불러오기도 함
바로 전에 현재 위치로 몇 마리나 입력했는지도 무시함
엄청난 앱이고, 많은 사람들이 자연과 더 가까워지게 해줌
가끔 운영 단체에 후원하라는 안내가 오긴 하지만, 명확하고 직접적인 요청이고, 이상한 꼼수 마케팅이나 다크 패턴은 보이지 않음
특히 소리 식별 기능은 누구든 쓸 수 있지만, 실제로는 불가능했던 경험을 가능케 해주고(귀로만 종을 구분), 자연 속에서 소리에 더 집중하도록 안내함
개인적으로 Merlin, 특히 eBird가 조류 관찰을 점수 경쟁처럼 유도하는 경향이 아쉽다고 생각함 — 새 개체수 감소 현상을 고려할 때, 전 세계를 돌며 최대한 많은 종을 보는 걸 독려하는 건 문제일 수도 있음
하지만 아주 작은 불만이고, Merlin은 누구에게나 자신 있게 추천할 수 있는 몇 안 되는 앱임
해킹에 관심 있는 사람은 이런 앱들이 AllTrails, Couchsurfing처럼 상업화되지 않게 적극적으로 지원해줬으면 좋겠음
개발자나 PM이 이 글 보고 피드백도 챙겼으면 하는 바람임
특히 sound ID가 콜롬비아 정글이나 숲처럼 네트워크가 전혀 없는 현장에서 기대 이상으로 잘 작동함
다만 앱의 다른 부분은 많이 미흡함
버튼이 자주 먹통이고 화면마다 일관성이 없으며 결과가 사라지는 등 여러 문제가 있음
iNaturalist와 연동 같은 기능도 있으면 좋겠고, 예전 녹음을 다시 열면 정작 당시 식별이 떴던 새가 "No matches"로 나옴
자연에서 여러 명이 그룹으로 다니다가 식별에 성공했는데, 누군가에게 보여주려 할 때 이미 사라진 경우가 많음
간편 피드백 버튼 정도만 추가되어도 과정을 크게 개선할 수 있을 것 같음
이 앱의 모든 개발자와 참여자들에게 깊은 감사의 마음을 전함
하지만 Android에서 시작 후 정확히 255초가 지나면 항상 크래시가 남(직접 시간까지 재봄)
버그 리포트를 남길 방법이 있는지 궁금함
재설치해야만 다시 쓸 수 있었음
iOS에선 지역 정보 추가가 완전히 고장난 상태임
팀이 정말 많은 노력을 들여 머신러닝 모델과 평가가 제대로 동작하게 만들었음
Sound ID는 흔히 볼 수 있는 "적당히 데이터만 넣어서 대충 훈련시키는" 접근이 아니라, 도메인 전문가의 세밀한 연구가 더 신뢰할 만한 결과를 줄 수 있음을 보여준 좋은 예임
언젠가 내 집 밖에서 여러 거리에서 새들이 동시에 엄청나게 시끄럽게 지저귀고 있었는데, 이 앱이 30초 만에 6종류를 정확히 집어냄
나름대로 저 6가지 다 합리적으로 보였음
내 정원에 자주 오는 새들은 다 종류를 알고 있으니, 이제는 어떤 새가 계속오는지, 짝이 바뀌는지, 좀 떨어진 곳에서도 "아 이 Kevin이구나"라는 식으로 구분하고 싶음
검은새 같이 비슷한 개체가 많은 종은 어려울 수도 있겠지만, 어떤 종은 AI로 충분히 가능할 것 같음
나는 새소리로 새를 식별하는 몇 가지 아이디어가 있는데, Merlin의 인식 기술이 외부에 API 형태로 공개된다면 활용에 최고일 것 같음
매번 앱에서 수탉 ID가 찍히나 기대해도 매번 안 뜸
연구팀 친구들에게 꼭 “수탉도 새다! 세계 최고의 알람이니 식별 대상에 넣어 달라”는 메시지 전달해줬으면 함
아마 이건 기술적으로 어쩔 수 없는 한계일 것 같음
며칠 전 식별 목록에 떴던 cardinal 노래를 우연히 눌렀더니, 내 울타리 근처에 둥지 튼 수컷 cardinal이 엄청난 반응을 보이고, 그날 이후 두 마리 모두 한 번도 안 보임
매일 보던 새인데, territory(영역) 의식이 강해서 그런지 단순히 앱으로 노래 재생한 것 때문에 둥지를 떠난 것 아닌지 걱정임
항상 그럴 때마다 “어 저 새 진짜 가까이 있는데?” → “폰 꺼내서 Merlin으로 알아볼까?” 하는 순간 벌어짐
앱에서도 이런 경고를 더 강조할 필요가 있다고 생각함 — "새를 부르기 위해 이 기능 쓰지 마세요, 본인 참고용으로만 들으세요" 같은 문구
만약 내가 새인데, 낯선 새소리가 일정 감정이나 의미를 직접 내 포유류 인간이 큰 덩치로 근처에서 트는 모습을 보면 내 가족을 이주시키는 게 당연한 반응일 것 같음
Cardinal은 특히 territory 성향이 강해서 둥지 시기에 서로 내쫓음
휘파람, "pishing", 폰 사용 등 모두가 자연스러운 행동을 방해함
자동차, 트럭, 잔디깎기, 오토바이 등 온갖 소음도 새들에 큰 영향임
"Sibley Guides"의 playback proper use 자료를 참고하면,
나는 오래전에 언어학 실험실에서 스펙트로그램을 분석해서 음소의 조음 위치를 파악하곤 했음
따라서 다른 음향표현보다 이를 모형 학습에 쓰는 게 당연하게 느껴짐
덕분에 소리만으로 새로운 종을 12개 넘게 찾았고, 일부는 나 혼자서도 울음소리만 들어서 알아낼 수 있게 됨
이런 기술 덕에 이 취미를 완전히 다르게 즐길 수 있게 됨
적어도 이 분야에서 기계학습/AI가 분명히 긍정적인 영향을 준 사례임
하지만 불편한 점 하나는 컴퓨터 PC에서 이미지를 웹으로 올릴 수 없는 부분임
DSLR로 새 사진을 찍는 이용자 입장에선, 이미지 전송만 해도 너무 번거로움
이건 치명적이진 않지만, 결국 나는 다른 방식으로 새를 식별할 수밖에 없음
비 모바일 UX 옵션이 추가된다면 정말 유용할 것임
아직 초기 알파지만, DSLR 촬영사진 워크플로에 도움될 수 있음
웹 기반 대안이 필요하다면, Hugging Face 데모 공간도 있으니 바로 브라우저로 이미지를 업로드해서 써볼 수 있음
다만 이건 모델 시연용이고, 사용 경험 자체보단 각 지역(유럽, 아라비안 반도 등)에 따라 수동으로 모델을 고르는 불편함이 있음
아직 지역 커버리지가 한정적이지만 점점 더 추가될 예정임
식별이 필요할 땐 그냥 모니터를 스마트폰으로 찍어서 Merlin에 넣음
48MP 사진은 필요 없고, 그냥 스크린샷으로도 충분함
개인적으로 게시해도 좋다 생각되는 사진만 식별하고, 올리고 나면 폰으로 접근 가능(Flickr, IG 등)하니 쉽게 가져와서 앱에 쓰면 됨
단지 아주 비슷한 종이 등장하는 경우만 약간 의심가는 판단이 있을 수 있음
예를 들면, 집 주변에 Purple Finch가 실제로 존재하는지는 미심쩍음(맨날 House Finch만 보이니까)
그래도 Merlin의 신뢰성 덕분에 내가 틀렸을 수도 있다 생각할 만큼 믿게 됨
그래도 대부분 정확한 결과고, 의심갈 땐 직접 새를 봐도 그만임
실제 매 소리를 들어도 Jay의 흉내와 거의 구분 못 했음
이론상 진짜 매일 수도 있겠지만, "bald eagle" 식별은 동네 애들이 소리 지른 걸 헷갈렸다는 게 더 설득력 있음
두 종은 외관으로는 확연히 구별 가능하지만, 귀로는 나조차도 구분 어렵기 때문에 Merlin을 탓하긴 힘듦
나는 WhoBird를 애용하는데, 이 앱은 내장식(완전 오프라인)으로 동작하며, 인터넷이 없어도 잘 되고 fdroid에도 등록되어 있음(https://f-droid.org/packages/org.woheller69.whobird/)
Merlin도 체험해보고 두 앱 성능을 비교해 볼 계획임
나도 산속에서 항상 오프라인으로 쓰고 있음