ChatGPT로 사진에서 '역방향 위치 검색'을 실행하는게 유행하고 있음
(techcrunch.com)- ChatGPT를 이용한 이미지 기반 위치 추적이 바이럴 트렌드로 확산되고 있음
- OpenAI의 최신 모델 o3와 o4-mini는 이미지 분석 및 웹 검색 기능을 조합해 높은 정확도의 위치 추론 수행
- 사용자들은 o3에 레스토랑 메뉴, 거리 풍경, 인물 사진 등을 입력해 "GeoGuessr" 게임처럼 위치 유추 시도
- 프라이버시 침해 우려가 커지며, OpenAI는 안전 장치가 있지만 명확한 방지책 부족
- OpenAI는 남용 감지 및 대응 시스템 존재를 밝혔지만, 실제 제한은 여전히 부족하다는 지적 있음
ChatGPT를 활용한 이미지 기반 역추적 트렌드
- 최근 사용자들 사이에서 ChatGPT를 통해 이미지 속 위치를 추적하는 트렌드가 확산 중임
- OpenAI가 출시한 신규 모델 o3와 o4-mini는 이미지 내 시각 정보를 추론할 수 있는 기능이 탑재됨
- 흐릿하거나 왜곡된 사진도 자르기, 회전, 확대 등의 전처리를 거쳐 분석 가능함
- 해당 기능은 웹 검색 기능과 결합되어 도시, 랜드마크, 식당, 술집 등의 위치 추론에 탁월한 성능을 보임
GeoGuessr처럼 활용되는 ChatGPT
- 사용자들은 o3에게 "GeoGuessr처럼 행동하라"는 요청을 하며 인스타그램 스토리 캡처, 거리 사진, 메뉴판 등으로 위치 추정 시도
- GeoGuessr 은 사진을 올리고 위치를 찾는 온라인 게임
- ChatGPT는 이전 대화 기록이나 EXIF 메타데이터 없이도 시각 단서만으로 위치를 유추함
- 특히 o3는 특정 상황에서 GPT-4o보다 뛰어난 성능을 보였음
예시: 어두운 바에 걸린 보라색 코뿔소 장식 사진을 보고
- GPT-4o는 "영국 펍"이라고 오답
- o3는 정확히 "윌리엄스버그의 스피크이지 바"라고 정답 추론
GPT-4o도 놀라운 정확도 보여줌
- TechCrunch가 진행한 테스트에서는 GPT-4o도 상당히 높은 정확도를 보였으며, 처리 속도는 더 빨랐음
- 단, 특정 이미지에서는 o3만이 정확히 위치를 알아낸 사례도 있음
- 그러나 o3도 완벽하진 않으며, 답을 내지 못하거나 엉뚱한 장소를 제시하는 경우도 존재함
잠재적인 프라이버시 침해 우려
- 아무런 제약 없이 누구나 타인의 사진을 이용해 위치를 추적할 수 있는 점은 큰 문제
- 예를 들어 인스타그램 스토리를 캡처해 도킹(doxxing) 위험으로 이어질 수 있음
- 현재 o3와 o4-mini 모델에 대해 OpenAI는 공식 안전 보고서에서 이 문제를 언급하지 않음
OpenAI의 공식 입장
- 기사 게재 몇 시간 후, OpenAI는 TechCrunch에 다음과 같은 성명을 전달함:
“o3와 o4-mini는 ChatGPT에 시각적 추론 능력을 추가하며,
접근성, 연구, 긴급 대응 상황에서 유용하게 사용될 수 있음.
우리는 민감한 정보 요청을 거절하도록 학습시켰고,
개인 식별 방지 및 남용 감시 메커니즘을 도입했으며,
정책 위반 시 적극적으로 대응하고 있음.” - 하지만 여전히 위치 역추적 기능에 대한 구체적 차단 기제나 기술적 제어는 부족한 상황
본문에 나오듯이 이미 '게임'의 형태로 즐기던 것인 만큼 이전에도 일반인이 접근하기 힘든 수준은 아니었죠.
위협은 위치를 특정당하면 안 되는 상황에 쉽게 위치를 특정할 수 있는 사진을 올릴 때 생기는 것입니다.
그 이전에 Hacker News 댓글에도 있듯이 공개된 인터넷에 무언가를 올린다는 것이 이미 정보의 노출을 상정해야 하는 일이고요.
Hacker News 의견
- "좌측 운전 차량, 그러나 교통은 좌측 통행"이라는 추론이 있지만, 사진은 어느 쪽으로 교통이 흐르는지 힌트를 주지 않음
- "상점 간판의 언어가 스페인어나 포르투갈어보다는 라틴 알파벳 비즈니스 이름처럼 보임"이라는 의견에 대해 스페인어와 포르투갈어도 라틴 알파벳으로 쓰여짐
- 거리 사진을 찍고 일부 랜드마크를 제외한 후, 약 500km 정도 오차가 있었으나 많은 것을 정확히 추론함
- 전체 사진을 사용했을 때, 유명한 섬을 잘못 인식함
- 구글 이미지의 랜드마크 사진을 사용했을 때도 같은 섬으로 인식함
- ChatGPT를 넘어서는 기술임을 확신함
- ChatGPT로 만든 사진을 Midjourney의 "Describe" 기능에 입력했을 때, 정확한 위치를 포함한 설명을 생성함
- 배경의 산 배열이 특정 지역을 나타내는 것으로 보임
- 새로운 트렌드가 생길 때마다 거부감을 느낌
- 로마 거리 사진을 보여주었을 때, 정책에 위배된다고 삭제됨
- 자동차 라디오 시계 설정 방법을 묻자, 정확한 방법과 라디오 모델을 식별함
- "새로운 개인정보 위험"에 대한 우려
- 인터넷 자체가 개인정보 위험을 내포하고 있음
- 매번 새로운 위험을 강조하는 것은 과도함
- 지오게서(Geoguessr) 게임에서 위치 추론 기술이 발전할 것임
- 위성 이미지나 비위성 이미지를 통해 위치를 정확히 파악할 수 있는 기술이 개발될 것임
- Geoguessr 게임에서 Gemini 2.5로 22k/25k 점수를 얻음
- 독일 에센과 영국 셰필드에서는 정확했으나, 이탈리아와 러시아에서는 오차가 있었음
- 단일 이미지로만 추론한 결과임
- 베트남 다낭시 한강에서 찍은 사진을 분석하여 정확히 위치를 파악함
- 분석 기술이 있음을 확인함
- 거리 사진을 통해 도시를 정확히 파악했으나, 구체적인 거리나 이웃은 잘못 추론함
- Google의 역 이미지 검색이 더 정확한 결과를 제공함