컴퓨터 비전으로 구현한 OpenStreetMap의 지도 기능
(blog.mozilla.ai)- Mozilla.ai는 인공지능(AI)이 오픈 협업을 통해 커뮤니티를 강화할 수 있는 많은 기회를 제공한다고 믿음.
- 이러한 기회는 신중하게 설계되어야 하며, AI의 과도한 사용에 대한 우려가 증가하고 있음.
- 이러한 배경에서 OpenStreetMap AI Helper Blueprint를 개발 및 출시
-
왜 OpenStreetMap인가?
- 데이터는 AI 응용 프로그램의 중요한 구성 요소이며, OpenStreetMap은 가장 완전한 오픈 맵 데이터베이스를 유지하는 활발한 커뮤니티를 보유하고 있음.
- OpenStreetMap은 도로, 철도역 등 다양한 데이터를 제공하며, 위성 이미지와 결합하여 다양한 AI 모델을 훈련할 수 있는 무한한 가능성을 제공함.
- AI를 사용하여 지도 작성 과정의 느린 부분을 가속화하고, 중요한 부분에서는 인간의 검증을 유지하는 것이 목표임.
-
왜 컴퓨터 비전인가?
- 많은 지도 기능은 다각형으로 표현되며, 이를 찾고 그리는 작업은 시간이 많이 소요됨.
- 컴퓨터 비전 모델은 충분한 데이터가 제공되면 이러한 작업을 쉽게 수행할 수 있음.
- YOLOv11과 SAM2 모델을 사용하여 객체 감지 및 세분화 작업을 수행하며, 이 모델들은 가볍고 빠르며 로컬 친화적임.
-
OpenStreetMap AI Helper Blueprint
-
1단계: OpenStreetMap에서 객체 감지 데이터셋 생성
- OpenStreetMap 데이터를 위성 이미지와 결합하여 훈련에 적합한 형식으로 변환.
- Nominatim API와 Overpass API를 사용하여 관심 지역의 데이터를 다운로드하고, Ultralytics YOLO 형식으로 저장.
-
2단계: 객체 감지 모델 미세 조정
- YOLOv11 모델을 미세 조정하고, Hugging Face Hub에 업로드.
-
3단계: OpenStreetMap에 기여
- 미세 조정된 모델을 사용하여 여러 타일에서 추론을 실행하고, 새로운 객체를 수동으로 검증 후 OpenStreetMap에 업로드.
-
1단계: OpenStreetMap에서 객체 감지 데이터셋 생성
-
마무리 생각
- OpenStreetMap은 커뮤니티 주도의 세계 지도를 만드는 오픈 협업의 강력한 예시임.
- OpenStreetMap AI Helper Blueprint는 AI가 인간의 기여를 향상시킬 수 있음을 보여주며, 고품질 데이터의 가치를 강조함.
- Blueprint를 사용하면 수작업보다 약 5배 더 많은 수영장을 같은 시간에 매핑할 수 있음.
- 다른 지도 기능에 대한 모델 훈련을 실험해보기를 권장하며, 프로젝트에 기여하거나 확장할 수 있음.
Hacker News 의견
-
OpenStreetMap Foundation에서 인사드림. AI로 감지된 기능을 데이터베이스에 직접 추가하지 말아야 함
- 알고리즘은 오탐지 문제와 직선 또는 직사각형 객체를 흔들리게 매핑하는 문제를 가짐
- 누락된 기능을 감지하는 도구로서 유용하지만, 감지된 객체가 올바르게 그려졌는지 확인하기 위해 인간의 개입이 필요함
- 관련 가이드라인은 OpenStreetMap 위키에서 확인 가능함
-
수영장 감지에 이어 태양광 감지도 시도해보고 싶음
- OSM이 수작업으로 성장할 수 있다는 생각에 반대하는 의견이 많음
- 10년 동안 60,000건의 변경을 했지만, 인간 자원봉사자의 열정만으로는 글로벌 스케일의 매핑을 해결할 수 없음
- 데이터의 품질, 출처, 버그 보고 방법, 소비자 지침을 주석으로 달 수 있는 확장 가능한 프레임워크가 필요함
- 예를 들어, "지난 1년 동안 인간이 매핑한 유형 X의 비즈니스"를 쿼리하고 싶을 때, "체크 날짜"로 어느 정도 가능함
- 그러나 속성의 정확성이나 매퍼가 이름/위치만 확인했는지 알 수 없음
- 매달 자동으로 데이터를 유지하기 위해 모든 장소의 영업 시간을 수집하는 것이 더 나을 수 있음
- 신뢰할 수 있는 특정 출처만 필터링할 수 있다면 데이터 소비자로서 더 좋을 수 있음
- AI로 추론된 POI와 같은 제한이 있어도 데이터를 사용할 수 있음
-
자동 매핑을 직접 경험한 후 매우 경계하게 됨
- 남미를 오토바이로 여행했는데, OSM에는 자동화된 것처럼 보이는 많은 편집이 있어 특정 지역에서는 거의 사용할 수 없음
- 시골 도로뿐만 아니라 꽤 큰 도시에서도 발생함
-
몇 년 전 이 분야에서 일한 경험이 있음
- 많은 기존 모델, 데이터셋, 도구 등이 존재함
- 관련 자료는 GitHub에서 확인 가능함
-
우리는 위성 이미지에서 보이는 것을 매핑하는 것이 아니라, 실제 지상 정보를 매핑하고 있음
- AI로 상상된 것을 기여하지 말아야 함
-
Google은 이를 허용하지 않지만, Mapbox는 비상업적 목적이나 OSM에 사용되는 경우 허용함
- Mapbox의 위성 이미지를 사용하여 파생 벡터 데이터셋을 생성할 수 있음
-
Mozilla가 좋은 브라우저를 만드는 데 집중했으면 좋겠음
-
몇 달 전 비슷한 작업을 했음 (작은 규모의 지리 데이터)
- 관련 자료는 GitHub에서 확인 가능함
-
SAM/2를 미세 조정하여 수영장이나 태양광 배열을 감지하는 방법에 대한 세부 정보를 보고 싶음
- 커뮤니티 회복력 프로젝트에 유용하지만 SAM2 미세 조정을 따라갈 수 없었음
- Yolov8 모델은 태양광을 잘 찾고 분할하지만, 가장자리가 매우 나빠서 많은 작업이 필요함
- SAM2로 훈련된 결과는 훨씬 나아 보임
- 정확성 문제로 인해 OSM에 추가하지 않겠지만, 다른 곳에서 사용할 수 있음
-
이를 '헤드업 디지타이징'이라고 불렀음