생성형 AI 검색 최적화(GEO), 대조군 두고 측정해봤다 — 정비한 치과만 2주새 11%→27%
(boily.co.kr)ChatGPT·Claude·Gemini·Perplexity에게 "○○동 치과 추천"을 물으면 어떤 병원을 답할까?
이걸 측정하는 도구를 만들며, 직접 대조 실험을 해봤습니다.
■ 세팅
- 질문 100개를 고정(동결)하고, 4개 AI에 각각 웹검색 켠 상태로 격주 측정
- 응답에서 특정 병원이 추천·언급되는 비율(노출률)을 집계
- 출발점이 거의 같던 두 치과(둘 다 AI 노출 ~11%)로 A/B
■ 결과 (2주)
- A 치과: 홈페이지 GEO·AEO 정비(구조화된 진료·의료진 정보, 크롤 가능한 콘텐츠, 내부링크)
→ 약 27% (+16%p), 3개 엔진에서 고르게 상승 - B 치과(대조군, 정비 안 함): 약 10%로 제자리
대조군을 둔 이유는 "그냥 시간이 지나서/AI가 업데이트돼서 오른 것"과 구분하기 위해서입니다.
정비한 쪽만 올랐다는 건, 최소한 이번 관찰에선 정비가 변화를 만들었다는 신호로 봅니다.
■ 한계 (정직하게)
- 단일 회차·소수 사례라 인과로 단정하지 않습니다.
- 2주 뒤 다시 측정해 유지·재현되는지 추세로 확인할 예정입니다.
- 병원명은 비공개(지역만 표기).
자세한 수치·차트: https://boily.co.kr/guide/geo-repair-case-2026-06
댓글과 토론
실험 설계에 문제가 있네요. 정말 'GEO'때문에 오른 것인지를 보고자 한다면, GEO를 제외한 가능한 모든 변수를 통제해야죠. 이 경우에는 대조군으로 "아무것도 안 한 치과"가 아니라, "SEO만 한 치과"가 더 적절해 보입니다. 본문 내용만으로는 GEO를 해서 오른 건지, 방치하던 홈페이지를 개선해서 오른 건지 알 수가 없어요.