9P by xguru 2020-07-07 | favorite | 댓글 2개

- 핀터레스트가 사용자가 Pin한 이미지에 대해 구글에 다시 그 이미지를 리버스 검색해서 메타데이터 정보를 모은 후 그 정보를 자신들의 사이트에 재 등록해서 그 사진의 원본이 자신인 것 처럼 위장한다는 주장
ㅤ→ 즉 상위 검색결과와 같은 내용을 가진 이미지가 되므로 이미지 검색에선 항상 가장 상위가 되는 것

- 이 주장이 흥미로운 점
ㅤ→ 구글이 보통 자신들의 사이트를 스크래핑 하는걸 좋아하지 않기 때문에 이렇게 많은 이미지에 대해 블록 안 당하고 하는 것이 신기함
ㅤ→ 이런 어두운 SEO전략(blackhat)들이 트위터등에 노출되면 구글은 보통 수동적으로 문제 사이트에 불이익을 가함으로써 조치를 취함
ㅤㅤ( 에전 Rap Genius 사례등에서 볼수 있듯이 )
ㅤ→ 핀터레스트는 상장회사 라서, 구글이 불이익을 준다면 주가에 영향을 줄 수 있음

- 콘텐트 연관도(Content Relevance)는 구글의 검색 순위를 결정 하는 요소. 구글이 이해하는 방식과 비슷하게 설명한다면 당연히 순위가 높아짐. 구글이 이걸 blackhat 으로 규정하고 반응 할까 ?

- Pinterest SEO Growth Hack 의 동작방식
ㅤ1. 사용자가 아무런 메타정보 없이 사진을 업로드
ㅤ2. 핀터레스트가 구글에서 그 이미지에 대해서 리버스 이미지 검색
ㅤ3. 그 이미지와 관련된 모든 텍스트들을 스크래핑
ㅤ4. 핀터레스트가 자신들의 페이지에 "What others are saying" 부분에 이 텍스트들을 표시
ㅤ5. 구글이 이 페이지를 읽어오게 되면 이 사진에 대해서 구글이 이미 이해하고 있는 내용들을 가지고 있으므로, 관련도가 유사하다고 판단 순위를 높게 올림
ㅤ6. 수백만개의 사진에 대해 반복

- 구글의 반응
ㅤ→ 담당팀에서 직접 답변은 없었지만 내부조사는 진행되고 있을 것.
ㅤ→ 아직 이게 유효한건 구글에게 이미지 검색에 대한 우선순위가 높지 않기 때문일 것.

** 콘텐트 연관도를 이용하여 검색 순위 높이는 방법 **
ㅤ→ 구글은 각 URL 및 콘텐츠에 대해서 특정 검색어나 키워드와 관련된 연관도를 조사하고 이를 순위에 반영한다는 것은 잘 알려진 사실
ㅤ→ 위처럼 특정 이미지에 대해 Google이 이미 알고 있는 여러 텍스트를 모은 포괄적인 페이지를 만들면 연관도가 높음
ㅤ→ 자신의 사이트에서 핀터레스트가 하는 것과 비슷한 일을 할 수 있는 방법은 TF-IDF(Term Frequency-Inverse Document Frequency) 라고 부르는 NLP 기법을 사용하는 것
ㅤ→ TF-IDF는 특정 단어나 구절이 해당 문서에 얼마나 중요한지 밝히는데 도움이 되는 텍스트 분석 기술
ㅤ→ 해당 이미지에 대해 상위 25개 정도의 URL을 가져와서 문서 전체에 TF-IDF 를 수행해서 주요 토픽을 분리 가능
ㅤ→ 이렇게 만든 문구들을 당신의 페이지에 넣으면 검색 순위가 올라갈 수도 있다는 주장

사실 핀터레스트가 저렇게 하는것 같다는 것도 하나의 주장일뿐이고, 이 사람의 글도 하나의 주장일뿐이긴 한데
구글 이미지 검색이 핀터레스트 때문에 굉장히 보기 힘들어진 것은 맞는 것 같습니다.

제가 피규어 도색때문에 다른 사람들의 페인팅 작례들을 많이 검색해보는데,
대부분 핀터레스트가 상위에 나오니까 클릭해서 핀터레스트 가서 다시 찾아가는게 일상이 되어버린지 한참 되었어요.
구글에서 "* 작례" 를 검색해보시면 최상위는 거의 다 핀터레스트가 차지하고 있습니다.
영문검색할때 "보드게임명 painting" 을 검색해봐도 핀터레스트가 최상위인게 많더군요