GN⁺ 2024-11-30 | parent | ★ favorite | on: 4Chan CAPTCHA 해독하기(nullpt.rs)
Hacker News 의견
  • JSON 스크립트를 사용하여 시각화 데이터를 파싱하는 것은 복잡한 작업임
    • 4chan이 이메일 인증을 요구하기 시작함
  • Keras와 Tensorflow.js 간의 상호 운용성 문제는 Tensorflow의 전형적인 문제임
    • TF는 통합된 제품보다는 관련 도구들의 모음처럼 느껴짐
    • 모든 오픈 소스 Google 라이브러리/도구가 비슷한 느낌을 줌
  • 왜 사람들이 왜곡된 텍스트 기반 캡차를 피하는지 이유가 있음
    • 컴퓨터가 인간보다 더 잘 풀 수 있는 수준에 도달함
    • 관련된 흥미로운 논문이 있음
  • 놀랍게도 많은 텍스트 기반 캡차는 몇 줄의 쉘 스크립트로 해결 가능함
    • imagemagik을 사용하여 그레이스케일로 변환 후 teserract로 처리 가능함
  • 2captcha.net 같은 사이트도 존재함
    • 캡차는 최소한의 노력을 요구하는 것과 같음
  • 캡차를 가장하여 사용자 행동과 타이밍을 분석하는 것이 더 나을지 궁금함
    • AI를 훈련시켜 상대방이 인간인지 아닌지를 판단하는 '역 튜링 테스트'를 발명할 수 있음
  • Silk Road CAPTCHA에 대한 2014년 분석이 있음
  • 4chan의 적절한 대응은 인간의 작업을 단순화하는 것임
    • 복잡한 캡차는 인간의 불편함을 증가시키고 기계의 해결 가능성을 줄이지 않음
  • 4chan 캡차의 문자 선택이 인종차별적/극단적 슬로건을 만들 수 있도록 의도되었을 가능성이 있음
    • 특정 문자들이 자주 사용됨
    • 무작위로 보이지만 특정 패턴이 자주 발생함
  • 4chan 캡차를 해결하는 프로젝트가 존재함
  • 4chan을 사용하려 했으나 캡차를 통과하지 못한 경험이 있음
  • 4chan이 Google 캡차처럼 봇 행동 감지를 하는지 궁금함