auto-identity-remove - macOS, Linux, Windows용 자동 데이터 브로커 옵트아웃 실행기
(github.com/stephenlthorn)- auto-identity-remove는 이름과 지역 정보로 데이터 브로커 사이트를 검색하고 옵트아웃 양식을 자동 제출해, 매월 500개 이상의 사람 검색 사이트와 데이터 브로커 데이터베이스에서 개인 정보를 제거하도록 돕는 도구임
- 실행 흐름은 브로커별 검색, 특정 프로필 목록 탐지, 옵트아웃 양식 제출, 필요한 경우 CAPTCHA 처리, 최근 완료된 항목 건너뛰기, 결과 알림, 수동 처리가 필요한 사이트 브라우저 열기로 구성됨
- 상태 추적은
state.json에 마지막 성공 시점과 실행 이력을 저장하며, 기본 재확인 주기는 90일이라 완료된 옵트아웃을 매번 다시 제출하지 않음 - CAPTCHA가 있는 양식은 CapSolver를 통해 처리할 수 있고, 비용은 대략 풀이당 $0.001이며, 설정하지 않으면 해당 사이트는 수동 처리 목록으로 넘어감
- 요구 사항은 Node.js 18+, macOS·Linux·Windows, Playwright 브라우저이며,
setup.js가 개인 정보 입력, 별칭, CapSolver 키, 일회성 계정, 알림, 월간 스케줄 등록을 안내함 - 월간 작업은 매월 1일 오전 9시에 실행되도록 등록되며, 플랫폼에 따라 launchd, systemd, crontab, schtasks를 자동 감지해 사용함
- Docker 실행도 지원하며 공식 Playwright 이미지를 사용해 Chromium과 시스템 의존성이 포함되고, 컨테이너 간 완료 이력을 유지하려면
state.json을 마운트해야 함 - 알림은 macOS의 iMessage 결과 요약을 지원하고, 헤드리스나 Docker 환경에서는
notify.webhook으로 ntfy.sh, Slack incoming webhook, Discord webhook에{"text": "<summary>"}를 POST할 수 있음 - 브로커 지원은 2단계로 나뉘며, STATUS.md에 정리된 명시적 브로커 42개는 개별 셀렉터로 매핑되고, 약 490개는 Do Not Sell 버튼, OneTrust·TrustArc·Osano, 일반 양식, DSAR 링크 탐색을 순서대로 시도하는 휴리스틱 방식임
✅ Submitted는 브로커가 양식을 접수했다는 뜻일 뿐 삭제 보장은 아니며,node watcher.js --verify는 기록된 성공 항목을 다시 검색해VERIFIED CLEAR,STILL LISTED,UNVERIFIABLE로 분류함- 지원되는 대표 자동 처리 대상에는 Spokeo, WhitePages, FastPeopleSearch, TruePeopleSearch, BeenVerified, Radaris, Acxiom, LexisNexis, ZoomInfo, Clearbit 등이 포함되고, Google Results About You와 Google Outdated Content는 수동 처리로 열림
- 비미국 사용자는 국가 코드, Province/Region, Postal code, 원문 전화번호 저장, 국가 선택 필드 입력을 지원하지만, Spokeo·WhitePages·FastPeopleSearch 등 US-only 브로커는 설정 국가가
US가 아니면 자동으로 건너뜀 --dry-run은 사이트 탐색과 양식 채우기만 수행하고 제출하지 않으며, 실험 기능인--pollute N은acceptsBogus: true로 표시된 일부 브로커에 가짜 기록을 제출하지만 약관 위반과 법적 위험 가능성이 명시돼 기본적으로 꺼져 있음- 개인 정보가 담긴
config.json, 옵트아웃 이력state.json, 실행 로그는 gitignore 대상이며, 저장소 라이선스는 MIT임
댓글과 토론
Hacker News 의견들
- 스팸 전화와 문자가 지겨워서, 500개 이상 데이터 브로커의 옵트아웃 절차를 매월 자동화하는 스크립트를 만들었음
도움이 필요한 부분은 휴리스틱 방식이 많이 놓친다는 것임. 일반 사이트마다 고유한 흐름이 많아서 네 가지 일반 전략으로는 잡히지 않음
실제로 성공하는 일반 사이트와 조용히 실패하는 사이트를 검증하고, 가치 높은 사이트에는 명시적 브로커 정의를 추가하고, macOS 외 환경에서 테스트하고, 이메일 인증 흐름을 처리할 사람이 필요함
Repo: https://github.com/stephenlthorn/auto-identity-remove
저장소에는 개인정보가 없고, 설정 스크립트가 로컬에서 정보를 입력받으며 gitignore 처리함- 현재 방식이 많은 사이트에서 성공하는지 궁금함. 저장소가 명백히 바이브 코딩됐거나 최소한 AI를 많이 써서 작성된 것처럼 보여서, 어디까지 이미 됐고 제대로 작동하려면 뭐가 남았는지 따라가기 어려움
이메일 인증은 임시로 “어떤 발신자의 메일에서 확인 링크를 클릭하라”고 알려주는 방식도 가능해 보임. 여러 제공자에 걸쳐 실제 받은편지함을 안정적으로 읽는 건 사실상 이메일 클라이언트가 필요해서 어려울 수 있음
그리고 빗나간 말일 수도 있지만, 이 댓글 자체도 AI가 생성한 것처럼 보임. 그렇다면 사이트 가이드라인 위반임Don't post generated comments or AI-edited comments. HN is for conversation between humans.
https://news.ycombinator.com/newsguidelines.html#generated
- 현재 방식이 많은 사이트에서 성공하는지 궁금함. 저장소가 명백히 바이브 코딩됐거나 최소한 AI를 많이 써서 작성된 것처럼 보여서, 어디까지 이미 됐고 제대로 작동하려면 뭐가 남았는지 따라가기 어려움
- 캐나다에서 써봤는데, Spokeo 같은 다른 서비스 가입을 권하고, 쓰지도 않는 Apple Mail 앱을 통해 이메일 접근을 요구했으며, 404도 많이 나왔고, 많은 사이트가 수동 개입을 필요로 했음
아이디어는 좋지만 일반적으로 유용해지려면 손볼 곳이 아주 많음. 숫자가 아닌 우편번호와 미국 외 주소가 자동화를 많이 깨뜨리는 것 같음- 사람들이 기본적으로 Apple 서비스를 쓴다고 가정하는 건 꽤 놀라움
- 2011년쯤에도 Yellow Pages가 주 전체 모든 주소로 종이 전화번호부를 배달했음. 우리 도시는 다음 날 임시 재활용 트럭을 따로 보내 전부 수거했고, 다들 버렸음
동료들과 보니 옵트아웃 양식에는 주소만 필요했음. 전국의 알려진 주소를 모아 몇 달에 걸쳐 자동 제출해서 모두 옵트아웃시키는 방안을 생각했지만 실행되지는 않았고, Yellow Pages 웹 개발자들이 몇 퍼센트 옵트아웃에서 긴급회의를 열었을지 상상하며 웃었음- 비슷한 시기에 형이 자기 집 방 몇 개를 전화번호부 배달 일을 하는 사람들에게 세줬음. 다른 나라였지만 Yellow Pages는 어디에나 있었던 듯함
배달원들이 감당을 못 하다가 결국 전화번호부 더미를 쌓아놓고 태우기 시작했음. 전화번호부를 그리워하는 사람이 없어서 걸리기까지 꽤 오래 걸렸음 - Yellow Pages 쪽은 옵트아웃을 못 받은 척했을 것임. 직접우편 업체와 스패머 절반이 그러는 것처럼
Uline이 1년에 두세 번씩 우체국 사서함으로 거대한 종이 카탈로그를 보내는 걸 막으려고 꽤 애썼음. 양식은 있지만 요청을 그냥 무시함
https://www.uline.com/CustomerService/ULINE_FAQ_Ans?FAQ_ID=4... - Australia Post에서 프로젝트의 데이터 프라이버시를 논의하다가, “여러분은 매년 수백만 명의 개인 데이터를 정기적으로 배포하고, 누구나 볼 수 있게 사람들 현관 앞에 정보를 놔두지 않나요?”라고 농담하지 않을 수 없었음
- 비슷한 시기에 형이 자기 집 방 몇 개를 전화번호부 배달 일을 하는 사람들에게 세줬음. 다른 나라였지만 Yellow Pages는 어디에나 있었던 듯함
- 그들이 하는 일은 사회를 실제로 개선하지 않으니, 건강한 사회라면 그런 일을 불법화할 수 있어야 함. 하지만 우리는 그러지 않으니 못 하는 상태임
- 충분히 불법화할 수 있음. GDPR 아래에서는 개인정보를 대규모로 수집하고 판매하는 일을 합법적으로 하기가 훨씬 어려움
여전히 일어나지 않는다는 뜻은 아니지만, 맞서 싸울 법적 근거를 줌. noyb.eu / Max Schrems 등은 그 전선에서 아주 중요하고 훌륭한 일을 하고 있음
- 충분히 불법화할 수 있음. GDPR 아래에서는 개인정보를 대규모로 수집하고 판매하는 일을 합법적으로 하기가 훨씬 어려움
- “CapSolver로 CAPTCHA를 풉니다(AI 기반, 풀이당 약 $0.001)”라니, 의심이 맞았음. 예전 같은 CAPTCHA로 불편을 겪는 건 나뿐이었음
- CAPTCHA 종류에 따라 다르지만, Apple, Cloudflare, Google이 인간 증명을 위해 원격 증명(remote attestation) 쪽으로 이동하는 데는 이유가 있음
reCAPTCHA v3 Enterprise와 MtCaptcha는 비용이 무려 3배로, 1000회 풀이에 $3임. 그래서 이쪽이 노리기 좋은 CAPTCHA로 보임 - 유료 CAPTCHA 풀이 서비스를 사서 삶을 더 편하게 만들고 싶어짐
- 브라우저 확장도 있는 듯함: https://www.capsolver.com/products/browser-extension
- CAPTCHA 종류에 따라 다르지만, Apple, Cloudflare, Google이 인간 증명을 위해 원격 증명(remote attestation) 쪽으로 이동하는 데는 이유가 있음
- MacOS에 묶인 건 launchd뿐인 것 같고, 이 정보는 문서에 추가하면 유용해 보임. CLI에서 그냥 실행할 수 있는지는 모르겠음
systemd 지원은 쉬울 듯함. Windows는 뭘 쓰는지 잘 모르겠음- Windows 서비스 만들기는 조금 더 어려움. Windows는 서비스에 실제 API를 쓰고, 단순히 프로세스 실행과 스크립팅에 기대는 방식이 아니기 때문임
다만 작업 스케줄러로는 한 달에 한 번 실행 같은 작업을 여러 방식으로 예약할 수 있음 - sc.exe나 tasksched를 쓰면 됨
- Windows 서비스 만들기는 조금 더 어려움. Windows는 서비스에 실제 API를 쓰고, 단순히 프로세스 실행과 스크립팅에 기대는 방식이 아니기 때문임
- 나한테는 상태 추적과 수동 대체 경로가 가장 흥미로움. 이런 도구라면 실제 전송 전에 어떤 필드가 어떤 브로커에게 제출될지 보여주는 드라이런/감사 모드가 꼭 있었으면 함
위협 모델이 애매한데, 도구가 노출을 줄여주기도 하지만 망가진 선택자가 개인정보를 엉뚱한 곳에 유출할 수도 있음 - 이게 오히려 내 정보를 500개 데이터 브로커에게 보내는 좋은 자동화 방법이 되는 건 아닌지 궁금함
- 3단계에서 어떤 정보를 제공해야 하는지 확인해보진 않았지만, 자동으로 옵트아웃 양식을 채우고 제출한다면 이름과 주소보다 더 많은 정보가 필요할 것 같음
훨씬 나은 해결책은 미국에서 GDPR 같은 법안을 추진하는 것임
- 3단계에서 어떤 정보를 제공해야 하는지 확인해보진 않았지만, 자동으로 옵트아웃 양식을 채우고 제출한다면 이름과 주소보다 더 많은 정보가 필요할 것 같음
- 적어도 캘리포니아에서는 DROP 양식이 올가을 온라인으로 제공될 예정임
- 업계에서 일하는 입장에서는 8월 1일이 캘리포니아에 등록된 약 500개 데이터 브로커에게 다모클레스의 검처럼 매달려 있음
소비자에게는 이미 열려 있음. 이웃 27.5만 명과 함께 가입할 수 있음
- 업계에서 일하는 입장에서는 8월 1일이 캘리포니아에 등록된 약 500개 데이터 브로커에게 다모클레스의 검처럼 매달려 있음
- 흥미로움. 한동안 써봤는지, 실제로 스팸 감소에 효과가 있는지 궁금함