미국 세관과 이민세관단속국에 항공편 정보 판매하는 데이터 브로커
(eff.org)- 데이터 브로커들이 개인의 항공편 관련 정보를 미국 세관(CBP)과 이민세관단속국(ICE)에 판매함
- Airlines Reporting Corporation(ARC)이 여행자 기록을 모아 정부 기관과 공유함이 최근 폭로됨
- 이용자 동의 없이 정보가 판매되며, 이는 개인정보 보호와 헌법적 권리 우회 문제로 이어짐
- 민감한 위치 정보, 인터넷 이용 기록, 공공요금 데이터 등도 유사하게 집계되어 법집행기관에 전달되고 있음
- 이러한 문제 해결을 위해 ‘Privacy First’ 법안과 ‘Fourth Amendment is Not For Sale’ 법안 등 강력한 개인정보 보호 입법 필요성 대두됨
데이터 브로커와 개인 정보 판매 문제
- 데이터 브로커들은 오랫동안 개인정보 보호법의 허점을 이용해 사용자 정보 수집 활동을 해왔음
- 이들은 우리의 동의 없이 위치 정보 등 민감한 데이터를 판매하며, 주요 거래처에는 법집행기관이 포함됨
- 이러한 데이터 시장은 누구든 개인 데이터를 수집하면 수익을 얻을 수 있는 구조로, 법을 회피하고자 하는 정부 기관에도 매력적임
ARC의 항공편 정보 판매 사례
- 404 Media와 기타 언론사의 폭로에 따르면, Airlines Reporting Corporation(ARC) 는 최소 8개 미국 주요 항공사들이 소유·운영하는 데이터 브로커임
- United Airlines, American Airlines 등에서 여행자 명단, 전체 여행 일정, 결제 내역 등 민감한 항공권 데이터를 수집한 뒤, 이를 몰래 미국 세관(CBP)에 판매해 옴
- 데이터 브로커들은 정보 출처를 감추는 방식까지 사용하여, 정부 기관이 해당 정보를 공개하는 것을 차단함
- 즉, 정부가 영장 등 사법적 절차 없이 정보 접근을 가능하게 하고, 출처까지 숨김으로써 사생활 침해와 권리 회피 문제가 발생함
Travel Intelligence Program (TIP)과 그 영향
- ARC의 Travel Intelligence Program(TIP) 은 과거 및 미래 39개월에 걸친 10억 건이 넘는 항공여행 기록을 집계함
- CBP는 내부 보고서에서 지역 경찰 및 주 경찰이 주목하는 인물 식별을 지원하기 위해 이런 정보가 필요하다고 밝힘
- 하지만, 미국 내에서 이민 단속 및 불합리한 검문, 수색이 증가하고 있는 상황에서, 이 정보가 무고한 여행자까지 의심 대상으로 확장하는 위험이 증대함
ARC의 영향력과 항공사 참여
- ARC를 통해 전 세계 54% 이상의 항공편 정보가 처리되고 있으며, 200개 이상의 항공사가 이 네트워크에 참여함
- 이사회에는 JetBlue, Delta, Lufthansa, Air France, Air Canada 등 미국 및 국제적 항공사 대표가 다수 포함됨
- 법집행기관에 민감 정보를 대량 판매함으로써, 항공사들은 개인 프라이버시보다 수익을 우선시하는 행태를 보임
- 실제 ICE(이민세관단속국)가 ARC에서 여행자 개인정보를 구매한 내역이 최근 공개됨
파급 효과 및 프라이버시 침해 현황
- 자유로운 이동은 민주 사회의 핵심임에도, ARC 등 데이터 브로커가 비밀리에 여행 이력 추적이 가능한 환경을 조성함
- 현재 미국에서 국적, 종교, 정치 성향 등에 따른 법적 불이익 가능성 논의가 커지는 가운데, ARC 데이터 활용이 공권력 남용으로 이어질 위험이 있음
- 데이터 브로커들은 항공정보 외에도 스마트폰 위치정보, 인터넷 백본 데이터, 공공요금 기록까지 판매하며 개인정보 침해 범위 확대 중임
정책적 요구 사항 및 해결방안
- 정부 당국이 국경 등에서 자유와 권리를 약화시키는 조치를 늘리는 중인 현시점에서, 이러한 *** 대규모 데이터 수집·판매가 더 큰 우려***를 야기함
- ARC의 사례는 ‘Privacy First’ 등 프라이버시 우선 법안의 필요성과 기업 데이터 처리 최소화 원칙 법제화 요구에 대한 경각심을 제고함
- 또한 법집행기관이 데이터 브로커에서 정보 판매를 통해 영장 없이 정보 수집을 우회하지 못하도록 하는 ‘Fourth Amendment is Not For Sale’ 법안 통과 필요성이 제기됨
- 마지막으로 데이터 브로커 등록 및 투명성 강화 등 규제 역시 시급한 과제로 등장함
Hacker News 의견
-
많은 사람들이 특권적인 1차 데이터 접근이 없어도 이런 데이터 모델을 만들기 얼마나 쉬운지 잘 모름. 2012년에 내가 만든 프로토타입은 소셜 미디어나 광고 데이터만으로도 대부분 사람들의 비행 이력을 대규모로 정확히 추적할 수 있음을 보여줌. 이런 건 아주 옛날부터 가능했음. 대략적인 방식은, 엔터티 그래프 내에서 시속 300km 미만 또는 거리 200km 미만의 시공간 간선을 걸러냄. 이 기준으로 “비행기 탑승” 여부를 추정하고 출발지와 도착지도 파악이 가능했음. 이 간선을 공공 비행 데이터나 제트 엔진의 유지보수 IoT 데이터와 연계하면 특정 비행편에도 매칭할 수 있음. 대부분은 평범한 공업 IoT 데이터가 다른 분야의 관계를 추정하는 데 어떻게 쓰이는지 간과함. 드물게 한 번에 여러 항공편이 가능한 케이스도 있었지만, 과거 비행이력을 참고해 과거에 이용한 주요 항공사를 선택하면 거의 항상 완벽하게 일치함. 인상적일 정도로 효과적이었고, 항공사 1차 데이터나 복잡한 분석이 전혀 필요하지 않았음. 결국 시간과 공간이 현실의 주키임
-
“비행 가능성 있는 경로를 선별했다”는 설명을 들으니, 문제의 본질은 결국 누가 처음에 '시공간 데이터'를 갖고 있냐는 점임. 결국 “네 신용카드 거래 내역이 있으면 언제 어디서 어떤 가게 갔는지 알 수 있다”는 말과 다를 바 없음. 소름끼치긴 하지만 진짜 심각한 건 그런 데이터 접근 자체가 가능하다는 점임. 애초에 누군가의 거친 위치를 시간대별로 전부 꿰고 있다면, 그 사람의 개별 비행기 탑승이력보다 시공간 데이터 자체가 훨씬 더 큰 가치를 지님
-
내가 흥미롭게 느끼는 점은 사람들이 각종 개인정보를 수집해 악용할 수 있다고 걱정하지만, 대부분 그 정보를 가지고 하는 일이 겨우 맞춤형 광고를 더 보여주는 것뿐이라는 점임
-
“제트 엔진의 유지보수 IoT 데이터” 같은 건 도대체 어디서 구함?
-
아마 ICE에서는 특정 인물이 어느 도시·국가를 언제 방문했는지 추적하려고 이런 데이터가 필요할듯 함
-
-
ARC를 단순한 “데이터 브로커”라고만 표현하는 게 흥미로움. 사실 ARC나 IATA는 항공권 결제 클리어링하우스이자 관련 업계 시스템 유지·감독 역할을 담당함. 원천적으로 거래 데이터가 이들에게 흘러가고, 이를 판매해 수익을 창출함. 그런데 이건 여타 데이터 브로커처럼 외부에서 데이터를 모아서 되파는 구조가 아니라 자체적으로 1차 데이터를 소유한 상태임. 이런 민감·비식별처리되지 않은 데이터를 판매·공유하는 게 허용되어야 하느냐는 근본적인 쟁점이지만, 그만큼 근본적인 1차 데이터임. Airline Reporting Corporation 전체 구조 설명 링크도 참고할 만함
- 이 설명이 기사에서 다뤄진 요점에는 딱히 반박이 되지 않음
-
브로커들이 판매하는 데이터의 양과 범위는 상상 이상으로 방대함. 심하게 생각해도 실제 상황은 그보다 열 배는 심각함
-
내 동료는 한 번 특정인을 타깃으로 이미지 배너 광고를 띄우고 “내가 이 정도도 된다고 했잖아, 친구!”라는 문구를 넣어 효과 시연을 했음. 일반인들은 광고사와 데이터 브로커가 자신에 대해 얼마나 많이 아는지 거의 모르고 있음
-
2014년쯤 리크루터들과 일할 때 사람들의 정보를 LinkedIn, Yelp, Twitter, GitHub, Eventbrite 등에서 긁어오는 툴을 봤음. 그 당시에 이미 10년 넘는 이력까지 모두 파악이 가능할 만큼 방대한 정보 확보가 가능했음. Palantir 같은 곳과 협업하면 정부는 Reddit 게시글까지 스타일 분석이나 심리분석도 가능할 것으로 보임
-
이런 데이터 프로필이 필요한 아트 프로젝트 아이디어가 있는데, 저렴하게 구매할 만한 좋은 소스 추천을 부탁함. 워낙 대규모 프로젝트라 어디서부터 시작해야 할지 모르겠음
-
이 업계에서 일하는 입장에서, 현실은 “1000배쯤 심각”하다고 느껴짐
-
HN 이용자 대부분이 실제 업계 실태를 거의 이해하지 못한다고 생각함. 방향 자체를 아예 다르게 잡아야 할 듯함. 대부분은 Google 정도만 내 개인정보 팔아넘긴다고 생각하지만, 실제로는 데이터 업계가 훨씬 방역 체계가 느슨함. 예를 들어 35세 동네 치과의사의 신용카드 거래내역을 딱 그 사람만 골라 원하는 포맷으로 하루 만에 뽑아달라고 전화주문할 수 있을 정도로 쉬움
-
-
데이터 시장이 얼마나 잘 숨겨져 있는지 신기함. 수많은 대기업이 매일 데이터를 추출하고 거래하고 있지만, 이렇게 시끄러운 “탈중앙화” 바람 속에서도 정작 오픈된 데이터 마켓플레이스는 없음. 나는 오픈된 행동 데이터까지 사고팔 수 있는 모델이 나오길 바라왔고, 실제로 사람들도 단순히 “상품”인 게 아니라 기업에 데이터 제공하고 그 대가를 받는 식으로 바뀌었으면 좋겠음
-
실제로 그렇게까지 숨겨져 있지는 않은 거 같음. 2021년에 50년 전 원한을 갚으려고 남의 집에 찾아간 사람이 있었는데, CCTV 영상에 PeopleFinders 폴더를 든 모습이 찍힘. 놀라운 점은 정부 기관들조차 이런 데이터를 판매하는 현실임
-
이런 수익 구조에서 더 챙길 생각하지 말고 그냥 모두 폐쇄하고 멈추는 게 맞다고 생각함
-
-
CBP와 ICE가 왜 데이터 브로커에서 정보를 사야 하는지 이해가 안 됨. TSA가 어차피 모든 사람의 탑승권을 다 스캔하고 있음
-
아마 TSA가 수집한 데이터에 접근하려면 엄격한 규정과 절차가 있을 테고, 그 데이터와 동일한 정보라도 브로커에서 사는 데는 별다른 요구 조건이 거의 없음. 데이터 출처도 TSA가 아니라 항공사, 결제사 등 다양할 수 있음. 브로커 데이터 품질은 보장하기 어렵지만, 절차가 훨씬 간단함
-
연방기관에서 근무할 때, 내 입장에서 공개 트윗 조차 수집하려면 왜 필요한지, 어떤 개인정보가 저장되는지, 보관 기간과 삭제 방안까지 문서화해서 직접 승인받아야 했음. 주말에 일반인이 할 수 있는 일도 정부 내에선 엄청난 승인이 필요함. 그런데, 만약 다른 기관 데이터를 요청하려면? 그건 아예 상상 이상으로 정치적 부담이 생김. 협력 기관이라도 쉽지 않고, 오히려 회의에서 동료 기관에 이런 요청을 언급하면 괜히 마찰만 늘어난다는 조언도 받았음. 반대로, 데이터 브로커에서 사오면 이런 복잡한 절차 필요 없음
-
TSA에서 승인을 막 나눠주지 않는 것도 이유일듯. 마치 경찰이 휴대폰 데이터를 요청할 때는 영장이 필요하지만, 통신사가 실시간 위치를 3자에 팔아 그걸 경찰이 사올 수 있다거나 하는 구조랑 비슷함. 참고 링크
-
정부는 법과 헌법을 피하기 위해 기업을, 기업은 규제를 피하려고 정부를 활용함. 옛날부터 내려오는 구조임
-
규제와 법률 관련 이유 외에도, 조직 내에서 각 부서가 쓸 수 있는 실용적인 데이터 스트림을 구축·조율하는 게, 이미 데이터 큐레이팅·관리·유통에 최적화된 브로커에게 사오는 것보다 더 어렵고 비용이 들어감. 비록 황당해 보이지만 결국에는 프리미엄 값을 주더라도 브로커 데이터가 속 편하고 신뢰성도 높음. TSA 기술팀은 데이터에 메타데이터를 붙이고 SLA까지 관리할 인센티브가 없음. 데이터 브로커는 그런 유인이 항상 있음
-
-
yaelwrites/Big-Ass-Data-Broker-Opt-Out-List는 데이터 브로커 옵트아웃을 시작하기에 좋은 목록임. 다만, 기사에 언급된 ARC는 현재 기준으로 이 리스트에 없음
-
주제와 조금 다르지만, 일반 회사들이 (광고 관련 기업 제외) 소비자 데이터와 행동 패턴을 판매해서 실제로 얼마만큼 수익을 내는지 대략적인 추정치를 아는 사람이 있는지 궁금함
-
두 달 전쯤에 HN에서 관련 논의와 다른 스레드도 있었음
-
이번 사례가 흥미로운 이유는, 과거 악질 브로커들은 EU에 영업거점이 없어 GDPR 벌금을 무시하거나, 괴리수익이 훨씬 크면 그냥 리스크로 받아들였지만(예 Clearview), 항공사처럼 본업 마진이 적고 글로벌 매출이 큰 회사엔 GDPR 위반이 훨씬 치명적임. 데이터 관리자가 항공사이면 브로커 제공 자체가 불법일 수 있고, EU에 잘 노출되어 있어서 벌금 회피도 힘듦. 심하면 회원국이 그 항공기 자체를 압류해버리거나, 모든 운항 금지까지 시도할 수 있음. 실제 독일이 태국 황태자 비행기를 압류한 사례도 있음. 관련 기사링크
- 항공사가 주요 데이터 출처 같지만, 실상은 소스가 굉장히 다양함. 탑승권 바코드엔 엄청난 정보가 담겨있고, 이건 암호화가 아니라 단순 인코딩이라서 읽기만 하면 됨. 바코드 리더기는 많은 업체에서 만들어 팔고, 체크인·수하물·면세점·라운지 등 공항에서 바코드 스캔하는 곳은 많음. 측정한 정보를 여러 방법으로 축적할 수 있음. 여권 스캐너도 저렴하게 구할 수 있고, 공항 상점이나 렌터카도 잘 사용함. 최근엔 얼굴 인식 기술 때문에 탑승권·여권 확인 없이 타기도 함. Uber 예약 정보 등 부수적인 데이터도 결합 가능함. 바코드 관련 상세 링크
-
내가 돈을 내고 내 자신 및 타인에 대해 데이터 브로커로부터 어떤 정보를 얻을 수 있는지 궁금해서, 이런 데이터 브로커에 어떻게 접근해야 할지 아는 사람 있음?