많은 인구 통계 수치가 조작되어 있다
(davidoks.blog)- 파푸아뉴기니와 나이지리아 등 여러 국가의 인구 통계가 실제와 크게 다르며, 정부조차 정확한 수치를 알지 못함
- 파푸아뉴기니의 경우 2000년 인구조사 자료를 단순 추정해 2022년 인구를 940만 명으로 발표했으나, UN 보고서는 약 1,700만 명으로 추정
- 나이지리아는 정치적 이해관계와 석유 수익 배분 때문에 인구조사가 반복적으로 조작되어 왔으며, 2006년 이후 공식 조사 없음
- 위성 이미지 기반 인구 추정도 오차가 최대 80% 이상에 달해 신뢰하기 어려움
- 전 세계적으로 많은 국가의 인구 수치가 불확실하며, 이는 경제·정책 통계 전반의 신뢰성에 영향을 미침
파푸아뉴기니의 인구 통계 혼란
- 파푸아뉴기니 정부는 2022년 인구를 940만 명으로 발표했으나, 이는 2000년 인구조사(550만 명) 를 기반으로 한 단순 추정치
- 2011년 인구조사는 실패로 간주되어 결과가 폐기됨
- UN 위임 보고서는 실제 인구가 약 1,700만 명에 달한다고 분석, 농촌 지역의 심각한 과소 집계를 지적
- 보고서 공개 후 정부는 보도 금지령을 내리고, UN은 기존 수치를 그대로 인정
- 2024년 새 인구조사도 심각한 누락 의혹이 제기되어, 여전히 실제 인구는 불명확한 상태
‘가짜 인구’ 주장과 그 반박
- 트위터 사용자 Bonesaw는 중국과 인도의 인구가 과장되었으며, 전 세계 실제 인구가 10억 명 미만이라고 주장
- 글에서는 이 주장을 “명백히 터무니없다” 고 평가
- 수십만 명의 정부·국제기구 인력이 공모해야 하는 불가능한 음모론으로 설명
- 다만 일부 국가는 실제 인구를 정확히 모른다는 점에서 일부 진실의 단서가 존재함
나이지리아의 인구 조작 역사
- 나이지리아는 공식적으로 2억4천만 명으로 아프리카 최대 인구국으로 분류되지만, 신뢰할 만한 인구조사 부재
- 인구조사는 의회 의석수와 석유 수익 배분에 직접 연결되어, 지역별 과장과 조작이 반복됨
- 1962년 조사에서 남부 인구가 많자, 1년 뒤 재조사로 북부 인구가 800만 명 증가
- 1973년 조사는 조작이 명백해 결과 미공개, 이후 18년간 조사 중단
- 2006년 조사 후 라고스 주가 자체 조사를 실시해 정부 수치보다 800만 명 많다고 발표
- 현 인구 수치는 2006년 결과를 단순 추정한 것으로, 공식 통계위원장조차 신뢰하지 않음
- 낮은 유권자 등록률·SIM 등록률·출산율 급감 등은 인구 과대 추정 가능성을 시사
다른 국가들의 불확실한 인구 통계
- 콩고민주공화국은 1984년 이후 인구조사 없음, 남수단·에리트레아·아프가니스탄·차드·소말리아 등도 수십 년간 미실시
-
CIA·세계은행 등은 공식 수치를 발표하지만, 신뢰 가능한 근거 부재
- 예: DRC의 2020년 인구 추정치는 7,300만~1억400만 명으로 편차 큼
- 일부 국가는 조사원이 급여 미지급·데이터 미제출·허위 보고로 정확도 저하
- 남아프리카공화국 2022년 인구조사도 최대 31% 과소 집계로 평가됨
위성 데이터의 한계
- 위성은 지리적 접근성 문제를 해결하지만, 가구 내 인원 수 파악 불가
-
Meta와 WorldPop의 위성 기반 추정치는 같은 지역에서도 두 배 차이 발생
- 예: 나이지리아 바우치의 5세 미만 아동 수를 Meta는 12.7만 명, WorldPop은 25.4만 명으로 추정
-
Nature 게재 연구에 따르면, 위성 기반 인구 추정은 실제보다 최대 84% 과소 집계
- 특히 중국·브라질·호주·폴란드·콜롬비아 등에서 큰 오차 발생
- 위성 기술은 향후 개선 가능성이 있지만, 현재로선 신뢰할 수준 아님
결론: 인구 통계의 불확실성과 인식의 한계
- 전 세계 인구 총합은 대체로 정확하겠지만, 개별 국가 단위의 오차는 심각
- 나이지리아는 과대, 수단은 과소 추정되는 등 상쇄 효과가 있을 수 있으나, 체계적 편향 여부는 불명확
- 인구 통계는 경제·정책 판단의 기초 데이터로, 부정확할 경우 국가 평가 전반이 왜곡됨
- 이러한 사례는 우리가 세계에 대해 알고 있다고 믿는 것보다 훨씬 적게 알고 있음을 보여줌
- 통계 수치의 생성 과정을 이해하고, 데이터에 대한 인식적 겸손(epistemic humility) 을 유지하는 것이 중요함
Hacker News 의견들
-
예전에 인구조사 업무에 참여한 적이 있음
중국처럼 10년마다 전국 인구조사를 하는 나라의 경우, 전체 수치는 꽤 정확하지만 지역별 데이터는 추정치에 기반함
이유는 여러 가지인데, 경제적으로 발전한 지역은 이주 인구가 많아 실제보다 적게 집계되고, 반대로 낙후 지역은 도시로 떠난 인구가 많아 과대 집계되는 경향이 있음
출생 데이터는 병원 출산과 출생증명서 제도로 정확하지만, 사망 데이터는 농촌의 매장 문화 때문에 지연되는 경우가 많음
예를 들어, 내 도시에서는 2021년 코로나 검사 때마다 440만 명 이상이 검사받았는데, 2020년 인구조사에서는 370만 명으로 나왔음- 중국과 인도의 인구 규모는 항상 놀라움
대학원 시절 중국 친구들이 많았는데, 그중 한 명이 Shenyang 출신이었음. 800만 명이 사는 도시인데도 중국 내에서는 상위 10위 안에도 들지 않음
중국의 100대 도시 중 인구 100만 명 이하인 곳이 하나도 없다는 게 인상적임 - 중국은 모든 사람이 주소를 등록해야 하는 걸로 아는데, 그렇다면 인구 데이터가 꽤 정확해야 하지 않나 생각했음
외국인도 등록해야 하고, 현지인들도 그렇게 한다고 들었음
- 중국과 인도의 인구 규모는 항상 놀라움
-
글이 “아무도 모른다”는 식으로 너무 과장된다고 느낌
인구 수치는 불확실성이 있는 추정치일 뿐, 무지의 영역은 아님
대부분의 국가는 인구조사를 하고, 출생·사망·이동 데이터를 통해 보정함
“가짜”라고 부르는 건 잘못된 표현이고, 단지 데이터 품질의 불균형 문제임- 예를 들어, 콩고민주공화국은 1984년 이후 인구조사를 하지 않았고, 남수단과 에리트레아는 독립 이후 한 번도 조사한 적이 없음
아프가니스탄은 1979년, 차드는 1991년, 소말리아는 1975년 이후로 없음 - 일부 국가는 인구 데이터를 조작할 유인이 있음
예를 들어 부동산 거품이 있을 때는 인구 증가를 보여야 시장 신뢰를 유지할 수 있음 - 글쓴이는 불확실성의 종류를 혼동하고 있음
조사 자체를 안 하거나 수치를 조작하는 경우는 단순한 오차와는 다름 - 그래도 “아무도 모른다”는 표현이 불확실성의 크기를 요약하기엔 적절하다고 생각함
- 원칙적으로는 동의하지만, 글이 말하는 건 단순한 오차 범위 이상의 문제임
- 예를 들어, 콩고민주공화국은 1984년 이후 인구조사를 하지 않았고, 남수단과 에리트레아는 독립 이후 한 번도 조사한 적이 없음
-
미국에서도 인구조사는 완벽하지 않음
특히 South Dakota는 세금과 거주 요건이 유리해 노마드 현상이 심함
RV 여행자나 트럭 운전사들이 우편함 주소로만 거주지를 등록해 실제 거주지와 불일치함
인구조사는 실제 거주지를 기준으로 하기 때문에 이들은 종종 누락됨
결과적으로 행정상 주민 수는 많지만, 실제 인구로는 적게 집계되어 연방 보조금을 덜 받는 역설이 생김- South Dakota가 추가 하원의석을 얻을 만큼 인구가 누락된 건 아닐 것 같음
10만 명 이상 차이가 나야 의미가 있을 텐데 그 정도는 아닐 듯함
- South Dakota가 추가 하원의석을 얻을 만큼 인구가 누락된 건 아닐 것 같음
-
“파푸아뉴기니 인구가 몇 명일까?”라는 질문 자체가 단순하다는 전제부터 이상하게 느껴짐
세상 대부분의 질문은 복잡하고, 단순한 답은 거의 없음
생물학이나 의학만 봐도 마찬가지임- 그건 문학적 장치임
글의 결론은 오히려 세상이 얼마나 복잡한지, 우리가 얼마나 인식적 겸손을 가져야 하는지를 강조함 - 복잡함은 현실의 문제라기보다 정의와 소통의 문제라고 생각함
- 단순하다는 건 쉬움을 뜻하는 게 아니라, 국가 운영의 기초라는 의미임
정부가 자국 인구조차 대략적으로도 모른다면 그 위의 모든 정책이 흔들림 - “가난한 나라의 인구 데이터가 부정확한 건 새삼스러운 일도 아니다”라는 문장을 같은 저자가 썼는데, 일부만 인용하는 건 불공정함
- 사소한 트집 잡기에 불과하다고 봄
- 그건 문학적 장치임
-
2017년 칠레에서 인구조사할 때 현지에 있었는데, 나라 전체가 멈출 정도로 큰 행사였음
이전 조사가 실패로 끝났던 터라 이번엔 국가적 자존심이 걸린 일이었음
이후 미국에서도 2019~2020년 인구조사 요원으로 일했는데, 팬데믹으로 인해 2020년 조사는 거의 재앙 수준이었음
통계가 발표된 후 일부 지역의 인구 감소 보도를 봤지만, 실제로는 단순히 조사 누락이었음- 나도 현장조사 경험이 있는데, 그 이후로는 공식 통계를 잘 믿지 않게 됨
사람들은 거짓말하거나 질문을 오해함. 완벽한 절차는 없음 - 우리나라는 모든 사람이 출생부터 중앙 데이터베이스에 등록되고, 주소 변경도 의무임
2001년 이후로는 별도의 인구조사를 하지 않고 중앙 등록 시스템으로 대체함 - 네덜란드도 1970년대부터 인구조사를 중단하고, 출생·사망 신고로 관리함
법적으로 등록되지 않으면 아무것도 할 수 없기 때문에 시스템이 꽤 견고함
- 나도 현장조사 경험이 있는데, 그 이후로는 공식 통계를 잘 믿지 않게 됨
-
“세계 인구가 10억 미만”이라는 주장은 터무니없지만, 인구 조작은 실제로 존재함
예를 들어 베네수엘라는 차베스 정권 이후 700만 명 이상이 해외로 떠났지만, 정부 통계에는 반영되지 않음
실제 인구와 보고된 인구 사이에 20~30% 차이가 있음- 만약 그게 사실이라면 미국과 일본이 세계 인구의 절반을 차지하게 될 것임
- 하지만 대규모 이주는 2017년 이후 미국의 경제 제재로 인한 하이퍼인플레이션 때문임
차베스주의 때문이 아니라 미국의 경제적 압박이 원인임
-
예전 직장에서 파푸아뉴기니 정글에 무선 중계망을 설치했는데, 주술 혐의로 화형당하지 않으려면 지켜야 할 규칙이 있었음
- PNG는 매우 폭력적인 환경임
내가 일했던 NGO 사무실에는 무장 경비와 금속 탐지기가 있었고, 서버실에는 M-16 소총이 보관되어 있었음
시내를 벗어나려면 반드시 보안 호위가 필요했음 - 아버지가 부르키나파소와 말리 등지에서 드론을 운용했는데, 현지인들이 ‘마녀의 새’라며 두려워해 설득해야 했다고 함
- “그 규칙이 뭔지 궁금함”
- 정글에 무선망을 설치한다면, 현지인들이 의심하는 것도 이해할 만함
- PNG는 매우 폭력적인 환경임
-
“가짜”라는 표현은 부적절하고, “부정확”이 더 맞음
인구 추정치는 항상 오차가 있고, 방향성 있는 편향이 있을 수 있음
데이터가 부실하거나 일부 조작되더라도, 그건 허위가 아니라 단순히 정확하지 않은 것임
“가짜”라면 실제 수치를 알고도 일부러 조작했다는 뜻인데, 그런 경우는 드물다고 봄- 하지만 파푸아뉴기니나 나이지리아처럼 인구를 부풀릴 유인이 강한 곳은 실제로 조작이 존재함
다만 “많은 나라가 가짜”라는 제목은 과장된 표현임 - “가짜”는 단순히 진짜가 아닌 것을 의미함
반드시 실제 수치를 알고 있어야 하는 건 아님 - 서방 정부들도 인구 증가를 적게 보이려는 정책적 유인이 있음
이민 통계를 낮추고 1인당 GDP를 높이려는 목적임
이런 유인이 데이터 생산 과정에 일정 부분 스며들 가능성은 있음
- 하지만 파푸아뉴기니나 나이지리아처럼 인구를 부풀릴 유인이 강한 곳은 실제로 조작이 존재함
-
“1991년 인구조사에서 실제보다 30% 적게 나왔지만 여전히 조작이 있었다”는 구절을 보고, 나라 운영을 포기하고 싶을 정도였음
- 그런 나라의 공무원이라면 아마 연줄 채용으로 들어갔을 가능성이 높음
상사가 “인구를 X백만 명으로 맞춰라”고 하면 그대로 따를 수밖에 없음
- 그런 나라의 공무원이라면 아마 연줄 채용으로 들어갔을 가능성이 높음
-
콩고민주공화국의 인구 수치는 믿기 어려움
국토 면적이 미국의 1/3인데 인구도 1/3이라면 밀도가 같아야 하는데, 위성사진으로 보면 대부분이 숲과 도시 몇 개뿐임- 자세히 보면 정글 속에도 작은 마을과 초가집 무리가 곳곳에 있음
미국도 서부 지역은 인구 밀도가 매우 낮으니 단순 비교는 무리임 - “큰 도시 몇 개와 끝없는 숲”이라는 묘사는 미국의 여러 주에도 해당됨
- 수도 킨샤사가 9배 크다는 건 과장처럼 보임
- 방글라데시나 갠지스 계곡을 보면 훨씬 좁은 면적에 수억 명이 살고 있음
- 일본도 미국의 1/20 크기지만 인구 밀도는 훨씬 높음
따라서 DRC도 충분히 그런 구조일 수 있음
- 자세히 보면 정글 속에도 작은 마을과 초가집 무리가 곳곳에 있음