GN⁺: 백만 분의 일 확률을 가진 것은 무엇인가? (2010년)
(stat.berkeley.edu)"백만 분의 일" 확률은 정말 있을까?
- "백만 분의 일" 확률에 대한 주제는 수업에서 재미있게 다룰 수 있는 내용임.
- 학생들에게 일상 대화에서 "백만 분의 일" 확률이 언급될 때 어떤 상황을 떠올리는지 물어봄.
- 학생들은 로또 당첨이나 번개 맞기 같은 전형적인 예시와 더 창의적인 제안을 함.
- 실제 일상 사용에서 "백만 분의 일" 확률이 어떻게 쓰이는지 데이터를 얻는 방법에 대해 논의함.
- 블로그 검색 외에는 실용적인 방법을 찾기 어려움.
- 실제로 "백만 분의 일" 확률을 가질 수 있는 사건에 대한 제안을 요청하고, 그 확률을 정량화할 수 있는지, 그리고 그것이 대략 백만 분의 일인지 검토함.
확률의 예시와 비예시
- 동전 던지기나 로또 당첨 같은 게임의 기회에서 명백한 예시들을 제시함.
- 예를 들어, 20번의 동전 던지기가 모두 뒷면으로 나올 확률은 "예"임.
- 캘리포니아 주 파워볼 복권에서 일년에 6장씩 구매 시 당첨 확률도 "예"임.
- 위키피디아 "랜덤 문서" 링크에서 특정 유명인을 얻을 확률도 "예"임.
- 하워드 단층에서 다음 50분 내에 큰 지진이 발생할 확률은 "예"임.
- 2007년 추정에 따르면 하워드 단층에서 6.7 이상의 지진 발생 확률은 연간 약 1%임.
- 미국에서 태어난 다음 24명의 아기 중 한 명이 대통령이 될 확률도 "예"임.
- 미국의 출생률은 연간 약 400만 명이고, 대통령 임기를 평균 6년으로 가정하면 24백만 명의 아기 중 한 명이 대통령이 될 것임.
- 선거에서 결정적인 한 표를 던질 확률은 상황에 따라 다르지만, 여론 조사에서 판단하기 어려운 캘리포니아 주 선거에서는 "예"임.
개인에게 미치는 위험
- "실제 세계" 프로젝트를 시작한 이래로 다양한 위험에 대한 이메일을 자주 받음.
- 비행기 추락, 해적에게 납치, 조류에 의한 익사, 라틴 아메리카에서의 교통사고 등의 위험에 대한 질문은 간단한 답이 없음.
- 죽음의 수치만 가지고는 충분하지 않고, 해당 활동에 참여하는 사람들의 수도 필요함.
- 스키나 스노보드 사고로 인한 사망률을 예로 들면, 미국 공식 스키장 방문 시 백만 번의 방문당 평균 0.7명의 사망률을 기준으로 함.
- 다양한 활동의 위험을 비교할 때는 활동에 소요되는 시간도 고려해야 함.
- "마이크로모트"라는 용어는 특정 활동으로 인한 백만 분의 일 사망 확률을 나타내며, 이 페이지는 다양한 활동의 비교를 제공함.
- 예를 들어, 스카이다이빙 점프 중 사망 확률은 "아니오"임.
- 이는 약 10 마이크로모트에 가까움.
- 개인의 행동에 따라 확률이 크게 달라질 수 있으므로, 인구 평균을 개인에게 적용하는 것은 상식적인 판단이 필요함.
- 예를 들어, 캘리포니아에서 200마일 자동차 여행 중 사망할 확률은 "예"임.
- 여기서는 캘리포니아의 사망률이 1억 5천만 차량 마일당 약 1건임.
- 번개에 맞을 확률은 "아니오"임.
- 번개에 맞는 것에 대한 신뢰할 수 있는 데이터가 없으며, 의료 도움을 받지 않으면 공식 통계에 포함되지 않음.
- 마지막으로, 남성이 유방암에 걸릴 확률은 "아니오"임.
- 남성의 유방암 발병률은 드물지만, 생각보다 흔하며, 평생 발병률은 약 1천 분의 일, 사망률은 5천 분의 일임.
- 질병, 흡연, 비만 등의 영향을 평가할 때는 "마이크로라이프"라는 개념을 사용하는 것이 더 좋음.
- 이는 기대 수명의 약 30분 변화를 의미하며, 이 시간은 성인 평생의 대략 백만 분의 일에 해당함.
GN⁺의 의견
- "백만 분의 일" 확률은 일상 대화에서 다양한 상황에 대한 과장된 표현으로 사용되지만, 실제로 이 확률을 가지는 사건들은 매우 드물고 특정 조건에 의존함.
- 이러한 확률을 이해하고 계산하는 것은 통계학적 사고를 키우는 데 도움이 되며, 위험 관리와 의사결정에 중요한 역할을 함.
- 개인의 행동과 상황에 따라 위험도가 크게 달라질 수 있으므로, 인구 통계적 평균을 개인에게 적용할 때는 신중해야 함.
Hacker News 의견
-
"과학자들은 어떤 일이 실제로 일어날 확률이 수백만 대 일이라고 계산했다. 하지만 마술사들은 수백만 대 일의 확률이 실제로는 열 번 중 아홉 번은 일어난다고 계산했다." -- 테리 프래첫
- 소설에서 "백만 대 일의 확률이지만, 작동할지도 모른다!"라고 하면 실제로 작동할 것이라는 점을 농담하는 내용.
- _Guards! Guards!_에서는 화살로 드래곤의 약한 부분을 맞추는 것만으로는 충분하지 않고, 확률을 정확히 백만 대 일로 만들기 위해 여러 가지 불가능해 보이는 상황을 만들어야 한다고 언급됨.
-
"한 번, 누군가가 내 이름을 물었다. 나는 '마크 쉬(Mark Xu)'라고 대답했다. 그 후 그들은 아마 내 이름이 '마크 쉬'라고 믿었을 것이다. 내 운전 면허증에 '마크 쉬'라고 쓰여 있을 것이라고 20:1의 확률로 내기를 했을 것이다."
- 누군가의 이름이 '마크 쉬'일 확률은 아주 관대하게 1:1,000,000이라고 가정.
- 내가 '마크 쉬'라고 말한 것에 대한 확률 비율이 20,000,000:1, 즉 약 24비트의 증거가 됨.
- 비범한 주장에는 비범한 증거가 필요하지만, 비범한 증거는 생각보다 흔할 수 있음.
- 다음은 모두 사망 확률이 약 1백만 분의 1, 또는 1 마이크로모트인 활동들:
- 오토바이로 6마일(9.7km) 이동
- 걸어서 17마일(27km) 이동
- 자전거로 20마일(32km) 이동
- 자동차로 230마일(370km) 이동
- 제트기로 1,000마일(1,600km) 이동
- 기차로 6,000마일(9,656km) 이동
- 그러나 짧은 거리를 자전거로 이동하면 건강 효과로 인해 기대 수명이 증가함.
-
"백만 년에 한 번"–개인에게 백만 년에 한 번 일어날 수 있는 일–은 지구상의 사람들에게는 매년 8,000번 이상 발생함. 많은 사람들이 카메라가 달린 스마트폰을 가지고 있어서 빠른 갈색 여우가 게으른 개를 뛰어넘는 실제 비디오를 가질 수 있음.
-
"베커 병(Becker Bottle)"을 정말 좋아함. 이 개념을 진정으로 시각화할 수 있는 능력을 제공하며, 화학 수업에 대한 훌륭한 학습 도구이자 재미있는 놀이거리임.
-
많은 트래픽을 가진 서비스 작업을 하면서 생각남
- 그렇게 많은 트래픽을 가진 서비스에서는 경계 사례가 얼마나 자주 발생하는지 흥미로움
- 로컬에서 재현하기 어려운 일이 로그를 보면 일주일에 100번 정도 발생함
-
글쎄, 파도가 그것을 쳤어.
- 파도가 그것을 쳤다고?
- 파도가 배를 쳤어.
- 그게 이상한가?
- 오, 바다에서? 백만 분의 1의 확률!
-
내가 생각해낸 가장 좋아하는 정신적 시각화: 뉴저지에서 플로리다까지 운전하는 것을 상상해보세요 (당신이 한 긴 운전으로 대체).
- 내 경우 약 1,200마일로, 시속 60마일로 20시간이 걸림. 그것은 72,000초의 지루한 운전임.
- 만약 당신이 20시간 동안 운전하는 동안 버튼을 누르고, 그것이 15초 동안 지속되는 "위험 구역"에 들어가면 당신은 짐.
- 이 예는 복권 당첨 확률(백만 분의 1보다 나쁨)을 볼 때 더 좋음 - 창문 밖으로 25센트짜리 동전을 던져서 도로의 적절한 1인치 구역 안에 착지하기를 바라는 것을 상상할 수 있음.
- 이 예는 여러분에게 직관적인 느낌을 줌 - 도로의 길이나 시간의 길이를 비교하여 다양한 확률을 비교할 수 있게 해줌.
-
EU에서 주택, 사무실 및 기타 일반 건물의 구조 공학 안전 요소를 알아두면 좋음.
- 유로코드는 3가지 결과 클래스를 정의: CC1, CC2, CC3.
- CC1은 가장 낮은 결과를 가지며 일반 주택, 경공업 및 농업에 사용됨. 구조 실패로 인한 사망 확률이 낮음, 0.001.
- CC2 건물(아파트, 사무실, 호텔 등)은 중간 정도의 사망 확률을 가짐, 0.03.
- CC3은 대형 경기장과 같은 특별 건물에 사용되며, 구조 실패 시 사망 위험이 높음, 0.3.
- 결과 클래스는 건물이 주어진 해에 붕괴될 수 있는 확률과 연관됨. 원인은 극단적인 날씨 등이 될 수 있음.
- CC1의 경우 이는 1 in 100, CC2는 1 in 10,000, CC3는 1 in 100,000의 확률임.
- 구조 안전 표준 뒤에 있는 통계를 순수하게 보면, 한 해에 폭풍으로 인한 구조 실패로 인해 스타디움에서 한 명 이상이 사망할 확률은 1 in 300,000이 될 수 있음.
- 통계는 바람, 눈, 비, 사용 등의 하중에 대한 간단한 참조 값과 쉬운 안전 요소로 매핑됨. 예를 들어 CC2는 모든 가변 하중에 대해 1.5의 안전 요소를 가짐.
-
젊은 남성의 평생 유방암 발병 확률이 1 in 1000인 것은 실제로 꽤 흥미로움: 그것은 그의 고환암 발병 확률보다 그렇게 낮지 않음, 고환암은 대략 1 in 250의 평생 확률을 가짐(미국 기준으로 가정).
- 그리고 남성이 유방암으로 사망할 확률은 고환암으로 사망할 확률과 대략 동일함: 둘 다 약 1 in 5000의 평생 확률임.