17만 개 영어 단어 중 몇 개를 알고 있나요?
(vocabowl-870366514258.us-west1.run.app)- VocabOwl은 171,476개 영어 단어를 기준으로 사용자가 실제로 아는 단어 수를 추정하는 Scientific Word Count 도구임
- 결과를 보려면 100문항 챌린지를 풀어야 하며, 짧은 테스트로 전체 어휘 규모를 추정하는 방식임
- 문항 구성에는 층화 표본 추출(stratified sampling) 방식이 쓰인다고 안내함
- 사이트는 Gemini 3 Flash AI 사용을 내세워 단어 테스트 생성·운영 방식에 AI를 포함함
- The Rest Is Science 팟캐스트와 Prof. Hannah Fry, Michael Stevens에게서 영감을 받은 프로젝트임
VocabOwl이 제공하는 테스트
- VocabOwl은 “How many of the 171,476 English words do you actually know?”라는 질문을 중심으로 한 영어 어휘 수 추정 서비스임
- 사용자는 100문항으로 구성된 챌린지를 풀고, 자신이 아는 영어 단어 수를 확인할 수 있음
- 테스트 문항은 scientifically stratified 방식으로 구성됐다고 안내함
구현 방식과 영감의 출처
- 사이트에는 Stratified Sampling이 핵심 방식으로 표시돼 있음
- 사용 기술로 Gemini 3 Flash AI가 표시됨
- 영감의 출처로 The Rest Is Science 팟캐스트, Prof. Hannah Fry, Michael Stevens가 표시돼 있음
댓글과 토론
Hacker News 의견들
-
단어 하나마다 클릭 수가 너무 많음. 이런 “아는 단어 수” 퀴즈를 좋아해서 끝까지 하긴 했지만, 전체적으로 분류가 의심스러움
초반 단어는 쉽고 후반 단어는 어렵다는 큰 흐름은 있지만, 중간 난이도는 꽤 뒤섞여 있음. breviary는 중급이라기엔 훨씬 더 희귀하고, Hippopotomonstrosesquippedaliophobia 같은 공포증 단어는 실제로 쓰이는 단어라기보다 초등학생이 사전에서 찾아 보여줄 법한 장난에 가까움. metamorphosis와 kinetic을 expert로 둔 것도 납득하기 어려움
정의도 대체로 알아볼 만했지만 lethargy를 “무기력한 상태”라고 한 건 뻔하고, complacent를 “자기만족적 우쭐함”으로 본 건 과하며, magnanimous에 “경쟁자”가 꼭 필요하진 않고, gauche는 “사회적으로 어색함”만으로는 tactless 뉘앙스를 놓침
“과학적”이라고 하면서 대충 공식만 제시하고 단어를 처음에 어떻게 층화했는지 설명하지 않음. 층화 표본 추출이 이런 일에 정식으로 인정된 방법이라면 실제 참고문헌 링크가 있었으면 함. 단어를 많이 안다고는 생각하지만, 이 앱이 준 75k 이상 추정치는 믿기 어려움- 몇 가지는 오히려 괜찮았다고 봄. breviary는 나에겐 익숙하고 드물지 않은 단어였음. 가톨릭 신자에게 널리 알려져 있고, 중세 미술이나 책에 관심이 있으면 알 가능성이 큼. 인쇄술 이전의 주요 책 종류 중 하나라, 채식 필사본 이미지를 떠올리면 절반쯤은 거기서 나온 것일 수 있음
Hippopotomonstrosesquippedaliophobia는 전체 단어를 외우라는 게 아니라 구성 요소를 보고 뜻을 추론하라는 문제로 보임. sesquippedalian을 알고 있었고, phobia도 쉽게 알아볼 수 있으며, hippo도 동물보다는 라틴어 어근상 “큰”에 가까울 수 있다고 짐작 가능함
complacent와 gauche도 그런 쓰임을 들어봤고, 사전이라면 나빠도 2~3번째 정의쯤은 될 것 같아서 불만 없음. 예전에 spelling bee에서 성적을 냈고, 주말마다 사전을 몇 시간씩 공부할 규율만 있었다면 더 올라갈 수도 있었음 - 마지막 단어 중 하나로 kerfuffle이 나왔는데 꽤 흔한 단어임. 반면 Zenzizenzizenzic은 처음 들어봤지만 맞힌 것 같음
내가 고른 답과 틀린 답의 정답을 보여주는 요약이 있으면 훨씬 좋겠음 - complacent가 본질적으로 smug하진 않아 보인다는 데 동의하지만, 이상하게 dictionary.com과 Wiktionary 모두 smug를 동의어나 정의 일부로 넣고 있음
다만 그쪽에서는 smug도 self-satisfied나 self-complacent와 비슷하게 분석하니, 예상과 다른 쪽은 smug의 의미일지도 모름. 내 감각으로 smug는 단순히 “자기-” 성격이라기보다 관계적이고, 누군가보다 우월한 상황을 즐기는 느낌임. complacent는 기본적으로 자기 상황에 만족하는 것이지만, 더 나아지기 위해 행동해야 하는데 그러지 않는다는 부정적 함의가 자주 붙음 - 테스트가 거의 적응형으로 보이지 않는데도 HN 첫 페이지에 올라갔다는 게 인상적임
- Hippopotomonstrosesquippedaliophobia를 몰라도 보기 네 개 중에서는 아주 쉽게 맞힐 수 있음
단어마다 클릭이 너무 많아서 끝내는 데 오래 걸렸고, 모르는 단어도 보기 때문에 추측이 너무 쉬웠음
- 몇 가지는 오히려 괜찮았다고 봄. breviary는 나에겐 익숙하고 드물지 않은 단어였음. 가톨릭 신자에게 널리 알려져 있고, 중세 미술이나 책에 관심이 있으면 알 가능성이 큼. 인쇄술 이전의 주요 책 종류 중 하나라, 채식 필사본 이미지를 떠올리면 절반쯤은 거기서 나온 것일 수 있음
-
개념은 흥미롭지만 100단어를 풀어야 하는 건 꽤 많음. 처음의 쉬운 단어들을 지나가는 게 지루해서, 흥미로운 단어가 나오기 전에 질려버렸음
이런 시스템은 내부적으로 점수와 신뢰도를 두고 훨씬 빠르게 보정할 수 있음. 처음에는 신뢰도가 낮고 시간이 지나며 올라가며, 초반에는 정답/오답이 점수를 빠르게 움직이다가 점차 안정되는 식임
실제로는 처음에 점점 덜 흔한 단어가 나오다가 틀리면 더 쉬운 단어로 돌아가고, 다시 맞히기 시작하면 결국 자기 수준 근처의 단어를 맴돌게 됨. 그리고 단어당 클릭도 너무 많음. 부담 없는 테스트니 정의를 한 번 클릭하면 바로 처리하고, 오클릭이 걱정되면 실행 취소 버튼을 두면 됨- 입력 실수도 생긴다고 보고 그걸 신뢰도 계산에 넣어야 함. 세상에서 가장 똑똑한 사람도 가끔 단순 입력 실수를 하거나, 순간적으로 엉뚱한 뉴런이 발화할 수 있음
- 특히 첫 번째 지적에 동의함. 10단어쯤 풀고 이탈했는데 다음 단계로 넘어가는 길이 명확하지 않았음
- 충분히 어려워지지도 않음. 게다가 너무 많은 단어가 긴 단어 자체나 장황하게 말하는 성향에 관한 단어였음
- 모바일에서는 제출 버튼이 화면 아래에 있어서 스크롤도 필요함. 한 번 스크롤한 뒤에는 위치가 맞는 것 같긴 함
- 클릭할 곳도 너무 멀리 떨어져 있음. 노트북에서 답을 고르고 확인하려고 커서를 계속 위아래로 움직여야 함
각 선택지에 글자나 숫자를 붙이고 키보드로 누를 수 있게 하면 좋겠음. 예전에 그런 폼 서비스가 있었고 꽤 잘 작동했는데 Typeform이었던 것 같음. 확인하려고 열어보니 이제 온통 AI 언급으로 덮여 있어서 확인할 흥미가 사라짐
-
다른 지적들에 더해, 구조적 오류 때문에 계산이 절반만 맞음. 세는 방식에 따라 100% 틀렸다고도 볼 수 있음
영어 원어민이고 책을 많이 읽는 괴짜이며 SAT 만점인데, 검색 없이 100개를 전부 맞혔음. 그런데도 “SCIENTIFIC ESTIMATE”가 170,000개 중 85,000개를 안다고만 나와서 혼란스러웠음
마지막의 “How is this calculated” 페이지를 보면 Oxford English Dictionary Second Edition 기준 현재 사용 단어가 약 171,476개라고 하면서, 난이도 구간을 Core Basics 3,000, Intermediate 7,000, Advanced 10,000, Expert 25,000, The Obscure 40,000+으로 나눔. 총점은 각 구간 정확도 × 구간 크기의 합이라고 함
그런데 이 구간들을 다 더해도 85,000이라 완벽한 점수를 받아도 50%만 나옴. 게다가 언어의 아주 제한적이고 난이도 대표성이 부족할 수 있는 부분집합을 쓰고 있음. 귀엽지만 여러 면에서 틀렸음- 완전히 같은 피드백임. 100개를 다 맞혔고 결과도 같았음
영어 어휘 테스트에서는 흔히 그렇듯, 그리스어를 알면 고난도에서 유리함 - “고급 단어” 선택이 좀 이상함. obscure가 그렇게 obscure하지 않음
전문적인 단어도 있긴 하지만, 대부분은 Radio 4의 평범한 대화에서도 들을 법한 단어들임 - 상당수는 보기 4개 중 3개가 명백히 말이 안 돼서 맞힐 수 있음. 진짜 추정이 목표라면 그냥 맞는 걸 고르게 하기보다 “모르겠음” 버튼이 있었으면 함
- 분명 AI로 만든 것 같음
- 80개쯤 맞혔고 57k가 나왔음
- 완전히 같은 피드백임. 100개를 다 맞혔고 결과도 같았음
-
78,000이 나왔고, 제2언어 치고는 꽤 좋음. 이 테스트의 최대값은 85,000처럼 보임
선택지들은 LLM이 만든 것 같고, “now”와 “forever”가 자주 보이는 등 몇 가지 패턴이 있음
몇 년 전에는 비슷한 게임을 했는데, 연속으로 충분히 맞히면 레벨이 올라가고 하나 틀리면 내려가는 식으로 계속 플레이할 수 있었음. 아주 높은 레벨에서는 오히려 쉬워졌는데, 고대 영어 단어가 섞였고 그 단어들이 내 모국어인 네덜란드어와 사실상 같았기 때문임. 자선 요소도 있었던 것 같고 아마 https://freerice.com/였는데, 지금은 게임이 단순화된 듯함
벨기에 Ghent University에도 흥미로운 테스트가 있었고, 특정 교육 수준의 평균 점수와 비교해 숙련도를 평가했음. 거기서는 41,000 정도가 나왔고, 대학 수준 영어 원어민 평균으로 평가됐던 것 같음. https://languagehat.com/ghent-vocabulary-test/ 하단 업데이트에 그 테스트가 어디로 갔는지와 몇 가지 대안이 있음 -
꽤 재미있음
제출 버튼을 없애고, 누르면 정답 여부를 보여준 뒤 1초쯤 지나 다음으로 넘어가면 좋겠음. 제출을 두 번 눌러야 하는 흐름이 몰입을 깨뜨림
또 내가 본 단어들에서는 보기 4개 중 하나가 정답, 하나가 정답의 반의어, 나머지 둘은 무작위에 가까웠음. 사실상 반의어가 함께 나오지 않은 선택지는 건너뛰어도 됨- 키보드 단축키가 있으면 100단어를 훨씬 덜 어색하게 풀 수 있음. 1~4로 보기 선택, Enter로 제출하고, 레이아웃이 덜컥 움직이는 문제도 고쳐야 함
- 74k로 추정됐지만 부풀려졌을 수 있다고 느낌. 답을 모를 때도 보기 분위기로 추측할 수 있는 경우가 많았고, 오답 선택지가 충분히 그럴듯하지 않았음
우선 단어를 흔한 영어 단어로 분해한 답은 배제할 수 있었음. 그렇게 쉽게 분해되는 단어라면 애초에 obscure일 리가 없기 때문임
객관식 문제의 오답 선택지를 쓰는 건 어렵다. 내가 아는 시험 중에서는 계산이나 암기를 요구하는 시험을 제외하면 폴란드 의사 국가시험인 LEK가 거의 잔혹할 정도로 잘함. 해당 분야 밖의 사람이 감으로 찍어서 무작위 확률 이상을 내기가 거의 불가능함 - 답을 잘못 누른 것이 아니라 휴대폰 화면을 실수로 건드린 것만으로 오답 처리된다면 정말 싫을 것 같음
-
“모르겠음”으로 답할 수 있어야 함. 정말 모를 때도 1/4 확률로 맞히는 건 불공정하고, 흔한 객관식 풀이 요령을 쓰면 더 잘 맞힐 수도 있음
기꺼이 틀렸다고 처리받고 싶었던 단어 몇 개도 맞힌 것으로 계산됐음- 100개를 전부 풀었는데 1/4도 아님. 어려운 단어에서는 설명 하나가 다른 것보다 훨씬 길면 그게 정답인 경우가 많음. 그 밖에도 선택지 두 개는 보통 어떤 사물인데, 그런 답은 정답인 적이 거의 없는 것 같음
난이도도 조금 섞어야 함. 마지막 30개쯤은 지루한 노동처럼 느껴졌음. 아이디어 자체는 멋짐 - 각 단어마다 예/아니오로 정의를 아는지 답하게 하면 더 쉽고 빠를 것임. 그러면 100개도 빠르게 훑을 수 있음. 각 선택지에 키보드 단축키도 있으면 좋겠음
- 몇 개는 선택지를 비교해서 올바른 정의를 추론했음
- 강제로 추측하게 하는 편이 더 의미 있을 수도 있음. 알고 있는 단어 구성 요소를 바탕으로 추측할 수 있기 때문임
최악의 경우에도 우연히 맞힐 25% 확률은 보정할 수 있음
- 100개를 전부 풀었는데 1/4도 아님. 어려운 단어에서는 설명 하나가 다른 것보다 훨씬 길면 그게 정답인 경우가 많음. 그 밖에도 선택지 두 개는 보통 어떤 사물인데, 그런 답은 정답인 적이 거의 없는 것 같음
-
문제를 꽤 쉽게 요령으로 풀 수 있음. 많은 선택지가 단어 정의처럼 보이지 않고, “정답 + 반대 의미 + 무관한 2개” 구조가 자주 나오며, 후반부에는 가장 긴 답이 정답인 경우가 아주 많음. 오답 선택지 설계가 좋지 않음
단어 표본도 단어, 말하기, 화자, 설득과 관련된 개념에 심하게 치우쳐 있음. 아마 LLM이 단어 고르기 작업에 맞춰 프롬프트를 받으면서 “단어”와 관련된 단어들을 고르게 된 듯함
배경을 말하자면 제2언어 화자이고 언어학 덕후이며 영어는 주로 학술·전문 환경에서 사용함. 위 요령들을 섞어 75,400이 나왔지만 실제로는 10~15k에 가까울 수 있음
디자인도 누가 보면 알겠지만 Duolingo와 고통스러울 정도로 비슷함- “등의 날카로운 통증” 같은 정의 때문에 영어 단어 lumbago를 찾아봐야 했음. 독일어에는 다채로운 표현인 Hexenschuss가 있음
어느 정도 나이가 있는 사람이라면 대부분의 언어에 이런 통증을 가리키는 단어가 있다는 데 공감할 것 같음 - 세미콜론이 들어간 선택지는 전부 정답이었음
- 랜딩 페이지에서 바로 Duolingo 같다는 걸 알아봤음
- “등의 날카로운 통증” 같은 정의 때문에 영어 단어 lumbago를 찾아봐야 했음. 독일어에는 다채로운 표현인 Hexenschuss가 있음
-
100개 중 88개를 맞혔지만, 거기서 알게 된 건 내가 추측을 꽤 잘한다는 것뿐임. 20개쯤은 그럴듯하지 않은 보기를 제거하거나, 단어 일부의 의미에서 추측해서 맞힐 수 있었음
내가 진짜 아는 단어 수와 맞힐 수 있는 단어 수를 더 정직하게 평가하려면 “모르겠음” 선택지가 있었으면 함 -
수준을 더 빨리 찾으려면 ELO 평점을 써야 함. 기본 단어 100개를 힘들게 푸는 건 의미 없음
-
OED의 171,476이라는 수치를 부정확하게 쓰고 있고, 사전과 언어를 크게 오해한 방식임
이 숫자는 Oxford English Dictionary 20권짜리 Second Edition에서 “current use”로 정의된 단어의 full entry 수를 가리킴. 단어 수를 뜻하지 않음. OED의 이형 철자, 굴절형, 구, run-on 항목도 모두 포함하지 않음
게다가 OED가 영어의 완전한 목록인 것도 전혀 아님. 사실 업데이트 주기가 매우 느리기 때문에 수백만 단어가 빠져 있을 가능성이 큼. 사전 편집자이자 사전학자로서 OED를 매일 쓰고, 만드는 사람들도 알고 있음