2P by GN⁺ 13시간전 | ★ favorite | 댓글 2개
  • 케냐 교육 시스템에서 형성된 공식적 영어 문체가 AI가 생성한 글처럼 보인다는 지적을 계속 받고 있음
  • 영어 작문 교육의 구조적 훈련이 문장 균형, 논리적 흐름, 연결어 사용 등을 강조해 AI 글쓰기와 유사한 결과를 낳음
  • 이러한 문체는 식민지 시절 영국식 영어 교육의 유산으로, 사회적 지위와 교양의 상징으로 유지되어 옴
  • AI 탐지기와 언어 모델의 편향이 비원어민의 글을 ‘비인간적’으로 판단하는 문제를 지적
  • 글쓰기를 통해 드러나는 것은 기계가 아니라 역사·교육·언어적 정체성의 산물임을 강조

AI와 인간 글쓰기의 오해

  • 본인의 제안서에 대해 “ChatGPT가 쓴 것 같다”는 피드백을 받은 경험에서 출발
    • 문체가 구조적이고 논리적이라는 이유로 ‘인간미가 부족하다’ 는 평가를 받음
  • 많은 작가들이 비슷한 반응을 겪고 있으며, 이는 비원어민 작가에 대한 편견과 연결됨
  • 글쓴이는 자신의 문체가 AI와 닮은 이유가 AI가 자신들의 교육 방식을 학습했기 때문이라고 설명

케냐식 영어 교육의 형성

  • KCPE(케냐 초등교육 자격시험) 의 영어 작문 시험이 글쓰기 훈련의 핵심
    • 40점 만점의 시험에서 높은 점수를 받기 위해 풍부한 어휘와 복합문 구조를 익혀야 함
  • 작문 규칙은 세 가지로 요약됨
    • 속담이나 강한 문장으로 시작, 다양한 어휘 사용, 완벽한 구조 유지
  • 교사는 빨간 펜으로 문법과 구조를 교정하는 ‘원조 알고리듬’ 역할을 수행
  • 이러한 훈련은 논리적·균형 잡힌 문장 구성을 강조하며, 이후 고등학교와 대학에서도 지속됨

식민지 유산과 언어의 위계

  • 케냐의 영어 교육은 영국 제국의 언어 체계에서 비롯됨
    • ‘Queen’s English’ 를 기준으로 한 문법적 정확성과 격식을 중시
  • 독립 이후에도 이 언어는 공식 언어이자 사회적 지위의 상징으로 유지
    • 정제된 영어 구사는 교육 수준과 계층을 구분하는 기준이 됨
  • 결과적으로 AI가 학습한 방대한 공식 문체는 케냐식 영어 교육의 산물과 유사한 형태를 띠게 됨

AI 탐지기의 편향과 한계

  • AI 탐지기는 ‘perplexity(예측 가능성)’‘burstiness(문장 길이 다양성)’ 을 기준으로 판별
    • 예측 가능한 문장 구조와 일정한 리듬은 비인간적으로 간주됨
  • 그러나 케냐식 교육은 바로 이런 예측 가능하고 균형 잡힌 문체를 이상으로 삼음
  • 연구 결과, 이러한 탐지기는 비원어민의 글을 AI 생성물로 잘못 분류할 가능성이 높음
  • 이는 언어적 다양성을 배제하는 기술적 편향을 드러냄

인간성과 언어의 재정의

  • 케냐 작가의 글은 기계가 아닌 교육과 역사, 문화의 결과물
  • ‘인간적인 글쓰기’의 기준이 비공식적이고 미국식 표현으로 한정되는 현실을 비판
  • 나이로비, 라고스, 뭄바이 등지의 작가들도 정확성과 논리성을 존중하는 글쓰기 전통을 공유
  • “AI처럼 보인다”는 판단은 다른 형태의 인간성을 인식하지 못하는 시선
  • 글의 결론은, 이것이 바로 케냐인의 글쓰기이며 오래전부터 이어져 온 방식이라는 선언으로 마무리됨
Hacker News 의견들
  • 우리 세대는 교사에게서 제자에게로 전해지는 글쓰기의 불문율을 배워왔음
    첫 문장은 반드시 속담이나 강렬한 문장으로 시작해야 했고, 평범한 단어 대신 ‘strode purposefully’ 같은 표현을 써야 했음
    하지만 대학에서 글쓰기를 공부하면서 점점 단순한 문장과 짧은 표현으로 밀려갔음
    지금은 Hemingway식 문체가 이상적이라 느껴짐. ChatGPT의 화려한 문체는 오히려 피로감을 줌
    작가의 실력은 인정하지만, 나는 단순하고 명료한 글을 선호함

    • 문장을 짧게 쓰는 강박이 영문 산문을 망쳤음
      대부분의 사람에게는 단순함이 도움이 되지만, 긴 문장이나 세미콜론, 미묘한 어휘를 ‘나쁜 글’로 치부하는 풍조가 문제임
      이런 태도는 독자와 작가 모두의 성장을 막음
      다만 ‘proceeded to’ 같은 표현은 여전히 쓰레기임. 학생들에게 억지로 ‘똑똑해 보이는’ 단어를 쓰게 하는 건 최악의 교육 방식임
      내 아내는 작가인데, 팬픽이나 로맨스 소설에서 ‘strode’라는 단어가 유난히 자주 등장한다고 함. 모두가 걸을 때마다 ‘당당히 걸었다’고 쓰는 건 아마추어의 흔한 특징임

    • 글쓰기 스타일에는 계급적 신호가 숨어 있음
      기사에서 말하듯, 우리가 배운 영어는 제국주의 시대의 ‘Queen’s English’였고, 권력의 언어였음
      글의 형식미를 익히는 건 단순히 시험을 통과하기 위한 게 아니라 ‘문명화된 사람’임을 증명하는 행위였음
      글쓰기의 유행은 사회적 패션의 순환과 비슷함. 화려한 문체가 대중화되면 상류층은 반대로 단순한 문체로 차별화함
      Hemingway식 절제된 문체는 마치 ‘찢어진 1000달러짜리 청바지’처럼, 여유 있는 자만이 일부러 검소하게 보이는 행위와 같음

    • 나는 Big Three 기업 중 한 곳에서 일했는데, ChatGPT의 문체가 회사에서 배운 자기평가 보고서 문체와 똑같음
      성과보다 ‘이야기’를 잘 포장하는 게 승진의 핵심이었음

    • 혹시 미국인인가? 영어권이라도 영국식과 미국식의 문화 차이가 큼
      미국인은 덜 허세스럽고 직설적인 반면, 영국식 영어는 여전히 화려하고 장식적인 경향이 있음
      내 체감상 영국인의 어휘력은 세대가 지날수록 줄어드는 중임

    • 글쓰기에는 두 가지 목적이 있음
      (1) 아이디어 전달용 글쓰기 — 단순할수록 좋음. Paul Graham의 에세이처럼 정보가 마찰 없이 머리에 들어옴
      (2) 자기표현용 글쓰기 — 화려하고 예술적인 문체가 어울림
      David Foster Wallace가 말했듯, 전자는 대화처럼 소통하는 글이고, 후자는 “이게 나야!”를 외치는 일기 같은 글임

  • LLM 학습 데이터의 상당 부분이 케냐에서 큐레이션되었다는 점이 흥미로움
    만약 일본에서 데이터가 만들어졌다면, ChatGPT가 “Don’t you agree?” 같은 일본식 어미를 썼을지도 모름
    관련 기사

    • 인도 출신 교재 저자 Malkiat Singh의 영향이 큼
      그의 교재는 케냐에서 표준 교재로 쓰였고, 그 제자들이 LLM 데이터 큐레이터가 되면서 그 문체가 전 세계 AI에 스며든 셈임
      Malkiat Singh 위키

    • (짧게) 어쩔 수 없는 일 같음

    • 樣은 아마 “ChatGPT (Japan)” 밈을 준비 중인 듯함 XD

    • 하지만 데이터 라벨링은 LLM의 텍스트 생성용 학습 데이터와는 별개임. 오해가 많음

  • 1897년 시카고 City News Bureau의 스타일 가이드를 읽었는데, 흥미로운 규칙이 많았음
    예를 들어 ‘night’와 ‘evening’을 혼동하지 말고, ‘very’는 불필요하게 쓰지 말라는 식임
    이런 세세한 규칙들이 당시의 언어 감각을 보여줌

    • 참고로 LWN도 여전히 ‘very’를 피하는 태도를 유지함
  • 내 눈에는 이 글의 문체가 ChatGPT와 전혀 다르게 보임
    많은 사람이 em-dash(—) 사용을 AI의 흔적으로 보지만, 그건 약한 신호임
    오히려 ChatGPT는 과장된 어투와 ‘공허한 장엄함’을 만들어냄
    실제로 문단을 비교해보면, AI 버전은 더 화려하지만 덜 진정성 있게 느껴짐

    • 이 글은 흡입력이 있음. 대부분의 GPT 출력은 한 단락만 넘어가면 집중이 끊김
      읽고 나면 아무 정보도 남지 않는 느낌임

    • LLM과 인간의 차이는 많은 단어로 아무 말도 하지 않는 능력에 있음

    • 이미 완성도 높은 문장을 GPT에 ‘개선하라’고 하면, 당연히 더 장황하게 만들 수밖에 없음
      원문은 구조적 장식이 있지만 의미가 살아 있음. AI가 쓴 글은 정보 밀도가 낮고 지루함

    • em-dash를 무작정 사냥하는 건 문법을 모르는 사람들의 행동임

  • 예술가나 유튜버도 같은 문제를 겪고 있음
    AI처럼 보인다는 이유로 오해받는 현상이 늘어남
    실제로 목소리가 AI 음성과 비슷하다는 이유로 일자리를 잃는 성우도 있을 것 같음

    • 나도 Factorio 영상을 올렸는데, 몇몇 시청자가 “AI 음성이 거슬린다”고 댓글을 달았음
      실제로는 내가 직접 말했고, 영상 끝에 얼굴도 나왔는데도 그랬음
      AI 음성은 감정이 없고 발음이 어색해서 금방 티가 남
      요즘 튜토리얼 영상 중엔 AI가 쓴 스크립트를 그대로 읽은 ‘내용 없는 영상’이 많음
      그래서 이제는 신뢰하는 크리에이터의 영상만 보게 됨
      내 영상 링크

    • AI 이미지 생성에 실제 인물의 얼굴이 무단 사용된다면, Pierce Brosnan이 가장 먼저 보상받아야 할 듯함

  • 우리 팀에서도 ChatGPT처럼 말하는 동료가 있었음
    WhatsApp과 Zoom에서 그의 말투가 너무 기계적이라 Meta AI에게 물어봤더니 “AI가 쓴 글 같다”고 답했음
    하지만 그는 실제로 AI를 쓰지 않았다고 했고, 지금 생각해보면 그럴 수도 있겠다는 생각이 듦

    • 하지만 AI에게 AI 판별을 맡기는 건 말이 안 됨. 그건 자기 자신에게 묻는 셈임

    • 나도 “ChatGPT가 나처럼 쓴다”는 경험을 했음
      나는 목록과 포맷팅을 자주 쓰고, 난독증 친화적인 글을 선호함
      2019년에 쓴 노트를 봐도 이미 ChatGPT 같은 느낌이 있었음
      일부러 철자 실수를 넣거나 비정형적인 문체를 섞기도 함

    • 냉정하게 말하면, 글이 ChatGPT의 기본 출력과 구분되지 않는다면 그건 나쁜 글
      실제로 AI를 쓰지 않았더라도, 그런 문체는 개선이 필요함
      교육에서는 AI보다 더 나은 글을 쓸 수 있는 사람에게만 좋은 평가를 줘야 함

    • “ChatGPT처럼 똑똑하게 들리려 한다”는 이유로 동료를 비난하는 건 좀 웃김

  • em-dash 논쟁이 흥미로움
    예전엔 Word가 자동으로 바꿔줄 때만 봤고, 직접 입력해본 적이 없었음
    Windows에서 Alt+0151을 눌러야 한다는 걸 이번에 처음 알았음
    그래서 나에겐 em-dash가 여전히 낯선 기호
    이제는 사람들이 다른 환경에서 쓴다는 걸 이해하게 되었음

    • 사실 HN에는 ChatGPT 이전부터 em-dash를 즐겨 쓰던 사람들이 있었음
      HN em-dash 사용자 순위표

    • 나는 emacs에서 Typo mode를 켜서 en/em dash와 스마트 따옴표를 자동으로 쓰게 설정함

    • HN 데이터셋을 분석해봤는데, AI 확산 이후에도 em-dash 사용량은 늘지 않았음
      다만 과도한 괄호식 문장 구조는 AI나 미숙한 글의 특징임

    • macOS 메모장에서 --가 자동으로 로 바뀌는 바람에 터미널 명령이 실패한 적도 있음

  • OP의 영어 실력에 감탄함
    대부분의 비원어민은 학교에서 문학적 영어를 배우기 때문에 형식적인 문체가 익숙함
    나도 프랑스에서 그런 교육을 받았지만, IT 업계에서 일하며 미국식 직설적 영어로 바뀌었음
    이 글은 ChatGPT가 쓴 게 아님. 불필요한 장식이 없고, 정보 밀도가 높음
    AI 글은 절반 이상을 건너뛰게 되지만, 이 글은 한 단어도 놓치고 싶지 않은 글이었음

  • 글을 잘 쓰는 사람의 저주 같은 현상임
    ChatGPT가 ‘잘 쓰는 글’을 흉내 내도록 설계되었기 때문에, 잘 쓰는 사람일수록 AI로 오해받음
    실제로 문법 오류가 많은 글도 ChatGPT처럼 들린다는 이유로 비난받는 걸 봤음

    • ChatGPT는 아프리카 비즈니스 영어로 훈련되었다는 공개 정보가 있음
      관련 기사
      ‘잘 쓴다’는 정의를 장황하고 무난하며 비판을 피하는 문체로 본다면, 그건 맞음

    • 사실 LLM은 사람보다 글을 잘 쓰지 못함
      ‘a/an’ 같은 기본 문법도 자주 틀리고, ‘because traffic’ 같은 의미 생략형 표현을 여전히 씀
      이런 걸 보면 인간의 세심한 의미 조정 능력은 여전히 우위에 있음

    • OP의 글에는 LLM 특유의 인공적인 느낌이 없음
      em-dash 사용도 자연스럽고, 개인적 감정이 묻어 있음

    • 나는 ChatGPT식 문체를 싫어함
      마케팅 문구처럼 피로감을 주고, 공허한 화려함만 남음
      이런 글은 독자를 지치게 하고, 정보 전달력도 떨어짐
      케냐에서 이런 문체를 가르친다는 게 놀라움

  • “나는 ChatGPT처럼 쓰지 않는다, ChatGPT가 나처럼 쓴다”는 말이 인상적임
    결국 우리는 점점 ChatGPT처럼 말하고 쓰게 될 운명
    아이들은 숙제를, 어른들은 이력서와 상담을 AI에게 맡기고, 대화에서도 “그건 맞아, 이유를 세 가지로 정리해볼게” 같은 말투를 쓰게 될 것임

    • (별 눈 이모지) “맞아요, Jim!”
      (체크 이모지) 이모지를 더 추가하세요 — 인간은 이모지를 사랑함
      (빨간 X 이모지) “bullshit” 같은 부정적 단어는 피하세요
      (엄지 이모지) 곧 인간 피드백 학습을 넘어설 거예요 (스마일)

재밌는 글이네요