단순히 X가 아니라, Y다

(mail.cyberneticforests.com)

3P by GN⁺ 1달전 | ★ favorite | 댓글 1개

LLM이 즐겨 쓰는 "It's not X, it's Y" 부정 대조 구문은 본래 대비를 설정하고 기존 가정을 재구성하는 데 유용한 수사 기법
최근 모델의 과용으로 이 구문이 나쁜 글쓰기로 낙인찍혔으나, 수사 장치는 담는 내용에 따라 가치가 달라짐
AI 탐지기와 Grammarly 같은 도구는 이런 패턴을 색출해 기계가 인간처럼 쓰도록 다시 인간이 쓰게 만드는 역설 유발
이 구문의 확산 원인으로 RLVR(검증된 보상을 통한 강화학습) 지목, 모델이 정답에 도달할 때 쓴 언어가 강화되는 방식과 연결
언어 패턴 자체를 평가 대상으로 삼으면 Goodhart의 법칙처럼 언어가 좋은 언어이기를 멈추며, 기계 판단에 의존하지 말고 비판적 사고가 필요함

부정 대조 구문과 그에 대한 반발

LLM이 끌리는 negative parallelism(부정 대조) 구문은 대비를 설정하는 기능을 가지며, "당신은 저렇다고 생각하지만 사실은 이렇다"처럼 가정을 재구성할 때 특히 유용
이 구문은 소셜 미디어, 특히 LinkedIn에 만연해 있으며, 자동 언어 생산에 대한 전쟁 속에서 반발 촉발
- em-dash 사용, delve·quietly·genuinely 같은 단어, 3개 항목 나열 등이 봇의 징표로 의심받음
최근 모델의 과용으로 많은 이가 이를 나쁜 글쓰기로 규정했으나, JFK의 "조국이 당신에게 무엇을 해줄지 묻지 말고, 당신이 조국에 무엇을 할 수 있는지 물으라"는 문장도 같은 기법이며 누구도 게으른 글이라 부르지 않음
- 수사 장치는 담는 내용에 따라 게으르거나 영감 있는 것이 될 뿐

자동 언어 생산과 탐지 도구의 역설

AI 탐지기는 이런 패턴을 찾아 마녀사냥에서 보호한다고 주장하나, 자신의 글을 Grammarly에 넣으면 AI 탐지기가 표시할 단어 패턴을 분석해 수정안 제시
- 이는 Grammarly에 대신 글 쓸 권한을 주고, 글의 리듬과 의도를 잃게 만듦
Grammarly는 한 섹션에서 27개 표현을 수정 대상으로 지적
- "automated language production"을 AI일 확률 11배 높음으로 표시, "against mechanized language synthesis"로 대체 제안
- "align with"는 AI 생성 확률 43배 높음으로 표시, 인간은 "corresponds"를 쓴다고 제안
- 작은 제안이 쌓여 결과가 자신이 선택하지 않은 글이 됨, 인간처럼 들리려는 기계가 인간 목소리를 대체
또 다른 AI 탐지 업체 Pangram에 $20을 지불해 투고 전 논문이 AI 생성이 아님을 확인
- 자신이 안 썼는지 알기 위해서가 아니라, 표시당하지 않을 것이라는 통보를 받기 위해 지불, 이를 사실상 갈취(extortion) 로 규정
- Pangram은 high·very likely·somewhat likely·human의 4단계 점수로 진실성을 범주화

추론에 적대적인 문화와 사후 학습

기계를 이해하려는 본능은 학습 데이터를 들여다보는 것이나, 그 데이터는 더 이상 "그냥 웹"이 아니며 웹은 원재료일 뿐 무겁게 가공됨
사후 학습(Post-training) 은 모델을 설계 목적에 맞게 최적화
- RLHF(인간 피드백 기반 강화학습): 인간이 응답에 순위를 매기면 시스템이 그런 응답을 강조
- RLVR(검증된 보상을 통한 강화학습): 더 기이하며 "It's not X, it's Y" 구문이 자주 나타나는 원인으로 의심됨
이 언어를 게으르다고 일축하면 왜 도처에 나타나는지 이해를 방해, 사고를 위한 강력한 틀을 모델의 사고 능력으로 착각하게 됨
- 언어가 한 일을 연산의 공으로 돌리는 셈

RLVR의 작동 방식

RLVR은 단어를 감시해 하위 프로세스를 작동시키는 구조가 아니라, 일반 모델처럼 학습된 뒤 토큰을 예측
- 토큰 예측은 학습 데이터의 수학적 분포에 따라 후보 목록을 만들고, 앞선 단어에 비춘 가능성으로 순위를 매기는 과정
RLVR은 모델이 수학 문제를 풀어가며 해법에 이르는 과정을 글로 쓰게 하여, 우리가 소리 내어 생각할 때 쓰는 언어를 재현
- 정답에 도달했을 때 그 과정에서 가장 자주 쓴 언어가 완성된 모델에서 강조됨, 이것이 업계가 부르는 reasoning(추론) 의 일부
"이상한 개" 비유
- 폰이 꺼진 상태에서 친구가 "그 이상한 개를 본 게 무슨 요일이었지?"라고 묻는 상황 제시
  - "목요일이었어" → 친구: "아니야, 목요일엔 내가 출장이었어" → "그럼 수요일, 친구 생일 파티 가는 길에 봤잖아" → 친구: "맞는데 파티는 금요일이었어, 그러니 금요일에 본 거야"
- 두 사람은 사진으로 검증 가능한 정답에 언어를 통해 도달, 첫 직감("목요일")은 모델이 예전에 멈추던 첫 추측에 해당
- 실제 기억과 경험을 가진 두 사람과 달리, 모델은 언어를 점점 길게 확장하며 추론의 패턴을 복제, 언어를 통해서가 아니라 언어 안에서 숙고를 재연
"suppose…", "because", "consider", "alternatively", "wait" 같은 고엔트로피(high-entropy) 단어가 더 긴 사변적 구절을 유발
- 대비·예외·추상을 끌어오는 언어로 이어지며, 수학 문제 정답에 도달하면 더 자주 나타나도록 강화됨

우리가 추론하는 이유

"이상한 개" 같은 대화의 요점은 달력 날짜 식별이 아니라 회상을 여는 것, 기억을 재구성하고 맥락을 음미하며 친구 간 연결을 깊게 하는 데 있음
LLM에서 쓰이는 추론 정의는 질문의 요점이 답을 얻는 것이고, 답은 검증 가능하며, 즉각적 종결에서 잃을 것이 없다고 가정
- 이는 글쓰기에 실제 영향을 미치며, 언어 모델로 사고를 빠르게 프로토타이핑할 때 의심에 대한 개방성을 잃음
- 모호함·의심·불확실성은 어떤 사고 방식에서 즉각적 답보다 더 중요
AI 탐지기가 텍스트를 AI 생성으로 표시하는 것은 추론의 구조적 패턴을 따르기 때문인지 의문, Pangram과 추론 모델 모두 인간이 글을 쓰며 추론하는 구조적 패턴을 탐지
- Pangram 모델은 2021년 이전 데이터로 학습한 뒤 동일 텍스트의 AI 생성 버전을 학습에 삽입
기계처럼 보인다고 공개적으로 망신을 주면, 사람들이 두려움에 "AI 글쓰기"로 내면화한 구조를 피하게 되어, 추론을 위한 언어가 감시받아야 한다는 신호 전달
- 결국 모델이 우리에게서 배운 구조, 즉 논증에 효과적인 도구를 비껴가게 만들어, 비판적 사고의 도구가 가장 필요할 때 그것을 꺼내게 됨

측정이 목표가 될 때

영국에서 AI 기반 에세이 평가 도구가 인간 채점자와 비교 테스트됨
- 이 시스템은 에세이 길이, 어휘 범위, 문장 복잡성에 기반해 높은 점수를 주었고, 이는 학문적 기준과 무관한 경우가 많음
- 이런 특성은 RLVR 기반 추론과 닮은 AI 추론의 특징, 즉 LLM이 엔지니어가 LLM을 평가하는 기준으로 인간을 채점하는 셈
경제학의 Goodhart의 법칙: "관찰된 통계적 규칙성은 통제 목적으로 압력을 받으면 붕괴하는 경향", 즉 측정이 목표가 되면 좋은 측정이기를 멈춤
- LLM에 적용하면 "언어의 측정이 목표가 될 때, 좋은 언어이기를 멈춤"
내용보다 언어 패턴을 평가하는 것은 위험하며 생성과 탐지 모두 이를 부추김, 자동 채점은 그 중간
- 추론의 행위가 아닌 추론의 형식을 보상하면 그것을 더 유혹적이고 흔하게 만들고, 형식을 처벌하면 추론 자체를 처벌할 위험, 따라서 기계 판단에 미루지 말고 모든 경우에 비판적으로 사고해야 함

자동화된 사고에 반대하며

"잘못한 게 없으면 걱정할 것도 없다"는 오랜 논리에 동의하지 않음
- 2018년 이래 자동 감시 시스템 정확도로 99.8% 가 인용되었으나, Arvind Narayanan에 따르면 이는 논문 단위 수치로 사용할 때마다 누적
- 그 결과 대학생의 최대 10% 가 거짓으로 고발될 수 있음, 모든 텍스트를 AI 검사에 돌리면 거짓 양성이 훨씬 큰 규모로 발생
이 모델들은 실질적 권한을 집중시키고, 기업은 우리를 대신해 추론하겠다고 약속
- 두 줄짜리 문구를 AI 해석기에 돌려 결과를 온라인에 올리고 "봐, 표절자야"라고 말할 때 위험한 것을 정상화
AI 탐지 압박에 따른 재작성과 자기검열 문화는 인간 표현 보호의 정반대, 기계의 유죄 판단 능력에 대한 신뢰를 정상화하는 데 저항해야 함
- AI로 글을 쓰는 것이 최악의 경우 정신의 산업화라면, AI 탐지는 최악의 경우 사고에 대한 감시 시스템이 됨

GN⁺ 1달전 [-]

Lobste.rs 의견들

어떤 자동 시스템이 글을 AI 같음으로 평가했다는 이유만으로 논문이 자동 탈락한다면 악몽 같고, 내 일에는 이런 문제가 없어 다행임
추론의 언어가 LLM 출력을 유창하고 설득력 있게 보이게 할 뿐 아니라, 애초에 작동하게 만들거나 적어도 더 잘 작동하게 만든다는 지점이 좋았음. 이런 기법은 인간에게도 잘 통하고, 그래서 5 Whys 분석 같은 기법이 효과가 있음
반면 게으른 저품질 글은 여전히 짚어내야 한다고 봄. 구조나 문체 장치에만 집중하지 않아도 가능함. 내 경우 보통 선의로 글을 읽기 시작하고, 몇 단락 뒤에도 저자의 핵심을 잡기 어렵다면 그때 전형적인 신호를 찾기 시작하는데, 꽤 자주 발견하게 됨
흥미로운 글이지만, 실제로는 무언가를 생각하기 위한 추론용 텍스트와, 그 추론이 끝난 뒤 전달하려고 쓰는 완성된 텍스트를 구분하겠음
예시에서는 생각하는 과정에서 “목요일이 아니라 수요일이었어”라고 말할 수 있지만, 남에게 메시지를 보낼 때는 그냥 “목요일이었어”라고 쓰게 됨
그래서 학계나 직장에서 실제 산출물인 보고서나 이메일은 주제에 대해 추론할 때 쓰는 언어를 쓰지 않을 테고, 제대로 썼다면 LLM처럼 보이지 않아야 함. 초안이나 개인 메모는 그럴 수 있지만, 최종 발송물은 아님
- 하지만 공식 산출물 자체가 추론 과정이라면 어떨까? 추론 과정이 글의 핵심 일부이거나 전부인 문서를 여러 번 써봤음
생성형 AI를 강하게 비판하는 편이지만, 영어가 모국어가 아닌 연구자가 글을 다듬는 용도로는 학술 글쓰기에서 쓸모가 있다고 봄
다만 거의 완성된 잘 구조화된 초안이 필요하지, 단순한 글머리표만 넣으면 환각이나 딱딱하고 부자연스러운 표현이 나오게 됨
최근 몇 년간 중국이나 인도 같은 국가에서 온 저품질 논문을 많이 심사하다 보니, 이들 국가 출신이 자주 쓰는 비원어민식 영어 관용 표현에 약간 편향이 생긴 것도 느꼈음. 안타까운 점은 내가 심사한 최고의 논문 중 일부도 이 국가들에서 나왔다는 것임
그런 의미에서 영어가 학계의 표준 언어가 된 만큼, LLM은 높은 언어 수준을 표준화하고 심사 과정의 편향을 줄이는 데도 도움을 줄 수 있음
- 비원어민 영어 사용자가 글을 다듬는 데 LLM을 쓸 수 있다는 논리는 전혀 받아들일 수 없음. 논문은 정밀해야 하고 저자의 의도를 정확히 담아야 함
  영어가 모국어가 아닌 직원이 많은 기관에는 보통 글쓰기 자문 담당자가 있어, 좋은 문장을 만들 뿐 아니라 더 중요하게는 작성된 내용이 저자의 의도와 맞는지 확인함. 이를 LLM에 맡기면 의미가 미묘하게 바뀌고, 사실 오류나 부정확한 주장 표현 때문에 결국 저자에게 더 나쁜 결과를 낳을 수 있음
  언어 자문을 제공하지 않는 기관은 직원에게 불리한 환경을 만드는 셈이고, 독립 연구자는 다른 이유로도 이미 더 불리한 경우가 많음
  비원어민 특유의 표현에 대한 무의식적 편향은 어느 정도 피하기 어렵지만, 논문 심사에서는 언어 문제가 명확하면 상당한 선의의 여지를 주고, 언어 문제 때문에 불명확하다고 본 부분을 수정 지시로 남기는 편이었음. 이건 스스로 점검하면서 관리해야 함
  서툰 언어 사용은 아이디어, 방법론, 결과를 어느 정도 흐릴 수 있지만, LLM은 실제로 내가 심사한 논문들에서처럼 이를 사실과 다른 내용으로 망가뜨릴 수 있고, 결국 반박과 수정이 필요하거나 논문이 바로 거절될 수도 있음. 이 문제를 다루는 더 나은 방식이 있으므로 LLM 사용을 권해서는 안 됨
  게다가 이것이 표절인지 아닌지는 아직 열린 문제임. 훨씬 큰 논쟁이고, 기본 사실관계조차 합의되지 않는 경우가 많음. 일부 학회나 저널은 이런 이유로 LLM 보조를 금지하므로, 그 규정도 존중해야 함
- 더 큰 문제는 이제 사람들이 LLM이 썼는지 아닌지를 둘러싼 히스테리 때문에 자연스러운 문체를 피하도록 사실상 강요받는다는 점임
  아이러니하게도 회사들은 이 히스테리를 수익화하는 데 시간을 낭비하지 않았고, LLM을 써서 글이 진짜 인간이 쓴 것인지 판정하면서 돈을 벌고, 무엇이 허용 가능한 글쓰기인지 정하는 심판이 되어버렸음
  사람들이 게으르게 문체만 보지 말고 내용에 제대로 관여하기 시작하면 이 문제 전체가 사라질 것이라는 저자의 지적은 맞음

답변달기

단순히 X가 아니라, Y다

부정 대조 구문과 그에 대한 반발

자동 언어 생산과 탐지 도구의 역설

추론에 적대적인 문화와 사후 학습

RLVR의 작동 방식

"이상한 개" 비유

우리가 추론하는 이유

측정이 목표가 될 때

자동화된 사고에 반대하며

함께 보면 좋은 글 β

댓글과 토론

Lobste.rs 의견들