글쓰기의 사회적 계약
(jola.dev)- LLM 글쓰기는 블로그, 소셜 미디어, 신문, 책, 맞춤법 검사와 초안 작성까지 퍼졌고, 반복되는 문체가 글을 균질한 슬롭처럼 보이게 만듦
- 독자는 글을 읽는 데 시간을 들이는 만큼 필자도 지적 노고를 들였다고 기대하며, LLM 사용은 결과물의 품질과 별개로 이 기대를 흔듦
- Oxide RFD 576은 필자가 직접 이해하고 썼다는 믿음이 독자의 이해 노력을 정당화하며, LLM 산문은 이 사회적 계약을 훼손한다고 봄
- ChatGPT 이후 생성 텍스트는 직접 쓰지 않아도 인간의 말과 문체에 영향을 주며, “delve”, “realm”, “meticulous” 같은 단어 사용 증가로 드러남
- 좋은 글의 기준은 문법과 어휘의 완성도에서 독창적 표현과 인간적 흔적으로 이동하며, 오탈자도 AI 텍스트와 구별되는 신호가 될 수 있음
LLM 글쓰기와 사회적 계약
- LLM은 여러 산업에 퍼졌지만, 특히 글쓰기에서 블로그, 소셜 미디어, 신문, 책, 맞춤법 검사, 문법, 사실 확인, 전체 초안 작성에 폭넓게 쓰이고 있음
- 많은 양의 콘텐츠를 만드는 데 강하지만, LLM 특유의 관용구와 문체 패턴을 알아보기 시작하면 곳곳에서 같은 느낌이 반복됨
- “it’s not x, it’s why”, em-dash, “you’re not imagining it, the problem is real” 같은 표현이 반복되며 글이 점점 같은 슬롭(slop) 으로 균질화됨
- 독자는 글을 읽는 데 시간을 들였는데 필자가 그에 상응하는 시간을 쓰지 않았다는 사실을 깨닫는 순간 강한 반감을 느낌
- 이 반감은 내용이 정확하고 충분히 조사됐으며 글 자체가 괜찮은 경우에도 사라지지 않음
Oxide RFD 576의 문제 제기
- Oxide RFD 576의 2.4절 “LLMs as writers” 는 LLM 생성 산문이 글쓰기의 사회적 계약을 훼손한다고 봄
- LLM이 없을 때는 독자와 필자 중 필자가 더 큰 지적 노고를 들였다는 전제가 성립함
- 독자는 필자가 어떤 생각을 직접 이해하고 썼다고 믿을 수 있을 때, 어려운 문장과 생각을 이해하려는 노력을 기울일 이유를 얻음
- LLM으로 글을 쓰면 글의 품질이나 내용의 정확성과 별개로, 필자가 콘텐츠를 만들기 위해 들인 노력이 줄어듦
- 핵심 문제는 결과물의 품질만이 아니라, 직접 쓰지 않고 LLM을 사용한 행위 자체가 사회적 계약을 어긴다는 데 있음
피하기 어려운 생성 텍스트의 영향
- LLM을 직접 쓰지 않아도 생성 텍스트의 홍수는 인간의 말과 글에 영향을 줌
- “you’re absolutely right” 같은 표현은 LLM을 놀리는 데 쓰이지만, 도구 자체가 인간의 언어 습관도 미묘하게 바꾸고 있음
- Max-Planck Institute for Human Development의 연구는 ChatGPT가 선호하는 단어가 인간의 구어에서도 더 자주 쓰이게 됐다고 분석함
- 증가한 단어에는 delve, realm, meticulous, adept, boast, swift, comprehend 등이 포함됨
- 생성 AI의 산출물은 직접 사용 여부와 상관없이 이미 언어 환경 곳곳에 퍼져 있음
저배경 강철 비유
- Low-background steel은 최초의 원자폭탄 폭발 이전에 생산된 강철을 가리키며, 특정 용도로 한때 더 많이 찾았던 재료임
- 1940~1950년대의 여러 핵실험은 대기 중 방사성 물질을 늘렸고, 이후 생산된 강철은 입자 검출기 같은 일부 응용 분야에 충분히 “깨끗하지” 않은 것으로 여겨졌음
- 다만 현재는 전 지구적 인위 배경 방사선이 낮아져 최근 생산된 강철도 대부분의 용도에 사용할 수 있는 것으로 보임
- 이 비유에서 2022년 11월 30일 이후의 글은 ChatGPT 확산 이후 쓰였기 때문에 어느 정도 LLM의 영향을 받은 것으로 간주됨
- 오래된 콘텐츠만 읽는 경우를 제외하면, LLM 이후의 언어 환경을 완전히 피하기는 어려움
LLM 이후의 글쓰기 기준
- 생성 콘텐츠가 인터넷을 더 많이 차지할수록 개인 인간과 모델 회사 모두에게 독창적 사고와 표현의 수요가 커질 것임
- LLM 없이 독창적 콘텐츠를 쓰는 능력은 더 가치 있어질 수 있음
- 다만 LinkedIn식 thought leadership 글과 AI 생성 고양이 이미지가 넘치는 환경에서는 그런 글을 찾아내기가 어려워짐
- 인간은 오랫동안 좋은 문법, 넓은 어휘, 적절한 표현과 은유, 탄탄한 구성을 좋은 글쓰기의 기준으로 여겨왔음
- LLM은 이런 전통적 기준을 대체로 충족하지만, 같은 패턴을 반복하고, 표현은 낡아 보이며, 은유는 다소 튀고, em-dash에는 나쁜 인상을 남김
좋은 글의 기준 변화
- 오늘날 학생은 열심히 써서 평균 점수를 받거나, 아무 일도 하지 않고 ChatGPT가 쓴 과제로 높은 점수를 받는 선택지를 가질 수 있음
- 현재 Claude가 쓴 글을 10년 전 사람에게 보여주면 크게 불평할 지점이 많지 않을 것이라는 평가가 가능함
- LLM 글은 오래 읽으면 반복성이 보이지만, 전통적인 “제대로 된” 글쓰기 기준에는 상당히 부합함
- 이제 더 중요한 가치는 독창적 표현으로 이동함
- 문법이 틀려도 다르다면 가치가 있고, 어휘가 제한적이어도 반복적인 LLM 단어를 피한다면 더 인간적으로 느껴짐
- 오탈자는 더 이상 단순한 결함이 아니라, 밋밋하고 일반화된 AI 생성 텍스트와 구별되는 인간적 흔적으로 받아들여질 수 있음
LLM 없이 쓰겠다는 약속
- 독자가 시간을 들여 글을 읽는 만큼, 필자도 글을 쓰는 데 시간을 들여야 사회적 계약이 성립함
- 오래된 영화를 틀어둔 채 하루의 상당 부분을 들여 작성한 글에는 읽는 사람의 시간에 대응하는 노력이 들어감
- 글쓰기는 즐거운 활동이며, 꾸준함의 정도는 달랐지만 평생 해온 일임
- 앞으로 글쓰기를 더 일상적인 루틴으로 만들려는 의지가 있으며, 그렇게 하는 일이 의미 있고 할 가치 있는 일로 여겨짐
댓글과 토론
Lobste.rs 의견들
-
Oxide RFD의 이 문장은 흔한 ai;dr 밈을 덜 날카롭고 덜 인용하기 좋지만 훨씬 더 명시적으로 풀어쓴 표현으로 보임
“LLM이 없을 때는 독자와 작성자 중 작성자가 더 큰 지적 노력을 들였다고 전제된다”는 말은 결국 “네가 쓰는 수고를 안 했다면, 나도 읽는 수고를 안 하겠다”는 뜻임 -
업무에 LLM을 끼워 넣는 작성자들에게서 전문성이 느껴지지 않음
이런 LLM 냄새는 전부 “나는 내 일을 할 생각이 없는 엉터리”라고 크게 외치는 것처럼 보임. 소프트웨어에서는 일관적이고 예측 가능하며 지루한 저분산 결과물이 좋다고 주장할 수도 있겠지만, 글쓰기에서는 대체로 그 반대라고 봄- 그중 얼마가 다른 모두가 콘텐츠를 대량 생산하는 상황에서 뒤처지지 않으려는 절박함이고, 얼마가 모든 일과 책임을 넘겨버리고 싶은 유혹에 굴복한 것인지 궁금함
- “소프트웨어에서는 일관적이고 예측 가능하며 지루한 저분산 결과물이 좋을 수 있지만 글쓰기는 반대”라는 말에는 강하게 동의하지 않음
오히려 더 일관적이고 예측 가능하며 지루한 글이 필요하다고 봄. 대부분의 글쓰기 지침은 명확성과 진실보다 문체를 우선시함. AI 글쓰기를 옹호하려는 건 아니고, 직접 글쓰기에 AI를 쓰지도 않으며 그 냄새도 싫지만, 더 많은 인간 작성자가 지루해질 용기를 가졌으면 함 - 가장 가능성 높은 독자가 LLM 자신들이라고 예상한다면 어떨까 싶음
-
Pull request도 마찬가지임. 예전에는 대부분의 노력이 문제를 깊이 생각하고 코드를 쓰는 데 들어갔음
리뷰도 일이 많을 수 있지만, 적어도 균형이 있었고 불균형하더라도 리뷰가 동시에 온보딩이나 교육 역할을 할 때였음. 프로젝트 품질을 신경 쓴다면 이제 방정식이 완전히 바뀜. 프로젝트 내부에 관심도 없는 사람들이 리뷰 가능한 속도보다 몇 자릿수 빠르게 PR을 쏟아낼 수 있음
정말 지침. 코드 리뷰에는 그래도vouch같은 시스템으로 신규 기여자의 PR을 막을 수 있다는 장점이 있음. 하지만 블로그 글 같은 경우에는 작성자가 정말 이해하고 신경 쓴 사람인지, 아니면 또 다른 슬롭 벽에 부딪힌 것인지 계속 의심하게 됨. 아직은 슬롭이 쉽게 알아볼 수 있지만, 생산자들이 전형적인 패턴을 막으라고 모델에 지시하면 그것도 바뀔 가능성이 큼. 내가 반기는 유일한 슬롭은 LinkedIn이 슬롭 댓글로 넘쳐나는 것뿐임- LinkedIn의 평균 게시물 품질에는 사실 아무 영향도 없었음
전에도 자기 과시 쓰레기였고, 후에도 자기 과시 쓰레기임. 다만 이제 만화풍 AI 이미지가 추가됐을 뿐 - 블로그 글 같은 건 Wayback Machine에 URL을 넣어 처음 만들어진 시점을 확인하기 시작했음
기본적으로 2022년 이전에 만들어진 것은 훨씬 덜 의심스럽게 봄. 아는 사람들은 이미지 검색에before:2022를 넣고 있음
- LinkedIn의 평균 게시물 품질에는 사실 아무 영향도 없었음
-
블로그 글을 읽을 때 가장 중요한 사회적 계약은 작성자가 그 경험을 통해 앞으로 글쓰기를 개선해 나갈 것이라는 점임
LLM 사용은 그것도 깨뜨림. 코드 작성에 LLM을 쓰는 문제는 논의해볼 수 있지만, 특히 블로그 글쓰기에서 LLM을 쓰는 건 그냥 역겨움 -
한동안 품고 있던 생각과 감정을 잘 말로 옮겨줬음. 특히 인간 손길의 불완전함을 바라는 마음이 그럼
남에게서도 그걸 원하고, 내 작업에도 내 인간성이 드러나길 원함. 나는 맞춤법이 아주 나쁜 편이라 친구들과 동료들에게 자주 놀림을 받는데, 블로그 글을 쓸 때 실수 몇 개를 일부러 남겨서 내가 아직 인간임을 보여줄까 진지하게 생각한 적도 있음. 물론 그건 좀 지나친 걸지도 모르겠음 -
“글쓰기를 즐기고 평생 해왔고, 이제 더 루틴처럼 해보려 한다. 의미 있고 할 만한 일처럼 느껴진다”는 말에 완전히 공감하지만 두 가지 두려움이 있음
첫째, 누군가가 2024/2025년쯤 우연히 블로그를 시작했거나 더 많이 발행하기 시작한 걸 보면 기본적으로 AI로 분류하고 보관하게 됨. 내 블로그도 외부에서 보면 그렇게 보일 것임. 둘째, AI 회사들이 더 나은 모델을 만드는 데 내 글이 도움이 되는 게 달갑지 않음. 다만 위선적으로 나도 AI를 매일 씀
두 번째 문제는 수많은 골리앗을 죽일 방법이 잘 안 보임. 첫 번째 문제는 콘텐츠 뒤에 충분한 인간의 주의가 들어갔음을 증명하는 일종의 인간 작업 증명이 생기길 바람. 글 쓰는 동안 Twitch로 스트리밍하는 것도 생각했지만 너무 비현실적이고, 바보 같은 아이디어나 “지금 쓰는 게 완전히 틀렸다”는 깨달음, 취향에 맞추려는 끝없는 재표현까지 포함한 글쓰기 과정을 공개하는 건 사실 부끄러울 것 같음. 다른 증명 방법은 떠오르지 않음 -
지금 꽤 복잡한 기술 블로그 글을 쓰는 중이고, 본문 문장은 전부 손으로 직접 쓰고 있음
말하고 싶은 바를 잡는 데 몇 번 시도가 필요했지만 이제 구조는 꽤 괜찮아진 것 같음. Claude를 도구로 쓴 부분은 텍스트 설명을 Mermaid 다이어그램으로 바꾸는 작업임. Mermaid에 들어간 노력은 고맙지만, 특히 흐름도나 시퀀스 다이어그램 같은 표준 구조를 벗어나면 일부 문법이 너무 난해하다고 느낌. 나는 Oxide에서 일하고 있고 RFD 576에도 어느 정도 의견을 냈음