도구와 대화하는 것의 피로감
(ohadravid.github.io)- LLM은 키보드나 자동차처럼 몸에 익는 좋은 도구가 아니라, 요청과 협상을 요구하는 상대처럼 작동해 사용자의 사회적 에너지를 소모함
- 좋은 도구는 일관성과 속도 덕분에 뇌가 신체의 확장처럼 받아들이지만, Claude나 Cursor 같은 LLM은 아직 그 수준에 미치지 못함
- LLM 사용자는 사람과 대화할 때처럼 요청하고, 설득하고, 때로는 화를 내며 사회적 비용을 지불하게 됨
- 사람과의 상호작용은 배움, 도전, 영감, 반박 같은 보상을 주지만, LLM은 주로 더 많은 코드와 테스트, 변명, 때로는 버그 리포트를 돌려줌
- 일부 작업은 1년 전 한 사람이 하기 어려웠던 수준까지 가능해졌지만, 모든 작업에서 사회적 에너지를 LLM에 쓰는 편이 실제 동료에게 쓰는 것보다 나은지는 불확실함
도구가 아니라 대화 상대가 되는 LLM
- LLM은 작동시키는 데 사회적 에너지를 요구하기 때문에 피로감을 줌
- 그 에너지는 실제 사람과의 상호작용에 쓰는 편이 더 나을 수 있음
- 좋은 도구를 사용할 때 뇌는 도구를 몸의 일부처럼 받아들임
- 자동차 운전
- 키보드 입력
- Vim이나 VSCode에서 키 조합을 눌러 작업 수행
- 반대로 사람과 대화할 때는 사회적 의식에 참여하게 됨
- 이야기를 나눔
- 도움을 요청함
- 티켓을 다음 분기로 넘기지 않기 위해 협력함
- 이런 사회적 두뇌 작업은 단순한 도구 사용보다 어렵고 더 많은 에너지를 요구함
LLM이 돌려주는 것과 부족한 보상
- LLM은 키보드나 자동차처럼 도구의 마법을 주지 못함
- Claude나 Cursor가 몸의 확장처럼 느껴진다고 말할 사람은 거의 없음
- 일관성과 속도가 충분하지 않아 뇌가 도구처럼 받아들이기 어려움
- 대신 사용자는 LLM과 대화하고, 협상하고, 설득하고, 때로는 화를 내는 사회적 세금을 냄
- 사람에게 사회적 비용을 쓰는 일은 더 많은 보상을 돌려주기 때문에 가치가 있음
- 새로 배우거나 도전받을 수 있음
- 영감을 받을 수 있음
- 허튼소리를 하면 상대가 거절할 수 있음
- 반대로 다른 사람을 가르치거나 도전하게 하거나 영감을 줄 수도 있음
- LLM은 대부분 더 많은 코드, 더 많은 테스트, 더 많은 변명을 돌려줌
- 때로는 더 많은 버그 리포트를 주며, 이는 가치가 있음
- 어떤 작업에서는 LLM 덕분에 한 사람이 1년 전에는 불가능했던 일을 할 수 있음
- 그러나 모든 작업에서 LLM과의 대화에 사회적 두뇌 작업을 쓰는 것이 적절한지는 분명하지 않음
- LLM은 사용자에게 말을 걸라고 요구하지만, 그 노력에 상응하는 보상을 주는 경우는 드묾
댓글과 토론
Lobste.rs 의견들
-
내 경우엔 AI와 대화하는 게 이미 제2의 본능처럼 됐음. 지금은 별의별 질문으로 하루에 채팅을 10개쯤 열고, 거의 의식하지도 않음
질문을 넣고, 읽고, 답하고, 다시 읽는 흐름이 Google로 검색하는 것과 비슷함. 운전처럼 손이 저절로 움직이는 수준이 된 것처럼, AI와 대화하는 것도 적어도 내겐 같은 자리를 차지하기 시작함- 나도 비슷하게 쓰지만 요즘은 Brave 검색을 점점 더 곁들임. LLM에 너무 의존하면 장기적으로 조사 능력이 퇴화할 수 있다는 느낌이 있음
출처를 찾고 지식을 엮는 일을 너무 많이 대신해 주기 때문임. 물론 중요도가 낮은 답을 빨리 얻고 싶을 때는 괜찮지만, 전반적으로는 조사 능력을 날카롭게 유지해야 한다고 봄 - 일반적인 바이브 코딩 흐름에는 이걸 포함하지 않았음. 동의함. 나도 Google 검색하듯 채팅을 열어 뭔가를 찾아보고, 질문을 짧게 유지하고 긴 왕복 대화를 시작하지 않으면 꽤 가볍게 느껴짐
특정 질문이 있을 때 코드베이스에도 질의하지만, 그건 내겐 동료에게 묻는 것에 더 가까움. 표현을 고민해야 하고, 구체적으로 다시 물어야 할 때가 있으며, 가끔은 거짓 답을 받아서 다시 표현을 고쳐야 하기 때문임 - LLM이 환각을 자주 일으킨다는 점을 생각하면 그게 좋은 일이라고 보진 않음. LLM 응답의 거의 절반이 정확하지 않다는 연구를 본 기억이 있고, 그 수치가 이후 크게 나아졌을 것 같지도 않음
쓰는 방식에 따라서는 생각을 거의 떠넘기게 되므로 역량 저하 위험도 있음. LLM에 더 많이 의존하기보다 덜 의존하려고 해야 함
- 나도 비슷하게 쓰지만 요즘은 Brave 검색을 점점 더 곁들임. LLM에 너무 의존하면 장기적으로 조사 능력이 퇴화할 수 있다는 느낌이 있음
-
“보상” 얘기로 말하자면, 며칠 전에 흥미로운 걸 봤음. 신입 프로그래머 둘과 일하고 있는데, 내겐 꽤 어려운 균형임. 사람을 북돋아 주는 걸 좋아하지만, 신입을 코칭할 때는 작업물을 비판적으로 평가해야 함
그래서 칭찬할 기회를 찾는데, 그들이 LLM에 기대어 만든 작업을 리뷰할 때는 LLM이 내가 칭찬하고 성장시킬 기회를 빼앗아 갔다는 걸 깨달음. 어떤 부분이 생성된 것이고, 어떤 부분이 실제로 본인이 익힌 결과인지 구분할 수 없음
결국 LLM이 한 작업을 비평하면서 “LLM에게 더 하게 하라/덜 하게 하라”고 말하게 되거나, 상대가 “하지만 LLM은 이렇게 말했는데요”라며 방어적으로 반응함. 솔직히 코드 리뷰의 가치 자체를 다시 생각하게 됨. 모두가 자기만의 가상 “코딩 친구”를 갖게 되면서, 코드 리뷰로 지식을 공유할 기회가 줄어든 것 같음- LLM이 끼면 접근 방식이 실제로 달라져야 함. 이제 리뷰에는 두 층위가 있음. 실제 코드 변경과, 그 변경을 만들기 위해 도구를 사용한 방식임
둘 다 피드백 가능한 영역이지만, 두 번째 영역에는 아직 전문가가 없어서 더 협업에 가까움. 그래도 첫 번째 규칙은 분명함. “LLM이 그렇게 말해서요”를 넘어 변경의 이유와 내용을 설명하지 못하면 거절하고 다시 해야 함
- LLM이 끼면 접근 방식이 실제로 달라져야 함. 이제 리뷰에는 두 층위가 있음. 실제 코드 변경과, 그 변경을 만들기 위해 도구를 사용한 방식임
-
LLM을 몰아가는 일이 피곤하다는 데는 동의하지만, 운전에 비할 바는 아님. 합법적으로 운전한 지 30년이 넘었지만, 하루 근무 시간 내내 운전해야 한다면 아마 다음 날은 쉬어야 할 것 같음
자기 실수만 걱정하는 게 아니라, 다른 운전자들의 무모함과 무능함 때문에 생명까지 위험해질 수 있음. 어디서 운전하느냐도 중요할 듯함 😅- 그건 자동차 사용자 경험의 사용성보다는, 그 사용자 경험을 조작할 때 생길 수 있는 치명적 결과와 같은 일을 하는 낯선 사람들에게 둘러싸여 있다는 점에 훨씬 더 가깝다고 봄
-
저자의 도구 정의를 따르면 내게 Firefox는 도구 자격이 없는 것 같고, 그 기준에서 Chromium은 적극적으로 악의적이고 적대적임
LLM을 둘러싼 정신 에너지 절약/소모 논의는 굉장히 다차원적이라는 인상이 있음. 사람처럼 채팅하는 쪽과 지속적인 마음이 없는 쪽 중 어디에 즉각 끌리는지의 정도가 있고, 그 위에 내향/양향/외향 성향이 얹힘. 사고가 선형 언어에 가까운지 먼지도 중요해서, LLM은 생각을 대체하는 것일 수도 있고 실제 사고를 짜증 나는 인간 커뮤니케이션 관습으로 번역하는 일을 대체하는 것일 수도 있음. 읽는 속도와 타이핑 속도의 차이도 있음
글이 다루는 사회적 페르소나와 왕복 대화에 관해서는, 나는 사람을 잘 읽지 못하고 사람을 되돌릴 수도 없으니 LLM에게 뭔가를 시키는 건 인간 대화와 전혀 같지 않음. 답변 전 장황한 부분을 들여다보며 내 문장의 모호함이 어떻게 해석됐는지 볼 수 있고, 대화의 앞부분은 유지한 채 마지막 요청을 다시 써서 잘못된 해석을 피할 수도 있음. 이후 답변을 유도하려고 히스토리 속 LLM 응답 자체를 고쳐 쓸 수도 있음
호스팅 LLM은 안전 관련 사고를 완전히 다시 쓰게 하는 데 덜 열성적일 수도 있겠지만, 그건 로컬 모델만 써야 할 또 하나의 이유임. 호스팅된 과점 서비스라는 점과 예고 없는 동작 변경, 숨겨진 가중치만으로도 피할 이유는 충분함
물론 이런 조작은 인간에게 할 수 있다 해도 나쁜 일임. 인간은 오래 지속되는 인격이기 때문임. 그래서 지속적인 마음을 갖도록 만들어지지 않은 도구와 대화하는 편이 때로 덜 피곤함. 내가 너무 짧고 사무적으로 말해도 도구는 거슬려 하지 않음
그리고 지금의 조언은, 인간 대화처럼 맥락에 실수를 남긴 뒤 해명하기보다는 초기 질의를 다시 써서 실수를 피하는 편이 거의 항상 낫다는 것 아닌가? -
Claude와 대화하는 게 좋고, 인간 선호에 맞춰 매우 호의적으로 훈련됐으니 비슷하게 느끼는 사람이 많을 거라고 봄