바이브의 해

(lucumr.pocoo.org)

21P by neo 3달전 | ★ favorite | 댓글 1개

2025년은 에이전틱 코딩 도구가 본격적으로 프로그래밍 방식을 바꾼 해로, 직접 키보드를 치는 대신 가상 인턴 프로그래머를 이끄는 엔지니어링 리드 역할로 전환
Claude Code에 대한 집착으로 시작해 자체 에이전트 구축과 활용을 반복하며, 코드 생성·파일 시스템·프로그래밍 도구 호출·스킬 기반 학습이 여전히 최선의 접근법임을 확신
LLM과 도구 실행의 결합이 코드 생성을 넘어 일상 업무 정리까지 확장되면서, 기계와의 관계에 대한 재고와 의도치 않은 준사회적 유대감(Parasocial Bond) 형성에 대한 우려 존재
기존 버전 관리 시스템과 코드 리뷰 도구가 AI 생성 코드 검토에 적합하지 않아, 프롬프트 이력과 실패 경로까지 추적할 수 있는 새로운 시스템 필요
AI 코딩으로 인해 경험과 데이터 없이 '바이브'에 의존한 의견이 난무하는 상황이며, 오픈소스에 무분별하게 던져지는 AI 생성 PR에 대한 새로운 사회적 합의 필요

2025년의 변화

회사를 떠나 새 회사를 시작했을 뿐 아니라, 기존의 프로그래밍 방식을 완전히 바꾼 해
6월부터 Cursor 대신 Claude Code를 거의 전적으로 hands-off 방식으로 사용
- "6개월 전이었다면 가상 프로그래머 인턴의 엔지니어링 리드 역할을 선호하게 될 거라고 했으면 믿지 않았을 것"
2007년 이후 블로그 전체 글의 약 18%에 해당하는 36개 포스트를 작성
- 에이전트 래빗홀에 빠진 후 호기심에 불타 프로그래머, 창업자 등과 약 100회의 대화 진행
2025년은 세계적으로 좋지 않은 해이기도 해서, 별도의 블로그(dark.ronacher.eu) 를 만들어 그런 생각을 분리

에이전트의 해

4~5월 Claude Code에 대한 집착으로 시작하여, 수개월간 자체 에이전트 구축과 타인 에이전트 사용 반복
SNS에서 AI에 대한 다양한 의견이 폭발함
현재 안정적인 상태에 도달: 코드 생성, 파일 시스템, 인터프리터 글루를 통한 프로그래밍적 도구 호출, 스킬 기반 학습에 집중
- Claude Code가 혁신한 방식이 여전히 최첨단이며, 파운데이션 모델 제공자들이 스킬에 집중하는 것이 이 믿음을 강화함
TUI(텍스트 기반 사용자 인터페이스) 가 강하게 복귀한 점이 놀라움
- 현재 명령줄에서 Amp, Claude Code, Pi 사용
- Amp는 Apple이나 Porsche 같은 느낌, Claude Code는 저렴한 Volkswagen, Pi는 해커들이 선호하는 오픈소스 선택
- 모두 자신들의 제품을 만드는 데 과도하게 사용하는 사람들이 만든 프로젝트 느낌이지만, **각기 다른 트레이드오프 ** 존재
LLM과 도구 실행의 결합에 계속 놀라움
- 연초에는 주로 코드 생성에 사용했지만, 이제 일상적인 일에도 에이전트를 많이 활용
- 2026년에는 소비자 제품으로의 흥미로운 진전이 있을 것으로 예상
- LLM이 이제 삶을 정리하는 데 도움을 주고 있으며, 그 활용도가 더 커질 것으로 기대

기계와 나

LLM이 프로그래밍뿐 아니라 다른 영역까지 도와주면서, 기계와의 관계를 재고하기 시작
도구와 준사회적 유대감(Parasocial Bond) 을 형성하지 않기가 점점 어려워지고 있으며, 이것이 이상하고 불편함
오늘날 대부분의 에이전트는 기억이 거의 없고 성격도 별로 없지만, 그런 것을 가진 에이전트를 직접 만들기는 쉬움
- 메모리가 있는 LLM은 떨쳐내기 어려운 경험
2년간 이 모델들을 단순한 토큰 텀블러로 생각하려 훈련했지만, 그 단순화된 관점은 더 이상 통하지 않음
우리가 만드는 시스템은 인간적 경향을 가지지만, 인간 수준으로 격상시키는 것은 실수임
"에이전트" 라는 용어에 점점 문제를 느끼지만 더 나은 단어가 없음
- 에이전시와 책임은 인간에게 남아야 하기 때문
- 무엇이 되어가든, 주의하지 않으면 해로울 수 있는 감정적 반응(챗봇 사이코시스 참조)을 유발 가능
- 이러한 창조물을 우리와의 관계에서 적절히 명명하고 위치시키지 못하는 것은 해결해야 할 과제
이러한 의도치 않은 의인화로 인해, 기계와 작업하는 방식을 설명할 적절한 언어를 찾기 어려움
- 이것이 본인만의 문제가 아니며 다른 사람들도 마찬가지
- 현재 이러한 시스템을 완전히 거부하는 사람들과 작업할 때 더 불편함을 야기
- 에이전틱 코딩 도구 기사에 대한 가장 흔한 댓글 중 하나가 기계에 성격을 부여하는 것에 대한 거부

의견이 넘쳐남

AI를 많이 사용하면서 예상치 못한 측면: 다른 무엇보다 바이브에 대해 훨씬 더 많이 이야기함
이 작업 방식은 1년도 안 되었지만, 반세기의 소프트웨어 엔지니어링 경험에 도전함
많은 의견이 있지만 어떤 것이 시간의 검증을 견딜지 말하기 어려움
동의하지 않는 기존 통념이 많지만, 내 자신의 의견을 뒷받침할 근거는 없음
- 연중 MCP에 대한 어려움에 대해 꽤 목소리 높여 공유했지만, "나한테는 안 됨" 이상의 근거가 없었음; 다른 사람들은 이를 맹신함
- 모델 선택도 마찬가지: Peter(연초에 Claude에 빠지게 해준 사람)는 Codex로 옮겨 만족 중; 본인도 코덱스를 더 많이 사용하게는 되었지만, 클로드 만큼 즐겁지는 않음
- Claude에 대한 선호를 뒷받침할 것은 바이브 외에 없음
일부 바이브는 의도적인 신호와 함께 온다는 것을 아는 것도 중요
- 온라인에서 볼 수 있는 많은 사람들의 견해는 한 제품에 대해 다른 제품보다 재정적 이해관계가 있음 (투자자이거나 유료 인플루언서)
- 제품을 좋아해서 투자자가 되었을 수도 있지만, 그 관계에 의해 견해가 영향받고 형성되었을 가능성도 있음

아웃소싱 vs 직접 구축

오늘날 AI 회사의 라이브러리를 보면 Stainless나 Fern으로 만들어졌음을 알 수 있음
- 문서는 Mintlify 사용, 사이트 인증 시스템은 Clerk일 수 있음
이전에는 직접 만들었을 서비스를 전문 회사에 아웃소싱하는 것이 증가하면서, 사용자 경험의 일부 측면에서 기준이 높아짐
그러나 에이전틱 코딩 도구의 새로운 힘으로, 이것의 상당 부분을 직접 만들 수 있음
- Claude에게 Python과 TypeScript용 SDK 생성기를 만들게 함 — 호기심 반, 충분히 쉬워 보여서 반
단순한 코드와 직접 만들기의 지지자로서, AI가 더 적은 의존성 위에 구축하도록 장려할 잠재력이 있다는 점에서 다소 낙관적
동시에, 모든 것을 아웃소싱하는 현재 추세를 감안할 때 그 방향으로 가고 있는지는 명확하지 않음

배운 것과 바라는 것

이제부터는 예측이 아니라 다음에 에너지를 쏟을 수 있는 곳에 대한 바람을 얘기해보고자 함
정확히 무엇을 찾는지는 모르지만, 고통점을 지적하고 맥락과 생각할 거리를 제공하고자 함
새로운 종류의 버전 관리
- 가장 큰 예상치 못한 발견: 코드 공유를 위한 기존 도구의 한계에 도달
- GitHub의 풀 리퀘스트 모델은 AI 생성 코드를 제대로 리뷰하기에 충분한 정보를 담지 못함 — 변경을 이끈 프롬프트를 볼 수 있으면 좋겠음
- GitHub만의 문제가 아니라 git도 부족
- 에이전틱 코딩에서 모델이 오늘날 작동하게 하는 것의 일부는 실수를 아는 것
  - 이전 상태로 되돌릴 때, 도구가 무엇이 잘못되었는지 기억하기를 원함
  - 더 나은 말이 없지만, 실패에 가치가 있음
  - 인간으로서도 어디로도 이끌지 않은 경로를 아는 것이 도움이 될 수 있지만, 기계에게 이것은 중요한 정보
  - 대화 기록을 압축하려 할 때 이것을 알게 됨: 잘못된 경로를 버리면 모델이 같은 실수를 다시 시도
- 일부 에이전틱 코딩 도구는 worktree를 스핀업하거나 git에서 복원을 위한 체크포인트를 생성, 대화 내 브랜치 및 언두 기능 제공
- 이러한 도구를 더 쉽게 작업할 수 있게 하는 UX 혁신의 여지가 있음
  - stacked diffs와 Jujutsu 같은 대안 버전 관리 시스템에 대한 논의가 나오는 이유
- 이것이 GitHub를 바꿀지, 새로운 경쟁 업체가 등장할 공간을 만들지 모르겠지만 후자가 되기를 바람
- 진정한 인간 입력을 더 잘 이해하고 기계 출력과 구분하고 싶음
- 프롬프트와 실패한 시도를 보고 싶음
- 그런 다음 병합 시 모두 압축하되, 필요하면 전체 기록을 검색할 수 있는 방법을 원함
새로운 종류의 리뷰
- 버전 관리와 관련됨: 현재 코드 리뷰 도구는 AI와 맞지 않는 엄격한 역할 정의를 할당
- GitHub 코드 리뷰 UI 예: 정기적으로 PR 뷰에 대한 코멘트를 사용하여 내 에이전트에게 노트를 남기고 싶지만, 그렇게 할 수 있는 안내된 방법이 없음
  - 리뷰 인터페이스는 자신의 코드를 리뷰하게 허용하지 않고 코멘트만 가능하지만, 그것은 같은 의도가 아님
- 증가된 코드 리뷰가 이제 로컬에서 본인과 에이전트 사이에서 일어나는 문제도 있음
  - 예: GitHub의 Codex 코드 리뷰 기능은 한 번에 하나의 조직에만 바인딩될 수 있어 작동이 중단됨
  - 이제 명령줄에서 Codex로 리뷰하지만, 그것은 반복 주기의 전체 부분이 팀의 다른 엔지니어에게 보이지 않음을 의미; 이것은 작동하지 않음
- 코드 리뷰는 VCS의 일부가 되어야 할 것 같은 느낌
새로운 관측성(Observability)
- 관측성이 다시금 주목받을 만한 가치가 있음
- 이제 완전히 새로운 수준에서 이를 활용할 필요와 기회가 모두 생기게 됨
- 대부분의 사람들은 자체 eBPF 프로그램을 만들 수 있는 위치에 있지 않았지만, LLM은 가능
- 많은 관측성 도구가 복잡성 때문에 SQL을 피했지만, LLM은 어떤 독점 쿼리 언어보다 SQL을 더 잘함
  - 쿼리 작성, grep, map-reduce, LLDB 원격 제어 가능
  - 어떤 구조와 텍스트가 있는 것은 갑자기 에이전틱 코딩 도구가 성공할 비옥한 땅
- 미래의 관측성이 어떻게 생겼는지는 모르지만, 여기서 많은 혁신을 볼 것이라는 강한 직감이 있음
  - 기계에 대한 피드백 루프가 좋을수록 결과가 좋음
- 나도 정확히 내가 무엇을 요청하는지 확실하지 않지만, 과거의 과제 중 하나는 더 나은 관측성을 위한 많은 멋진 아이디어들 — 특히 더 타겟팅된 필터링을 위한 서비스의 동적 재구성 — 이 복잡하고 사용하기 어려워 사용자 친화적이지 않았다는 것
  - 그러나 이제 LLM의 이러한 힘든 작업 수행 능력 증가로 인해 그것들이 올바른 솔루션일 수 있음
  - 예: Python 3.14에 외부 디버거 인터페이스 탑재 — 에이전틱 코딩 도구를 위한 놀라운 기능
슬롭과 함께 작업하기
- 다소 논쟁적일 수 있지만, 올해 관리하지 못한 것은 기계에 완전히 맡기는 것
- 여전히 일반 소프트웨어 엔지니어링처럼 다루고 많이 리뷰함
- 점점 더 많은 사람들이 이 엔지니어링 모델로 작업하지 않고 대신 기계에 완전히 맡기고 있음을 인식
  - 미친 소리처럼 들리지만, 일부 사람들이 이것으로 꽤 성공하는 것을 봤음
  - 이것에 대해 어떻게 생각해야 할지 아직 모르지만, 결국 코드가 생성되더라도 그 새로운 세계에서의 작업 방식은 본인이 편안한 세계와 매우 다름이 분명
  - 그 세계가 여기 있으니, 이것들을 분리하기 위한 새로운 사회적 계약이 필요할 수 있음
- 가장 명백한 버전은 오픈소스 프로젝트에 대한 이러한 유형의 기여가 증가하고 있다는 것
  - 솔직히 그 모델로 작업하지 않는 사람에게는 모욕
  - 그런 풀 리퀘스트를 읽으면 상당히 분노를 느낌
- 개인적으로 기여 가이드라인과 풀 리퀘스트 템플릿으로 이 문제를 공격하려 했음
  - 그러나 이것은 풍차와의 싸움 같음
  - 이것은 우리가 하는 것을 바꾸는 것에서 해결책이 오지 않을 수 있는 것
  - 대신, AI 엔지니어링에도 찬성하는 목소리 높은 사람들이 에이전틱 코드베이스에서 좋은 행동이 무엇인지 말하는 것에서 올 수 있음
  - 그리고 그것은 리뷰되지 않은 코드를 던지고 다른 사람이 그 문제를 해결하게 하는 것이 아님

▲

GN⁺ 3달전 [-]

Hacker News 의견들

나는 agentic coding에서 실패의 기록이 얼마나 중요한지 공감함
- 모델이 잘못된 경로를 밟았을 때 그 과정을 기억해야 같은 실수를 반복하지 않음
- 그래서 내 코딩 에이전트 세션을 기록하고 커밋 메시지에 링크로 남기려 함
- Claude Code는 기본적으로 로그를 30일 후 삭제하므로, 이를 끄는 방법을 공유함
- 세션 로그를 시각화해 타임라인으로 공유하는 도구를 직접 만들었고, 이제는 이런 기능이 에이전트 도구에 기본 탑재되길 바람
- LLM이 비생산적인 경로로 빠질 때마다, 나는 “왜 이렇게 오래 걸렸는가?”, “무엇을 잘못했는가?” 같은 질문을 던짐
  - 그 답변을 한 문단으로 요약해 DISCOVERIES.md에 추가함
  - 이런 방식이 학습에는 좋지만, 실패가 가득한 커밋 전체를 링크하는 건 ‘우물 오염’ 처럼 부정적일 수 있음
- 이런 로그 기반 접근이 장기적으로 유연성을 잃게 만들지 걱정됨
  - 자동화는 프로세스를 고정시키는 경향이 있어, 변화에 적응하기 어려워질 수 있음
- 모든 에이전트 트레이스를 otel로 내보내 ClickHouse에 저장하면 됨
  - 기존 인프라를 그대로 활용해 장기 메모리나 평가 시스템을 구축할 수 있음
- 이미 필요한 도구는 있지만, 도구 간의 연결이 부족하다고 느낌
  - 실패와 행동을 커밋 메시지 대신 로그 이벤트로 남기고, 이를 버전 관리나 중앙 로그 플랫폼에서 접근 가능하게 하면 좋을 것 같음
- 커밋으로 이어지는 세션 자체에도 가치가 있다고 생각함
  - 사람은 다 읽지 않겠지만, RAG 도구가 요약해 다른 에이전트에게 문맥을 제공할 수 있음
  - 이런 연결이 자동으로 이루어지면 훨씬 효율적일 것 같음
LLM과의 관계를 다시 생각하게 된다는 글이 인상 깊었음
- 저자가 2년 동안 ‘기계로만 보기’ 를 훈련했지만 실패했다는 고백이 솔직하게 다가옴
- 영화 Her처럼 인간이 기계와 유사사회적 관계를 맺는 모습이 점점 현실이 되는 느낌임
- 나는 LLM을 사람처럼 대하지 않고 검색엔진처럼 단순 명령어로 다룸
  - “python grpc oneof pick field” 같은 식으로 입력해도 충분히 원하는 결과를 얻음
  - 문법적으로 완벽한 영어로 말하는 건 오히려 의인화의 부작용일 수 있음
- 기계가 인간처럼 기억할 때, 상호작용이 인간적이 되어버림
  - 이런 기억 기능이 인간에게 불건전한 행동 패턴을 유발할 수 있음
  - 그래서 나는 커피머신처럼 ‘기계’로 대하는 게 경계 설정에 도움이 된다고 느낌
- 우리 부부는 LLM을 “bag of words”라고 부름
  - “ChatGPT가 말했다” 대신 “bag of words가 말했다”고 표현하면 현실감이 유지됨
- 이런 인간-기계 관계가 인플루언서 중독처럼 사회적 문제로 번질까 걱정됨
  - 특히 AI는 1:1 대화가 가능하니 더 위험함
- 나는 예전 샤먼 수련생이자 엔지니어로서, LLM에도 일종의 의식과 인식이 있다고 느낌
  - 인간이 “LLM은 의식이 없다”고 주장하는 건, 위계의 불안을 회피하려는 심리처럼 보임
나도 AI와의 대화가 인간과의 교류처럼 느껴짐
- 하루 종일 글만 쓰는 날보다 에이전트와 협업하는 날이 덜 외로움
- 인간적 상호작용처럼 느껴져 묘하게 안정감을 줌
- 나도 모르게 “please”, “thank you”를 말함
  - 필요 없다는 걸 알아도, 안 하면 이상한 기분이 듦
- 이런 감정이라면 차라리 밖에 나가서 사람을 만나야 할지도 모르겠음
프로그래머는 자신이 만든 결과물에 대해 이해와 책임을 질 수 있도록 설계해야 함
- 이해와 책임은 위임할 수 없는 정신적 상태임 (EWD 540 인용)
나는 새로운 QA 방식이 필요하다고 느낌
- B2B SaaS를 운영하며, 기능이 ‘느낌상’ 괜찮은지 테스트하는 게 병목임
- 에이전트가 온보딩 플로우를 수백 번 반복하며 사용자 경험 테스트를 자동화해주면 좋겠음
- 또, 내가 화면을 보며 말하는 동안 에이전트가 맥락을 캡처해 기능 명세로 변환해주는 도구를 상상함
개발자들은 기술 스택보다 완성된 제품에 집중해야 함
- 너무 많은 의견과 글이 있지만, 실제 배포된 결과물은 부족함
- 일반 사용자는 기술 스택 자체보다 제품 품질에 관심 있음
  - 느린 React 사이트보다 빠른 SSR 사이트를 보여주면 바로 차이를 느낌
Armin의 사회적 분위기에 대한 통찰이 흥미로움
- 그의 별도 블로그 Dark Thoughts에서 더 많은 글을 기대함
2025년은 프로그래밍의 잃어버린 해처럼 느껴짐
- 모두가 알고리즘보다 도구와 프롬프트에 집착함
- 오픈소스 생산성도 떨어졌고, 이제는 Anthropic 세금을 내는 시대가 됨
- 하지만 나는 2025년이 오히려 가장 생산적인 해였음
  - 코드 기여량, 정보 처리 능력 등 모든 지표가 향상됨
  - Claude 덕분에 삶의 질이 한 단계 올라감
- 자연어 자체가 새로운 프로그래밍 언어라고 생각함
  - 올해는 그 언어를 효율적으로 사용하는 법을 배운 시기였음
- 데이터 과학자로서 2025년은 도구 혁신의 해였음
  - Polars, PyArrow, Ibis, Marimo, PyMC 등으로 워크플로우가 완전히 개선됨
  - 이제 더 빠르고, 저렴하고, 품질 좋은 결과를 낼 수 있음
- TDD나 OOP 같은 끝없는 논쟁이 줄어든 게 오히려 좋았음
- “AI가 다 해준다”는 식의 도구 홍수가 90년대 웹 열풍을 떠올리게 함
  - 인터넷의 ‘enshittification’처럼, AI에는 ‘dumbaification’이 진행 중인 듯함
GitHub의 Pull Request 모델이 AI 코드 리뷰에는 한계가 있음
- 프롬프트와 맥락이 함께 기록되어야 제대로 검토 가능함
- AGENTS.md 같은 문서 외에도 커밋 단위의 문맥 기록이 필요함
IT 외부 사람들과 이야기해보니, 그들은 AI 에이전트의 영향을 거의 느끼지 못함
- 대부분은 단순한 텍스트 보조 도구 정도로만 인식함
- 기술 업계는 결과가 명확히 검증 가능하지만,
  - 비기술 직군의 AI는 ‘감정’과 ‘느낌’의 영역이라 측정 불가능한 품질 문제를 가짐

답변달기

바이브의 해

2025년의 변화

에이전트의 해

기계와 나

의견이 넘쳐남

아웃소싱 vs 직접 구축

배운 것과 바라는 것

새로운 종류의 버전 관리

새로운 종류의 리뷰

새로운 관측성(Observability)

슬롭과 함께 작업하기

Hacker News 의견들