바이브 코딩의 창시자의 주말

  • Karpathy가 주말 프로젝트를 에이전트에게 맡겼다. IP, 사용자명, 비밀번호, 목표만 주고 30분 뒤 전부 완성
  • 99%의 시간 동안 코드를 직접 작성하지 않고 에이전트에게 명령하고 감독하는 방식 — "에이전틱 엔지니어링"
  • 하지만 개발자 60%가 AI를 사용하면서도 완전 위임은 0-20%에 불과 — 위임 패러독스. "Do you trust your agents?" 대부분이 아직 "아니오"

① 분해 능력 (Decomposition)

  • "회원가입 기능 만들어줘"라고 하면 뭔가 나오긴 나온다. 문제는 내가 원하던 게 아닐 확률이 높다는 것
  • AddPlan 화면을 PRD만 던져서 에이전트에게 맡겼다가 핑퐁 수십 턴, 반나절을 날린 경험
  • AI와 소크라틱 대화로 인터뷰 5분 → 엣지 케이스 사전 정리 → 수정 2-3턴으로 축소
  • 구현 전에 생각의 시간을 갖는 것, 그 5분이 4시간을 아낀다

② 컨텍스트 설계 (Context Architecture)

  • AGENTS.md를 잘 쓰는 것도 중요하지만, 코드 아키텍처 자체가 잘 설계되어 있으면 에이전트가 컨텍스트를 파악하는 속도가 완전히 다르다
  • 플랫 디렉토리에서 에이전트가 헤매던 것을 Feature 단위 디렉토리로 재구성하니 즉각 개선
  • Armin Ronacher: "도구는 LLM 카오스 원숭이가 완전히 잘못 쓰는 것에 대비해야 한다"

③ 완료 정의 (Definition of Done)

  • CLI 프로젝트를 밤새 돌렸더니 1시간 만에 종료 — 타입 정의만 세팅하고 비즈니스 로직은 빈 껍데기
  • 두 번째 시도에서는 테스트 자체를 에이전트가 자기 편하게 재작성
  • 에이전트의 "완료"는 내 "완료"와 다르다
  • Elvis의 7단계 DoD 시스템(PR→CI→코드리뷰3개→텔레그램)이 극단적이지만 방향을 보여준다

④ 실패 복구 (Failure Recovery Loop)

  • 재분배 엔진에서 같은 파라미터가 함수마다 다른 시맨틱 → A를 고치면 B가 깨지는 무한루프
  • 같은 프롬프트로 재시도하는 건 벽에 같은 방향으로 계속 머리를 박는 것
  • 실패를 3가지(컨텍스트 부족, 방향 오류, 구조적 충돌)로 분류하면 처방이 명확해진다
  • "Must NOT Have" 가드레일이 무한루프를 끊었다

⑤ 관찰 가능성 (Observability)

  • liquidglass를 에이전트에게 맡기고 "이상한데... 그냥 두자"가 가장 비싼 판단
  • 20개 파일이 엉킨 상태로 롤백 불가
  • 이후 예광탄 전략 + 블루프린트 — 처음 적용하는 기술은 블루프린트를 미리 그릴 수 없으니, 예광탄이 빠르게 그려준다
  • 관찰 가능성이 신뢰를 만들고, 신뢰가 위임을 가능하게 한다

⑥ 메모리 설계 (Memory Architecture)

  • 3일 연속 작업하면 매일 아침 15분씩 맥락 설명으로 날린다
  • Claude Code hooks로 세션 종료 시 자동 메모리 추출 → 다음 세션 5초 복원
  • Boris Cherny 팀은 CLAUDE.md를 git에 체크인해서 팀 전체가 공유
  • 개인의 기억이 아니라 팀의 기억이 에이전트에게 전달되는 구조

⑦ 병렬 관리 (Parallel Orchestration)

  • Boris Cherny는 10-15개 병렬 세션을 동시에 돌린다
  • CTO 시절 스쿼드 6개를 매니징하던 경험이 에이전트 병렬 관리와 놀라울 만큼 비슷하다
  • ADHD가 아니라 의도된 멀티태스킹 = 매니징
  • 사람은 질문을 하지만 에이전트는 묻지 않고 자기 판단으로 진행 — 사전 설계가 더 중요하다

⑧ 추상화 계층 설계 (Abstraction Layering)

  • Level 0(직접 코딩) → Level 1(에이전트 지시) → Level 2(오케스트레이터) → Level 3(메타 설계)
  • 매일 20분짜리 루틴을 스킬로 만들어 2분으로 줄인 경험
  • 컴파운딩 엔지니어링 — 프로젝트는 결승선 게임이 아니라 복리형 게임. 앞의 세션들이 뒤에 복리로 영향을 준다

⑨ 감각 (Taste)

  • AI가 만든 디자인은 60-70점. Ellie의 디자인이 들어오는 순간 "아, 이거 된다"는 감각
  • AI가 만든 정보 정리 포스트는 좋아요 0, 충동적으로 쓴 한 줄 자랑글이 조회수 3만
  • KinglyCrow의 "No Skill, No Taste" — LLM이 스킬 진입 장벽을 낮췄지만, taste라는 진짜 장벽은 오히려 증폭
  • Chris Lattner: "구현의 자동화가 일어날수록, 설계·판단·감각의 중요성이 오히려 높아진다"
  • 80%가 범람하는 시대에 차별화는 나머지 20%에서 나온다

나가며

  • 끝난 건 타이핑이지, 엔지니어링이 아니다
  • 이 9가지는 AI 이전에도 좋은 엔지니어가 갖추고 있던 것들
  • 좋은 설계의 레버리지도 커졌지만, 나쁜 설계의 피해도 커졌다
  • 그 쇼의 주인공은 AI가 아니라, AI를 잘 다루는 엔지니어다