29P by GN⁺ 8시간전 | ★ favorite | 댓글 2개
  • OpenAI가 직접 공개한 개발자용 Codex 강의 웨비나 영상 (58분)
  • Codex는 코드 완성이나 페어 프로그래밍을 넘어, 엔지니어가 대규모 작업을 에이전트에게 위임할 수 있도록 설계된 코딩 에이전트 플랫폼
  • Codex 앱, CLI, IDE 확장 등 다양한 인터페이스에서 동일한 백엔드를 공유하며, 병렬로 여러 작업을 동시에 실행 가능
  • 계획(Plan), 설계(Design), 빌드(Build), 테스트(Test), 리뷰(Review), 문서화(Document), 배포 및 유지보수(Deploy & Maintenance)까지 소프트웨어 개발 생명주기(SDLC) 전체를 커버
  • agents.md 파일을 통해 에이전트의 행동 지침을 리포지토리 단위로 설정하고, SkillsAutomations로 반복 워크플로우를 패키징하여 자동 실행 가능
  • 25시간 무중단 작업과 13~14회의 서버사이드 컴팩션(compaction) 을 통한 장시간 컨텍스트 유지가 가능하며, OS 수준 샌드박스로 보안 보장

AI 코딩의 진화: 코드 완성에서 에이전트 위임으로

  • 지난 수년간 AI 코딩은 코드 완성(타이핑 속도 약 10% 향상) → 페어 프로그래밍(파일 간 계획, 테스트 실행, 리포 수정) 단계를 거쳐 발전
  • 두 접근법 모두 "더 나은 협업자"를 만드는 데 초점이 있었으나, Codex는 1년 전부터 위임 가능한 에이전트 구축을 목표로 개발 시작
  • 2025년 12월, GT 5.2 Codex 모델이 장시간 무중단 작업과 높은 조종성(steerability)을 확보하면서 "진정한 에이전트 위임"의 핵심 장벽을 해소
  • 이후 더 빠르고 효율적인 GT 5.3, 그리고 최신 GT 5.4 모델로 성능이 지속 향상
  • 대규모 엔터프라이즈 코드베이스를 안정적으로 탐색하고, 사용자 의도에 맞춰 장시간 정렬 상태를 유지하는 것이 핵심 발전 포인트

Codex 사용 가능한 인터페이스

  • Codex는 하나의 에이전트를 CLI, IDE 확장, Codex 앱 등 여러 표면(surface)에서 사용 가능하며, 모두 동일한 백엔드 공유
  • Codex 앱은 병렬 작업 실행에 가장 시각적인 인터페이스로, 여러 에이전트를 동시에 실행하고 출력을 검토하는 데 최적화
  • Peter Steinberger(OpenClaw 창시자)의 사례: 기존에 10개 이상의 CLI 창을 관리하던 방식에서 Codex 앱으로 전환해 병렬 에이전트 관리 효율성 향상
  • macOS와 Windows 모두 지원하며, openai.com/codex에서 다운로드 가능, Windows는 Microsoft Store에서도 제공
  • CLI에서는 codex login 명령으로 초기 로그인 후 codex 명령으로 세션 시작

Codex 앱 UI와 설정

  • 모델 선택(GPT 5.4 등)과 추론 노력 수준(reasoning effort) 조절 가능: low, medium, high, extra high
    • medium이 기본값으로, 속도와 추론 깊이의 균형이 가장 우수
    • 간단한 질문에는 low, 장시간 깊은 사고가 필요한 경우 high 또는 extra high 적합
  • Speed 모드(fast/standard) 토글로 응답 속도 조절 가능
  • 로컬 작업 외에 Git worktree 모드와 원격 클라우드 컨테이너 시작 옵션 제공
  • 권한 설정: 기본 권한(프로젝트 내 파일 읽기/편집, 위험 명령 시 승인 요청)과 전체 접근(컴퓨터 파일 전체, 네트워크 접근, 승인 없이 실행) 중 선택 가능
    • 신규 사용자에게는 기본 권한 권장
  • 왼쪽 사이드바에서 프로젝트(폴더) 추가 및 전환 가능

SDLC 전 단계에서의 Codex 활용

  • OpenAI는 "Building an AI Native Engineering Team" 가이드를 발행, 코딩 에이전트가 SDLC 7단계(계획, 설계, 빌드, 테스트, 리뷰, 문서화, 배포/유지보수) 전체를 가속화하는 방법을 정리
  • 특히 테스트와 리뷰 단계가 코드 생성 능력 향상에 따라 더욱 중요해짐
  • 복잡한 코드베이스에서의 추론과 프로덕션 수준 코드 작성에서 Codex가 특히 뛰어난 평가를 받고 있음

계획(Plan) 단계

  • Plan 모드 활성화(/plan 또는 Shift+Tab)로 Codex가 구현 전 계획을 먼저 수립
  • 데모에서 SwiftUI iOS 컴패니언 앱 계획을 요청하자, Codex가 코드베이스를 탐색한 뒤 후속 질문(인증 방식, 첫 릴리스 범위 등)을 제시
  • 추천 옵션 수락 또는 직접 입력으로 에이전트를 조정 가능
  • 계획에 대한 가정(assumptions)을 명시하여 사용자가 검증하고 수정할 수 있는 구조

설계(Design) 단계 — MCP 연동

  • MCP(Model Context Protocol) 를 통해 Figma, Linear 등 외부 도구의 컨텍스트를 Codex에 직접 연결
    • CLI, IDE 확장, Codex 앱 모든 인터페이스에서 지원
  • Figma MCP 연동 시 디자인 링크를 붙여넣으면 Codex가 디자인 컨텍스트를 가져와 코드로 변환
    • MCP가 미설정인 경우 Codex가 자동으로 설치 안내 표시
  • ChatGPT 앱 통합도 서드파티가 만든 연동으로 Codex에서 직접 사용 가능
  • 이를 통해 엔지니어는 핵심 로직에 집중하고, 디자이너는 더 많은 디자인 컨셉 탐구에 시간 투입 가능

빌드(Build) 단계

  • SDLC에서 코딩 에이전트의 영향이 가장 큰 단계
  • 데모에서 N+1 쿼리 비효율성 수정 및 회귀 테스트 추가, API 라우트 인증 누락 감사, NextAuth v4에서 Auth.js v5로의 마이그레이션 등을 병렬로 실행
  • Figma 디자인 기반 코드 생성 결과: 10개 파일 변경, 320줄 코드 작성, CSS 수작업 불필요
  • Worktree 기능으로 로컬 프로젝트의 사본을 자동 생성하여 병렬 작업 간 충돌 방지, 별도 리포지토리 복사 불필요
  • agents.md에 지정한 npx tsc, npm test 등의 검증·빌드·린트 명령을 Codex가 자동 실행하여 팀 컨벤션 준수 확인
  • 빌드 자체는 더 이상 병목이 아니며, 엔터프라이즈 환경에서는 코드가 팀 규약에 맞는지 검증하는 것이 핵심
  • 터미널을 Command+J로 앱 내에서 직접 열어 사용 가능
  • iOS 앱도 Xcode를 직접 열지 않고 Codex 앱 내에서 xcode build 실행 가능

슬래시 명령(Slash Commands)

  • CLI, IDE 확장, Codex 앱 모두에서 슬래시 명령 지원: plan 모드, 파일 멘션, 세션 상태 확인, 권한 변경 등
  • /experimental 명령으로 실험적 기능 토글 가능
    • 멀티 에이전트(sub-agents) 생성 기능 포함
    • CLI가 다른 인터페이스보다 약간 앞서 신기능 탑재
  • 한 인터페이스에서 토글한 설정은 동일 백엔드를 공유하므로 모든 인터페이스에 반영

리뷰(Review) 단계

  • /review 명령으로 베이스 브랜치 대비 또는 로컬 미커밋 변경사항에 대한 코드 리뷰 실행
  • Codex 에이전트는 P0/P1 수준 버그 식별에 특화 훈련되어 있어 노이즈가 적은 고신호 피드백 제공
  • PR이 CI/CD 파이프라인에 도달하기 전에 로컬에서 이슈를 조기 발견 가능
  • GitHub Cloud 네이티브 통합: Codex가 PR에 대해 사전(proactive) 또는 사후(reactive) 코드 리뷰를 자동 수행
    • regex 규칙 검토처럼 인간이 놓치기 쉬운 P1 이슈를 포착한 사례 소개
  • GitLab, Bitbucket 등 다른 SCM은 Codex SDK를 통해 직접 연동 구축 가능
  • diff 패널에서 직접 코드 리뷰 코멘트를 추가하면 다음 대화의 컨텍스트로 자동 반영

Skills — 재사용 가능한 워크플로우 패키징

  • Skill은 Codex가 실행할 재사용 가능한 워크플로우 지침을 패키징한 오픈 표준
    • 구조적으로 하나의 폴더이며, 필수 파일은 skill.md(메타데이터 + 에이전트 지침)
    • 선택적으로 실행 스크립트, 문서, 템플릿 추가 가능
  • MCP를 skill 내부에 임베드하여 외부 도구 연동도 가능
  • 데모 예시: PR 코멘트 처리, BuildKite 빌드 실패 자동 수정, 데드 코드 탐지 등
  • Skill Creator(시스템 스킬): 대화 중 "create a skill to find dead code paths"처럼 요청하면 자동으로 skill.md를 스캐폴딩
  • Skill Installer(시스템 스킬): 생성된 스킬을 로컬 Codex 스킬 디렉토리에 즉시 설치
  • 긴 대화 후 반복될 워크플로우를 skill로 변환해두면 다음에는 한 번의 호출로 전체 워크플로우 실행 가능
  • GitHub Issue Plan PR 스킬 예시: 하나의 프롬프트로 GitHub 이슈 트리아지 → 계획 → 편집 → 문서화 → 드래프트 PR 생성까지 SDLC 전 단계를 한 번에 수행

문서화(Documentation) 단계

  • Codex의 가장 과소평가된 활용 영역 중 하나
  • 시스템 다이어그램 생성, 기능 구현 시 문서 자동 업데이트 등 지원
  • Linear MCP와 연동하여 특정 티켓의 수정 사항, 회귀 테스트 결과, 검증 내역을 Linear 보드에 자동 문서화한 데모 소개

배포 및 유지보수(Deploy & Maintenance) 단계

  • Codex 앱에서 Commit, Push, PR 생성을 버튼 클릭으로 직접 수행(Git 기반)
  • 스택 트레이스를 붙여넣으면 Codex가 전체 코드베이스를 추론하여 이슈 원인 파악
  • Triage Page 스킬: 인시던트 ID를 입력하면 세부 정보 수집, 인시던트 확인, 메트릭·로그 검사, 패치까지 원스톱으로 처리
    • 페이저 듀티 대응을 수동 로그 분석에서 에이전트 위임으로 전환
  • PR Babysitter 스킬: PR의 CI/CD 파이프라인 진행을 지속 모니터링하고, 문제 발생 시 자동 수정하여 최종 머지까지 자동 완료
    • OpenAI 대규모 모노레포 환경에서 실제 사용 중
    • 오픈소스 스킬 리포지토리에서 다운로드 가능

Automations — 스케줄 기반 자동 실행

  • 스킬 활용에 익숙해진 후 Automations 기능으로 특정 일정에 작업 자동 실행 설정 가능
  • Sentry 스킬 자동화: 매주 목요일(또는 매일) 특정 리포지토리의 이슈를 찾아 수정 제안 또는 자동 수정
  • "What is everyone up to?" 자동화: 매일 오전 9시에 리포지토리의 팀원 활동 현황을 요약 출력
  • 프롬프트를 직접 입력하지 않아도 Codex가 백그라운드에서 지속 작업 수행

Codex 에이전트의 작동 원리

  • Codex 에이전트는 루프 기반으로 동작: 사용자가 명확한 목표와 초기 방향 → 에이전트가 추론, 도구 호출, 파일 읽기, 리포지토리 검색, 코드 작성, 명령 실행을 반복
  • 각 도구 결과가 다음 모델 호출에 피드백되어 점진적 이해 구축과 진행
  • 컨텍스트(context) 가 에이전트 성능을 좌우하는 핵심 변수: 적절한 양의 입력으로 올바른 방향을 지시하는 것이 중요
  • OS 수준 샌드박싱: 하네스 수준의 경량 제한이 아닌 운영체제 수준에서 네트워크·파일 접근을 제어
    • 모델이 발전하면서 경량 보호를 우회할 가능성에 대비한 설계
    • 모든 시스템(Mac, Windows)에서 샌드박스 지원, Windows는 WSL보다 보안이 강화된 네이티브 Windows 샌드박스 구현
  • config TOML 파일에서 approval mode(승인 시점)와 sandbox mode(접근 범위) 세부 설정 가능
    • 기본값은 "on request"로 정상 실행하다가 권한 상승 필요 시 일시 정지

컴팩션(Compaction) — 장시간 스레드 관리

  • 대화가 모델의 컨텍스트 제한에 근접하면, Codex가 초기 부분을 압축하는 컴팩션 수행
  • 컴팩션은 서버사이드에서 원시 사고 체인(chain of thought) 기반으로 처리되어, 클라이언트사이드보다 작업의 실질적 내용을 더 잘 보존
  • 실제 사례: 25시간 무중단 작업 중 13~14회 컴팩션을 수행하면서 컨텍스트 유지 성공

효과적인 위임을 위한 프롬프팅 베스트 프랙티스

  • 최소한의 프롬프트에 명확한 목표, 제약 조건, "완료" 기준을 포함
  • 검증 조건을 프롬프트에 내장: 성공 기준, 실행할 테스트·빌드 명령 명시
  • 오픈엔드 프롬프트 활용: 성능 개선 아이디어, 테스트 커버리지 부족 영역 등을 Codex에게 질문하여 사고 파트너로 활용

agents.md — 에이전트 행동 지침 파일

  • Cursor의 Rules, Windsurf의 설정 등과 유사한 오픈 포맷, OpenAI 독점이 아님
  • 모든 Codex 세션에서 자동 로드되어 일관된 결과 도출에 기여
  • 3단계 우선순위 체계:
    • 글로벌(~/.codex/agents.md): 개인 기본 설정(팀 무관)
    • 리포지토리 루트(agents.md): 리포 전체 컨벤션
    • 서브디렉토리(agents.md): 마이크로서비스/하위 폴더별 세부 지침
    • Codex가 프로젝트 루트에서 현재 디렉토리까지 경로를 따라 agents.md를 연결(concatenate) 하며, 더 구체적인 파일이 우선
  • 포함 권장 항목: 리포지토리 개요, 실행 명령, 테스트 기대치, 핵심 모듈 위치, 커밋/PR 가이드라인
  • /init 명령(CLI)으로 첫 agents.md 자동 생성 가능, 콜드 스타트 문제 해소
  • 100줄 이하로 간결하게 유지 권장(OpenAI 내부 모노레포 agents.md 기준)
  • 내용이 길어질 경우 태스크별 마크다운 파일(planning.md, code-review.md, architecture.md 등)로 분리하고 agents.md에서 참조
  • Codex에게 로컬 세션 로그(저장 경로 제공됨)를 분석하게 하여 매주 agents.md 개선안을 자동 제안받는 자동화 패턴 소개
  • Codex에게 대화 회고(retrospective) 를 요청하여 gotcha 섹션이나 참고 사항을 agents.md에 자동 반영하는 활용법

마무리 — Codex 도입을 위한 3가지 핵심 실천 사항

  • agents.md 생성과 커스텀 설정 구성
  • 실제 업무 작업을 Codex에 부여하고, 일상적으로 사용하는 도구(MCP)와 연결
  • 빌드 단계만이 아니라 설계부터 배포·유지보수까지 전체 개발 루프에서 Codex를 실행하며 지속 반복

이거 들으신 분 계세요?
1시간 투자할만큼 의미있나요?

대딸깍 AI 시대에 시간이 귀하다보니 ㅋ

OpenAI 아카데미도 오픈한지 이제 거의 1년이라 꽤 좋은 강의들이 많이 쌓이고 있습니다.
(근데 자동 생성 영어 자막만 있는건 좀 아쉽)