소프트웨어 엔지니어를 위한 Codex

(academy.openai.com)

69P by GN⁺ 2달전 | ★ favorite | 댓글 3개

OpenAI가 직접 공개한 개발자용 Codex 강의 웨비나 영상 (58분)
Codex는 코드 완성이나 페어 프로그래밍을 넘어, 엔지니어가 대규모 작업을 에이전트에게 위임할 수 있도록 설계된 코딩 에이전트 플랫폼
Codex 앱, CLI, IDE 확장 등 다양한 인터페이스에서 동일한 백엔드를 공유하며, 병렬로 여러 작업을 동시에 실행 가능
계획(Plan), 설계(Design), 빌드(Build), 테스트(Test), 리뷰(Review), 문서화(Document), 배포 및 유지보수(Deploy & Maintenance)까지 소프트웨어 개발 생명주기(SDLC) 전체를 커버
agents.md 파일을 통해 에이전트의 행동 지침을 리포지토리 단위로 설정하고, Skills와 Automations로 반복 워크플로우를 패키징하여 자동 실행 가능
25시간 무중단 작업과 13~14회의 서버사이드 컴팩션(compaction) 을 통한 장시간 컨텍스트 유지가 가능하며, OS 수준 샌드박스로 보안 보장

AI 코딩의 진화: 코드 완성에서 에이전트 위임으로

지난 수년간 AI 코딩은 코드 완성(타이핑 속도 약 10% 향상) → 페어 프로그래밍(파일 간 계획, 테스트 실행, 리포 수정) 단계를 거쳐 발전
두 접근법 모두 "더 나은 협업자"를 만드는 데 초점이 있었으나, Codex는 1년 전부터 위임 가능한 에이전트 구축을 목표로 개발 시작
2025년 12월, GT 5.2 Codex 모델이 장시간 무중단 작업과 높은 조종성(steerability)을 확보하면서 "진정한 에이전트 위임"의 핵심 장벽을 해소
이후 더 빠르고 효율적인 GT 5.3, 그리고 최신 GT 5.4 모델로 성능이 지속 향상
대규모 엔터프라이즈 코드베이스를 안정적으로 탐색하고, 사용자 의도에 맞춰 장시간 정렬 상태를 유지하는 것이 핵심 발전 포인트

Codex 사용 가능한 인터페이스

Codex는 하나의 에이전트를 CLI, IDE 확장, Codex 앱 등 여러 표면(surface)에서 사용 가능하며, 모두 동일한 백엔드 공유
Codex 앱은 병렬 작업 실행에 가장 시각적인 인터페이스로, 여러 에이전트를 동시에 실행하고 출력을 검토하는 데 최적화
Peter Steinberger(OpenClaw 창시자)의 사례: 기존에 10개 이상의 CLI 창을 관리하던 방식에서 Codex 앱으로 전환해 병렬 에이전트 관리 효율성 향상
macOS와 Windows 모두 지원하며, openai.com/codex에서 다운로드 가능, Windows는 Microsoft Store에서도 제공
CLI에서는 codex login 명령으로 초기 로그인 후 codex 명령으로 세션 시작

Codex 앱 UI와 설정

모델 선택(GPT 5.4 등)과 추론 노력 수준(reasoning effort) 조절 가능: low, medium, high, extra high
- medium이 기본값으로, 속도와 추론 깊이의 균형이 가장 우수
- 간단한 질문에는 low, 장시간 깊은 사고가 필요한 경우 high 또는 extra high 적합
Speed 모드(fast/standard) 토글로 응답 속도 조절 가능
로컬 작업 외에 Git worktree 모드와 원격 클라우드 컨테이너 시작 옵션 제공
권한 설정: 기본 권한(프로젝트 내 파일 읽기/편집, 위험 명령 시 승인 요청)과 전체 접근(컴퓨터 파일 전체, 네트워크 접근, 승인 없이 실행) 중 선택 가능
- 신규 사용자에게는 기본 권한 권장
왼쪽 사이드바에서 프로젝트(폴더) 추가 및 전환 가능

SDLC 전 단계에서의 Codex 활용

OpenAI는 "Building an AI Native Engineering Team" 가이드를 발행, 코딩 에이전트가 SDLC 7단계(계획, 설계, 빌드, 테스트, 리뷰, 문서화, 배포/유지보수) 전체를 가속화하는 방법을 정리
특히 테스트와 리뷰 단계가 코드 생성 능력 향상에 따라 더욱 중요해짐
복잡한 코드베이스에서의 추론과 프로덕션 수준 코드 작성에서 Codex가 특히 뛰어난 평가를 받고 있음

계획(Plan) 단계

Plan 모드 활성화(/plan 또는 Shift+Tab)로 Codex가 구현 전 계획을 먼저 수립
데모에서 SwiftUI iOS 컴패니언 앱 계획을 요청하자, Codex가 코드베이스를 탐색한 뒤 후속 질문(인증 방식, 첫 릴리스 범위 등)을 제시
추천 옵션 수락 또는 직접 입력으로 에이전트를 조정 가능
계획에 대한 가정(assumptions)을 명시하여 사용자가 검증하고 수정할 수 있는 구조

설계(Design) 단계 — MCP 연동

MCP(Model Context Protocol) 를 통해 Figma, Linear 등 외부 도구의 컨텍스트를 Codex에 직접 연결
- CLI, IDE 확장, Codex 앱 모든 인터페이스에서 지원
Figma MCP 연동 시 디자인 링크를 붙여넣으면 Codex가 디자인 컨텍스트를 가져와 코드로 변환
- MCP가 미설정인 경우 Codex가 자동으로 설치 안내 표시
ChatGPT 앱 통합도 서드파티가 만든 연동으로 Codex에서 직접 사용 가능
이를 통해 엔지니어는 핵심 로직에 집중하고, 디자이너는 더 많은 디자인 컨셉 탐구에 시간 투입 가능

빌드(Build) 단계

SDLC에서 코딩 에이전트의 영향이 가장 큰 단계
데모에서 N+1 쿼리 비효율성 수정 및 회귀 테스트 추가, API 라우트 인증 누락 감사, NextAuth v4에서 Auth.js v5로의 마이그레이션 등을 병렬로 실행
Figma 디자인 기반 코드 생성 결과: 10개 파일 변경, 320줄 코드 작성, CSS 수작업 불필요
Worktree 기능으로 로컬 프로젝트의 사본을 자동 생성하여 병렬 작업 간 충돌 방지, 별도 리포지토리 복사 불필요
agents.md에 지정한 npx tsc, npm test 등의 검증·빌드·린트 명령을 Codex가 자동 실행하여 팀 컨벤션 준수 확인
빌드 자체는 더 이상 병목이 아니며, 엔터프라이즈 환경에서는 코드가 팀 규약에 맞는지 검증하는 것이 핵심
터미널을 Command+J로 앱 내에서 직접 열어 사용 가능
iOS 앱도 Xcode를 직접 열지 않고 Codex 앱 내에서 xcode build 실행 가능

슬래시 명령(Slash Commands)

CLI, IDE 확장, Codex 앱 모두에서 슬래시 명령 지원: plan 모드, 파일 멘션, 세션 상태 확인, 권한 변경 등
/experimental 명령으로 실험적 기능 토글 가능
- 멀티 에이전트(sub-agents) 생성 기능 포함
- CLI가 다른 인터페이스보다 약간 앞서 신기능 탑재
한 인터페이스에서 토글한 설정은 동일 백엔드를 공유하므로 모든 인터페이스에 반영

리뷰(Review) 단계

/review 명령으로 베이스 브랜치 대비 또는 로컬 미커밋 변경사항에 대한 코드 리뷰 실행
Codex 에이전트는 P0/P1 수준 버그 식별에 특화 훈련되어 있어 노이즈가 적은 고신호 피드백 제공
PR이 CI/CD 파이프라인에 도달하기 전에 로컬에서 이슈를 조기 발견 가능
GitHub Cloud 네이티브 통합: Codex가 PR에 대해 사전(proactive) 또는 사후(reactive) 코드 리뷰를 자동 수행
- regex 규칙 검토처럼 인간이 놓치기 쉬운 P1 이슈를 포착한 사례 소개
GitLab, Bitbucket 등 다른 SCM은 Codex SDK를 통해 직접 연동 구축 가능
diff 패널에서 직접 코드 리뷰 코멘트를 추가하면 다음 대화의 컨텍스트로 자동 반영

Skills — 재사용 가능한 워크플로우 패키징

Skill은 Codex가 실행할 재사용 가능한 워크플로우 지침을 패키징한 오픈 표준
- 구조적으로 하나의 폴더이며, 필수 파일은 skill.md(메타데이터 + 에이전트 지침)
- 선택적으로 실행 스크립트, 문서, 템플릿 추가 가능
MCP를 skill 내부에 임베드하여 외부 도구 연동도 가능
데모 예시: PR 코멘트 처리, BuildKite 빌드 실패 자동 수정, 데드 코드 탐지 등
Skill Creator(시스템 스킬): 대화 중 "create a skill to find dead code paths"처럼 요청하면 자동으로 skill.md를 스캐폴딩
Skill Installer(시스템 스킬): 생성된 스킬을 로컬 Codex 스킬 디렉토리에 즉시 설치
긴 대화 후 반복될 워크플로우를 skill로 변환해두면 다음에는 한 번의 호출로 전체 워크플로우 실행 가능
GitHub Issue Plan PR 스킬 예시: 하나의 프롬프트로 GitHub 이슈 트리아지 → 계획 → 편집 → 문서화 → 드래프트 PR 생성까지 SDLC 전 단계를 한 번에 수행

문서화(Documentation) 단계

Codex의 가장 과소평가된 활용 영역 중 하나
시스템 다이어그램 생성, 기능 구현 시 문서 자동 업데이트 등 지원
Linear MCP와 연동하여 특정 티켓의 수정 사항, 회귀 테스트 결과, 검증 내역을 Linear 보드에 자동 문서화한 데모 소개

배포 및 유지보수(Deploy & Maintenance) 단계

Codex 앱에서 Commit, Push, PR 생성을 버튼 클릭으로 직접 수행(Git 기반)
스택 트레이스를 붙여넣으면 Codex가 전체 코드베이스를 추론하여 이슈 원인 파악
Triage Page 스킬: 인시던트 ID를 입력하면 세부 정보 수집, 인시던트 확인, 메트릭·로그 검사, 패치까지 원스톱으로 처리
- 페이저 듀티 대응을 수동 로그 분석에서 에이전트 위임으로 전환
PR Babysitter 스킬: PR의 CI/CD 파이프라인 진행을 지속 모니터링하고, 문제 발생 시 자동 수정하여 최종 머지까지 자동 완료
- OpenAI 대규모 모노레포 환경에서 실제 사용 중
- 오픈소스 스킬 리포지토리에서 다운로드 가능

Automations — 스케줄 기반 자동 실행

스킬 활용에 익숙해진 후 Automations 기능으로 특정 일정에 작업 자동 실행 설정 가능
Sentry 스킬 자동화: 매주 목요일(또는 매일) 특정 리포지토리의 이슈를 찾아 수정 제안 또는 자동 수정
"What is everyone up to?" 자동화: 매일 오전 9시에 리포지토리의 팀원 활동 현황을 요약 출력
프롬프트를 직접 입력하지 않아도 Codex가 백그라운드에서 지속 작업 수행

Codex 에이전트의 작동 원리

Codex 에이전트는 루프 기반으로 동작: 사용자가 명확한 목표와 초기 방향 → 에이전트가 추론, 도구 호출, 파일 읽기, 리포지토리 검색, 코드 작성, 명령 실행을 반복
각 도구 결과가 다음 모델 호출에 피드백되어 점진적 이해 구축과 진행
컨텍스트(context) 가 에이전트 성능을 좌우하는 핵심 변수: 적절한 양의 입력으로 올바른 방향을 지시하는 것이 중요
OS 수준 샌드박싱: 하네스 수준의 경량 제한이 아닌 운영체제 수준에서 네트워크·파일 접근을 제어
- 모델이 발전하면서 경량 보호를 우회할 가능성에 대비한 설계
- 모든 시스템(Mac, Windows)에서 샌드박스 지원, Windows는 WSL보다 보안이 강화된 네이티브 Windows 샌드박스 구현
config TOML 파일에서 approval mode(승인 시점)와 sandbox mode(접근 범위) 세부 설정 가능
- 기본값은 "on request"로 정상 실행하다가 권한 상승 필요 시 일시 정지

컴팩션(Compaction) — 장시간 스레드 관리

대화가 모델의 컨텍스트 제한에 근접하면, Codex가 초기 부분을 압축하는 컴팩션 수행
컴팩션은 서버사이드에서 원시 사고 체인(chain of thought) 기반으로 처리되어, 클라이언트사이드보다 작업의 실질적 내용을 더 잘 보존
실제 사례: 25시간 무중단 작업 중 13~14회 컴팩션을 수행하면서 컨텍스트 유지 성공

효과적인 위임을 위한 프롬프팅 베스트 프랙티스

최소한의 프롬프트에 명확한 목표, 제약 조건, "완료" 기준을 포함
검증 조건을 프롬프트에 내장: 성공 기준, 실행할 테스트·빌드 명령 명시
오픈엔드 프롬프트 활용: 성능 개선 아이디어, 테스트 커버리지 부족 영역 등을 Codex에게 질문하여 사고 파트너로 활용

agents.md — 에이전트 행동 지침 파일

Cursor의 Rules, Windsurf의 설정 등과 유사한 오픈 포맷, OpenAI 독점이 아님
모든 Codex 세션에서 자동 로드되어 일관된 결과 도출에 기여
3단계 우선순위 체계:
- 글로벌(~/.codex/agents.md): 개인 기본 설정(팀 무관)
- 리포지토리 루트(agents.md): 리포 전체 컨벤션
- 서브디렉토리(agents.md): 마이크로서비스/하위 폴더별 세부 지침
- Codex가 프로젝트 루트에서 현재 디렉토리까지 경로를 따라 agents.md를 연결(concatenate) 하며, 더 구체적인 파일이 우선
포함 권장 항목: 리포지토리 개요, 실행 명령, 테스트 기대치, 핵심 모듈 위치, 커밋/PR 가이드라인
/init 명령(CLI)으로 첫 agents.md 자동 생성 가능, 콜드 스타트 문제 해소
100줄 이하로 간결하게 유지 권장(OpenAI 내부 모노레포 agents.md 기준)
내용이 길어질 경우 태스크별 마크다운 파일(planning.md, code-review.md, architecture.md 등)로 분리하고 agents.md에서 참조
Codex에게 로컬 세션 로그(저장 경로 제공됨)를 분석하게 하여 매주 agents.md 개선안을 자동 제안받는 자동화 패턴 소개
Codex에게 대화 회고(retrospective) 를 요청하여 gotcha 섹션이나 참고 사항을 agents.md에 자동 반영하는 활용법