6P by GN⁺ 6시간전 | ★ favorite | 댓글 7개
  • 여러 AI 에이전트를 동시에 관리하고 병렬 작업장기 협업을 지원하는 AI 개발 통합환경
  • 각 에이전트가 독립 스레드로 실행되어 프로젝트별 멀티태스킹과 코드 리뷰, diff 코멘트, 수동 수정이 가능
  • Skills 기능을 통해 코드 작성뿐 아니라 정보 수집, 문제 해결, 이미지 생성, 문서 작성, 클라우드 배포 등 다양한 작업으로 확장
  • Automations 기능으로 정해진 일정에 따라 백그라운드에서 자동으로 반복 작업 수행 가능
  • 기본적으로 샌드박스 보안이 적용되며, 네트워크 접근 등 상위 권한이 필요한 명령은 사용자 승인 필요
  • ChatGPT Free 및 Go 사용자에게도 한시적으로 Codex 제공, 유료 플랜은 사용량 한도 2배 증가

Codex 앱 개요: 에이전트를 위한 커맨드 센터

  • 2025년 4월 Codex 출시 이후 개발자들의 에이전트 활용 방식이 근본적으로 변화함
    • 모델이 복잡하고 장기적인 작업을 처음부터 끝까지 처리할 수 있게 됨
    • 개발자들은 이제 여러 에이전트를 프로젝트 전반에 걸쳐 조율하며 작업을 위임하고 병렬 실행
  • 핵심 과제가 "에이전트가 무엇을 할 수 있는가"에서 "사람이 어떻게 에이전트를 대규모로 지휘하고 감독하며 협업할 수 있는가" 로 전환됨
  • 기존 IDE와 터미널 기반 도구는 이러한 작업 방식을 지원하도록 설계되지 않아 새로운 도구 필요
  • macOS용 Codex 앱여러 AI 에이전트를 동시에 관리하고 병렬로 작업을 실행할 수 있음
  • 장기 실행 작업을 지원하며, 에이전트 간 협업을 통해 소프트웨어 설계·개발·배포·유지보수 전 과정을 관리

다중 에이전트 병렬 작업

  • Codex 앱은 에이전트와의 멀티태스킹을 위한 집중 공간 제공
    • 에이전트는 프로젝트별로 구성된 별도 스레드에서 실행되어 컨텍스트 손실 없이 작업 간 전환 가능
    • 스레드 내에서 에이전트의 변경 사항을 검토하고, diff에 코멘트를 달거나 에디터에서 직접 수정 가능
  • Worktrees 기본 지원으로 여러 에이전트가 동일 저장소에서 충돌 없이 작업
    • 각 에이전트가 코드의 격리된 복사본에서 작업하여 로컬 git 상태에 영향 없이 다양한 경로 탐색 가능
    • 에이전트 작업 중 변경 사항을 로컬에서 체크아웃하거나 로컬 git 상태 변경 없이 계속 진행 가능
  • Codex CLI 및 IDE 확장에서 세션 히스토리와 설정을 자동으로 가져와 기존 프로젝트에서 바로 사용 가능

Skills: 코드 생성을 넘어선 확장

  • Codex가 코드를 작성하는 에이전트에서 코드를 사용해 컴퓨터에서 작업을 수행하는 에이전트로 진화 중
  • Skills를 통해 정보 수집 및 종합, 문제 해결, 작성 등 코드 생성 이상의 작업으로 확장 가능
    • 지침, 리소스, 스크립트를 번들로 묶어 Codex가 도구에 연결하고 워크플로우 실행 가능
    • 팀의 선호도에 따라 작업을 안정적으로 완료
  • Codex 앱에 Skills를 생성하고 관리하는 전용 인터페이스 포함
    • 특정 Skills 사용을 명시적으로 요청하거나 작업에 따라 자동으로 사용하도록 설정 가능
  • Skills 활용 예시: 레이싱 게임 생성

    • Codex에 다양한 레이서, 8개 맵, 스페이스바로 사용 가능한 아이템이 포함된 레이싱 게임 제작 요청
      • 이미지 생성 스킬(GPT Image 기반)과 웹 게임 개발 스킬 활용
      • 단일 초기 프롬프트로 700만 토큰 이상 독립적으로 작업하여 게임 완성
      • 디자이너, 게임 개발자, QA 테스터 역할을 수행하며 실제로 게임을 플레이해 검증
    • 게임명: Voxel Velocity, Three.js를 사용한 3D 복셀 카트 레이서
      • 싱글 레이스 모드(항상 3랩, 인간 1명 vs CPU 7명, 8개 트랙 즉시 이용 가능)
      • 아케이드 드라이빙 모델, 드리프트 충전 시스템, 부스트 티어(Tier 1 0.7초, Tier 2 1.1초, Tier 3 1.5초)
      • 8개 캐릭터, 8개 아이템, CPU 난이도 프리셋, AI 스플라인 구현
  • 제공되는 주요 Skills

    • Implement designs: Figma에서 디자인 컨텍스트, 에셋, 스크린샷을 가져와 1:1 시각적 동일성의 프로덕션 UI 코드로 변환
    • Manage projects: Linear에서 버그 분류, 릴리스 추적, 팀 워크로드 관리
    • Deploy to the cloud: Cloudflare, Netlify, Render, Vercel 등 주요 클라우드 호스트에 웹 앱 배포
    • Generate images: GPT Image 기반 이미지 생성 스킬로 웹사이트, UI 목업, 제품 비주얼, 게임 에셋용 이미지 생성 및 편집
    • Build with OpenAI APIs: OpenAI API로 빌드 시 최신 문서 참조
    • Create documents: PDF, 스프레드시트, docx 파일 읽기, 생성, 편집(전문적 포맷과 레이아웃 지원)
    • 앱에서 새 스킬 생성 시 앱, CLI, IDE 확장 어디서든 사용 가능
    • 저장소에 스킬을 체크인하여 전체 팀이 사용하도록 공유 가능

Automations: 반복 작업 자동화

  • Automations 기능으로 Codex가 정의된 일정에 따라 백그라운드에서 자동 작업 수행
    • 지침과 선택적 스킬을 결합하여 설정
    • 완료 시 결과가 검토 대기열에 저장되어 필요 시 이어서 작업 가능
  • OpenAI 내부 활용 예시
    • 일일 이슈 분류
    • CI 실패 찾기 및 요약
    • 일일 릴리스 브리프 생성
    • 버그 확인

Personality: 작업 스타일 맞춤 설정

  • 개발자마다 에이전트와의 작업 방식 선호도가 다름
    • 간결하고 실행 중심의 파트너를 원하는 경우
    • 더 대화적이고 공감적인 상호작용을 선호하는 경우
  • Codex에서 두 가지 퍼스널리티 선택 가능: 간결하고 실용적인 스타일 vs 대화적이고 공감적인 스타일
    • 기능 변화 없이 선호하는 방식에 맞춤
    • 앱, CLI, IDE 확장에서 /personality 명령으로 설정

보안: 기본 적용 및 설정 가능

  • Codex 에이전트 스택 전반에 설계 단계부터 보안 통합
  • Codex CLI와 동일하게 네이티브, 오픈소스, 설정 가능한 시스템 수준 샌드박싱 사용
  • 기본 설정
    • 에이전트는 작업 중인 폴더 또는 브랜치의 파일 편집과 캐시된 웹 검색만 허용
    • 네트워크 접근 등 상위 권한이 필요한 명령 실행 시 사용자 승인 요청
  • 프로젝트 또는 팀용 규칙을 구성하여 특정 명령이 상위 권한으로 자동 실행되도록 설정 가능

이용 가능 여부 및 가격

  • Codex 앱은 오늘부터 macOS에서 이용 가능
  • ChatGPT Plus, Pro, Business, Enterprise, Edu 구독자는 ChatGPT 로그인으로 CLI, 웹, IDE 확장, 앱에서 Codex 사용 가능
  • 사용량은 ChatGPT 구독에 포함, 필요 시 추가 크레딧 구매 옵션 제공
  • 한시적으로 ChatGPT Free 및 Go 사용자에게도 Codex 제공
  • 이 기간 동안 모든 유료 플랜의 기존 Codex 사용자에게 사용량 한도 2배 증가

향후 계획

  • 2024년 12월 중순 GPT-5.2-Codex 출시 이후 전체 Codex 사용량 2배 증가
  • 지난 한 달간 100만 명 이상의 개발자가 Codex 사용
  • 향후 계획
    • Windows 앱 출시 예정
    • 모델 기능의 최전선 확장
    • 더 빠른 추론 제공
  • 앱 내 개선 사항
    • 실제 피드백을 기반으로 다중 에이전트 워크플로우 지속 개선
    • 병렬 작업 관리 및 에이전트 간 전환 시 컨텍스트 유지 용이성 향상
  • Automations 확장
    • 클라우드 기반 트리거 지원 구축 중
    • 컴퓨터가 열려 있지 않아도 Codex가 백그라운드에서 지속 실행 가능

Codex의 핵심 전제

  • 모든 것이 코드로 제어된다는 단순한 전제에 기반
  • 에이전트가 코드에 대해 추론하고 생성하는 능력이 좋을수록 모든 형태의 기술 및 지식 작업에서 더 유능해짐
  • 현재 핵심 과제: 프론티어 모델의 기능과 사람들이 실제로 쉽게 사용할 수 있는 정도 사이의 격차
  • Codex는 모델의 전체 지능을 실제 작업에 쉽게 지휘, 감독, 적용할 수 있도록 하여 이 격차를 해소하도록 설계됨
  • 최고의 코딩 에이전트를 만드는 데 집중했으며, 이는 코드 작성을 넘어 광범위한 지식 작업을 위한 강력한 에이전트의 기반이 될 것

저도 요즘 Codex가 메인인데 좋네요. 윈도우용도 빨리 나왔으면

처음 시작하면 기존에 Codex로 작업하던 프로젝트들 싹 불러오고 왼쪽에 프로젝트/쓰레드 단위로 쭈루룩 보여줘서 여러개 동시에 일시키기 딱 좋습니다.

Claude Code가 아니라 Codex가 메인인 이유가 있으실까요?

플랜 문서 길게 만들어서 일하라고 던져 놓는 편인데 Codex가 이쪽에 더 잘 맞더라고요.
그리고 확실히 레이트 리밋이 잘 안걸려요. 싼 계정에서 여러 프로젝트 동시에 돌리는 편인데두요.

오홍 댓글 감사합니다.

OpenClaw 제작자가 Codex 쓰는 것도 그렇고

https://news.hada.io/topic?id=26222

Codex도 평이 나쁘지 않아보이는데 Hacker News 댓글들 보면 또 아닌 것 같기도 하고...

2222 윈도우/리눅스 제발 ㅠ
ChatGPT 브라우저라는 아틀라스도 써보고 싶었는데 윈도우 커밍쑨 해놓고 한참 소식 없네용

Wsl나 윈도우 줘...

Hacker News 의견들
  • 수십억 달러를 가진 AI 기업들이 왜 여전히 네이티브 앱을 못 만드는지 이해가 안 됨
    대부분 단순한 채팅 UI 수준인데, Electron으로는 OS API(예: Win32)를 직접 호출하기 어려워서 깊은 통합이 불가능함
    Blender, Godot, Unity, UE5 같은 복잡한 소프트웨어도 다 네이티브로 돌아가는데, 이런 기업들이 변명만 하는 게 답답함
    • 데스크톱 개발 환경이 엉망임. Microsoft가 너무 많은 반쪽짜리 프레임워크를 내놔서 뭘 써야 할지 모르는 상황임
      Windows에서는 Electron이 사실상 표준이고, Microsoft조차 자주 사용함
      MacOS는 훨씬 낫지만, 팀이 결국 Mac 전용으로 잠기거나 Electron으로 크로스 플랫폼을 선택하게 됨
    • 요즘 비디오 게임 UI도 HTML/JS 기반을 많이 씀
      UE5의 UI도 네이티브 느낌이 거의 없고, Electron보다 낫다고 하기도 어려움
      Electron에서도 네이티브 API 호출은 가능함
      대부분의 사용자는 앱이 네이티브인지 아닌지 신경 안 쓰고, 웹 개발자를 데스크톱 앱 개발로 재활용할 수 있다는 점이 기업 입장에선 큰 장점임
    • 오히려 반대로 생각함. 모든 걸 텍스트 인터페이스로 만들면 모델이 도구를 자연스럽게 학습할 수 있음
      TUI나 GUI는 불필요한 추상화층이라 자동화를 어렵게 함
      핵심은 단순한 명령 호출과 로그 기록임. [headless 모드나 세션 로그]가 그 방향에 가까움
    • AI로 만든 결과가 결국 입력창 하나 있는 Electron 앱이라는 게 현실임
    • 네이티브 앱이 제공할 수 있는 기능이 뭐가 그렇게 중요한지 모르겠음
      대부분의 사람은 앱이 웹 기술로 만들어졌는지 신경 안 씀
      Electron 덕분에 Linux 포팅도 쉬워짐. 네이티브만 고집하면 이런 건 불가능했을 것임
  • 최근 두 달간 Codex를 많이 써봤는데 꽤 인상적이었음
    완벽하진 않지만, 중간급 엔지니어 수준의 결과를 꾸준히 냄
    다만 앱이 “Loading projects…”에서 멈춰버림
    문서 링크도 깨져 있었는데, 이 링크는 지금은 작동함
    여러 VM 환경을 VS Code Remote로 쓰고 있어서, 포트 오프셋 설정을 좀 바꿔야 할 듯함
    • ChatGPT($20/월)와 Claude($200/년)를 같이 쓰는데, Codex는 아직 사용 제한에 걸린 적이 없음
      Codex는 문제 해결 중 루프에 빠지는 경우가 많고, Claude가 그런 걸 잘 마무리해줌
      두 모델을 번갈아 쓰는 방식이 꽤 효율적임
    • 링크 문제를 알려줘서 고맙다는 답변을 받았음. 로딩 속도도 개선 중이라고 함
    • Codex는 백엔드나 논리적 작업에는 강하지만, 단순한 프론트엔드 UI 작업은 자주 실수함
      그래도 꾸준히 개선되고 있어서 기대 중임
    • 나는 Cursor를 계속 쓸 예정임. OpenAI는 새 앱을 내기보다 기존 앱의 버그 수정에 집중해야 함
  • Codex는 Claude Cowork류의 경쟁 제품처럼 보임
    Cowork는 Claude Code를 VM에서 호출하고, Codex는 CLI를 OS 샌드박스에서 실행함
    기술 스택은 Electron 40, React 19, TypeScript, Node.js, SQLite, Vite 등으로 구성됨
    macOS용으로는 Sparkle, Squirrel, Sentry 등을 사용함
    • 이름과 diff/worktree 중심 설계를 보면 개발자 지향성이 강함
    • 부트캠프 수준의 스택이라 좀 실망스러움
    • Sentry 통합이 네이티브인지 MCP를 통한 것인지 궁금함
    • git과 터미널 뷰가 있어서 CLI 사용자에게는 큰 장점임. skills 기능도 기대됨
  • Codex를 써봤는데 너무 느리고 멍청해서 화가 날 정도였음
    지시를 따르지 않고, 중간에 멈추거나 엉뚱한 코드를 던져줌
    Nuxt 4+ 관련 최신 데이터가 없어 계속 오류를 냄
    Undo 기능도 제대로 작동하지 않고, 피드백이 없음
    Claude Code는 같은 작업을 한 번에 처리했는데 Codex는 오래 걸리고 엉망이었음
    이걸 보니 예전 Nokia N800을 썼을 때처럼, 가능성은 있는데 완성도가 너무 낮아서 OpenAI의 방향성이 걱정됨
  • OpenAI의 Codex는 사실상 Emdash, Conductor 같은 제품을 공식화한 버전임
    Anthropic도 비슷한 Claude Code 멀티 에이전트 앱을 낼지 궁금함
    • 이미 Claude Code Desktop이 있음
    • 멀티 에이전트 접근이 과대평가된 것 같음
      명확한 계약(API 정의 등)이 있다면 독립적인 세션으로 병렬 작업하는 게 더 효율적임
    • GUI로 Claude Code를 쓸 때, 전체 Claude Code harness를 쓰는 건지 단순히 모델만 쓰는 건지 궁금함
    • Emdash는 처음 들어봤는데, 이런 툴이 너무 많아서 홍보가 어렵고 시장이 시끄러움
      직접 비슷한 걸 만들 뻔했음
    • Claude Code 웹 버전이 연구 미리보기로 공개되어 있음
  • 에이전트 기능은 별로 흥미롭지 않음
    Recursive Language Models 논문의 핵심은 요구사항과 설계, 계획 등을 맥락이 아닌 불변 객체로 관리하는 것임
    나는 각 단계(spec, analysis, plan 등)를 .md 파일로 관리하고, 승인 단계를 둔 kanban 프로세스로 운영함
    이렇게 하면 UI 없이도 잘 돌아가고, 코드 품질이 유지되어 장기적으로 개발 속도가 10배 빨라짐
  • Codex의 핵심 기능이 병렬 에이전트 실행인 듯하지만, 나는 이미 Claude Code에서 9개월째 그렇게 쓰고 있음
    .claude/commands.claude/agents를 이용하면 여러 작업을 동시에 돌릴 수 있음
    Codex는 Claude가 놓치는 부분을 잘 잡아주고, 두 모델을 상호 보완적으로 쓰면 효율이 높음
    Codex는 저렴하고 무제한에 가까운 사용량이 장점이고, Claude는 품질이 더 높음
  • 나는 주로 Claude Code를 쓰지만, 가장 좋은 오케스트레이터는 Zencoder.ai의 Zenflow였음
    plan.md를 기반으로 프로세스를 구성하고, 동적으로 단계나 훅을 추가할 수 있음
    워크플로우 자동화를 문서 기반으로 제어할 수 있어서 편리함
    • 하지만 검색해보면 또 다른 “AI 크레딧 패키지 판매 앱”인 경우가 많음
      이미 주요 3개 모델에 돈을 내고 있어서 이런 서비스는 오래 못 갈 것 같음
    • 이미 500개 넘는 AI 통합 서비스가 존재함
  • 데모 게임 “Voxel Velocity”의 하단에 “Enter start”라고 되어 있지만, 실제로는 Enter가 선택만 바꿈
    7백만 토큰을 썼다는데 이런 QA 오류를 못 잡은 게 놀라움
    • 게임 자체는 인상적이지만, 세세한 부분에서 품질 관리가 부족함
      이런 미묘한 문제는 테스트 하네스나 QA 에이전트로 잡기 어려움
    • 6만, 80만, 700만 토큰 버전 간에 게임 기능 차이가 거의 없음
      토큰이 늘어도 완성도만 높아졌을 뿐, 플레이는 동일함. 그 추가 토큰이 뭘 한 건지 궁금함
  • Linux 사용자인데, Codex가 Mac 전용이라 아쉬움
    CLI 버전도 같은 기능을 지원할 계획이 있는지 궁금함
    • OpenAI의 Romain이 직접 답변함. Electron 기반이라 Windows와 Linux 지원도 곧 추가될 예정이라고 함
    • 현재는 Mac에서도 Intel 칩에서는 실행되지 않음
    • MacOS가 실험용으로는 적합함. 하드웨어 구성이 일정해서 엣지 케이스 버그가 적기 때문임
  • 전부 로컬에서만 돌아가는 게 아쉬움
    내부망에서만 동작하는 관리형 클러스터 기능이 있으면 좋겠음
    팀원과 작업 진행 상황 공유도 가능하게 하면 이상적임
    • 나는 ssh와 tmux로 비슷하게 쓰고 있음
      이런 기능을 도구 차원에서 지원하면 훨씬 편할 것 같음
  • OpenAI와 Codex는 초기 혁신을 이끌었지만, 이제는 Claude와 Gemini가 더 앞서 있음
    최근 GPT-5.x 품질도 떨어지고, 이번 발표에서도 Mac 전용 출시만 한 게 아쉬움
    기사에 오타도 많고, 실제 사용된 프롬프트를 공개하지 않은 점도 불만임
    그래도 개선되면 다시 써볼 의향은 있음
    • 영상에서 코드 생성 구간이 5배속 이상으로 빠르게 편집된 게 눈에 띔
      Sonnet이나 Gemini 3.0 Flash의 속도에 익숙해져서 그런 듯함
    • 나는 오히려 Codex가 Claude Code나 Gemini보다 복잡한 작업 처리에 더 안정적이라고 느낌
      20달러 ChatGPT가 200달러 Claude보다 효율적임
    • MacOS 우선 출시 정책은 OpenAI가 예전에도 그랬음