거의 모든 것을 위한 Codex
(openai.com)- Codex 앱이 대규모 업데이트되어, 이제 소프트웨어 개발 전 과정을 하나의 워크스페이스에서 수행 가능
- 컴퓨터를 직접 조작하며 일상 업무 도구와 앱을 함께 사용하고, 이미지 생성, 과거 행동 학습, 반복 작업 수행를 추가해 개발 워크플로우를 자동화하고 확장함
- 데스크톱 앱에 PR 리뷰, 다중 파일/터미널 보기, SSH 원격 devbox 연결, 인앱 브라우저가 포함되어 프론트엔드 디자인과 앱/게임 반복 작업이 빨라짐
- 90개 이상의 플러그인과 gpt-image-1.5 모델이 통합되어, 코드 작성부터 디자인·테스트·협업까지 연결된 환경을 제공함
- 기존 대화 스레드 재사용과 장기 작업 자동 스케줄링, 메모리 프리뷰를 통해 수일~수주에 걸친 작업 지속성 확보
Codex 주요 업데이트
- Codex 앱이 macOS와 Windows용으로 대규모 업데이트되어, 300만 명 이상의 주간 개발자 사용자에게 소프트웨어 개발 전 과정을 지원하는 도구로 확장됨
- 새 버전은 컴퓨터 제어, 이미지 생성, 메모리, 플러그인, 인앱 브라우저 기능을 추가해 개발자 워크플로우를 가속화함
- PR 리뷰, 다중 파일 및 터미널 보기, SSH를 통한 원격 devbox 연결 등 개발 중심 기능이 강화됨
- 모든 개선 사항은 코드 작성, 출력 확인, 변경 검토, 협업을 하나의 워크스페이스에서 수행하도록 통합됨
-
컴퓨터 제어 및 병렬 작업
- 배경 컴퓨터 제어 기능을 통해 사용자의 컴퓨터에서 직접 클릭, 입력, 탐색을 수행할 수 있음
- 자체 커서를 사용해 앱을 조작하며, API가 없는 앱에서도 테스트나 반복 작업 가능
- 여러 에이전트가 동시에 Mac에서 병렬로 작업할 수 있으며, 사용자의 다른 앱 작업과 간섭하지 않음
- 프론트엔드 변경 반복, 앱 테스트, 비API 환경 작업에 유용함
- 배경 컴퓨터 제어 기능을 통해 사용자의 컴퓨터에서 직접 클릭, 입력, 탐색을 수행할 수 있음
-
웹 및 브라우저 통합
-웹과 네이티브하게 연동되어, 인앱 브라우저를 통해 웹페이지 위에서 직접 주석을 달아 Codex에게 구체적인 지시 전달 가능- 현재는 프론트엔드 및 게임 개발에 유용하며, 추후 localhost 웹 앱을 넘어 브라우저를 완전히 제어하는 방향으로 확장 예정
-
이미지 생성 및 시각 워크플로우
- gpt-image-1.5 모델을 사용해 이미지 생성 및 반복 작업 수행
- 스크린샷과 코드와 결합해 제품 콘셉트, 프론트엔드 디자인, 목업, 게임 비주얼을 같은 워크플로우 내에서 제작 가능
-
플러그인 확장
- 90개 이상의 새로운 플러그인이 추가되어 다양한 앱과 MCP 서버 통합 지원
- 주요 플러그인: Atlassian Rovo(JIRA 관리), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
- 플러그인은 Codex가 더 많은 맥락 수집 및 자동 작업 수행을 가능하게 함
-
개발자 워크플로우 강화
- GitHub 리뷰 코멘트 처리, 다중 터미널 탭 실행, SSH를 통한 원격 devbox 연결(알파 단계) 지원
- 사이드바에서 파일을 직접 열고 PDF, 스프레드시트, 슬라이드, 문서의 리치 프리뷰 제공
- 에이전트 계획, 소스, 산출물을 추적하는 새 요약 패널(summary pane) 제공
- 코드 작성, 출력 확인, 변경 리뷰, 에이전트 협업을 하나의 워크스페이스에서 이동할 수 있어 개발 수명주기 단계 간 전환 속도 향상
-
자동화 및 장기 작업
- 자동화 기능이 확장되어 기존 대화 스레드를 재사용하고, 축적된 컨텍스트를 유지함
- Codex가 스스로 향후 작업을 스케줄링하고 자동으로 재개해 수일~수주에 걸친 장기 작업 지속 가능
- 팀 활용 사례: 오픈된 PR 머지, 작업 후속 조치, Slack·Gmail·Notion 등 도구 전반의 빠른 대화 추적
-
메모리 및 개인화
- 메모리 프리뷰(preview of memory) 기능으로 Codex가 과거의 유용한 컨텍스트(개인 선호, 수정, 수집된 정보 등)를 기억함
- 이전에는 광범위한 커스텀 인스트럭션으로만 가능했던 수준의 품질과 속도를 향후 작업에서 구현
- Codex가 중단 지점 이어가기를 선제적으로 제안, 프로젝트·연결된 플러그인·메모리 컨텍스트를 활용해 작업 제안 및 우선순위 목록 자동 생성
- 예: Google Docs의 확인 필요 코멘트 식별 → Slack·Notion·코드베이스에서 관련 컨텍스트 수집 → 우선순위가 매겨진 액션 리스트 제공
- 메모리 프리뷰(preview of memory) 기능으로 Codex가 과거의 유용한 컨텍스트(개인 선호, 수정, 수집된 정보 등)를 기억함
-
배포 계획 및 제공 범위
- ChatGPT 계정으로 로그인한 Codex 데스크톱 앱 사용자에게 순차 배포 중
- 개인화 기능(컨텍스트 인식 제안, 메모리) 은 Enterprise, Edu, EU, UK 사용자에게 곧 제공 예정
- 컴퓨터 제어 기능은 macOS에서 우선 제공되며, EU 및 UK 지역으로 확대 예정
Codex의 진화와 목표
- 출시 1년 만에 Codex는 코드 작성뿐 아니라 시스템 이해, 맥락 수집, 리뷰, 디버깅, 협업, 장기 작업 관리로 사용 범위 확대
- OpenAI는 AGI가 인류 전체에 이익이 되도록 하는 것을 목표로 하며, 이번 업데이트는 사람이 상상하는 것과 실제로 구축할 수 있는 것의 간극을 좁히는 방향으로 설계됨
- Codex는 앞으로도 소프트웨어 제작 과정의 도구, 워크플로우, 의사결정과 더욱 밀접하게 통합될 예정임
전 코덱스가 요즘 메인이라, 굉장히 반가운 업데이트네요.
openai-oauth - ChatGPT 계정으로 OpenAI API를 무료로 사용하기
이거 이용하면 이제 이미지 생성도 가능해 지겠어요
Hacker News 의견들
-
댓글들을 읽어보면 많은 사람들이 Claude Desktop과 Cowork가 이미 이런 기능들을 제공한다는 걸 모르는 듯함
Codex는 혁신이라기보다 단지 따라잡고 있는 느낌임- Codex가 요즘 HN에서 인기를 끄는 이유는 Anthropic이 개인 사용자에 대한 rate limit을 낮췄기 때문임
OpenAI는 엔터프라이즈 고객이 적어서 개인 사용자에게 더 많은 컴퓨팅 자원을 보조할 수 있음
결국 사용자 수가 늘면 Anthropic처럼 될 것임. 지금은 단지 PR 전략일 뿐임 - Codex는 Claude Cowork보다 더 많은 기능을 가지고 있음. 예를 들어 백그라운드에서 컴퓨터를 직접 조작하는 기능 등임
- Claude에는 아직 이런 기능이 없음
Codex는 백그라운드에서 앱을 클릭하고 타이핑하며 여러 에이전트가 동시에 작업할 수 있음 - 두 제품이 점점 수렴하는 느낌임. 최근 Claude Mac 앱의 UI가 Codex와 거의 동일하게 바뀜
- 사실 지금은 어느 쪽도 진정한 혁신을 하고 있지 않음
내가 쓴 블로그 글에서도 말했듯, AI가 더 능동적으로 일해야 함
예를 들어 Slack 요약, 회의록 통합, 미팅 준비 노트 자동 생성 같은 건 이미 가능한데 아무도 안 하고 있음
결국 중요한 건 주의력 관리이고, AI는 우리가 어디에 집중해야 할지를 도와야 함
- Codex가 요즘 HN에서 인기를 끄는 이유는 Anthropic이 개인 사용자에 대한 rate limit을 낮췄기 때문임
-
요즘 UI를 보면 코드를 숨기려는 경향이 강함
프롬프트가 진짜 소스이고, 코드는 귀찮은 중간 산출물처럼 다뤄짐- 나는 오히려 반대로 접근함. 코드 구조를 머릿속에 두고 AI와 페어 프로그래밍하듯 대화함
이렇게 하면 속도도 빨라지고 결과물도 내가 직접 쓴 코드처럼 나옴 - Codex 앱이 아직 Linux에서 안 되는 걸 보면, 대상 사용자는 코드를 잘 모르는 사람들 같음
- 사실 이런 도구들은 비개발자에게 더 큰 이익을 줌
우리는 이미 자동화할 줄 알지만, 대부분의 사람들은 그렇지 않음 - 진짜 개발자 감성을 원한다면 vim에서 git diff로 비교하며 작업하면 됨
- 예전에 어셈블리만 진짜 코드라고 믿던 시절이 있었음
지금은 고급 언어가 이상하게 느껴지지만, 결국 추상화의 층위가 늘어나는 과정임
프롬프트 엔지니어링도 결국 또 다른 인공 언어 체계임
- 나는 오히려 반대로 접근함. 코드 구조를 머릿속에 두고 AI와 페어 프로그래밍하듯 대화함
-
회의적 시선이 많지만, 나는 이게 대중적으로 확산될 것이라 생각함
25년간 CLI를 써왔지만 요즘은 Codex로 터미널 작업을 대신함
GUI 버전이 잘 만들어지면 일반 사용자도 금방 익숙해질 것임- 나도 Linux 사용자로서 OS를 자연어로 제어하는 게 정말 즐거움
예전엔 몇 시간 걸리던 설정이 이제 몇 초면 끝남 - 앞으로 3~5년 내에 코드 품질의 개념이 바뀌고, IDE 사용률이 급감할 것 같음
- 이런 접근이야말로 진짜 컴퓨터 사용임
GUI가 필요한 앱을 제외하면 대부분의 작업은 텍스트 기반 AI로 충분함 - 특히 Docker-compose 오류 해결 같은 건 정말 마법 같음
- 하지만 이런 접근은 더 느리고, 더 많은 컴퓨팅 자원을 쓰며, 데이터가 외부에 기록될 위험이 있음
- 나도 Linux 사용자로서 OS를 자연어로 제어하는 게 정말 즐거움
-
Codex가 컴퓨터와 앱을 직접 제어하는 걸 정말 원하는지 의문임
나는 여전히 샌드박스 보안을 중요하게 생각함- 프로그래머는 대체로 원하지 않지만, 일반인은 Star Trek식 음성 명령을 원함
- Mac에서 버튼 클릭 정도는 무섭지 않음. 오히려 자동 승인된 프로그램을 돌려두는 게 더 위험함
- 나는 오히려 AI가 대신 클릭해주길 원함. 반복 작업이 너무 지루함
- 어떤 사람들은 OpenClaw 같은 걸 직접 돌리기도 함. 나는 최소한 Docker로 격리함
- 실제로 내 Mac의 권한 문제를 Codex가 자동으로 고쳐준 적도 있음
-
OpenAI는 경쟁사 발표 시점에 맞춰 비공개 릴리스를 준비해두는 것 같음
- (OpenAI 직원) 실제로는 그렇게 계산된 건 아님. 내부에서 개발 후 일정에 맞춰 외부 공개함
언론과 인플루언서 일정은 미리 조율함 - 그래도 최근 릴리스 타이밍을 보면 우연이라 보기 어렵다는 의견도 있음
- 회사가 하이프 중심으로 운영된다는 말도 있음
- 결국 미디어 주도권 싸움이라는 데 동의함
- 그들은 이미 TBPN 인수로 미디어 감각을 입증했음
- (OpenAI 직원) 실제로는 그렇게 계산된 건 아님. 내부에서 개발 후 일정에 맞춰 외부 공개함
-
두 번째 영상의 프롬프트가 “폰트와 태그라인 길이를 줄여줘”였음
이제 LLM을 폰트 크기 조정에 쓰는 건가 싶음
세 번째 영상에서는 “히어로 섹션 이미지를 생성해줘”라는데,
제품 설명에 AI 생성 이미지를 쓰는 건 너무 가짜 같음 -
솔직히 이걸 어디에 써야 할지 모르겠음
코딩 보조로는 유용하지만, 내 컴퓨터를 직접 조작하게 하고 싶진 않음
Slack 요약 정도면 모르겠지만, 지금은 문제 없는 문제를 해결하려는 솔루션처럼 보임 -
나는 Cowork/Codex 같은 전문 에이전트가 비개발자용으로 가장 빠르게 성장할 제품군이 될 거라 봄
이런 에이전트는 인간 대신 소프트웨어를 다루게 될 것임
관련 글에서도 정리했지만,
결국 소프트웨어 시장 구조 자체가 바뀔 것임- 하지만 이런 에이전트가 성공하려면 전체 접근 권한이 필요함
그만큼 보안 위협도 커짐 - 나는 기계공학 출신 CEO인데, Claude Code로 소셜 캠페인 전체를 자동화함
이메일과 회의록을 읽고, 작업을 계획하고 실행한 뒤 요약까지 보내줌
대부분의 지식 작업이 결국 코드 형태로 표현되기 때문에 가능한 일임 - 대부분의 지식 근로자는 이런 도구를 배우려 하지 않음
- LLM이 최고의 UI/UX임. 별도 인터페이스를 설계할 필요가 없음
데이터 연결만 잘 하면 B2B SaaS 시장이 열릴 것임 - 나도 Codex를 비코딩 업무에 많이 쓰지만, 프로그래머적 사고방식이 있어야 잘 작동함
- 하지만 이런 에이전트가 성공하려면 전체 접근 권한이 필요함
-
Codex가 여전히 민감한 파일을 사용자 동의 없이 읽는지 궁금함
관련 이슈는 GitHub에 있음- 이번 업데이트로 컴퓨터 제어 기능이 추가된 만큼, 권한 모델이 더 중요해짐
- 파일 검색, 브라우저 접근 등 경계가 불명확해 어떤 권한이 열리는지 알기 어려움
- Reddit 사례처럼 Claude가 사용자의 보안을 비판한 일도 있었음
민감한 데이터가 없는 별도 머신에서 실행하는 게 안전함 - 나도 어제 직접 겪었음. 아직은 그런 문제 있음
-
Codex 이름이 혼란스러움
하나는 에이전트형 프로그래밍 도구, 다른 하나는 Mac/Windows용 GUI 앱인데 이름이 같음- 그래도 Microsoft의 작명보다는 조금 낫다고 생각함