OpenAI, macOS용 Codex 앱 공개

▲

GN⁺ 3달전 | parent | ★ favorite | on: OpenAI, macOS용 Codex 앱 공개(openai.com)

Hacker News 의견들

수십억 달러를 가진 AI 기업들이 왜 여전히 네이티브 앱을 못 만드는지 이해가 안 됨
대부분 단순한 채팅 UI 수준인데, Electron으로는 OS API(예: Win32)를 직접 호출하기 어려워서 깊은 통합이 불가능함
Blender, Godot, Unity, UE5 같은 복잡한 소프트웨어도 다 네이티브로 돌아가는데, 이런 기업들이 변명만 하는 게 답답함
- 데스크톱 개발 환경이 엉망임. Microsoft가 너무 많은 반쪽짜리 프레임워크를 내놔서 뭘 써야 할지 모르는 상황임
  Windows에서는 Electron이 사실상 표준이고, Microsoft조차 자주 사용함
  MacOS는 훨씬 낫지만, 팀이 결국 Mac 전용으로 잠기거나 Electron으로 크로스 플랫폼을 선택하게 됨
- 요즘 비디오 게임 UI도 HTML/JS 기반을 많이 씀
  UE5의 UI도 네이티브 느낌이 거의 없고, Electron보다 낫다고 하기도 어려움
  Electron에서도 네이티브 API 호출은 가능함
  대부분의 사용자는 앱이 네이티브인지 아닌지 신경 안 쓰고, 웹 개발자를 데스크톱 앱 개발로 재활용할 수 있다는 점이 기업 입장에선 큰 장점임
- 오히려 반대로 생각함. 모든 걸 텍스트 인터페이스로 만들면 모델이 도구를 자연스럽게 학습할 수 있음
  TUI나 GUI는 불필요한 추상화층이라 자동화를 어렵게 함
  핵심은 단순한 명령 호출과 로그 기록임. [headless 모드나 세션 로그]가 그 방향에 가까움
- AI로 만든 결과가 결국 입력창 하나 있는 Electron 앱이라는 게 현실임
- 네이티브 앱이 제공할 수 있는 기능이 뭐가 그렇게 중요한지 모르겠음
  대부분의 사람은 앱이 웹 기술로 만들어졌는지 신경 안 씀
  Electron 덕분에 Linux 포팅도 쉬워짐. 네이티브만 고집하면 이런 건 불가능했을 것임
최근 두 달간 Codex를 많이 써봤는데 꽤 인상적이었음
완벽하진 않지만, 중간급 엔지니어 수준의 결과를 꾸준히 냄
다만 앱이 “Loading projects…”에서 멈춰버림
문서 링크도 깨져 있었는데, 이 링크는 지금은 작동함
여러 VM 환경을 VS Code Remote로 쓰고 있어서, 포트 오프셋 설정을 좀 바꿔야 할 듯함
- ChatGPT($20/월)와 Claude($200/년)를 같이 쓰는데, Codex는 아직 사용 제한에 걸린 적이 없음
  Codex는 문제 해결 중 루프에 빠지는 경우가 많고, Claude가 그런 걸 잘 마무리해줌
  두 모델을 번갈아 쓰는 방식이 꽤 효율적임
- 링크 문제를 알려줘서 고맙다는 답변을 받았음. 로딩 속도도 개선 중이라고 함
- Codex는 백엔드나 논리적 작업에는 강하지만, 단순한 프론트엔드 UI 작업은 자주 실수함
  그래도 꾸준히 개선되고 있어서 기대 중임
- 나는 Cursor를 계속 쓸 예정임. OpenAI는 새 앱을 내기보다 기존 앱의 버그 수정에 집중해야 함
Codex는 Claude Cowork류의 경쟁 제품처럼 보임
Cowork는 Claude Code를 VM에서 호출하고, Codex는 CLI를 OS 샌드박스에서 실행함
기술 스택은 Electron 40, React 19, TypeScript, Node.js, SQLite, Vite 등으로 구성됨
macOS용으로는 Sparkle, Squirrel, Sentry 등을 사용함
- 이름과 diff/worktree 중심 설계를 보면 개발자 지향성이 강함
- 부트캠프 수준의 스택이라 좀 실망스러움
- Sentry 통합이 네이티브인지 MCP를 통한 것인지 궁금함
- git과 터미널 뷰가 있어서 CLI 사용자에게는 큰 장점임. skills 기능도 기대됨
Codex를 써봤는데 너무 느리고 멍청해서 화가 날 정도였음
지시를 따르지 않고, 중간에 멈추거나 엉뚱한 코드를 던져줌
Nuxt 4+ 관련 최신 데이터가 없어 계속 오류를 냄
Undo 기능도 제대로 작동하지 않고, 피드백이 없음
Claude Code는 같은 작업을 한 번에 처리했는데 Codex는 오래 걸리고 엉망이었음
이걸 보니 예전 Nokia N800을 썼을 때처럼, 가능성은 있는데 완성도가 너무 낮아서 OpenAI의 방향성이 걱정됨
OpenAI의 Codex는 사실상 Emdash, Conductor 같은 제품을 공식화한 버전임
Anthropic도 비슷한 Claude Code 멀티 에이전트 앱을 낼지 궁금함
- 이미 Claude Code Desktop이 있음
- 멀티 에이전트 접근이 과대평가된 것 같음
  명확한 계약(API 정의 등)이 있다면 독립적인 세션으로 병렬 작업하는 게 더 효율적임
- GUI로 Claude Code를 쓸 때, 전체 Claude Code harness를 쓰는 건지 단순히 모델만 쓰는 건지 궁금함
- Emdash는 처음 들어봤는데, 이런 툴이 너무 많아서 홍보가 어렵고 시장이 시끄러움
  직접 비슷한 걸 만들 뻔했음
- Claude Code 웹 버전이 연구 미리보기로 공개되어 있음
에이전트 기능은 별로 흥미롭지 않음
Recursive Language Models 논문의 핵심은 요구사항과 설계, 계획 등을 맥락이 아닌 불변 객체로 관리하는 것임
나는 각 단계(spec, analysis, plan 등)를 .md 파일로 관리하고, 승인 단계를 둔 kanban 프로세스로 운영함
이렇게 하면 UI 없이도 잘 돌아가고, 코드 품질이 유지되어 장기적으로 개발 속도가 10배 빨라짐
Codex의 핵심 기능이 병렬 에이전트 실행인 듯하지만, 나는 이미 Claude Code에서 9개월째 그렇게 쓰고 있음
.claude/commands와 .claude/agents를 이용하면 여러 작업을 동시에 돌릴 수 있음
Codex는 Claude가 놓치는 부분을 잘 잡아주고, 두 모델을 상호 보완적으로 쓰면 효율이 높음
Codex는 저렴하고 무제한에 가까운 사용량이 장점이고, Claude는 품질이 더 높음
나는 주로 Claude Code를 쓰지만, 가장 좋은 오케스트레이터는 Zencoder.ai의 Zenflow였음
plan.md를 기반으로 프로세스를 구성하고, 동적으로 단계나 훅을 추가할 수 있음
워크플로우 자동화를 문서 기반으로 제어할 수 있어서 편리함
- 하지만 검색해보면 또 다른 “AI 크레딧 패키지 판매 앱”인 경우가 많음
  이미 주요 3개 모델에 돈을 내고 있어서 이런 서비스는 오래 못 갈 것 같음
- 이미 500개 넘는 AI 통합 서비스가 존재함
데모 게임 “Voxel Velocity”의 하단에 “Enter start”라고 되어 있지만, 실제로는 Enter가 선택만 바꿈
7백만 토큰을 썼다는데 이런 QA 오류를 못 잡은 게 놀라움
- 게임 자체는 인상적이지만, 세세한 부분에서 품질 관리가 부족함
  이런 미묘한 문제는 테스트 하네스나 QA 에이전트로 잡기 어려움
- 6만, 80만, 700만 토큰 버전 간에 게임 기능 차이가 거의 없음
  토큰이 늘어도 완성도만 높아졌을 뿐, 플레이는 동일함. 그 추가 토큰이 뭘 한 건지 궁금함
Linux 사용자인데, Codex가 Mac 전용이라 아쉬움
CLI 버전도 같은 기능을 지원할 계획이 있는지 궁금함
- OpenAI의 Romain이 직접 답변함. Electron 기반이라 Windows와 Linux 지원도 곧 추가될 예정이라고 함
- 현재는 Mac에서도 Intel 칩에서는 실행되지 않음
- MacOS가 실험용으로는 적합함. 하드웨어 구성이 일정해서 엣지 케이스 버그가 적기 때문임
전부 로컬에서만 돌아가는 게 아쉬움
내부망에서만 동작하는 관리형 클러스터 기능이 있으면 좋겠음
팀원과 작업 진행 상황 공유도 가능하게 하면 이상적임
- 나는 ssh와 tmux로 비슷하게 쓰고 있음
  이런 기능을 도구 차원에서 지원하면 훨씬 편할 것 같음
OpenAI와 Codex는 초기 혁신을 이끌었지만, 이제는 Claude와 Gemini가 더 앞서 있음
최근 GPT-5.x 품질도 떨어지고, 이번 발표에서도 Mac 전용 출시만 한 게 아쉬움
기사에 오타도 많고, 실제 사용된 프롬프트를 공개하지 않은 점도 불만임
그래도 개선되면 다시 써볼 의향은 있음
- 영상에서 코드 생성 구간이 5배속 이상으로 빠르게 편집된 게 눈에 띔
  Sonnet이나 Gemini 3.0 Flash의 속도에 익숙해져서 그런 듯함
- 나는 오히려 Codex가 Claude Code나 Gemini보다 복잡한 작업 처리에 더 안정적이라고 느낌
  20달러 ChatGPT가 200달러 Claude보다 효율적임
- MacOS 우선 출시 정책은 OpenAI가 예전에도 그랬음