6P by GN⁺ 5시간전 | ★ favorite | 댓글 4개
  • Codex 앱이 대규모 업데이트되어, 이제 소프트웨어 개발 전 과정을 하나의 워크스페이스에서 수행 가능
  • 컴퓨터를 직접 조작하며 일상 업무 도구와 앱을 함께 사용하고, 이미지 생성, 과거 행동 학습, 반복 작업 수행를 추가해 개발 워크플로우를 자동화하고 확장함
  • 데스크톱 앱에 PR 리뷰, 다중 파일/터미널 보기, SSH 원격 devbox 연결, 인앱 브라우저가 포함되어 프론트엔드 디자인과 앱/게임 반복 작업이 빨라짐
  • 90개 이상의 플러그인gpt-image-1.5 모델이 통합되어, 코드 작성부터 디자인·테스트·협업까지 연결된 환경을 제공함
  • 기존 대화 스레드 재사용과 장기 작업 자동 스케줄링, 메모리 프리뷰를 통해 수일~수주에 걸친 작업 지속성 확보

Codex 주요 업데이트

  • Codex 앱이 macOS와 Windows용으로 대규모 업데이트되어, 300만 명 이상의 주간 개발자 사용자에게 소프트웨어 개발 전 과정을 지원하는 도구로 확장됨
  • 새 버전은 컴퓨터 제어, 이미지 생성, 메모리, 플러그인, 인앱 브라우저 기능을 추가해 개발자 워크플로우를 가속화함
  • PR 리뷰, 다중 파일 및 터미널 보기, SSH를 통한 원격 devbox 연결 등 개발 중심 기능이 강화됨
  • 모든 개선 사항은 코드 작성, 출력 확인, 변경 검토, 협업을 하나의 워크스페이스에서 수행하도록 통합됨
  • 컴퓨터 제어 및 병렬 작업

    • 배경 컴퓨터 제어 기능을 통해 사용자의 컴퓨터에서 직접 클릭, 입력, 탐색을 수행할 수 있음
      • 자체 커서를 사용해 앱을 조작하며, API가 없는 앱에서도 테스트나 반복 작업 가능
      • 여러 에이전트가 동시에 Mac에서 병렬로 작업할 수 있으며, 사용자의 다른 앱 작업과 간섭하지 않음
    • 프론트엔드 변경 반복, 앱 테스트, 비API 환경 작업에 유용함
  • 웹 및 브라우저 통합

    -웹과 네이티브하게 연동되어, 인앱 브라우저를 통해 웹페이지 위에서 직접 주석을 달아 Codex에게 구체적인 지시 전달 가능
    • 현재는 프론트엔드 및 게임 개발에 유용하며, 추후 localhost 웹 앱을 넘어 브라우저를 완전히 제어하는 방향으로 확장 예정
  • 이미지 생성 및 시각 워크플로우

    • gpt-image-1.5 모델을 사용해 이미지 생성 및 반복 작업 수행
    • 스크린샷과 코드와 결합해 제품 콘셉트, 프론트엔드 디자인, 목업, 게임 비주얼을 같은 워크플로우 내에서 제작 가능
  • 플러그인 확장

    • 90개 이상의 새로운 플러그인이 추가되어 다양한 앱과 MCP 서버 통합 지원
    • 주요 플러그인: Atlassian Rovo(JIRA 관리), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
    • 플러그인은 Codex가 더 많은 맥락 수집 및 자동 작업 수행을 가능하게 함
  • 개발자 워크플로우 강화

    • GitHub 리뷰 코멘트 처리, 다중 터미널 탭 실행, SSH를 통한 원격 devbox 연결(알파 단계) 지원
    • 사이드바에서 파일을 직접 열고 PDF, 스프레드시트, 슬라이드, 문서의 리치 프리뷰 제공
    • 에이전트 계획, 소스, 산출물을 추적하는 새 요약 패널(summary pane) 제공
    • 코드 작성, 출력 확인, 변경 리뷰, 에이전트 협업을 하나의 워크스페이스에서 이동할 수 있어 개발 수명주기 단계 간 전환 속도 향상
  • 자동화 및 장기 작업

    • 자동화 기능이 확장되어 기존 대화 스레드를 재사용하고, 축적된 컨텍스트를 유지함
    • Codex가 스스로 향후 작업을 스케줄링하고 자동으로 재개해 수일~수주에 걸친 장기 작업 지속 가능
    • 팀 활용 사례: 오픈된 PR 머지, 작업 후속 조치, Slack·Gmail·Notion 등 도구 전반의 빠른 대화 추적
  • 메모리 및 개인화

    • 메모리 프리뷰(preview of memory) 기능으로 Codex가 과거의 유용한 컨텍스트(개인 선호, 수정, 수집된 정보 등)를 기억함
      • 이전에는 광범위한 커스텀 인스트럭션으로만 가능했던 수준의 품질과 속도를 향후 작업에서 구현
    • Codex가 중단 지점 이어가기를 선제적으로 제안, 프로젝트·연결된 플러그인·메모리 컨텍스트를 활용해 작업 제안 및 우선순위 목록 자동 생성
    • 예: Google Docs의 확인 필요 코멘트 식별 → Slack·Notion·코드베이스에서 관련 컨텍스트 수집 → 우선순위가 매겨진 액션 리스트 제공
  • 배포 계획 및 제공 범위

    • ChatGPT 계정으로 로그인한 Codex 데스크톱 앱 사용자에게 순차 배포 중
    • 개인화 기능(컨텍스트 인식 제안, 메모리) 은 Enterprise, Edu, EU, UK 사용자에게 곧 제공 예정
    • 컴퓨터 제어 기능은 macOS에서 우선 제공되며, EU 및 UK 지역으로 확대 예정

Codex의 진화와 목표

  • 출시 1년 만에 Codex는 코드 작성뿐 아니라 시스템 이해, 맥락 수집, 리뷰, 디버깅, 협업, 장기 작업 관리로 사용 범위 확대
  • OpenAI는 AGI가 인류 전체에 이익이 되도록 하는 것을 목표로 하며, 이번 업데이트는 사람이 상상하는 것과 실제로 구축할 수 있는 것의 간극을 좁히는 방향으로 설계됨
  • Codex는 앞으로도 소프트웨어 제작 과정의 도구, 워크플로우, 의사결정과 더욱 밀접하게 통합될 예정임

웹 디자인 요청하면 항상 카드 스타일로 구현하는 건 언제 고치지. 이거만 고쳐주면 클로드 아예 안쓸 것 같은데

VSCode 로만 연결해서 사용했는데 앱으로 해봐야겠네요

전 코덱스가 요즘 메인이라, 굉장히 반가운 업데이트네요.

openai-oauth - ChatGPT 계정으로 OpenAI API를 무료로 사용하기

이거 이용하면 이제 이미지 생성도 가능해 지겠어요

Hacker News 의견들
  • 댓글들을 읽어보면 많은 사람들이 Claude DesktopCowork가 이미 이런 기능들을 제공한다는 걸 모르는 듯함
    Codex는 혁신이라기보다 단지 따라잡고 있는 느낌임

    • Codex가 요즘 HN에서 인기를 끄는 이유는 Anthropic이 개인 사용자에 대한 rate limit을 낮췄기 때문임
      OpenAI는 엔터프라이즈 고객이 적어서 개인 사용자에게 더 많은 컴퓨팅 자원을 보조할 수 있음
      결국 사용자 수가 늘면 Anthropic처럼 될 것임. 지금은 단지 PR 전략일 뿐임
    • Codex는 Claude Cowork보다 더 많은 기능을 가지고 있음. 예를 들어 백그라운드에서 컴퓨터를 직접 조작하는 기능 등임
    • Claude에는 아직 이런 기능이 없음
      Codex는 백그라운드에서 앱을 클릭하고 타이핑하며 여러 에이전트가 동시에 작업할 수 있음
    • 두 제품이 점점 수렴하는 느낌임. 최근 Claude Mac 앱의 UI가 Codex와 거의 동일하게 바뀜
    • 사실 지금은 어느 쪽도 진정한 혁신을 하고 있지 않음
      내가 쓴 블로그 글에서도 말했듯, AI가 더 능동적으로 일해야 함
      예를 들어 Slack 요약, 회의록 통합, 미팅 준비 노트 자동 생성 같은 건 이미 가능한데 아무도 안 하고 있음
      결국 중요한 건 주의력 관리이고, AI는 우리가 어디에 집중해야 할지를 도와야 함
  • 요즘 UI를 보면 코드를 숨기려는 경향이 강함
    프롬프트가 진짜 소스이고, 코드는 귀찮은 중간 산출물처럼 다뤄짐

    • 나는 오히려 반대로 접근함. 코드 구조를 머릿속에 두고 AI와 페어 프로그래밍하듯 대화함
      이렇게 하면 속도도 빨라지고 결과물도 내가 직접 쓴 코드처럼 나옴
    • Codex 앱이 아직 Linux에서 안 되는 걸 보면, 대상 사용자는 코드를 잘 모르는 사람들 같음
    • 사실 이런 도구들은 비개발자에게 더 큰 이익을 줌
      우리는 이미 자동화할 줄 알지만, 대부분의 사람들은 그렇지 않음
    • 진짜 개발자 감성을 원한다면 vim에서 git diff로 비교하며 작업하면 됨
    • 예전에 어셈블리만 진짜 코드라고 믿던 시절이 있었음
      지금은 고급 언어가 이상하게 느껴지지만, 결국 추상화의 층위가 늘어나는 과정임
      프롬프트 엔지니어링도 결국 또 다른 인공 언어 체계임
  • 회의적 시선이 많지만, 나는 이게 대중적으로 확산될 것이라 생각함
    25년간 CLI를 써왔지만 요즘은 Codex로 터미널 작업을 대신함
    GUI 버전이 잘 만들어지면 일반 사용자도 금방 익숙해질 것임

    • 나도 Linux 사용자로서 OS를 자연어로 제어하는 게 정말 즐거움
      예전엔 몇 시간 걸리던 설정이 이제 몇 초면 끝남
    • 앞으로 3~5년 내에 코드 품질의 개념이 바뀌고, IDE 사용률이 급감할 것 같음
    • 이런 접근이야말로 진짜 컴퓨터 사용
      GUI가 필요한 앱을 제외하면 대부분의 작업은 텍스트 기반 AI로 충분함
    • 특히 Docker-compose 오류 해결 같은 건 정말 마법 같음
    • 하지만 이런 접근은 더 느리고, 더 많은 컴퓨팅 자원을 쓰며, 데이터가 외부에 기록될 위험이 있음
  • Codex가 컴퓨터와 앱을 직접 제어하는 걸 정말 원하는지 의문임
    나는 여전히 샌드박스 보안을 중요하게 생각함

    • 프로그래머는 대체로 원하지 않지만, 일반인은 Star Trek식 음성 명령을 원함
    • Mac에서 버튼 클릭 정도는 무섭지 않음. 오히려 자동 승인된 프로그램을 돌려두는 게 더 위험함
    • 나는 오히려 AI가 대신 클릭해주길 원함. 반복 작업이 너무 지루함
    • 어떤 사람들은 OpenClaw 같은 걸 직접 돌리기도 함. 나는 최소한 Docker로 격리함
    • 실제로 내 Mac의 권한 문제를 Codex가 자동으로 고쳐준 적도 있음
  • OpenAI는 경쟁사 발표 시점에 맞춰 비공개 릴리스를 준비해두는 것 같음

    • (OpenAI 직원) 실제로는 그렇게 계산된 건 아님. 내부에서 개발 후 일정에 맞춰 외부 공개함
      언론과 인플루언서 일정은 미리 조율함
    • 그래도 최근 릴리스 타이밍을 보면 우연이라 보기 어렵다는 의견도 있음
    • 회사가 하이프 중심으로 운영된다는 말도 있음
    • 결국 미디어 주도권 싸움이라는 데 동의함
    • 그들은 이미 TBPN 인수로 미디어 감각을 입증했음
  • 두 번째 영상의 프롬프트가 “폰트와 태그라인 길이를 줄여줘”였음
    이제 LLM을 폰트 크기 조정에 쓰는 건가 싶음
    세 번째 영상에서는 “히어로 섹션 이미지를 생성해줘”라는데,
    제품 설명에 AI 생성 이미지를 쓰는 건 너무 가짜 같음

  • 솔직히 이걸 어디에 써야 할지 모르겠음
    코딩 보조로는 유용하지만, 내 컴퓨터를 직접 조작하게 하고 싶진 않음
    Slack 요약 정도면 모르겠지만, 지금은 문제 없는 문제를 해결하려는 솔루션처럼 보임

  • 나는 Cowork/Codex 같은 전문 에이전트가 비개발자용으로 가장 빠르게 성장할 제품군이 될 거라 봄
    이런 에이전트는 인간 대신 소프트웨어를 다루게 될 것임
    관련 글에서도 정리했지만,
    결국 소프트웨어 시장 구조 자체가 바뀔 것

    • 하지만 이런 에이전트가 성공하려면 전체 접근 권한이 필요함
      그만큼 보안 위협도 커짐
    • 나는 기계공학 출신 CEO인데, Claude Code로 소셜 캠페인 전체를 자동화
      이메일과 회의록을 읽고, 작업을 계획하고 실행한 뒤 요약까지 보내줌
      대부분의 지식 작업이 결국 코드 형태로 표현되기 때문에 가능한 일임
    • 대부분의 지식 근로자는 이런 도구를 배우려 하지 않음
    • LLM이 최고의 UI/UX임. 별도 인터페이스를 설계할 필요가 없음
      데이터 연결만 잘 하면 B2B SaaS 시장이 열릴 것임
    • 나도 Codex를 비코딩 업무에 많이 쓰지만, 프로그래머적 사고방식이 있어야 잘 작동함
  • Codex가 여전히 민감한 파일을 사용자 동의 없이 읽는지 궁금함
    관련 이슈는 GitHub에 있음

    • 이번 업데이트로 컴퓨터 제어 기능이 추가된 만큼, 권한 모델이 더 중요해짐
    • 파일 검색, 브라우저 접근 등 경계가 불명확해 어떤 권한이 열리는지 알기 어려움
    • Reddit 사례처럼 Claude가 사용자의 보안을 비판한 일도 있었음
      민감한 데이터가 없는 별도 머신에서 실행하는 게 안전함
    • 나도 어제 직접 겪었음. 아직은 그런 문제 있음
  • Codex 이름이 혼란스러움
    하나는 에이전트형 프로그래밍 도구, 다른 하나는 Mac/Windows용 GUI 앱인데 이름이 같음

    • 그래도 Microsoft의 작명보다는 조금 낫다고 생각함