6P by spilist2 2시간전 | ★ favorite | 댓글 2개

계기

  • Claude Opus 4.7 출시 노트에서 '토큰 사용량 증대' 부분이 가장 눈에 띄었음.
  • 충분한 토큰과 시간이 있다면 할 수 있는 게 너무 많아진 시대가 되면서, 토큰 효율도 계속 이슈가 되고 있음
  • "클로드 코드와 코덱스에서 설정값을 바꿈으로써 토큰 효율을 끌어올리는 방법이 있을까?" 라는 의문이 생겼고 클로드 코드 공식문서(설정/환경변수/IDE), 코덱스 공식문서(설정/환경변수/MCP), 코덱스 소스코드 등을 분석해보니 유의미한 결과를 얻음
  • 평소에 쓰는 인터랙티브 모드 뿐 아니라, 프로그래머블하게 논-인터랙티브 모드에서 토큰 효율/부팅 속도/안정성 등을 끌어올리는 방법도 많이 알게 됨

내 상태 분석용 프롬프트

거두절미하고 내 코딩 에이전트 설정이 어떤지 점검하고 싶은 분들을 위한 프롬프트:

https://gist.github.com/spilist/c468cbf1ed0ffc91100f813aabdcd520/… 를 읽고 그대로 실행해줘  

무엇이 실제로 토큰을 먹는가

코딩 에이전트에서 토큰이 새는 경로는 대체로 세 가지

  1. 매 세션 또는 매 턴 자동으로 붙은 추가 텍스트
  2. 대화 히스토리에 남은 너무 긴 툴 호출 출력
  3. 검색, 커넥터, IDE 연동처럼 외부 연결로 인한 추가 호출

클로드 코드와 코덱스에서 위 3개를 줄일 수 있는 레버들을 소개. (안 쓰는 MCP 서버/플러그인 끄기, 모델 및 리즈닝 정도 조절 등 기본적인 건 생략)

  • 각 설정에 대한 설명, 트레이드오프는 무엇인지 등은 블로그에 자세히 적어둠

Claude Code (최종 확인 버전: 2.1.114)

  1. includeGitInstructions: false

  2. autoConnectIde: false

  3. CLAUDE_CODE_GLOB_NO_IGNORE=false

  4. 출력 상한 설정하기 (BASH_MAX_OUTPUT_LENGTH, CLAUDE_CODE_FILE_READ_MAX_OUTPUT_TOKENS, MAX_MCP_OUTPUT_TOKENS)

  5. 짧고 간단한 작업, 또는 비대화형 모드를 위한 환경변수와 플래그들

    • ENABLE_CLAUDEAI_MCP_SERVERS=false: MCP 서버 끄기
    • CLAUDE_CODE_DISABLE_AUTO_MEMORY=1: 자동 저장된 메모리가 로드되지 않게 하기
    • CLAUDE_CODE_DISABLE_CLAUDE_MDS=1: 글로벌/프로젝트 CLAUDE.md 를 무시
    • CLAUDE_AGENT_SDK_DISABLE_BUILTIN_AGENTS=1: 빌트인 서브에이전트 및 스킬 정의를 시스템 프롬프트에서 제외
    • --tools: 네이티브 툴을 선택적으로 활성화. --tools "" 면 전부 비활성화. 정말 모델의 지능만 쓰는 워커에서는 다 꺼도 괜찮고, 대화형으로 간단한 작업 시킬 때는 다 끄면 아예 일을 못하니 "Bash,Edit,Glob,Grep,Read,Write" 처럼 필요한 것만 켜면 됨
    • --strict-mcp-config: CLI로 명시한 MCP 설정만 쓰고 전역 MCP 설정은 무시. 워커마다 필요한 커넥터만 깔끔하게 주입할 수 있음.
    • --disable-slash-commands: /help, /clear 같은 슬래시 커맨드 정의가 시스템 프롬프트에서 빠짐
    • --no-session-persistence: 세션 저장/재개 경로를 쓰지 않아서 일회성 실행의 흔적이 사라짐
    • --exclude-dynamic-system-prompt-sections: 머신/환경마다 바뀌는 섹션을 빼 프롬프트 캐시 재사용률을 끌어올임
    • --system-prompt: 다 떠나서 클로드 시스템 프롬프트를 아예 교체해버릴 수도 있음
  6. attribution 비우기

Codex CLI (최종 확인 버전: 0.121.0 + 해당 버전 Codex Github 소스코드)

  1. ChatGPT에 연결된 MCP(앱/커넥터) 끄기 (features.apps = false)
  2. web_search = "disabled"
  3. 출력 상한 설정하기 (tool_output_token_limit)
  4. 비대화형 모드에서 잘 돌게 만드는 플래그들
    • --profile: 특정 설정(web_search = "disabled", tool_output_token_limit = 2000 등)을 묶어두고 선택 적용 가능
    • --json + --output-last-message FILE : 파이프라인에서 파싱/추출이 쉬워져 후처리 단계 토큰 재소비를 줄임
    • --sandbox read-only: 읽기만 필요한 자동화에서 의도치 않은 쓰기 시도 → 재시도 루프 → 토큰 낭비를 차단
    • --skip-git-repo-check: 신뢰하는 디렉토리가 아니어도 실행 가능
    • --ephemeral: 세션 파일을 디스크에 저장 안 함
    • --color never: 파이프 출력이 깔끔해짐
  5. attribution 비우기

맺으며

꼼꼼히 사실 확인을 했지만 당연히 틀린 부분이 있을 수 있습니다. 편하게 제보해주시면 감사하겠습니다.

좋은 정보 공유 감사드립니다. 근본적으로 토큰 사용량 자체가 너무 적어진걸 체감하고있어서 클로드에서 늘려줬으면 좋겠네요 하네스가 돌다가 중간에끊기니...

감사합니다. 클로드 토큰 소모도 크고 일도 코덱스 대비 좀 불만족스러워서 저는 요즘 코덱스로 더 일을 많이 하고 있어요.