# DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트

> Clean Markdown view of GeekNews topic #29835. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=29835](https://news.hada.io/topic?id=29835)
- GeekNews Markdown: [https://news.hada.io/topic/29835.md](https://news.hada.io/topic/29835.md)
- Type: GN+
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2026-05-25T07:53:25+09:00
- Updated: 2026-05-25T07:53:25+09:00
- Original source: [esengine.github.io](https://esengine.github.io/DeepSeek-Reasonix/)
- Points: 1
- Comments: 1

## Topic Body

- **DeepSeek API 전용**으로 설계된 오픈소스 터미널 코딩 에이전트로, `api.deepseek.com`과 직접 통신  
- **Append-only 루프**가 DeepSeek의 byte-stable prefix cache에 최적화되어, 긴 세션에서 **90% 이상 캐시 히트율** 유지 및 입력 토큰 비용 약 1/5 수준으로 절감 (동종 도구 대비 약 1/3 비용 수준)  
- 글로벌 설치 필요 없이 `npx reasonix code` 한 줄로 실행 (Node ≥ 22, macOS/Linux/Windows 지원)  
- **3대 핵심 설계**  
  - **Cache-First Loop**: append-only 구조, 마커 의존 없음, 결정론적 호출 순서로 prefix 캐시 유지  
  - **R1 Thought Harvest**: 빠져나간 tool call의 추론 체인 수집  
  - **Tool-Call Repair**: schema-aware self-heal 방식 복구  
- **터미널 우선(Terminal-first)** 원칙으로 IDE 플러그인 미지원, `git diff`·`ls` 등 터미널 도구를 그대로 활용  
  - **TypeScript + Ink TUI** 기반, Tauri 데스크톱 클라이언트도 별도 제공 (Node 런타임 번들)  
- **V4 Two-tier 모델 운용**: 기본 V4-Flash로 저비용 반복, `/pro`로 단일 턴 V4-Pro 승격, `/preset max`로 세션 전체 Pro 실행  
- **MCP(Model Context Protocol) 1급 지원**: `--mcp "name=cmd args"` 한 줄로 외부 서버 연결, stdio·SSE·Streamable HTTP 전송 방식 지원  
- **Sandbox + `/plan` 게이트**: 모든 내장 도구는 실행 디렉터리에 샌드박스, `/plan` 모드는 read-only audit gate로 승인 전 쓰기 차단  
  - SEARCH/REPLACE 편집은 pending 큐로 대기, `/apply` 전까지 디스크 미반영  
- **Composable Skills**: `.reasonix/skills/&lt;name&gt;.md`에 Markdown 파일 배치, frontmatter `runAs: subagent`·`allowed-tools`로 격리 실행  
- **Replay & Events**: 모든 이벤트가 디스크에 기록되어 `reasonix replay / events / stats` 명령으로 과거 세션 재생·통계·감사 가능  
- **Plain text 기반 확장성**: `/mcp`·`/skills`·`/memory`·`/config`·`/slash` 디렉터리로 모든 설정을 git 추적 가능한 평문으로 관리  
- **자체 호스팅 DeepSeek 엔드포인트 지원**: 0.30부터 비표준 키 prefix 허용, `baseUrl`만 내부 주소로 지정하면 루프·캐시·tool 프로토콜 동일 동작  
- DeepSeek API 가격: **V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)**  
- MIT 라이선스

## Comments


### Comment 58167

- Author: neo
- Created: 2026-05-25T07:53:26+09:00
- Points: 1

###### [Hacker News 의견들](https://news.ycombinator.com/item?id=48256953) 
- DeepSeek 캐시를 활용하는 데 꼭 **DeepSeek 전용 코딩 에이전트**가 필요한지는 잘 모르겠음  
  어제 Codex 할당량 문제가 아직 해결되지 않아서, DeepSeek V4 Pro를 Codex에서 쓰려고 아주 작은 브리지를 만들었는데, 내가 한 작업의 거의 대부분이 캐시된 것처럼 보였음: [https://i.imgur.com/7eKn6wN.png](<https://i.imgur.com/7eKn6wN.png>)  
  2026-05-23 기준 입력 캐시 적중 39,123,200 토큰, 캐시 미적중 1,692,286 토큰이었고, 브리지는 특별한 일을 하지 않고 DeepSeek API 형태를 Codex가 기대하는 형태로 맞춰줄 뿐이라 캐싱 관련 특수 처리는 전혀 없음  
  캐싱이 더 좋아진다는 점 외에는, DeepSeek API로 OpenCode를 직접 띄우는 것과 비교해 어떤 이점이 있는지 잘 모르겠음. 그것도 분명 비슷하게 캐싱이 되고, 중요하다면 api.deepseek.com과 직접 통신하며, 훨씬 성숙한 실행 환경을 얻게 됨
  - 이 페이지를 링크하는 편이 더 나아 보임: [https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...](<https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1--cache-first-loop>)  
    왜 더 나은 해법이라고 보는지, 왜 그렇게 **강한 설계 철학**을 갖는지 설명하고 있음  
    “자동 접두사 캐싱은 이전 요청의 정확한 바이트 접두사가 일치할 때만 활성화된다. 대부분의 에이전트 루프는 매 턴 순서를 바꾸거나 다시 쓰거나 새 타임스탬프를 주입한다 — 실제 캐시 적중률은 20% 미만”  
    그래서 이 부분과 다른 기법들을 최적화해 캐시 적중률을 높이고 비용을 낮추는 구조임
  - Opencode는 **캐시 안정성** 문제가 꽤 심한데, 지금은 고칠 의지가 별로 없어 보임
  - 나도 딱 같은 생각이었고, 내가 쓰는 코딩 에이전트의 DeepSeek 제공자 코드를 보니 작성자가 적은 내용은 거의 다 구현돼 있었음  
    궁금한 사람을 위해: [http://github.com/tontinton/maki](<http://github.com/tontinton/maki>)
  - “DeepSeek V4 Pro를 Codex에서 쓰려고 작은 브리지를 만들었다”면 그 **브리지**를 공유해 줄 수 있는지 궁금함  
    DeepSeek v4는 claude-code나 opencode와 같이 쓰면 훌륭함. 내 경우 claude code가 opencode보다 비용이 덜 들었는데, 아마 더 잘 설계된 실행 환경 때문이라고 봄
  - 이건 터미널에 네이티브로 붙는 것처럼 보임. 즉, TUI 안에서 에이전트를 실행하거나 감싸는 별도 앱이 없는 구조 같음  
    결국 명령어 대신 **일반 영어 문장**을 입력하는 방식인가 봄

- 이 웹사이트는 Codex가 만든 것처럼 보임. 팀을 위해 기능 개요 HTML을 만들어 달라고 Codex에 시켰더니, 과하게 꾸며진 괴물이 나왔는데, 의미 있는 정보는 거의 없는 큰 통계 박스, 같은 글꼴·색상·레이아웃·히어로 섹션까지 딱 비슷했음  
  이 사이트처럼 모바일에서도 끔찍했음. 결국 Claude에게 한 페이지짜리 HTML 파일을 만들게 했고, 의도를 명확히 설명하는 데 95% 정도는 바로 쓸 수 있었으며 약간만 수정하면 됐음
  - 요즘 **LLM 기반 디자인**이 많이 이렇게 보임. 강하게 기울어진 세리프 글꼴 조합을 사람들이 왜 못생겼다고 느끼지 않는지 모르겠음  
    모바일에서는 코드 예제가 계속 콘텐츠를 밀어내서 페이지 대부분을 읽기도 어려움. 물론 너무 가혹한 평일 수 있고 의도는 좋았겠지만, 더 단순한 웹사이트면 충분했을 듯함
  - “Claude가 한 페이지짜리 HTML 파일을 만들었고 95% 정도는 바로 쓸 수 있었다”는 말만으로는 어떤 모델에 대해서도 많은 걸 말해주지 않음  
    애초에 소프트웨어 엔지니어라면 누구나 알듯이, **기능을 빼면** 어떤 프로젝트든 급격히 단순해질 수 있음

- 작성자가 이해해 줬으면 하는 건, 어떤 사람들은 컴퓨터 메모리 절반을 먹지 않는 **단일 자체 포함 바이너리**를 원하고, 그래서 Rust나 Go로 쓰고 싶어 한다는 점임
  - Rust, Go, Zig로 새 소프트웨어가 많이 나오는 건 정말 반가움  
    느린 인터프리터 언어가 제공하던 가치와 개발 편의성은 점점 사라지고 있음. 새 언어들은 좋은 것들을 기본으로 갖추고 있거나, 더 정확히는 새벽 1시 호출 알람이 우리를 화나게 만들기 시작한 듯함
  - AI를 쓴다는 점과 온갖 주장들이 있다고 해도, 예를 들어 **순수 Go**로 코딩 에이전트를 못 쓸 이유가 뭔지 설명해 줄 수 있는지 궁금함  
    Go에는 좋은 터미널 라이브러리가 이미 많음
  - 컴퓨터 메모리 절반 이상을 먹는 단일 자체 포함 바이너리를 시험해 보고 싶다면 **ds4-agent**도 있음
  - 특히 코딩 에이전트 시대에 그런 걸 원한다면, 그냥 직접 만들면 되지 않나 싶음
  - 코딩 봇을 만들면서 정작 코딩을 아끼는 건 뭔가를 말해주는 듯함

- 그 페이지는 마음에 들지 않음. **타이핑 애니메이션** 때문에 예제 영역 크기가 계속 바뀌고, 아래 콘텐츠가 위아래로 밀려남  
  정말 나쁜 사용자 경험임
  - 에이전트가 있든 없든, 사람들은 여전히 웹사이트를 여러 해상도나 최소한 창 너비별로 테스트해야 함  
    그런데 이게 점점 잃어버린 기술이 되어가는 것 같음
  - Claude가 만든 디자인 AI 찌꺼기 같음

- 1년 동안 실행 환경을 만들어 온 입장에서 보면, opencode 쪽 사람들이 멍청해서 **접두사 캐시**를 깨는 게 아님  
  보통 일부러 그렇게 하는 건 테스트해 봤을 때 전체 결과가 더 좋기 때문임  
  dsv4가 다른 모델들의 평균적인 동작과 충분히 다르다고 생각한다면, 근거와 함께 특정 예외 처리를 추가하는 패치를 원하는 실행 환경에 PR로 보내면 됨. “캐시 때문에 항상 append-only로 가야 한다”고 맹목적으로 가정하는 건 모두의 시간을 낭비하는 일임

- 이건 DeepSeek가 만든 에이전트가 아니므로 **제목이 오해를 부름**

- 이제 DeepSeek의 브랜드가 충분히 강해져서, 사람들이 그 **브랜드 인지도**에 올라타고 싶어 하는 단계가 됐음

- 꽤 재미있음. 나는 월 200달러짜리 Claude 구독자이고, 그동안 다른 걸 쓸 필요가 거의 없었음  
  그런데 Claude가 내 작업 흐름을 점점 제한할수록, 특히 최근 IDE/-p 사용 변경 이후로, 다른 곳으로 가고 싶어짐  
  최첨단 추론은 정말 원해서 걱정되지만, DeepSeek에는 여전히 관심이 감
  - 최첨단 추론을 원한다면 다른 모델도 한번 써보고 **최상위 모델**과 얼마나 다른지 직접 확인해 보는 게 좋음  
    나는 그렇게 해보고 Qwen-2.5-Max만으로도 충분하다는 걸 깨달았음. 내가 다루는 장난감 작업들에는 Claude Sonnet 3.5도 충분할 거라고 봄. 수학 필즈상을 노리는 게 아니니까
  - 오늘 꽤 복잡한 **역공학 작업**을 DS-4 xhigh와 GPT-5.5 xhigh에 줬음  
    약 6시간 뒤 둘 다 완전한 역공학에는 실패했지만 차이는 컸음  
    DS는 30분마다 멈추면서 완전한 역공학을 끝냈고 이제 다 동작할 거라고 말했지만, 실제로는 1%도 끝내지 못했음. 특정 지름길을 쓰지 말라고 강하게 지시했는데도 계속 지름길을 찾았고, 완전한 실패였음  
    반면 GPT-5.5는 정말 놀라웠음. 해야 할 일을 제대로 했고, 초기 계층을 끝내고 필요한 걸 완전히 이해했다고 확신하기 전에는 다음 단계로 넘어가지 않았음. 6시간 동안 내가 프롬프트를 넣은 건 올바른 방향으로 가는 걸 보고 조금 더 나은 방식으로 살짝 유도했을 때뿐이었음. 싸우고 있다는 느낌이 없었음  
    물론 압축 이후 가끔 “역공학을 도와줄 수 없다”는 식으로 튀긴 했지만, 새 세션에서는 깔끔하게 해결됐음  
    Claude 구독은 한 달 전에 취소해서 비교하진 못했지만, DeepSeek는 Opus 4.6/4.7과 작업하던 느낌을 많이 떠올리게 했음. 어떤 사람에게는 긍정 신호일 수도 있겠지만, GPT-5.5를 보니 Claude/DS식 작업 방식은 너무 성가시다는 게 드러남
  - 월 200달러 플랜은 꼭 유지하고, 오픈 가중치 모델과 더 높은 한도가 있는 10달러 코딩 플랜은 시도하지 않는 편이 좋겠음  
    Anthropic이 살아남으려면 당신 돈이 필요하고, 본인이 최첨단을 쓰고 있다는 생각에 더 잘 잘 수 있을 테니까
  - Anthropic 모델을 완전히 버리기보다는, 계획 수립 같은 일부 작업에는 쓰고 구현은 DeepSeek 같은 것에 넘기는 선택지도 있음  
    도구가 달라도 **Markdown 계획서**는 꽤 잘 통함. 5x Max 구독에서 Pro로 낮추게 되면 나는 그렇게 할 생각임  
    Claude Code에서 서드파티 제공자를 쉽게 쓰게 해주는 런처도 만들고 있음: [https://ccode.kronis.dev](<https://ccode.kronis.dev>)  
    로컬 프록시는 이미 동작하고 있고, 아직 동적 모델 전환만 없음. 추가하기 어렵지는 않을 것 같고, 일정에 따라 1~2주 안에는 들어갈 듯함  
    Anthropic을 완전히 떠나는 건 현명하지 않다고 봄. 모델이 훌륭하고, 구독하면 내가 좋아하는 Remote Control 같은 기능도 얻을 수 있기 때문임. 다만 티어를 바꿔서 돈을 조금 아끼는 건 가능해 보임. 반대로 품질 기준선은 필요함. 예전에 Cerebras에서 GLM 4.6을 썼을 때는 허술한 결과가 좀 많았음
  - 최첨단 추론을 원한다면 **GPT 5.5 Pro**를 써야 함

- **캐시 적중 효율**에 집중한 점이 마음에 듦. 사용자 비용 효율을 극대화하는 훌륭한 제품을 만든 DeepSeek 팀에 박수를 보냄
  - 한동안 써봤는데 전적으로 동의함. 내가 같이 쓰는 Codex나 Claude만큼 좋다고 봄  
    비용에 민감한 구간에서는 승자이고, 어떤 스타트업이 데이터 보존을 염두에 두고 잘 묶어낸다면 기업용으로 팔 수 있는 훌륭한 제품이 될 수 있음. 코딩 어시스턴트 용도에서 핵심 이슈는 **데이터 보존과 개인정보 보호**이기 때문임
  - 혹시 모르니, 이 프로젝트는 누군가의 사이드 프로젝트임  
    “독립 오픈소스 프로젝트 · DeepSeek와 무관”
  - 이미 저렴한 API 비용까지 더하면, 아마 같은 작업을 며칠 동안 돌려도 될 것 같음
  - 캐시 적중 효율이라는 게 어떻게 가능한지 모르겠음. 이전 문맥을 바꾸지 않는 문제 아닌가?  
    여기서 조정할 수 있는 **손잡이**가 뭐가 있는지 이해가 안 됨

- 써봤는데 텍스트 입력 영역이 검은 배경에 어두운 글꼴이었음  
  문서를 확인하고 DeepSeek v4, Claude, Gemini에게 글꼴/스타일 도움을 요청했지만, **어두운 테마 터미널**에서 실행하는 것 말고는 아무것도 통하지 않았음. 미친 일임. 이 프로젝트 개발자들은 아무도 밝은 테마를 안 쓰나?
  - 문제라는 데는 동의하지만, 아마 실제로 안 쓸 것 같음  
    **밝은 테마**는 아주 드물게 쓰임