# Tokuin - LLM 토큰 사용량 및 API 비용 추정용 Rust CLI 도구

> Clean Markdown view of GeekNews topic #26045. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=26045](https://news.hada.io/topic?id=26045)
- GeekNews Markdown: [https://news.hada.io/topic/26045.md](https://news.hada.io/topic/26045.md)
- Type: news
- Author: [xguru](https://news.hada.io/@xguru)
- Published: 2026-01-23T09:44:24+09:00
- Updated: 2026-01-23T09:44:24+09:00
- Original source: [github.com/nooscraft](https://github.com/nooscraft/tokuin)
- Points: 5
- Comments: 0

## Summary

**Tokuin**은 여러 LLM 제공자의 **토큰 사용량과 API 비용을 정밀 추정**하는 Rust 기반 CLI 도구입니다. 단일 프롬프트부터 JSON 채팅 포맷까지 처리하며, 모델별 토큰 단가를 반영해 비용을 자동 계산합니다. `load-test` 모드에서는 실제 호출 없이 **동시성·지연시간·비용을 한 번에 시뮬레이션**할 수 있어, LLM 워크플로우의 성능·비용 최적화를 자동화 파이프라인에 통합하기에 적합합니다.

## Topic Body

- OpenAI, Claude, Gemini, OpenRouter 등 여러 LLM 제공자/모델에 대해 **토큰 수·API 비용**을 빠르게 정밀 추정하는 크로스플랫폼 CLI 툴  
- 모델별 토큰 계산 지원 및 모델별 토큰 단가를 기반으로 **API 호출 비용 자동 산출**  
- 단일 프롬프트뿐 아니라 **JSON chat 형식, 역할별(system/user/assistant) 토큰 브레이크다운, 여러 모델 간 토큰·비용 비교, Markdown minify, diff 모드, watch 모드** 등 실전 워크플로우에 맞는 기능을 제공  
- `load-test` 기능을 켜면 OpenAI·Anthropic·OpenRouter·커스텀 엔드포인트에 대해 **동시성·지연시간·에러율·토큰·비용을 한 번에 측정하는 부하 테스트 러너**로 동작  
  - **dry-run 모드**로 실제 호출 없이 비용 예측 가능   
- **다양한 입력/출력 형식 지원**   
  - 입력: 일반 텍스트 및 JSON 채팅 포맷 모두 처리 가능하며 **파일 입력**, **표준 입력**, **프롬프트 비교(diff)** 기능 제공  
  - 출력: text/json/csv/Prometheus/markdown 등 다양한 출력 포맷을 지원함   
- 커스텀 가격파일(TOML)을 통해 **모델별 가격 변동에 대응하면서 비용 추정 정확도**를 유지할 수 있음  
- 토크나이저·모델 정의·파서·출력·HTTP/프로바이더·시뮬레이터가 모듈화된 구조라 **새 모델·새 프로바이더 추가나 CI/자동화 파이프라인 통합**에 적합한 설계

## Comments


_No public comments on this page._