추가적으로, 요청 후 response 내에서 해당 request 에 쓰인 토큰 양을 볼 수 있습니다 !

모델: claude-sonnet-4-6
요청 크기: 68.9 KB

"usage": {
"input_tokens": 3,
"cache_creation_input_tokens": 12394,
"cache_read_input_tokens": 6499,
"cache_creation": {
"ephemeral_5m_input_tokens": 0,
"ephemeral_1h_input_tokens": 12394
},
"output_tokens": 74,
"service_tier": "standard",
"inference_geo": "not_available"
}

또 이를 모델별 가격을 적용하여 request 당 cost 도 계산 해 두었으니 많은 이용 부탁드려요 ㅎㅎ

캐시읽기: 6.5K tok × $0.3/MTok = $0.0019
캐시쓰기: 12.4K tok × $3.75/MTok = $0.0465
미캐시 입력: 3 tok × $3/MTok = $0.0000
출력: 74 tok × $15/MTok = $0.0011

합계: $0.0495
캐시 적중률: 34%