token 같은 개념아닌가요?

GPT에서 이미지도 text token 처럼 계산 되듯이요

회사가 제공하는 다른 서비스를 보니 이해가 됩니다. Speech to text to Speech 방식인 것 같네요 그래서 중간 텍스트에 대한 과금을 하는거구요