회사가 제공하는 다른 서비스를 보니 이해가 됩니다. Speech to text to Speech 방식인 것 같네요 그래서 중간 텍스트에 대한 과금을 하는거구요