스탠드얼론 정적 바이너리로 도구를 배포해야 하는 이유

단순 추론용으로 쓰는 cpu 런타임이면 형편은 좀 나은데, 요즘 요구되는 LLM 서비스 때문에 트래픽도 트래픽대로, 용량도 용량대로 늘어나니 비용 계산할때 욕나옵니다 ㅋㅋㅋ