반대로 추론이 오히려 남는 장사라는 분석이 있던데...

실제 문제는 훈련 루프에 RL을 위한 추론 컴퓨팅까지 추가돼서 복잡성이 증가된게 문제라고 합니다.