phoon 2025-04-14 | parent | ★ favorite | on: 구글이 모든 AI 분야에서 승리하고 있다(thealgorithmicbridge.com)

스펙으로는 gpt 4.5를 이기는 모델들이 없지 않지만... 단순 번역만 시켜봐도 둘의 문장구성 능력은 비슷하지조차 않습니다.(gpt압승)
이제는 벤치마크나 테스트셋을 어떻게 구성해야 할지 논의도 있어야 할 것 같아요.
LLM자체의 성능도 일반적 task에서 기대 이하라는 평도 심심치 않고 말이죠...