▲phoon 2025-04-14 | parent | ★ favorite | on: 구글이 모든 AI 분야에서 승리하고 있다(thealgorithmicbridge.com)스펙으로는 gpt 4.5를 이기는 모델들이 없지 않지만... 단순 번역만 시켜봐도 둘의 문장구성 능력은 비슷하지조차 않습니다.(gpt압승) 이제는 벤치마크나 테스트셋을 어떻게 구성해야 할지 논의도 있어야 할 것 같아요. LLM자체의 성능도 일반적 task에서 기대 이하라는 평도 심심치 않고 말이죠...
스펙으로는 gpt 4.5를 이기는 모델들이 없지 않지만... 단순 번역만 시켜봐도 둘의 문장구성 능력은 비슷하지조차 않습니다.(gpt압승)
이제는 벤치마크나 테스트셋을 어떻게 구성해야 할지 논의도 있어야 할 것 같아요.
LLM자체의 성능도 일반적 task에서 기대 이하라는 평도 심심치 않고 말이죠...