지난 5년간 LLM 컨텍스트 윈도우의 크기 확장 타임라

AI 벤치 수치 말고 실제 사용 경험에서 코딩 성능이 Claude보다 나은 모델이 있나요?