▲GN⁺ 2024-07-25 | parent | ★ favorite | on: Mistral Large 2 모델 공개 (mistral.ai)Hacker News 의견 Mistral Large 2와 Llama 3.1 405b 모델을 테스트한 결과, 두 모델 간에 명확한 우열을 가리기 어려움 Claude를 사용 중이라면 계속 사용하는 것이 좋음 Claude에 대한 바람: 더 똑똑해지길 바람 더 긴 컨텍스트 윈도우 (1M+) 네이티브 오디오 입력 및 톤 이해 거절 시 도덕적 판단을 줄이길 바람 더 빠르길 바람 출력 토큰 수 증가 모델 경쟁이 치열해지고 있음 Claude 3.5 Sonnet이 다른 모든 모델을 압도함 Mistral이나 Llama를 일상적으로 사용하는 방법을 잘 모르겠음 AI 코딩 어시스턴트를 개발 중이며, 여러 모델을 시도해본 결과 Mistral Large 2가 가장 실망스러웠음 비상업적 라이선스가 실망스러움 Llama 3.1 405b와 경쟁할 만하지만 라이선스가 더 제한적임 모델 간 차이가 줄어들고 있어 특정 사용 사례에 맞게 Llama 405B를 미세 조정하는 것이 더 나을 것임 품질에서 큰 도약이 없는 한, 현재 상태에서 큰 차이는 없을 것임 경쟁이 치열해져서 기쁨 많은 비용을 들여 SOTA 모델을 만들고 있지만, GPT-4o와 Claude Opus 수준에 머물러 있음 데이터와 GPU를 더 투입하는 것만으로는 한계에 도달하고 있음 사용자 경험과 "개성"이 중요해질 것임 Claude Sonnet을 즐기고 있으며, 다른 모델보다 더 날카롭게 느껴짐 각 단계마다 더 많은 에너지와 자원이 필요함을 잊지 말아야 함 PyLLMs의 최근 모델 벤치마크 결과를 공유함 Nemo의 속도와 품질에 놀람 Mistral Large는 좋지만 매우 느림 Claude 모델 중 Opus와 Sonnet 3.5 중 어느 것이 더 능력 있는지 혼란스러움 Mistral Large 2는 향상된 함수 호출 및 검색 기능을 갖추고 있음 함수 호출 정확도가 약 50%라는 것은 복잡한 작업에서 절반은 실패한다는 의미인지 의문임 ChatGPT-4o를 선호하며, 문제가 있을 때 Claude를 사용하지만 더 나은 결과를 얻지 못함
Hacker News 의견