GN⁺ 2024-07-25 | parent | ★ favorite | on: Mistral Large 2 모델 공개 (mistral.ai)
Hacker News 의견
  • Mistral Large 2와 Llama 3.1 405b 모델을 테스트한 결과, 두 모델 간에 명확한 우열을 가리기 어려움
  • Claude를 사용 중이라면 계속 사용하는 것이 좋음
  • Claude에 대한 바람:
    • 더 똑똑해지길 바람
    • 더 긴 컨텍스트 윈도우 (1M+)
    • 네이티브 오디오 입력 및 톤 이해
    • 거절 시 도덕적 판단을 줄이길 바람
    • 더 빠르길 바람
    • 출력 토큰 수 증가
  • 모델 경쟁이 치열해지고 있음
  • Claude 3.5 Sonnet이 다른 모든 모델을 압도함
  • Mistral이나 Llama를 일상적으로 사용하는 방법을 잘 모르겠음
  • AI 코딩 어시스턴트를 개발 중이며, 여러 모델을 시도해본 결과 Mistral Large 2가 가장 실망스러웠음
  • 비상업적 라이선스가 실망스러움
  • Llama 3.1 405b와 경쟁할 만하지만 라이선스가 더 제한적임
  • 모델 간 차이가 줄어들고 있어 특정 사용 사례에 맞게 Llama 405B를 미세 조정하는 것이 더 나을 것임
  • 품질에서 큰 도약이 없는 한, 현재 상태에서 큰 차이는 없을 것임
  • 경쟁이 치열해져서 기쁨
  • 많은 비용을 들여 SOTA 모델을 만들고 있지만, GPT-4o와 Claude Opus 수준에 머물러 있음
  • 데이터와 GPU를 더 투입하는 것만으로는 한계에 도달하고 있음
  • 사용자 경험과 "개성"이 중요해질 것임
  • Claude Sonnet을 즐기고 있으며, 다른 모델보다 더 날카롭게 느껴짐
  • 각 단계마다 더 많은 에너지와 자원이 필요함을 잊지 말아야 함
  • PyLLMs의 최근 모델 벤치마크 결과를 공유함
    • Nemo의 속도와 품질에 놀람
    • Mistral Large는 좋지만 매우 느림
  • Claude 모델 중 Opus와 Sonnet 3.5 중 어느 것이 더 능력 있는지 혼란스러움
  • Mistral Large 2는 향상된 함수 호출 및 검색 기능을 갖추고 있음
  • 함수 호출 정확도가 약 50%라는 것은 복잡한 작업에서 절반은 실패한다는 의미인지 의문임
  • ChatGPT-4o를 선호하며, 문제가 있을 때 Claude를 사용하지만 더 나은 결과를 얻지 못함