13P by xguru 17일전 | favorite | 댓글 3개
  • 4/18일 Llama 3 모델 공개 이후 개발자 커뮤니티의 반응이 엄청났음
    • 모델이 120만회 이상 다운로드되었고, Hugging Face에서 개발자들이 600개 이상의 파생 모델을 공유했음
    • Llama 3 GitHub 레포지토리가 17,000개 이상의 별을 받았음
    • LMSYS Chatbot Arena 리더보드에서 Llama 3 70B Instruct 모델이 영어 전용 평가에서 1위를 차지했고, 전체적으로는 6위를 기록해 공개된 모델 중 가장 높은 순위를 차지했음 (폐쇄적인 독점 모델에 이어)

Llama 3의 초기 적용 사례

  • 실리콘, 하드웨어, 클라우드 제공업체 파트너들이 Llama 3를 사용자에게 배포하기 시작했음
  • 예일대학교 의과대학에서는 EPFL 컴퓨터 및 통신 과학 학교와 함께 Llama 3 출시 24시간 만에 Llama 3를 파인튜닝해 의학 분야 최초의 Llama 3 8B 모델인 Llama-3[8B]-MeditronV1.0을 소개했음
    • 이 새로운 모델은 MedQA, MedMCQA 등의 표준 벤치마크에서 동일한 파라미터 등급의 모든 최신 오픈 모델을 능가했음
    • 예일대학교와 EPFL이 Llama 2를 기반으로 Meditron의 첫 번째 버전을 구축한 방법에 대한 자세한 내용은 해당 링크에서 확인할 수 있음

Llama 3의 향후 계획

  • 향후 몇 달 동안 멀티모달, 다국어 대화, 더 긴 컨텍스트 창, 전반적인 기능 향상 등 새로운 기능을 갖춘 모델을 공개할 예정임
  • 곧 더 많은 내용을 공유하고 커뮤니티 주도의 혁신의 다음 물결을 볼 수 있기를 기대함

갈수록 국내 대기업 LLM들은 경쟁력을 잃어 가는군요. 폐쇄형이 전략이라면 성능에서 충분히 경쟁력을 갖추던가, 성능이 떨어져도 활용처 확대가 전략이라면 한글 중심을 내새우지 말던가 해야 하는데 정 반대로 하는 상황이니까요.

한국어 리더보드에서 의미없는 가중치 경쟁만 하고 그걸로 뉴스 띄워서 주가방어나 하고 있으니 ㅋㅋㅋ