19P by xguru 2023-07-19 | favorite | 댓글 3개
  • 연구 및 상업용도 모두 사용가능한 오픈소스 대규모 언어모델
  • Llama 1 대비 40% 많은 2조개의 토큰 데이터로 훈련
  • 2배의 컨텍스트 길이: 4096
  • 세가지 크기의 모델: 7B, 13B, 70B
  • 추론, 코딩, 숙련도, 지식테스트등 많은 벤치마크에서 다른 오픈소스 언어 모델보다 훌륭한 성능(MPT, Falcon, Llama-1)
  • 공개된 데이터 소스로 훈련되었으며, 파인튜닝된 Llama-2-chat 역시 공개된 명령어셋 및 백만개가 넘는 사람의 주석을 활용
  • 다운로드에 포함된 것들
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

이번에도 누군가 "공익" 목적으로 토렌트 마그넷을 풀어버릴까요?

이번에는 그럴필요없이 바로 공개

분야별로 차이는 있지만 거의 GPT-3.5 에 근접하거나 더 뛰어난 평가가 나오고 있네요

완전 오픈인거 같지만 중요한 제약이 하나 있습니다. "MAU 7억을 넘는 서비스"라면 메타에 라이센스를 요청해야 하며, 메타가 거부할 수 있음.

"구글, 틱톡 니네는 쓰지마!" 인듯하네요.

Microsoft 는 발빠르게 Llama 2 를 Azure 에서 사용할 수 있게 공개했습니다.
https://blogs.microsoft.com/blog/2023/…

Microsoft는 OpenAI 도 그렇고, Meta 하고도 좋은 관게를 유지하고 있나 보네요