13P by xguru 4달전 | favorite | 댓글 2개
  • 2024년 8월에 EXAONE 3.0을 선보였고, LG 내부용으로만 사용하다가 오픈 모델로 전환
  • 다양한 목적에 맞게 구성된 라인업 중 7.8B Instruction Tuned 모델을 연구용으로 오픈소스 공개
  • 국내외 AI 연구자들의 의미 있는 연구와 AI 생태계 발전에 기여하기를 기대함
  • Decoder-only Transformer Architecture 기반, 파라미터 수 7.8B, 학습 데이터 양 8T

영어 Global Top 수준 달성: Real-world Use Cases 평균 점수 1위, 단일 Benchmark에서도 우수한 성능

  • 7.8B 모델의 영어 성능은 다른 모델 대비 Global Top 수준
  • 4개 벤치마크 평가 결과 글로벌 Top 모델보다 우수한 성능 확인
  • Math, Coding에서 평균 점수 1위, Reasoning도 높은 성능

단연 월등한 한국어 성능: Real-world use cases와 단일 Benchmark 모두 평균 점수 1위

  • 영어/한국어 Bi-lingual 모델로 한국어에서도 뛰어난 성능
  • Real-world use cases 측면 성능 확인을 위해 2개 Benchmark 사용
  • 단일 Benchmark는 KMMLU 등 영어 평가 Benchmark와 부합하도록 구성
  • Real-world use cases와 단일 Benchmark 모두 평균 점수 1위 결과 확인

경제성 확보: 3년간의 연구개발로 비용 6% 수준으로 절감

  • AI 활용을 위해 성능 개선 외에 경제성 강화 필수
  • 3년간 AI 모델 경량화 기술 연구개발과 비용 효율화에 집중
  • 7.8B 모델은 EXAONE 2.0 대비 추론 처리 시간 56% 감소, 비용 72% 절감
  • EXAONE 1.0 대비 비용을 6% 수준으로 크게 감축한 성과

윤리적 투명성: 우수 결과 외 보완 필요한 영역도 공개

  • LG AI연구원은 AI 모델 연구개발 과정에서 AI 윤리 반드시 고려
  • EXAONE 3.0 7.8B 모델도 Red Teaming 과정을 거쳐 윤리성과 보안성 평가
  • 내부 및 외부 제3자 데이터셋 사용해 평가에 활용
  • 성적 차별이나 불법 답변 방지에는 우수하나 보완 필요 부분 존재
  • AI 윤리 발전을 위해 평가 결과를 투명하게 공개
  • 연구자들의 활발한 AI 윤리 연구 기대, LG AI연구원도 지속 연구 예정

문제는 라이선스가 NC죠. gguf 뽑아내는것도 라이선스 위반이고...

국내 뉴스도 이곳에 공유할 일이 많아지면 좋겠습니다 ;)