[GN#216] LLM 연구의 공개 과제들

2023-08-21 ~ 2023-08-27 사이의 주요 뉴스들

대규모 언어 모델(LLM) 에 대한 관심이 폭발적으로 증가하면서 다양한 부분에서 연구가 이뤄지고 있습니다. 실시간 머신러닝 플랫폼 Claypot의 공동 창업자인 Chip Huyen이 "LLM 연구의 공개 과제들" 이라는 제목으로 요즘 LLM 분야에서 주로 얘기되는 10개의 도전 과제를 정리했습니다. 환각(Hallucination) 감소 및 측정, 컨텍스트 길이 및 컨텍스트 구성 최적화, 멀티모달리티, 더 빠르고 저렴한 LLM 만들기, Transformer를 능가하는 새로운 모델 아키텍처, GPU의 대안 개발, 에이전트, Human Preference, 채팅 인터페이스, 비영어권 언어용 LLM 구축 등을 제시하고 있는데요. 간단한 설명과 함께 원문에는 더 깊이 공부하기 위한 자료 링크들도 제공하고 있으니 참고하시기 바랍니다.

StableDiffusion, Whisper, LlaMA 같은 오픈소스 AI 모델을 가지고 개인이나 스타트업들도 다양한 AI 기반 도구와 서비스를 만들고 있는데요. 사이드 프로젝트라면 로컬에서도 가능하겠지만, 프로덕션을 위해서는 GPU 클라우드가 필요합니다. "Cloud GPU 가이드 - AI에 어떤 GPU를 어디서 써야 할까?" 글은 사용하는 AI 모델에 따라 써야하는 GPU 종류를 로컬 및 클라우드에서 성능 및 가성비에 맞게 제시하고, AWS/Azure 같은 메이저 클라우드 외의 업체들 중에 어떤 곳을 써야 하는지등을 정리한 자료입니다. 글 원본은 7월에 공개되었는데 8월에도 최신 내용에 맞게 업데이트되었고, 아마도 계속 업데이트할 것으로 예상됩니다.

Show GN - 직접 만드신 오픈소스나, 재직중인 스타트업의 제품/서비스를 소개해주세요

Ask GN - 다양한 질문을 올려주세요.

✓ 사내 커뮤니케이션 도구에 GeekNews Bot을 추가해서 멤버들과 함께 새 글을 받아보세요
ㅤ→ Slack봇, 잔디봇, Teams봇, Discord봇, 구글 챗 봇, Swit 봇
긱뉴스는 RSS로도 구독 가능합니다
✓ 주위분들께 긱뉴스 위클리 - https://news.hada.io/weekly 뉴스레터를 추천해 주세요.


매주 월요일 아침, 지난 일주일간의 GeekNews 중 엄선한 뉴스들을 이메일로 보내드립니다.