GPT-3 같은 대규모 언어 모델의 API사용에 관한 정리
(unzip.dev)- (Hosted) Large Language Models
- LLM은 어떻게 동작하는가
- 왜 필요한가 : 어려운 문제 해결, 빠르고 쉬운 사용, 자원이 없는 회사들
- 반대하는 이유는 : 비용, 모든 것을 해결하진 못함, 민감한 데이터, 과도할 수 있음, 나쁜 결과로 이어질수도
- 툴과 플레이어들 : GPT-3 Playground, AI21 Studio, Hugging face, EleutherAI
- 전망
- 개발자들에게 새로운 가능성을 열어줌
- 실세계 데이터에 적용
- 파인 튜닝을 통해 정확도 향상
- 비디오 & 오디오에 적용(DALL-E 2 같이)
- 새로운 역할을 생성할 수도
- 최적화 (LLM을 생성하는데 필요한 비용 및 계산능력을 줄임)
- 예제, 사용하는 회사들 및 그외
이 https://unzip.dev/ 는 저도 최근에 구독한 뉴스레터 인데요.
특정 기술 주제에 대해서 이해하기 쉽게 잘 정리해서 공유하고 있으니 살펴보세요.
구독하는 이메일 주소 입력창이 아주 독특하니까 꼭 구독을 한번 해보시는 것을 추천드립니다.