DeepSpeed Chat - RLHF를 이용한 ChatGPT-like 모델 훈련용 프레임워크

xguru · 2023-04-17T10:26:01+09:00

빠르고 저렴하며 확장 가능한 개방형 시스템 프레임워크 End-to-End RLHF(Reinforcement Learning Human Feedback)를 통해 모든 규모의 고품질 ChatGPT 스타일 모델을 생성 가능 1클릭으로 48GB 메모리가 장착된 NVIDIA A6000 GPU 한대로 1.3B 파라미터 ChatGPT 모델을 1.36시간내에 훈련, 생성 및 서빙 가능 Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT 등이 이용중

(github.com/microsoft)

12P by xguru 2023-04-17 | ★ favorite | 댓글 1개

빠르고 저렴하며 확장 가능한 개방형 시스템 프레임워크
End-to-End RLHF(Reinforcement Learning Human Feedback)를 통해 모든 규모의 고품질 ChatGPT 스타일 모델을 생성 가능
1클릭으로 48GB 메모리가 장착된 NVIDIA A6000 GPU 한대로 1.3B 파라미터 ChatGPT 모델을 1.36시간내에 훈련, 생성 및 서빙 가능
Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT 등이 이용중

xguru 2023-04-17 [-]

DeepSpeed - MS가 공개한 딥러닝 최적화 라이브러리
Databricks, ChatGPT와 비슷한 Dolly 2.0 오픈소스로 공개

답변달기

DeepSpeed Chat - RLHF를 이용한 ChatGPT-like 모델 훈련용 프레임워크

함께 보면 좋은 글 β

댓글과 토론