llamafile - 단일 파일로 LLM 배포 및 실행 하기

(github.com/Mozilla-Ocho)

1개의 파일로 대부분의 컴퓨터에서 설치없이 LLM을 쉽게 실행 지원
llama.cpp와 Cosmopolitan Libc를 결합한 프레임워크
- 1개의 빌드로 여러 OS, 다양한 CPU 아키텍처에서 실행 가능
채팅 및 이미지 인식이 가능한 LLaVA 모델을 예제로 제공
- 4GB 파일인 llava-v1.5-7b-q4-server.llamafile 을 다운 받아서 실행하면 끝
- 맥/리눅스/BSD 의 경우는 chmod +x 하고 바로 실행
- 윈도우는 확장자 뒤에 .exe 를 붙여서 바로 실행
- 실행되면 자동으로 브라우저가 열리고 채팅 인터페이스를 표시
그외에 Mistral-7B-Instruct, WizardCoder-Python-13B 등의 llamafile 도 제공