로컬에서 Llama 2 실행하는 방법 안내

(replicate.com)

5P by GN⁺ 2023-07-26 | ★ favorite | 댓글 2개

인터넷 연결 없이 자체 장치에서 Llama 2를 실행할 수 있습니다.
Llama 2를 로컬에서 실행할 수 있는 세 가지 오픈 소스 도구가 있습니다: Llama.cpp, Ollama 및 MLC LLM.
Llama.cpp는 Mac, Windows 및 Linux를 지원하는 C/C++로 된 Llama의 포트입니다.
Ollama는 명령 줄 인터페이스로 Llama 2를 실행할 수 있는 macOS 앱입니다.
MLC LLM을 사용하면 iOS 및 Android를 포함한 휴대폰에서 Llama 2를 실행할 수 있습니다.
Ollama는 3B 모델을 실행하기 위해 최소 8GB의 RAM, 7B 모델을 위해 16GB, 13B 모델을 위해 32GB를 권장합니다.
MLC LLM은 Llama 2의 7B, 13B 및 70B 버전을 지원하지만 아이폰 사용자를 위해 아직 베타 버전입니다.
Discord 커뮤니티에서 창작물을 공유하고 지원을 받을 수 있습니다.
Replicate은 Llama 2를 클라우드에서 실행하고 세부 조정할 수 있는 옵션을 제공합니다.

haebom 2023-07-28 [-]

맥 스튜디오 M2에서 돌리는데 잘 돌아갑니다.

GN⁺ 2023-07-26 [-]

Hacker News 의견

유저가 Llama 2를 Windows에서 빌드하기 위한 지침을 제공하며, CUDA 툴킷 설치와 모델 다운로드를 포함한다.
Llama 2를 더 쉽게 실행하기 위한 PowerShell 함수가 공유된다.
PEFT/Lora를 사용하여 Google Colab A100 GPU에서 Llama 2를 세밀하게 조정하는 라이브 코딩 스트림이 언급된다.
댓글러는 Linux 기계에 GPU를 사용하기 위해 Hugging Face 추론을 제안한다.
CPU 또는 MPS(M1/M2 GPU)에서 실행할 수 있는 원본 Llama 2 코드의 포크가 공유된다.
Llama 2를 MacOS 또는 Windows에서 쉽게 사용하기 위해 GPT4All이 권장된다.
웹사이트에서 스크립트를 직접 bash로 파이핑하는 것에 대한 주의가 제기된다.
댓글러는 Llama 2가 이미지를 해석하고 사용할 수 있는 잠재력에 대해 논의한다.
연구 이상으로 Llama 2를 사용하는 목적에 대해 의문이 제기된다.
LLM 모델의 한계가 언급되며, 영화 '매트릭스'에 대한 JSON 객체 생성을 거부한다.