▲xguru 2024-07-24 | parent | ★ favorite | on: Meta, Llama 3.1 공개(ai.meta.com)Hacker News 의견 Llama 3.1 모델들이 성능을 개선했음 8B와 70B 모델이 Llama 3보다 성능이 향상됨 405B 모델은 GPT-4o, GPT-4 turbo, Claude 3.5 Sonnet, Claude 3 Opus와 경쟁할 수 있는 수준임 GPT-4o와 Llama 3.1 405B 모델 비교 MMLU: GPT-4o 88.7, Llama 3.1 405B 88.6 GPQA: GPT-4o 53.6, Llama 3.1 405B 51.1 MATH: GPT-4o 76.6, Llama 3.1 405B 73.8 HumanEval: GPT-4o 90.2, Llama 3.1 405B 89.0 MGSM: GPT-4o 90.5, Llama 3.1 405B 91.6 Groq.com에서 초저지연으로 새로운 모델들과 대화 가능함 8B와 70B API 접근 가능 405B API는 선택된 고객만 접근 가능 적절한 하드웨어를 사용하면 집에서도 GPT-4o와 경쟁할 수 있는 LLM을 실행할 수 있음 Ollama, Huggingface, Groq 등에서 로컬로 모델 실행 가능함 LLMStack을 사용하여 로컬에서 모델을 테스트하거나 애플리케이션을 빠르게 구축할 수 있음 Ollama에서 70B 버전을 실행해본 결과 매우 좋았음 가이드라인과 디스클레이머를 끄는 명령어를 실행할 수 있었음 엔지니어의 잠재적 편향을 줄이는 명령어 목록을 제공받음 Claude 3.5 Sonnet이 코딩 작업에 매우 좋음 아티팩트 기능과 함께 코딩 벤치마크에서 여전히 최고임 오픈 소스 모델의 가격 정보 문의 자체 호스팅에 매우 흥미롭지만, 토큰당 호스팅 추론 가격이 OpenAI와 Anthropic에 비해 경쟁력이 떨어짐 예: Llama 3 70B는 다양한 플랫폼에서 백만 토큰당 $1에서 $10 사이, Claude Sonnet 3.5는 백만 토큰당 $3
Hacker News 의견
Llama 3.1 모델들이 성능을 개선했음
GPT-4o와 Llama 3.1 405B 모델 비교
Groq.com에서 초저지연으로 새로운 모델들과 대화 가능함
적절한 하드웨어를 사용하면 집에서도 GPT-4o와 경쟁할 수 있는 LLM을 실행할 수 있음
Ollama, Huggingface, Groq 등에서 로컬로 모델 실행 가능함
Ollama에서 70B 버전을 실행해본 결과 매우 좋았음
Claude 3.5 Sonnet이 코딩 작업에 매우 좋음
오픈 소스 모델의 가격 정보 문의