GN⁺: g1 - Groq에서 Llama-3.1 70B를 사용하여 o1과 유사한 추론 체인 생성
(github.com/bklieger-groq)- g1은 LLM의 추론 능력을 향상시키기 위해 프롬프트 전략을 사용하는 초기 프로토타입
- 이는 LLM이 논리적 문제를 해결할 수 있게 하며, 기존 모델들이 어려워하는 문제를 해결할 수 있게 함
- g1은 오픈 소스 커뮤니티가 새로운 전략을 개발하도록 영감을 주기 위해 오픈 소스로 공개
작동 방식
- g1은 Llama3.1-70b를 사용하여 동적 Chain of Thought를 생성함.
- 각 단계에서 LLM은 다음 추론 단계로 진행하거나 최종 답변을 제공할 수 있음.
- 시스템 프롬프트에는 LLM을 위한 팁이 포함됨.
- 예를 들어, "대안 답변 탐색 포함" 및 "답을 도출하기 위해 최소 3가지 방법 사용"과 같은 지시사항이 있음.
- 이러한 방법을 통해 LLM의 추론 능력이 향상됨.
예시
- g1은 단순 논리 문제를 60-80%의 정확도로 해결할 수 있음.
- 예시: "strawberry에 R이 몇 개 있나요?"라는 질문에 대해 g1은 70%의 정확도를 보임.
빠른 시작
-
Streamlit UI 사용 방법:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py
-
Gradio UI 사용 방법:
cd gradio pip3 install -r requirements.txt python3 app.py
프롬프트 전략
-
프롬프트 예시:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" }
-
프롬프트 구성:
- 전문가 AI 어시스턴트 역할 부여
- 각 단계에 제목과 내용을 제공
- JSON 형식으로 응답
- 최소 3단계 이상의 추론 단계 사용
- LLM의 한계를 인식하고 대안 답변 탐색 포함
- 재검토 시 실제로 다른 접근 방식을 사용
주요 포크
- Mult1: 여러 AI 제공자를 사용하여 o1과 유사한 추론 체인 생성 (GitHub Repository)
Credits
- 이 앱은 Benjamin Klieger에 의해 개발됨
GN⁺의 정리
- g1은 LLM의 추론 능력을 향상시키기 위한 프롬프트 전략을 사용하는 초기 프로토타입임.
- 오픈 소스 커뮤니티가 새로운 전략을 개발하도록 영감을 주기 위해 오픈 소스로 공개됨.
- g1은 단순 논리 문제를 해결하는 데 있어 기존 모델보다 높은 정확도를 보임.
- 이 기사는 LLM의 추론 능력을 향상시키기 위한 다양한 방법을 탐구하는 데 유용함.
- 유사한 기능을 가진 다른 프로젝트로는 OpenAI의 o1이 있음.
Hacker News 의견
- ChainOfThought 방법은 단순하며, TreeOfThoughts가 더 정교한 방법임
- OpenAI와 관련된 힌트는 트리 탐색과 관련이 있음
- CoT를 트리로 구축하고 최적의 솔루션을 찾는 것이 중요함
- 대문자로 지시사항을 강조하는 것이 재미있음
- AGI를 성공시키는 첫 번째 사람은 LLM의 신뢰성을 높이는 방법을 찾을 것임
- o1의 혁신은 Chain-of-Thought가 아니라 CoT를 잘 수행하도록 모델을 가르치는 것임
- 단순한 프롬프트 엔지니어링으로는 o1 성능을 얻을 수 없음
- LLM이 입력을 다르게 '확대'하여 문제를 해결할 수 있음
- 텍스트를 글자별로 입력하거나 이미지 형태로 변환하여 세부 사항을 확인할 수 있음
- optillm 프로젝트와 유사한 작업을 수행함
- 여러 최적화 기술을 사용하여 LLM을 개선할 수 있음
- ollama:8b를 사용하여 100% 로컬에서 실행하도록 변경함
- Readme는 아직 업데이트되지 않음
- "추론"의 정의를 찾는 것이 중요함
- LLM의 추론 문제를 고전 알고리즘과 결합하여 해결할 수 있음
- 생각 과정을 두 부분으로 나누고 적절한 모델에서 실행해야 함
- .9와 .11 중 어느 것이 더 큰지 묻는 프롬프트에서 .9가 더 크다고 응답함
- 이는 단순한 시스템 프롬프트임
- 재미로 Llama-3.1 7B 모델을 로컬에서 실행하도록 프로젝트를 포크함
- 딸기 문제는 해결하지 못하지만 0.9가 더 크다는 것을 알아냄