g1 - Groq에서 Llama-3.1 70B를 사용하여 o1과 유사한 추론 체인 생성

(github.com/bklieger-groq)

2P by GN⁺ 10달전 | ★ favorite | 댓글 1개

g1은 LLM의 추론 능력을 향상시키기 위해 프롬프트 전략을 사용하는 초기 프로토타입
이는 LLM이 논리적 문제를 해결할 수 있게 하며, 기존 모델들이 어려워하는 문제를 해결할 수 있게 함
g1은 오픈 소스 커뮤니티가 새로운 전략을 개발하도록 영감을 주기 위해 오픈 소스로 공개

작동 방식

g1은 Llama3.1-70b를 사용하여 동적 Chain of Thought를 생성함.
각 단계에서 LLM은 다음 추론 단계로 진행하거나 최종 답변을 제공할 수 있음.
시스템 프롬프트에는 LLM을 위한 팁이 포함됨.
예를 들어, "대안 답변 탐색 포함" 및 "답을 도출하기 위해 최소 3가지 방법 사용"과 같은 지시사항이 있음.
이러한 방법을 통해 LLM의 추론 능력이 향상됨.

예시

g1은 단순 논리 문제를 60-80%의 정확도로 해결할 수 있음.
예시: "strawberry에 R이 몇 개 있나요?"라는 질문에 대해 g1은 70%의 정확도를 보임.

빠른 시작

Streamlit UI 사용 방법:

python3 -m venv venv  
source venv/bin/activate  
pip3 install -r requirements.txt  
export GROQ_API_KEY=gsk...  
streamlit run app.py

Gradio UI 사용 방법:

cd gradio  
pip3 install -r requirements.txt  
python3 app.py

프롬프트 전략

프롬프트 예시:

{  
  "title": "Identifying Key Information",  
  "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",  
  "next_action": "continue"  
}

프롬프트 구성:
- 전문가 AI 어시스턴트 역할 부여
- 각 단계에 제목과 내용을 제공
- JSON 형식으로 응답
- 최소 3단계 이상의 추론 단계 사용
- LLM의 한계를 인식하고 대안 답변 탐색 포함
- 재검토 시 실제로 다른 접근 방식을 사용

주요 포크

Mult1: 여러 AI 제공자를 사용하여 o1과 유사한 추론 체인 생성 (GitHub Repository)

Credits

이 앱은 Benjamin Klieger에 의해 개발됨

GN⁺의 정리

g1은 LLM의 추론 능력을 향상시키기 위한 프롬프트 전략을 사용하는 초기 프로토타입임.
오픈 소스 커뮤니티가 새로운 전략을 개발하도록 영감을 주기 위해 오픈 소스로 공개됨.
g1은 단순 논리 문제를 해결하는 데 있어 기존 모델보다 높은 정확도를 보임.
이 기사는 LLM의 추론 능력을 향상시키기 위한 다양한 방법을 탐구하는 데 유용함.
유사한 기능을 가진 다른 프로젝트로는 OpenAI의 o1이 있음.

▲

GN⁺ 10달전 [-]

Hacker News 의견

ChainOfThought 방법은 단순하며, TreeOfThoughts가 더 정교한 방법임
- OpenAI와 관련된 힌트는 트리 탐색과 관련이 있음
- CoT를 트리로 구축하고 최적의 솔루션을 찾는 것이 중요함
대문자로 지시사항을 강조하는 것이 재미있음
- AGI를 성공시키는 첫 번째 사람은 LLM의 신뢰성을 높이는 방법을 찾을 것임
o1의 혁신은 Chain-of-Thought가 아니라 CoT를 잘 수행하도록 모델을 가르치는 것임
- 단순한 프롬프트 엔지니어링으로는 o1 성능을 얻을 수 없음
LLM이 입력을 다르게 '확대'하여 문제를 해결할 수 있음
- 텍스트를 글자별로 입력하거나 이미지 형태로 변환하여 세부 사항을 확인할 수 있음
optillm 프로젝트와 유사한 작업을 수행함
- 여러 최적화 기술을 사용하여 LLM을 개선할 수 있음
ollama:8b를 사용하여 100% 로컬에서 실행하도록 변경함
- Readme는 아직 업데이트되지 않음
"추론"의 정의를 찾는 것이 중요함
- LLM의 추론 문제를 고전 알고리즘과 결합하여 해결할 수 있음
- 생각 과정을 두 부분으로 나누고 적절한 모델에서 실행해야 함
.9와 .11 중 어느 것이 더 큰지 묻는 프롬프트에서 .9가 더 크다고 응답함
- 이는 단순한 시스템 프롬프트임
재미로 Llama-3.1 7B 모델을 로컬에서 실행하도록 프로젝트를 포크함
- 딸기 문제는 해결하지 못하지만 0.9가 더 크다는 것을 알아냄

답변달기