2P by neo 29일전 | favorite | 댓글 1개
  • g1은 LLM의 추론 능력을 향상시키기 위해 프롬프트 전략을 사용하는 초기 프로토타입
  • 이는 LLM이 논리적 문제를 해결할 수 있게 하며, 기존 모델들이 어려워하는 문제를 해결할 수 있게 함
  • g1은 오픈 소스 커뮤니티가 새로운 전략을 개발하도록 영감을 주기 위해 오픈 소스로 공개

작동 방식

  • g1은 Llama3.1-70b를 사용하여 동적 Chain of Thought를 생성함.
  • 각 단계에서 LLM은 다음 추론 단계로 진행하거나 최종 답변을 제공할 수 있음.
  • 시스템 프롬프트에는 LLM을 위한 팁이 포함됨.
  • 예를 들어, "대안 답변 탐색 포함" 및 "답을 도출하기 위해 최소 3가지 방법 사용"과 같은 지시사항이 있음.
  • 이러한 방법을 통해 LLM의 추론 능력이 향상됨.

예시

  • g1은 단순 논리 문제를 60-80%의 정확도로 해결할 수 있음.
  • 예시: "strawberry에 R이 몇 개 있나요?"라는 질문에 대해 g1은 70%의 정확도를 보임.

빠른 시작

  • Streamlit UI 사용 방법:

    python3 -m venv venv  
    source venv/bin/activate  
    pip3 install -r requirements.txt  
    export GROQ_API_KEY=gsk...  
    streamlit run app.py  
    
  • Gradio UI 사용 방법:

    cd gradio  
    pip3 install -r requirements.txt  
    python3 app.py  
    

프롬프트 전략

  • 프롬프트 예시:

    {  
      "title": "Identifying Key Information",  
      "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...",  
      "next_action": "continue"  
    }  
    
  • 프롬프트 구성:

    • 전문가 AI 어시스턴트 역할 부여
    • 각 단계에 제목과 내용을 제공
    • JSON 형식으로 응답
    • 최소 3단계 이상의 추론 단계 사용
    • LLM의 한계를 인식하고 대안 답변 탐색 포함
    • 재검토 시 실제로 다른 접근 방식을 사용

주요 포크

  • Mult1: 여러 AI 제공자를 사용하여 o1과 유사한 추론 체인 생성 (GitHub Repository)

Credits

  • 이 앱은 Benjamin Klieger에 의해 개발됨

GN⁺의 정리

  • g1은 LLM의 추론 능력을 향상시키기 위한 프롬프트 전략을 사용하는 초기 프로토타입임.
  • 오픈 소스 커뮤니티가 새로운 전략을 개발하도록 영감을 주기 위해 오픈 소스로 공개됨.
  • g1은 단순 논리 문제를 해결하는 데 있어 기존 모델보다 높은 정확도를 보임.
  • 이 기사는 LLM의 추론 능력을 향상시키기 위한 다양한 방법을 탐구하는 데 유용함.
  • 유사한 기능을 가진 다른 프로젝트로는 OpenAI의 o1이 있음.
Hacker News 의견
  • ChainOfThought 방법은 단순하며, TreeOfThoughts가 더 정교한 방법임
    • OpenAI와 관련된 힌트는 트리 탐색과 관련이 있음
    • CoT를 트리로 구축하고 최적의 솔루션을 찾는 것이 중요함
  • 대문자로 지시사항을 강조하는 것이 재미있음
    • AGI를 성공시키는 첫 번째 사람은 LLM의 신뢰성을 높이는 방법을 찾을 것임
  • o1의 혁신은 Chain-of-Thought가 아니라 CoT를 잘 수행하도록 모델을 가르치는 것임
    • 단순한 프롬프트 엔지니어링으로는 o1 성능을 얻을 수 없음
  • LLM이 입력을 다르게 '확대'하여 문제를 해결할 수 있음
    • 텍스트를 글자별로 입력하거나 이미지 형태로 변환하여 세부 사항을 확인할 수 있음
  • optillm 프로젝트와 유사한 작업을 수행함
    • 여러 최적화 기술을 사용하여 LLM을 개선할 수 있음
  • ollama:8b를 사용하여 100% 로컬에서 실행하도록 변경함
    • Readme는 아직 업데이트되지 않음
  • "추론"의 정의를 찾는 것이 중요함
    • LLM의 추론 문제를 고전 알고리즘과 결합하여 해결할 수 있음
    • 생각 과정을 두 부분으로 나누고 적절한 모델에서 실행해야 함
  • .9와 .11 중 어느 것이 더 큰지 묻는 프롬프트에서 .9가 더 크다고 응답함
    • 이는 단순한 시스템 프롬프트임
  • 재미로 Llama-3.1 7B 모델을 로컬에서 실행하도록 프로젝트를 포크함
    • 딸기 문제는 해결하지 못하지만 0.9가 더 크다는 것을 알아냄