4P by neo 11달전 | favorite | 댓글 1개

ChatGPT 출시 1주년: 오픈소스 대형 언어 모델의 추격

  • 2022년 말 출시된 ChatGPT는 AI 분야 전반에 걸쳐 큰 변화를 가져옴.
  • 대형 언어 모델(LLM)을 지도 학습과 인간 피드백에서의 강화 학습으로 조정하여, 다양한 작업에서 인간의 질문에 답하고 지시를 따를 수 있는 능력을 보여줌.
  • 이러한 성공 이후, 학계와 산업계에서 LLM에 대한 관심이 증가하고, 많은 스타트업이 LLM에 집중하고 있으며, 오픈소스 LLM들이 빠르게 발전하며 특정 작업에서는 ChatGPT와 동등하거나 더 나은 성능을 보이는 것으로 주장함.

연구 및 비즈니스에 미치는 영향

  • 비록 폐쇄 소스 LLM들(예: OpenAI의 GPT, Anthropic의 Claude)이 일반적으로 오픈소스 모델들보다 우수한 성능을 보이지만, 오픈소스 LLM들의 발전은 빠르며 일부 작업에서는 동등하거나 더 나은 성능을 달성했다는 주장이 있음.
  • 이러한 발전은 연구뿐만 아니라 비즈니스에도 중요한 영향을 미침.

GN⁺의 의견

  • ChatGPT의 출시 1주년을 맞아, 오픈소스 대형 언어 모델들이 빠르게 발전하고 있으며, 특정 작업에서는 ChatGPT와 비슷하거나 더 나은 성능을 보이고 있다는 점이 중요함.
  • 이는 연구와 비즈니스 모두에 중대한 영향을 미치며, AI 기술의 민주화와 혁신을 촉진하는 데 기여할 수 있음.
  • 이 글은 AI 기술의 발전과 그것이 사회에 미치는 영향에 관심이 있는 사람들에게 흥미로운 내용을 제공함.
Hacker News 의견
  • 최근 몇 일 동안 공개된 크고 강력한 모델들:

    • Qwen 72B (및 1.8B): 32K 컨텍스트, 3T 토큰으로 훈련, 월 사용자 1억 미만 상업 라이선스, 벤치마크에서 강력한 성능
    • DeepSeek LLM 67B: 4K 컨텍스트, 2T 토큰, Apache 2.0 라이선스, 코드 분야에서 강력함(DeepSeek Code 33B와 비교해도 더 나음)
    • 중국에서 출시된 모델들: Yi 34B(100B 소문이 있음), XVERSE-65B, Aquila2-70B, Yuan 2.0-102B
    • OpenChat 3.5: 7b 모델로 2023년 3월 ChatGPT와 비슷한 결과를 달성, 8k 컨텍스트 윈도우, 챗봇 경기장 리더보드에서 Llama-2-70b-chat보다 높은 순위
    • 오픈소스 LLM은 특히 매개변수 효율성과 소비자가 자신의 하드웨어에서 실행할 수 있는 유용한 모델을 제공하는 측면에서 업계를 선도함
  • 13억 매개변수 llama2를 qlora로 미세 조정한 능력 시연:

    • Inkbot은 지식 그래프를 생성하며, YAML 형식으로 적절한 구조를 반환, GPT4보다 더 나은 결과를 얻음
    • 간단한 프롬프트와 복잡한 프롬프트에 대한 예시 제공
    • 청크 요약 기능도 수행함
  • 전문화된 여러 모델(코드, 채팅, 수학, SQL, 건강 등) 앞에 프롬프트 라우터를 두는 것이 필요해질 것으로 보임:

    • 일반 모델이 실행 중인 라우터에 요청을 보냄
    • 프롬프트/질문이 분해되어 전문가 모델로 분류 및 전달됨
    • 응답이 돌아와 일반 모델에 의해 조립됨
    • 이와 유사한 프로젝트가 진행 중인지에 대한 질문
  • 현재 약 70B 모델들은 ChatGPT 3.5와 동등한 수준이며, 작은 모델들은 처음에는 비슷해 보일 수 있지만, 더 높은 비율로 환각을 일으키고 세계에 대한 지식이 부족함

  • GPT 4는 더 깊은 수준에서 '이해함'이며, 오픈소스 모델은 아직 비교가 되지 않음

  • 오픈소스 기술은 OpenAI가 구현하지 않는 출력 제어 기능(예: llama.cpp의 문법 또는 ControlNet)을 가지고 있어, 이 측면에서는 오픈소스가 OpenAI보다 앞서 있음

  • DeepSeek 67B 모델을 사용해본 경험 공유:

    • ChatGPT의 필요성을 대체할 만큼 충분함
  • Mistral OpenOrca는 창의적 글쓰기/분석에 있어 GPT4-turbo와 거의 동등하며, 비슷한 텍스트를 출력하는 경향이 있음

  • 장기적으로 오픈소스 LLM이 따라잡는 것은 거의 피할 수 없으며, 오픈소스 커뮤니티는 자원이 훨씬 제한적이지만 <30B 매개변수 모델의 개발 속도를 크게 높임

  • 개인적 경험에 따르면, 오픈소스 LLM은 아직 GPT 3.5의 품질에 도달하지 못했지만, 이미 오늘날 유용하며 로컬 머신에서 실행 가능함

  • Neovim 플러그인 gen.nvim을 사용하여 간단한 작업을 수행하며 많은 시간을 절약함

  • 미래에 대한 기대감 표현

  • GPT4가 지난 한 달 동안 지속적으로 후퇴함에 따라 오픈소스 모델이 따라잡고 있음을 확신함