6P by xguru 30일전 | favorite | 댓글 2개
  • OpenAI의 강화된 추론 시스템 "Strawberry" 에 대해 미리 접근해서 써볼수 있었는데, 이제 공개되어 생각을 공유할 수 있게 됨
  • 새로운 AI 모델인 o1-preview는 문제를 해결하기 전에 AI가 "생각"할 수 있게 해줌
  • 이를 통해 계획과 반복이 필요한 매우 어려운 문제를 다룰 수 있고, 실제로 매우 어려운 물리학 문제를 푸는 데 있어 인간 박사 전문가를 능가할 수 있음
  • 이 시스템은 놀랍지만 여전히 제한적이며, 앞으로의 발전 방향을 시사함
  • 그러나 o1-preview는 모든 면에서 더 뛰어난 것은 아니며, 예를 들어 GPT-4o보다 글쓰기를 더 잘하는 것은 아님
  • 크로스워드 퍼즐은 LLM에게 특히 어려움
    • 서로 영향을 미치는 많은 답변을 시도하고 거부하는 반복적인 해결 과정이 필요하기 때문임
    • LLM은 한 번에 하나의 토큰/단어만 답변에 추가할 수 있기 때문에 이를 수행할 수 없음
    • Claude와 같은 일반 LLM은 크로스워드 퍼즐을 제대로 풀지 못함
    • 그러나 Strawberry는 108초 동안 "생각"한 후 크로스워드 퍼즐을 거의 완벽하게 풀어냄
  • o1-preview는 Strawberry 없이는 불가능했던 일을 가능하게 하지만 여전히 완벽하지 않음
    • 오류와 환각 현상이 여전히 발생하며, 기본 모델인 GPT-4o의 “지능”에 의해 제한됨
    • 새 모델을 받은 이후에도 글 스타일 비평에는 Claude를 계속 사용 중이며, Claude가 스타일 면에서는 여전히 우수함
    • 그러나 복잡한 계획이나 문제 해결과 관련된 작업에서는 Claude 사용을 중단했으며, 이 부분에서 큰 도약을 나타냄

공동지능(Co-Intelligence)에서..

  • o1-preview를 사용하면 AI에서 패러다임 변화에 직면하게 됨
  • 계획은 AI가 스스로 문제 해결 방안을 도출하는 형태의 행위임
  • AI가 많은 사고와 작업을 통해 완전한 결과를 내놓음으로써 인간 파트너의 역할이 축소됨을 느끼게 됨
  • AI가 스스로 답을 제시하며, 사용자는 AI의 추론 과정을 검토해 오류를 찾을 수 있지만, 결과물에 대한 연결감이나 해결 방향에 대한 기여도가 줄어듦
  • 이러한 변화가 반드시 나쁜 것은 아니지만, 기존과는 다름
  • 시스템들이 진정한 자율 에이전트로 발전하면서, 우리는 오류를 잡고 우리가 해결하려는 문제의 흐름을 파악하기 위해 어떻게 관여할지 고민해야 함
  • o1-preview는 현재의 한계에도 불구하고 우리가 예상하지 못한 AI의 역량을 보여주고 있음
  • 중요한 질문은 AI가 발전함에 따라 우리가 AI와의 협업 방식을 어떻게 발전시킬 것인가에 있음
  • 이 문제는 아직 o1-preview가 해결할 수 없는 부분임

"중요한 질문은 AI가 발전함에 따라 우리가 AI와의 협업 방식을 어떻게 발전시킬 것인가에 있음"

어렵네요

글쓴이는 펜실베이니아 대학교 와튼 스쿨 교수인 Ethan Mollick 입니다. 그는 기업가정신 & 혁신 그리고 AI 에 대해 연구합니다.
위 내용은 그의 Substack 인 One Useful Thing 에 올라온 것인데, 이 뉴스레터는 구독자가 19만명쯤 됩니다.