- OpenAI의 강화된 추론 시스템 "Strawberry" 에 대해 미리 접근해서 써볼수 있었는데, 이제 공개되어 생각을 공유할 수 있게 됨
- 새로운 AI 모델인 o1-preview는 문제를 해결하기 전에 AI가 "생각"할 수 있게 해줌
- 이를 통해 계획과 반복이 필요한 매우 어려운 문제를 다룰 수 있고, 실제로 매우 어려운 물리학 문제를 푸는 데 있어 인간 박사 전문가를 능가할 수 있음
- 이 시스템은 놀랍지만 여전히 제한적이며, 앞으로의 발전 방향을 시사함
- 그러나 o1-preview는 모든 면에서 더 뛰어난 것은 아니며, 예를 들어 GPT-4o보다 글쓰기를 더 잘하는 것은 아님
- 크로스워드 퍼즐은 LLM에게 특히 어려움
- 서로 영향을 미치는 많은 답변을 시도하고 거부하는 반복적인 해결 과정이 필요하기 때문임
- LLM은 한 번에 하나의 토큰/단어만 답변에 추가할 수 있기 때문에 이를 수행할 수 없음
- Claude와 같은 일반 LLM은 크로스워드 퍼즐을 제대로 풀지 못함
- 그러나 Strawberry는 108초 동안 "생각"한 후 크로스워드 퍼즐을 거의 완벽하게 풀어냄
- o1-preview는 Strawberry 없이는 불가능했던 일을 가능하게 하지만 여전히 완벽하지 않음
- 오류와 환각 현상이 여전히 발생하며, 기본 모델인 GPT-4o의 “지능”에 의해 제한됨
- 새 모델을 받은 이후에도 글 스타일 비평에는 Claude를 계속 사용 중이며, Claude가 스타일 면에서는 여전히 우수함
- 그러나 복잡한 계획이나 문제 해결과 관련된 작업에서는 Claude 사용을 중단했으며, 이 부분에서 큰 도약을 나타냄
공동지능(Co-Intelligence)에서..
- o1-preview를 사용하면 AI에서 패러다임 변화에 직면하게 됨
- 계획은 AI가 스스로 문제 해결 방안을 도출하는 형태의 행위임
- AI가 많은 사고와 작업을 통해 완전한 결과를 내놓음으로써 인간 파트너의 역할이 축소됨을 느끼게 됨
- AI가 스스로 답을 제시하며, 사용자는 AI의 추론 과정을 검토해 오류를 찾을 수 있지만, 결과물에 대한 연결감이나 해결 방향에 대한 기여도가 줄어듦
- 이러한 변화가 반드시 나쁜 것은 아니지만, 기존과는 다름
- 시스템들이 진정한 자율 에이전트로 발전하면서, 우리는 오류를 잡고 우리가 해결하려는 문제의 흐름을 파악하기 위해 어떻게 관여할지 고민해야 함
- o1-preview는 현재의 한계에도 불구하고 우리가 예상하지 못한 AI의 역량을 보여주고 있음
- 중요한 질문은 AI가 발전함에 따라 우리가 AI와의 협업 방식을 어떻게 발전시킬 것인가에 있음
- 이 문제는 아직 o1-preview가 해결할 수 없는 부분임