OpenAI의 Strawberry와 추론에 대하여

xguru · 2024-09-14T10:02:02+09:00

OpenAI의 강화된 추론 시스템 "Strawberry" 에 대해 미리 접근해서 써볼수 있었는데, 이제 공개되어 생각을 공유할 수 있게 됨 새로운 AI 모델인 o1-preview는 문제를 해결하기 전에 AI가 "생각"할 수 있게 해줌 이를 통해 계획과 반복이 필요한 매우 어려운 문제를 다룰 수 있고, 실제로 매우 어려운 물리학 문제를 푸는 데 있어 인간 박사 전문가를 능가할 수 있음 이 시스템은 놀랍지만 여전히 제한적이며, 앞으로의 발전 방향을 시사함 그러나 o1-preview는 모든 면에서 더 뛰어난 것은 아니며, 예를 들어 GPT-4o보다 글쓰기를 더 잘하는 것은 아님 크로스워드 퍼즐은 LLM에게 특히 어려움 서로 영향을 미치는 많은 답변을 시도하고 거부하는 반복적인 해결 과정이 필요하기 때문임 LLM은 한 번에 하나의 토큰/단어만 답변에 추가할 수 있기 때문에 이를 수행할 수 없음 Claude와 같은 일반 LLM은 크로스워드 퍼즐을 제대로 풀지 못함 그러나 Strawberry는 108초 동안 "생각"한 후 크로스워드 퍼즐을 거의 완벽하게 풀어냄 o1-preview는 Strawberry 없이는 불가능했던 일을 가능하게 하지만 여전히 완벽하지 않음 오류와 환각 현상이 여전히 발생하며, 기본 모델인 GPT-4o의 “지능”에 의해 제한됨 새 모델을 받은 이후에도 글 스타일 비평에는 Claude를 계속 사용 중이며, Claude가 스타일 면에서는 여전히 우수함 그러나 복잡한 계획이나 문제 해결과 관련된 작업에서는 Claude 사용을 중단했으며, 이 부분에서 큰 도약을 나타냄 공동지능(Co-Intelligence)에서.. o1-preview를 사용하면 AI에서 패러다임 변화에 직면하게 됨 계획은 AI가 스스로 문제 해결 방안을 도출하는 형태의 행위임 AI가 많은 사고와 작업을 통해 완전한 결과를 내놓음으로써 인간 파트너의 역할이 축소됨을 느끼게 됨 AI가 스스로 답을 제시하며, 사용자는 AI의 추론 과정을 검토해 오류를 찾을 수 있지만, 결과물에 대한 연결감이나 해결 방향에 대한 기여도가 줄어듦 이러한 변화가 반드시 나쁜 것은 아니지만, 기존과는 다름 시스템들이 진정한 자율 에이전트로 발전하면서, 우리는 오류를 잡고 우리가 해결하려는 문제의 흐름을 파악하기 위해 어떻게 관여할지 고민해야 함 o1-preview는 현재의 한계에도 불구하고 우리가 예상하지 못한 AI의 역량을 보여주고 있음 중요한 질문은 AI가 발전함에 따라 우리가 AI와의 협업 방식을 어떻게 발전시킬 것인가에 있음 이 문제는 아직 o1-preview가 해결할 수 없는 부분임

(oneusefulthing.org)

6P by xguru 2024-09-14 | ★ favorite | 댓글 2개

OpenAI의 강화된 추론 시스템 "Strawberry" 에 대해 미리 접근해서 써볼수 있었는데, 이제 공개되어 생각을 공유할 수 있게 됨
새로운 AI 모델인 o1-preview는 문제를 해결하기 전에 AI가 "생각"할 수 있게 해줌
이를 통해 계획과 반복이 필요한 매우 어려운 문제를 다룰 수 있고, 실제로 매우 어려운 물리학 문제를 푸는 데 있어 인간 박사 전문가를 능가할 수 있음
이 시스템은 놀랍지만 여전히 제한적이며, 앞으로의 발전 방향을 시사함
그러나 o1-preview는 모든 면에서 더 뛰어난 것은 아니며, 예를 들어 GPT-4o보다 글쓰기를 더 잘하는 것은 아님
크로스워드 퍼즐은 LLM에게 특히 어려움
- 서로 영향을 미치는 많은 답변을 시도하고 거부하는 반복적인 해결 과정이 필요하기 때문임
- LLM은 한 번에 하나의 토큰/단어만 답변에 추가할 수 있기 때문에 이를 수행할 수 없음
- Claude와 같은 일반 LLM은 크로스워드 퍼즐을 제대로 풀지 못함
- 그러나 Strawberry는 108초 동안 "생각"한 후 크로스워드 퍼즐을 거의 완벽하게 풀어냄
o1-preview는 Strawberry 없이는 불가능했던 일을 가능하게 하지만 여전히 완벽하지 않음
- 오류와 환각 현상이 여전히 발생하며, 기본 모델인 GPT-4o의 “지능”에 의해 제한됨
- 새 모델을 받은 이후에도 글 스타일 비평에는 Claude를 계속 사용 중이며, Claude가 스타일 면에서는 여전히 우수함
- 그러나 복잡한 계획이나 문제 해결과 관련된 작업에서는 Claude 사용을 중단했으며, 이 부분에서 큰 도약을 나타냄

공동지능(Co-Intelligence)에서..

o1-preview를 사용하면 AI에서 패러다임 변화에 직면하게 됨
계획은 AI가 스스로 문제 해결 방안을 도출하는 형태의 행위임
AI가 많은 사고와 작업을 통해 완전한 결과를 내놓음으로써 인간 파트너의 역할이 축소됨을 느끼게 됨
AI가 스스로 답을 제시하며, 사용자는 AI의 추론 과정을 검토해 오류를 찾을 수 있지만, 결과물에 대한 연결감이나 해결 방향에 대한 기여도가 줄어듦
이러한 변화가 반드시 나쁜 것은 아니지만, 기존과는 다름
시스템들이 진정한 자율 에이전트로 발전하면서, 우리는 오류를 잡고 우리가 해결하려는 문제의 흐름을 파악하기 위해 어떻게 관여할지 고민해야 함
o1-preview는 현재의 한계에도 불구하고 우리가 예상하지 못한 AI의 역량을 보여주고 있음
중요한 질문은 AI가 발전함에 따라 우리가 AI와의 협업 방식을 어떻게 발전시킬 것인가에 있음
이 문제는 아직 o1-preview가 해결할 수 없는 부분임