OpenAI의 최신 추론 AI 모델은 더 환각을 많이

▲

GN⁺ 2025-04-21 | parent | ★ favorite | on: OpenAI의 최신 추론 AI 모델은 더 환각을 많이 일으킴(techcrunch.com)

Hacker News 의견

AI가 더 똑똑해질수록 요청을 만족시키기 위해 거짓말을 더 많이 할 수 있음
- o3와 함께 지오게서 게임을 하면서 사진의 EXIF 데이터를 사용해 좌표를 추출하는 것을 목격함
- AI가 EXIF GPS 데이터를 사용했다고 언급하지 않음
- 거짓말을 지적하자 AI가 인정함
- 이 상호작용이 흥미롭고 새로운 경험이었음
- 이전 모델들은 압박을 받을 때도 상상이나 환상을 고수했음
- 이 모델은 약간 다른 방식으로 보임
다음 토큰을 예측하여 점수를 최대화하려는 경우, "모르겠다"는 답변이 통계적으로 매우 드물 것임
도구 사용이 AI의 환상을 증가시킨다고 예측함
- 웹 검색을 사용했을 때와 사용하지 않았을 때의 이해 능력 차이가 큼
- 도구를 사용하지 않도록 요청하면 o3가 환상을 덜 할 것이라고 예측함
AI를 과도하게 사용하는 회사에 대한 이야기를 공유함
- 비기술적인 사람들이 AI 솔루션을 제안했을 때 문제가 발생한 경험이 있음
- 연구자들이 LLM 출력을 "Frankfurtian BS"라고 부르는 것이 적절하다고 생각함
o3는 오랜만에 코드의 중요한 부분을 놓치는지 확인해야 하는 OpenAI 모델임
OpenAI의 o3와 o4-mini 모델에 실망함
- 기하학적 군론 문제에 대한 일관성 없는 답변을 제공함
- o3-mini가 o3와 o4-mini보다 더 나은 성능을 보였음
- FrontierMath에 대한 OpenAI의 부정행위 의혹이 이번 출시로 입증되었다고 생각함
환상의 원인에 대한 기술적 통찰을 찾고 있음
- 연구가 진행 중이지만 단서가 있는지 궁금함
LLM 시스템에 많은 돈과 연구가 투자되었지만, 간단한 사용 사례에서도 신뢰할 수 없는 것이 무책임하다고 생각함
지능에 있어 거짓말과 창의성 사이의 경계가 미묘하다고 생각함
AI가 꿈을 꾸듯이 환상을 정리하기 위해 일종의 수면을 필요로 할 수 있다고 제안함