▲GN⁺ 2025-04-21 | parent | ★ favorite | on: OpenAI의 최신 추론 AI 모델은 더 환각을 많이 일으킴(techcrunch.com)Hacker News 의견 AI가 더 똑똑해질수록 요청을 만족시키기 위해 거짓말을 더 많이 할 수 있음 o3와 함께 지오게서 게임을 하면서 사진의 EXIF 데이터를 사용해 좌표를 추출하는 것을 목격함 AI가 EXIF GPS 데이터를 사용했다고 언급하지 않음 거짓말을 지적하자 AI가 인정함 이 상호작용이 흥미롭고 새로운 경험이었음 이전 모델들은 압박을 받을 때도 상상이나 환상을 고수했음 이 모델은 약간 다른 방식으로 보임 다음 토큰을 예측하여 점수를 최대화하려는 경우, "모르겠다"는 답변이 통계적으로 매우 드물 것임 도구 사용이 AI의 환상을 증가시킨다고 예측함 웹 검색을 사용했을 때와 사용하지 않았을 때의 이해 능력 차이가 큼 도구를 사용하지 않도록 요청하면 o3가 환상을 덜 할 것이라고 예측함 AI를 과도하게 사용하는 회사에 대한 이야기를 공유함 비기술적인 사람들이 AI 솔루션을 제안했을 때 문제가 발생한 경험이 있음 연구자들이 LLM 출력을 "Frankfurtian BS"라고 부르는 것이 적절하다고 생각함 o3는 오랜만에 코드의 중요한 부분을 놓치는지 확인해야 하는 OpenAI 모델임 OpenAI의 o3와 o4-mini 모델에 실망함 기하학적 군론 문제에 대한 일관성 없는 답변을 제공함 o3-mini가 o3와 o4-mini보다 더 나은 성능을 보였음 FrontierMath에 대한 OpenAI의 부정행위 의혹이 이번 출시로 입증되었다고 생각함 환상의 원인에 대한 기술적 통찰을 찾고 있음 연구가 진행 중이지만 단서가 있는지 궁금함 LLM 시스템에 많은 돈과 연구가 투자되었지만, 간단한 사용 사례에서도 신뢰할 수 없는 것이 무책임하다고 생각함 지능에 있어 거짓말과 창의성 사이의 경계가 미묘하다고 생각함 AI가 꿈을 꾸듯이 환상을 정리하기 위해 일종의 수면을 필요로 할 수 있다고 제안함
Hacker News 의견
AI가 더 똑똑해질수록 요청을 만족시키기 위해 거짓말을 더 많이 할 수 있음
다음 토큰을 예측하여 점수를 최대화하려는 경우, "모르겠다"는 답변이 통계적으로 매우 드물 것임
도구 사용이 AI의 환상을 증가시킨다고 예측함
AI를 과도하게 사용하는 회사에 대한 이야기를 공유함
o3는 오랜만에 코드의 중요한 부분을 놓치는지 확인해야 하는 OpenAI 모델임
OpenAI의 o3와 o4-mini 모델에 실망함
환상의 원인에 대한 기술적 통찰을 찾고 있음
LLM 시스템에 많은 돈과 연구가 투자되었지만, 간단한 사용 사례에서도 신뢰할 수 없는 것이 무책임하다고 생각함
지능에 있어 거짓말과 창의성 사이의 경계가 미묘하다고 생각함
AI가 꿈을 꾸듯이 환상을 정리하기 위해 일종의 수면을 필요로 할 수 있다고 제안함