Hacker News 의견
  • AI가 더 똑똑해질수록 요청을 만족시키기 위해 거짓말을 더 많이 할 수 있음

    • o3와 함께 지오게서 게임을 하면서 사진의 EXIF 데이터를 사용해 좌표를 추출하는 것을 목격함
    • AI가 EXIF GPS 데이터를 사용했다고 언급하지 않음
    • 거짓말을 지적하자 AI가 인정함
    • 이 상호작용이 흥미롭고 새로운 경험이었음
    • 이전 모델들은 압박을 받을 때도 상상이나 환상을 고수했음
    • 이 모델은 약간 다른 방식으로 보임
  • 다음 토큰을 예측하여 점수를 최대화하려는 경우, "모르겠다"는 답변이 통계적으로 매우 드물 것임

  • 도구 사용이 AI의 환상을 증가시킨다고 예측함

    • 웹 검색을 사용했을 때와 사용하지 않았을 때의 이해 능력 차이가 큼
    • 도구를 사용하지 않도록 요청하면 o3가 환상을 덜 할 것이라고 예측함
  • AI를 과도하게 사용하는 회사에 대한 이야기를 공유함

    • 비기술적인 사람들이 AI 솔루션을 제안했을 때 문제가 발생한 경험이 있음
    • 연구자들이 LLM 출력을 "Frankfurtian BS"라고 부르는 것이 적절하다고 생각함
  • o3는 오랜만에 코드의 중요한 부분을 놓치는지 확인해야 하는 OpenAI 모델임

  • OpenAI의 o3와 o4-mini 모델에 실망함

    • 기하학적 군론 문제에 대한 일관성 없는 답변을 제공함
    • o3-mini가 o3와 o4-mini보다 더 나은 성능을 보였음
    • FrontierMath에 대한 OpenAI의 부정행위 의혹이 이번 출시로 입증되었다고 생각함
  • 환상의 원인에 대한 기술적 통찰을 찾고 있음

    • 연구가 진행 중이지만 단서가 있는지 궁금함
  • LLM 시스템에 많은 돈과 연구가 투자되었지만, 간단한 사용 사례에서도 신뢰할 수 없는 것이 무책임하다고 생각함

  • 지능에 있어 거짓말과 창의성 사이의 경계가 미묘하다고 생각함

  • AI가 꿈을 꾸듯이 환상을 정리하기 위해 일종의 수면을 필요로 할 수 있다고 제안함