AI 환각의 원인-2: 푸른 요정 앞의 데이비드
(brunch.co.kr/@ninetailedwolf)뇌과학적 연구와 기호학적 가설을 통해 AI 환각(Hallucination)의 원인을 인간의 언어 사용 메커니즘에서 찾는 글입니다.
뇌과학적 근거: N400 뇌파 발견 및 최신 연구(Goldstein et al., 2024)를 인용하여, 인간의 뇌 또한 AI처럼 문맥을 기반으로 다음 단어를 확률적으로 예측함을 설명합니다.
데이터 빈곤 가설: 초기 인류를 '학습 데이터가 부족한 소형 언어 모델(SLM)'로 비유합니다. 부족한 정보로 세계를 설명하기 위해 신화나 '신(God)' 같은 고압축 기호를 생성해 냈으며, AI의 환각은 이 과정이 텍스트에 남아 재현되는 것으로 해석합니다.
통계적 딜레마: 데이터 분포가 다른 집단 간에 예측 정확도와 오류의 균형을 동시에 맞추는 것은 통계적으로 불가능함을 지적합니다. 나아가 환각을 판별하는 인간의 도덕적 기준(상상의 질서) 자체가 가변적임을 논합니다.
결론: 영화 <A.I.>의 데이비드 사례를 통해, 기계의 출력값을 '환각'으로 규정하는 기준이 무엇인지, 인간이 기계에 투영하는 의미 부여 또한 일종의 환각이 아닌지 질문합니다.
어떤의미인지는 이해할듯 ㅋㅋ 세상은 우주고 인간은 자아라는 작은 그릇을 가져서 세상을 필연적으로 분해.분석해 추상화된 데이터로 적재함. 그래서 자신의 그릇한계너머. 인지바깥의 외부세계를 예측하거나 상상할수밖에 없다라는 개념에 가까운듯
이번 2편은 솔직히 말해서 지난 1편에 비해 훨씬 실망스럽습니다.
이번 편에서는 논리를 정당화하기 위하여 "환각"의 판단 기준을 사실관계의 오류에 국한시키지 않고 차별과 공정성 및 사회적 판단에 이르기까지 다른 범주에서 다루던 문제를 모두 포함시키도록 잔뜩 늘려놓고 있습니다.
이러한 해석 확장에는 그걸 충분히 정당화할 수 있을 근거가 반드시 필요하다고 생각하는데, "사변적 언어"라는 주장 외에는 확장의 근거가 희박해 보입니다.
앞서 1편에서는 움베르토 에코를 인용하셨던데, 제가 알기로는 움베르토 에코야말로 무분별한 해석 확장이 소통의 기반을 무너뜨리는 걸 비판한 학자가 아닙니까? 이 부분에 대해 답변 부탁드립니다.
그리고 혹시 지난 1편과 관련하여 제가 댓글로 추가 질문했던 부분에 대해서도 답변해주실 수 있는지 확인 부탁드립니다.