Cyc 부고
(yuxi-liu-wired.github.io)사이크 프로젝트의 실패
- 요약: 사이크(Cyc) 프로젝트는 40년 동안 인공지능의 일반 지능을 구축하려는 시도로, 상징적 논리를 확장하는 방식으로 진행되었으나 실패로 끝남. 이 에세이는 사이크의 비밀스러운 역사를 조명하여 널리 알리고자 함.
자동화된 수학자와 EURISKO
- 자동화된 수학자(AM): 더글러스 레나트의 첫 번째 전설적인 프로젝트로, 수학적 개념을 자동으로 발견하는 시스템이었음. 그러나 AM은 초기 발견 이후 빠르게 지적 피로에 빠졌음.
- EURISKO: AM의 한계를 극복하기 위해 개발된 시스템으로, 새로운 발견을 위한 휴리스틱 규칙을 스스로 발견할 수 있도록 설계됨. 그러나 EURISKO도 결국 지적 피로에 빠졌음.
사이크의 역사
- 사이크의 시작: 1985년 레나트는 상식 지식을 수동으로 인코딩하여 사이크를 시작함. 약 3천만 개의 주장과 2억 달러의 비용이 소요됨.
- 상업적 사용: 사이크는 2016년 이후 상업적 응용으로 전환되었으나, 오라클과 IBM 같은 기존 기업의 서비스와 기능적으로 동일함.
- 비밀주의: 사이크는 비밀스러운 성격을 띠며, 외부 연구자들이 사용하기 어려웠고, 공개 벤치마크에서 성과를 내지 못함.
사이크의 실패 원인
- 상징적 논리의 한계: 레나트는 상징적 논리 접근 방식을 고수했으나, 이는 AI의 일반 지능을 달성하는 데 실패함.
- 상식 지식의 중요성: 레나트는 인간이 지적 피로에 빠지지 않는 이유를 방대한 상식 지식에서 찾았으며, 이를 통해 새로운 아이디어를 끝없이 생성할 수 있다고 봄.
결론
- 상징적 논리의 한계: 사이크의 실패는 상징적 논리 접근 방식이 AI의 일반 지능을 달성하는 데 적합하지 않음을 보여줌.
Hacker News 의견
-
"이것은 자각 있는 AI가 쓸 법한 문장이다: '여기 볼 것은 없다, 지나가라'라는 생각이 들었음"
- Cyc는 유용한 방향으로 나아가지 않는다고 느낌
- McCarthy의 블록 세계 데모에 감명받았음
- AI가 작동할 '컨텍스트'를 만드는 규칙을 공식화한 것이 중요하다고 생각함
- LLM의 초기 실패 사례는 컨텍스트 실패의 전형적인 예임
- 기존 모델은 훈련 중 컨텍스트가 없기 때문에 출력이 컨텍스트에 맞춰 조정되지 않음
-
"매우 흥미롭고 가치 있는 기사임"
- 프로젝트가 실패했다고 단정 짓는 것은 아쉬움
- 신경망이 유용해지기까지 40년 이상 걸렸음
- Cycorp의 지식 기반이 일반적으로 접근 가능해지면 LLM 훈련에 사용될 수 있을 것임
-
"온라인으로 공개된 opencyc 버전을 실행할 수 있음"
- GitHub에 데이터셋과 지식 기반, 추론 엔진이 있음
- 오래된 버전의 Java로 작성되었음
-
"AM과 EURISKO에 대해 많이 읽으려 했지만, Lenat의 작업은 비공개였음"
- 다른 사람들이 Lenat의 작업을 기반으로 발전시키지 못하게 한 것이 아쉬움
-
"기사는 Symbolic AI에 대한 훌륭한 리뷰임"
- 과거에 OpenCyc와 많은 시간을 보냈지만, 10년 동안 다루지 않았음
- Symbolic AI의 생산적인 미래는 LLM을 사용하여 비구조화된 데이터에서 지식 그래프와 상징적 관계를 구축하는 것과 관련이 있을 것임
-
"Cyc는 웹사이트에 따르면 잘 진행되고 있음"
- Lenat는 2023년에 사망했지만, 여전히 '리더십 팀'의 유일한 멤버로 나와 있음
-
"Lenat는 데이터의 양이 유용한 지능을 얻는 열쇠라는 점에서 방향성은 맞았다고 생각함"
- Cyc 프로젝트를 비판했지만, LLM에서도 비슷한 일이 일어났음
-
"훌륭한 에세이임! OP의 끊임없는 연구에 감사함"
-
"Cyc에 대해 강한 의견은 없지만, 이 부고는 꽤 악의적이라고 느낌"
- Lenat의 기본 신념은 ML에서도 공유됨
- ML은 압도적인 양의 컴퓨팅이 필요했음
-
"작년의 큰 Cyc 스레드"