리처드 서튼과 앤드류 바르토, 2024 튜링상 수상

▲

GN⁺ 2025-03-06 | parent | ★ favorite | on: 리처드 서튼과 앤드류 바르토, 2024 튜링상 수상(awards.acm.org)

Hacker News 의견

매우 멋진 일임. 아내와 나는 Andy Barto와 그의 아내의 집을 구매했음
- 구매 과정에서 입찰 전쟁이 있었음
- 그가 수학자라는 것을 알고 소수(prime number)로 제안을 했음
- 그의 업적이 인정받는 것을 보니 정말 기쁨
멋짐! 잘 자격을 갖춘 사람임. 그들은 RL 교과서 두 판을 무료 PDF로 제공함
- 1982년부터 AI 실무자로 일해왔고, RL은 개인적으로 마스터하기 어려운 주제였음
- Sutton/Barto 책, White 교수의 Coursera RL 강의 등이 큰 도움이 되었음: 추천함
- 그들의 책의 예제 프로그램은 Common Lisp와 Python으로 제공됨
The Bitter Lesson을 다시 읽기 좋은 시기임
Sutton은 인간 후계주의자이며, 인간이 모두 죽어도 상관하지 않음. 그는 신뢰할 수 없고 축하받을 인물이 아님
물리학자들에게 상을 줬으면 더 좋았을 것임
Sutton이 미국 대신 캐나다 에드먼턴에 사는 것이 놀라움
- 이는 그가 명예와 돈보다 진실성과 성실함을 중시한다는 것을 보여줌
이들은 훌륭하지만, 불행히도 Sutton과 Barto의 AI 책은 정말 나쁨
- Trask의 Grokking Machine Learning과 몇 달간의 ML 논문 구현이 더 나을 것임
내가 가르친 강의에서 그들의 RL 책을 사용했음
- 아름답게 쓰여졌고 무료로 제공됨
- 아름다운 글에 자주 집중하다가 실제 내용을 놓치곤 했음
Andrew Barto와 Richard Sutton의 Turing Award 수상을 진심으로 축하함
- 학생 시절, 그들의 교과서 Reinforcement Learning: An Introduction이 이 분야에 입문하는 계기가 되었음
- 'Temporal Difference Learning'에 대한 6장이 순차적 의사결정에 대한 사고방식을 근본적으로 바꾸어 놓았음
- 오늘날에도 여전히 읽기를 강력히 추천하는 고전임
오랜 시간이 걸린 일임. 아이디어를 처음부터 끝까지 관철시키고, 이를 동적 프로그래밍 책의 하위 장이 아닌 전체 분야로 확장시킴
- 더 많은 게임이 실제로 RL을 사용했으면 좋겠음 - 이 모든 것이 시작된 곳임 - 정말 멋질 것임