Hacker News 의견
  • 매우 멋진 일임. 아내와 나는 Andy Barto와 그의 아내의 집을 구매했음

    • 구매 과정에서 입찰 전쟁이 있었음
    • 그가 수학자라는 것을 알고 소수(prime number)로 제안을 했음
    • 그의 업적이 인정받는 것을 보니 정말 기쁨
  • 멋짐! 잘 자격을 갖춘 사람임. 그들은 RL 교과서 두 판을 무료 PDF로 제공함

    • 1982년부터 AI 실무자로 일해왔고, RL은 개인적으로 마스터하기 어려운 주제였음
    • Sutton/Barto 책, White 교수의 Coursera RL 강의 등이 큰 도움이 되었음: 추천함
    • 그들의 책의 예제 프로그램은 Common Lisp와 Python으로 제공됨
  • The Bitter Lesson을 다시 읽기 좋은 시기임

  • Sutton은 인간 후계주의자이며, 인간이 모두 죽어도 상관하지 않음. 그는 신뢰할 수 없고 축하받을 인물이 아님

  • 물리학자들에게 상을 줬으면 더 좋았을 것임

  • Sutton이 미국 대신 캐나다 에드먼턴에 사는 것이 놀라움

    • 이는 그가 명예와 돈보다 진실성과 성실함을 중시한다는 것을 보여줌
  • 이들은 훌륭하지만, 불행히도 Sutton과 Barto의 AI 책은 정말 나쁨

    • Trask의 Grokking Machine Learning과 몇 달간의 ML 논문 구현이 더 나을 것임
  • 내가 가르친 강의에서 그들의 RL 책을 사용했음

    • 아름답게 쓰여졌고 무료로 제공됨
    • 아름다운 글에 자주 집중하다가 실제 내용을 놓치곤 했음
  • Andrew Barto와 Richard Sutton의 Turing Award 수상을 진심으로 축하함

    • 학생 시절, 그들의 교과서 Reinforcement Learning: An Introduction이 이 분야에 입문하는 계기가 되었음
    • 'Temporal Difference Learning'에 대한 6장이 순차적 의사결정에 대한 사고방식을 근본적으로 바꾸어 놓았음
    • 오늘날에도 여전히 읽기를 강력히 추천하는 고전임
  • 오랜 시간이 걸린 일임. 아이디어를 처음부터 끝까지 관철시키고, 이를 동적 프로그래밍 책의 하위 장이 아닌 전체 분야로 확장시킴

    • 더 많은 게임이 실제로 RL을 사용했으면 좋겠음 - 이 모든 것이 시작된 곳임 - 정말 멋질 것임