Hacker News 의견

요약해보겠음:

  • Deep Reinforcement Learning(심층 강화학습)을 배우려고 노력하면서, 많은 훌륭한 리소스들을 활용할 수 있었으나, 이론과 실습의 적절한 균형을 제공하는 자료는 부족했음
  • 그래서 직접 만들어 오픈 소스로 공유하기로 결정함. 처음부터 파이썬 노트북에 알고리즘을 재작성하여 "교육적 접근법"으로 작성함
  • QLearning, DQN, SAC, PPO 등 가장 많이 사용되는 알고리즘에 대한 이론과 코딩 연습을 안내하는 실습 중심의 단계별 튜토리얼임

피드백

  • 실제로 동작하는 간단한 예제는 많지만, 문제가 발생했을 때 어떻게 해야 할지에 대한 실용적인 리소스가 부족함. 예를 들어 액션이 최대값에 걸려 있거나, 탐색이 제대로 되지 않는 등의 문제 상황에 대한 조언이 있으면 좋겠음
  • 최신 RL 기술도 테트리스에서는 간단한 휴리스틱에 비해 성능이 좋지 않은 문제가 있음
  • Gym과 유사한 음악 생성용 DRL 프레임워크 RaveForce를 공유함. 이를 활용해 알고리즘을 테스트해볼 수 있음
  • 통계/ML 배경 지식이 부족한 사람도 에이전트가 어떻게 학습하는지 이해하는데 도움이 될 것 같음
  • 유튜브 영상 링크를 추가하면 좋겠음
  • 제목에서 Andrej Karpathy의 "Neural Network: Zero To Hero"를 차용했다고 밝힘. 개인 브랜드 혼동 가능성에 대한 지적도 있음