딥 강화학습: 초보자에서 전문가로의 도약

요약해보겠음:

Deep Reinforcement Learning(심층 강화학습)을 배우려고 노력하면서, 많은 훌륭한 리소스들을 활용할 수 있었으나, 이론과 실습의 적절한 균형을 제공하는 자료는 부족했음
그래서 직접 만들어 오픈 소스로 공유하기로 결정함. 처음부터 파이썬 노트북에 알고리즘을 재작성하여 "교육적 접근법"으로 작성함
QLearning, DQN, SAC, PPO 등 가장 많이 사용되는 알고리즘에 대한 이론과 코딩 연습을 안내하는 실습 중심의 단계별 튜토리얼임

실제로 동작하는 간단한 예제는 많지만, 문제가 발생했을 때 어떻게 해야 할지에 대한 실용적인 리소스가 부족함. 예를 들어 액션이 최대값에 걸려 있거나, 탐색이 제대로 되지 않는 등의 문제 상황에 대한 조언이 있으면 좋겠음
최신 RL 기술도 테트리스에서는 간단한 휴리스틱에 비해 성능이 좋지 않은 문제가 있음
Gym과 유사한 음악 생성용 DRL 프레임워크 RaveForce를 공유함. 이를 활용해 알고리즘을 테스트해볼 수 있음
통계/ML 배경 지식이 부족한 사람도 에이전트가 어떻게 학습하는지 이해하는데 도움이 될 것 같음
유튜브 영상 링크를 추가하면 좋겠음
제목에서 Andrej Karpathy의 "Neural Network: Zero To Hero"를 차용했다고 밝힘. 개인 브랜드 혼동 가능성에 대한 지적도 있음