RL-agent의 DOOM 플레이 데이터를 바탕으로 diffusion 모델을 학습 (next frame prediction)