Lecture 33: ς Deep Q-Learning

Key Word(s): Reinforcement Learning, Policy Iteration vs Value Iteration, SARSA, On-policy, Off-policy, Q - Learning

Slides

Lecture 33: Deep Q-Learning (PDF)

Exercises

Lecture 33: Q-Learning using DQN (Notebook)