Python Reinforcement Learning 强化学习教程系列 - Python

reinforcement-learning

简介
1. 1.1 Why?
2. 1.2 课程要求
Q-learning
Sarsa
Deep Q Network
Policy Gradient
1. 5.1 Policy Gradients 算法更新 (Tensorflow)
2. 5.2 Policy Gradients 思维决策 (Tensorflow)
Actor Critic
Model Based RL

支持让教学变得更优秀

点我赞助莫烦