莫烦PYTHON
大家说
赞助
About
教程 ▾
Python基础 ▾
基础
多进程 multiprocessing
多线程 threading
窗口视窗 Tkinter
机器学习 ▾
有趣的机器学习
强化学习 Reinforcement Learning
进化算法 Evolutionary Algorithm
神经网络 ▾
Tensorflow
PyTorch
Theano
Keras
通用机器学习 Scikit-learn
数据处理 ▾
数据 Numpy & Pandas
画图 Matplotlib
Git ▾
Git 版本管理
简介
1.1 Why?
1.2 课程要求
Q-learning
2.1 小例子
2.2 Q-learning 算法更新
2.3 Q-learning 思维决策
Sarsa
3.1 Sarsa 算法更新
3.2 Sarsa 思维决策
3.3 Sarsa-lambda
Deep Q Network
4.1 DQN 算法更新 (Tensorflow)
4.2 DQN 神经网络 (Tensorflow)
4.3 DQN 思维决策 (Tensorflow)
4.4 OpenAI gym 环境库 (Tensorflow)
4.5 Double DQN (Tensorflow)
4.6 Prioritized Experience Replay (DQN) (Tensorflow)
4.7 Dueling DQN (Tensorflow)
Policy Gradient
5.1 Policy Gradients 算法更新 (Tensorflow)
5.2 Policy Gradients 思维决策 (Tensorflow)
Actor Critic
6.1 Actor Critic (Tensorflow)
6.2 Deep Deterministic Policy Gradient (DDPG) (Tensorflow)
6.3 Asynchronous Advantage Actor-Critic (A3C) (Tensorflow)
6.4 Distributed Proximal Policy Optimization (DPPO) (Tensorflow)
Model Based RL
支持 让教学变得更优秀
点我 赞助 莫烦