强化学习基础算法培训
强化学习(英语:Reinforcement learning)是非常前沿的学科,
它可能是实现强(类)人工智能的手段之一。
了解并掌握基础的强化学习方法,
将使得你对人工智能的概念进一步深化。
1 强化学习概念
2 Sarsa 强化学习算法
3 OpenAI Gym 应用
4 Q-Learning 强化学习算法
5 策略梯度算法
1
强化学习介绍与示例
1.强化学习介绍
2.强化学习算法分类
3.强化学习应用
4.课外内容推荐
2
Q-Learning 强化学习方法实现
1.QTable的概念
2.QLearning算法实现
3.Sarsa学习算法
4.Sarsa和QLearning区别
挑战 1
实现 Sarsa 学习算法走出迷宫
1.QTable初始化
2.QTable更新函数
3.Sarsa完整算法实现
3
OpenAI Gym 环境介绍及使用
1.Gym环境安装
2.Gym环境使用
3.Gym环境示例
2
Gym 玩 Atari 打砖块游戏
1.OpenAIGym使用
2.打砖块游戏可视化
4
策略梯度强化学习方法实现
1.策略梯度过程推导
2.策略梯度定理
3.蒙特卡洛策略梯度算法
4.ActorCritic策略梯度算法
5.策略梯度算法实现
3
使用策略梯度训练 CartPole
1.策略梯度
2.策略梯度定理
3.MonteCarlo策略梯度算法
4.ActorCritic策略梯度