课程名称:Python 实现文本解析器培训

4401 人关注
(78637/99817)
课程大纲:

强化学习基础算法培训

 

 

强化学习(英语:Reinforcement learning)是非常前沿的学科,

它可能是实现强(类)人工智能的手段之一。

了解并掌握基础的强化学习方法,

将使得你对人工智能的概念进一步深化。

1 强化学习概念

2 Sarsa 强化学习算法

3 OpenAI Gym 应用

4 Q-Learning 强化学习算法

5 策略梯度算法

1
强化学习介绍与示例

1.强化学习介绍

2.强化学习算法分类

3.强化学习应用

4.课外内容推荐

2
Q-Learning 强化学习方法实现

1.QTable的概念

2.QLearning算法实现

3.Sarsa学习算法

4.Sarsa和QLearning区别

挑战 1
实现 Sarsa 学习算法走出迷宫

1.QTable初始化

2.QTable更新函数

3.Sarsa完整算法实现

3
OpenAI Gym 环境介绍及使用

1.Gym环境安装

2.Gym环境使用

3.Gym环境示例

2
Gym 玩 Atari 打砖块游戏

1.OpenAIGym使用

2.打砖块游戏可视化

4
策略梯度强化学习方法实现

1.策略梯度过程推导

2.策略梯度定理

3.蒙特卡洛策略梯度算法

4.ActorCritic策略梯度算法

5.策略梯度算法实现

3
使用策略梯度训练 CartPole

1.策略梯度

2.策略梯度定理

3.MonteCarlo策略梯度算法

4.ActorCritic策略梯度


登录 后发表评论
新评论
全部 第1节 第2节 第3节 第4节 第5节 第6节 第7节 第8节 第9节 第10节 第11节 第12节 第13节 第14节 第15节 第16节 第17节
我的报告 / 所有报告