曙海培训-Python 实现文本解析器培训

课程大纲

课程大纲：

强化学习基础算法培训

强化学习（英语：Reinforcement learning）是非常前沿的学科，

它可能是实现强（类）人工智能的手段之一。

了解并掌握基础的强化学习方法，

将使得你对人工智能的概念进一步深化。

1 强化学习概念

2 Sarsa 强化学习算法

3 OpenAI Gym 应用

4 Q-Learning 强化学习算法

5 策略梯度算法

1
强化学习介绍与示例

1.强化学习介绍

2.强化学习算法分类

3.强化学习应用

4.课外内容推荐

2
Q-Learning 强化学习方法实现

1.QTable的概念

2.QLearning算法实现

3.Sarsa学习算法

4.Sarsa和QLearning区别

挑战 1
实现 Sarsa 学习算法走出迷宫

1.QTable初始化

2.QTable更新函数

3.Sarsa完整算法实现

3
OpenAI Gym 环境介绍及使用

1.Gym环境安装

2.Gym环境使用

3.Gym环境示例

2
Gym 玩 Atari 打砖块游戏

1.OpenAIGym使用

2.打砖块游戏可视化

4
策略梯度强化学习方法实现

1.策略梯度过程推导

2.策略梯度定理

3.蒙特卡洛策略梯度算法

4.ActorCritic策略梯度算法

5.策略梯度算法实现

3
使用策略梯度训练 CartPole

1.策略梯度

2.策略梯度定理

3.MonteCarlo策略梯度算法

4.ActorCritic策略梯度

请登录后发表评论

新评论

全部第1节第2节第3节第4节第5节第6节第7节第8节第9节第10节第11节第12节第13节第14节第15节第16节第17节

我的报告 / 所有报告

我要提问

课程名称：Python 实现文本解析器培训

课程教师

进阶课程

课程名称：Python 实现文本解析器培训

课程教师

进阶课程

开始新实验

开始评估课实验

开始实验