当前位置：首页 > IT技术

关于DRL

时间:2019-08-26 20:11:55来源:IT技术作者:seo实验室小编阅读:71次「手机版」

　

drl

DRL: deep reinforcement learning

DRL = DL (deep learning) + RL (reinforcement learning)

大多数情况下，reward既不为正，也不为负，为0，导致RL非常难训练。

Alpha Go是监督学习+增强学习。在一开始，学习按照人的棋谱下棋，然后学到一定程度，再自己跟自己下。

相关阅读

深度强化学习系列之(3): ADS软硬件分析及DRL在Torcs中

DRL在ADS中的分析与应用举例 1、DRL&ADS系列之（1）：强化学习概述 2、DRL&ADS系列之(2)：深度强化学习及DQN算法讲解 3、DRL&ADS系列之（3）:

分享到:

猜你喜欢

上一篇：SQL 使用 select * 的弊端
下一篇：并发(十六)：不要使用Thread.join()——并行变串行

栏目导航

推荐阅读

热门阅读