drl
DRL: deep reinforcement learning
DRL = DL (deep learning) + RL (reinforcement learning)
大多数情况下,reward既不为正,也不为负,为0,导致RL非常难训练。
Alpha Go是监督学习+增强学习。在一开始,学习按照人的棋谱下棋,然后学到一定程度,再自己跟自己下。
相关阅读
深度强化学习系列之(3): ADS软硬件分析及DRL在Torcs中
DRL在ADS中的分析与应用举例 1、DRL&ADS系列之(1):强化学习概述 2、DRL&ADS系列之(2):深度强化学习及DQN算法讲解 3、DRL&ADS系列之(3):