说明: 南京大学俞扬副教授在第二期《人工智能前沿讲习班》的报告完整PPT,内容包括强化学习的概念、主要算法类型和应用等,值得反复精读,目录如下: 一、介绍(Introduction) 二、马尔可夫决策过程(Markov Decision Process) 三、从马尔可夫决策过程到强化学习(from Markov Decision Process to Reinforce Learning) 四、值函数估计(Value function approximation) 五、策略搜索(Policy Sear
<zhuf14> 上传 | 大小:23mb