© 1999-2048 dssz.net 粤ICP备11031372号
[机器学习] 微软亚洲研究院秦涛_强化学习PPT
说明: 近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。 该报告分为3个部分: 1、强化学习基础,包括: 马氏决策过程 Bellman方程 规划 最优控制 蒙特卡洛采样 TD算法 2、强化学习新算法,包括: 基于值函数的算法 基于策略函数的算法 基于两者的混合算法 3、强化学习所面临的挑战,如鲁棒性、样本效率等<zpf1002> 上传 | 大小:7mb