Mastering the game of Go without human knowledge 本

文件名称: Mastering the game of Go without human knowledge

所属分类: 机器学习

开发工具:

文件大小: 2mb

下载次数: 0

上传时间: 2017-10-19

提供者: pier*****

下载 (2mb)

不能下载？报告错误

详细说明：本文为英文版完整论文。论文摘要翻译：长期以来，人工智能算法的目标就是让机器能够学习，在具有挑战性的专业领域，从婴儿般的状态（没有经验、知识基础）发展到超人类的级别。近期，AlphaGo成为了首个打败人类围棋世界冠军的程序。AlphaGo中的树形检索（tree search）可以利用深度神经网络评估棋局并进行落子，甚至能通过自我对弈实现强化学习（reinforcement learning）。本文（nature24270）介绍一种纯粹基于强化学习的算法，无需人类数据、指导或者超出游戏规则的专业知识。AlphaGo成为了自己的老师：建立了一个神经网络来预测AlphaGo的落子选择和比赛胜负方。这个神经网络强化了树形检索的能力，求解了更优的落子选择，并为下一次迭代提供了更强的自我对弈。从“婴儿”开始，我们的新程序AlphaGo Zero表现出了超越人类的“才能”，面对旧版AlphaGo——冠军终结者，战绩是100（胜）-0（败）。 ...展开收缩

(系统自动生成,下载前可以参看下载内容)