tic_tac_toe
这是一项正在进行的工作。
目标:
探索软件过程如何从基本原理中学到如何解决问题空间。这是受到启发。但是,AlphaZero的学习过程是不透明的,这并没有扩大我对软件如何学习问题空间的了解。这个项目是一个过程,人类可以通过该过程理解计算机从第一原理中学习的方式。
侧边栏:
人们不会通过以下任何方式来学习井字游戏,国际象棋或围棋之类的游戏:
详尽研究规则,策略和战术
详尽地研究过往大师的所有精彩游戏
他们实际上所做的是学习足够的知识以开始玩第一款游戏,然后随着游戏的进行进行学