您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Numerical_TicTacToe_Agent_using_Reinforcement_Learning:建立一个学习弹奏数字井字游戏的RL(强化学习)代理。 代理通过Q-Learning学习游戏-源码

  2. 数值_井字棋_代理_使用_强化_学习 建立一个学习弹奏数字井字游戏的RL(强化学习)代理。 代理通过Q-Learning学习游戏。 游戏( 是最受欢迎和持久的游戏之一。 由于它的熟悉性,该游戏通常被用作数学决策过程的入门示例。 它的简洁性使其成为一个完美的游戏,可以说明思考前瞻和学习每个决策的结果所带来的收益。 井字游戏有多种变体。 最经典的是X和O,每个玩家都希望将他们的三个标记放在3x3网格的水平,垂直或对角线行中。 该游戏的另一个流行变体是数字井字游戏。 使用数字1到9代替X和O。
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:24117248
    • 提供者:weixin_42123296