© 1999-2048 dssz.net 粤ICP备11031372号
[深度学习] 通过深度强化学习的交通信号时间
说明: 通过深度强化学习的交通信号时间,IEEE最新文章 .打造交通信号控制的强化学习系统 如果把由信号机、检测器等组成的交通信号控制系统当成一个“智能体”,将我们目睹的人车路当成“环境”,通过如下方式就可以构造强化学习系统:传感器从环境里获取观测状态(例如:流量、速度、排队长度等),传递给信号机,信号控制系统根据这些状态来选择一个得分最高状态的动作来执行(例如:当前相位保持绿灯或者切换成红灯),并对执行效果进行回馈(例如:采用排队长度作为回报函数),系统根据回报结果,调整打分系统的参数。这样就形成一<zyk1060513882> 在 上传 | 大小:930816