首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于监督机制的城市交通信号多智能强化学习控制方法
引用本文:张轮,张希雨,夏凡,赵文文.基于监督机制的城市交通信号多智能强化学习控制方法[J].交通与运输,2020,36(4):86-91.
作者姓名:张轮  张希雨  夏凡  赵文文
作者单位:同济大学 道路与交通工程教育部重点实验室,上海 201804;同济大学 道路与交通工程教育部重点实验室,上海 201804;同济大学 道路与交通工程教育部重点实验室,上海 201804;同济大学 道路与交通工程教育部重点实验室,上海 201804
摘    要:在城市交通环境下,通过分析控制方法灵活性与稳定性的关系,提出一种考虑网络稳定性的多智能体强化学习控制方法。该方法将稳定状态引入信号控制决策模块,建立稳定规则库,在基本多智能体强化学习控制系统上,设置了一套独立运行的稳定监督装置,对违反稳定规则的控制策略进行校正,以约束控制方法灵活性的方式提升其稳定性,以监督控制的形式实现了多智能体强化学习控制。在时变交通流场景下,以典型路网进行VISSIM仿真试验。结果表明:基于稳定监督控制的多智能体强化学习控制方法提高了算法的运行效率,同时保证了控制效果,适用于复杂交通网络。

关 键 词:交通工程  交通信号  多智能体强化学习  Q学习  网络稳定性  监督机制
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号