基于监督机制的城市交通信号多智能强化学习控制方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于监督机制的城市交通信号多智能强化学习控制方法

引用本文：	张轮,张希雨,夏凡,赵文文.基于监督机制的城市交通信号多智能强化学习控制方法[J].交通与运输,2020,36(4):86-91.

作者姓名：	张轮张希雨夏凡赵文文

作者单位：	同济大学道路与交通工程教育部重点实验室,上海 201804;同济大学道路与交通工程教育部重点实验室,上海 201804;同济大学道路与交通工程教育部重点实验室,上海 201804;同济大学道路与交通工程教育部重点实验室,上海 201804

摘要：	在城市交通环境下,通过分析控制方法灵活性与稳定性的关系,提出一种考虑网络稳定性的多智能体强化学习控制方法。该方法将稳定状态引入信号控制决策模块,建立稳定规则库,在基本多智能体强化学习控制系统上,设置了一套独立运行的稳定监督装置,对违反稳定规则的控制策略进行校正,以约束控制方法灵活性的方式提升其稳定性,以监督控制的形式实现了多智能体强化学习控制。在时变交通流场景下,以典型路网进行VISSIM仿真试验。结果表明:基于稳定监督控制的多智能体强化学习控制方法提高了算法的运行效率,同时保证了控制效果,适用于复杂交通网络。
关键词：	交通工程交通信号多智能体强化学习 Q学习网络稳定性监督机制
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏