基于深度强化学习的自适应交通信号控制研究 |
| |
引用本文: | 徐建闽,周湘鹏,首艳芳.基于深度强化学习的自适应交通信号控制研究[J].重庆交通大学学报(自然科学版),2022(8):24-29. |
| |
作者姓名: | 徐建闽 周湘鹏 首艳芳 |
| |
作者单位: | 1. 华南理工大学土木与交通学院;2. 华南理工大学广州现代产业技术研究院 |
| |
基金项目: | 国家自然科学基金面上项目(61873098);;广东省自然科学基金项目(2018A030313250);;广东省科技计划项目(2016A030305001); |
| |
摘 要: | 为了提高交通控制算法的适应性和鲁棒性,缓解城市交通拥堵,提出了一种改进的D3QN(dueling double deep Q-network, D3QN)自适应信号控制方法。首先对几种强化学习自适应控制模式进行分析,然后在固定步长动作模式的基础上提出了不定步长动作模式,并构造了一种基于空间占有率的奖励函数;最后使用Sumo软件,对中山市东区街道某交叉口分别在稳定流和随机流场景下进行仿真。仿真结果表明:该方法具有良好的收敛性,有效地降低了延误时间和排队长度。
|
关 键 词: | 交通工程 交通仿真 自适应控制 交通流 深度强化学习 |
|