首页 | 本学科首页   官方微博 | 高级检索  
     检索      

平衡主线和匝道交通运行的强化学习型匝道控制研究
引用本文:章立辉,余宏鑫,熊满初,胡文琴,王亦兵.平衡主线和匝道交通运行的强化学习型匝道控制研究[J].重庆交通大学学报(自然科学版),2023(4):87-97+107.
作者姓名:章立辉  余宏鑫  熊满初  胡文琴  王亦兵
作者单位:1. 浙江大学建筑工程学院智能交通研究所;2. 浙江大学建筑设计研究院有限公司;3. 浙江大学平衡建筑研究中心
基金项目:国家重点研发计划项目(2018YFB1600500);;浙江省重点研发计划项目(2021C01012);
摘    要:考虑合流区域主线和匝道的交通流运行状态,提出了一种基于深度强化学习的鲁棒自适应匝道控制模型——DRLARM模型。根据交通流运行特征,构造了平衡主线交通效率和匝道排队长度的强化学习奖励函数;为适应动态变化的交通环境,采用多交通流场景混合训练控制模型,在不同拥堵成因、不同拥堵时长、不同需求分布等测试场景下开展仿真实验,对比分析了无控制及DRLARM、ALINEA和PI-ALINEA模型控制的车辆平均行程时间A、车道占有率o、匝道排队长度W和匝道损失时间比P等评价指标。研究表明:DRLARM模型控制的平均行程时间A相比无控工况节省了22%,略好于ALINEA模型,与PI-ALINEA模型控制效果相当;DRLARM模型在不同测试场景下产生的匝道损失时间比P较稳定,匝道排队长度W绝对值相较于ALINEA模型和PI-ALINEA模型均缩短了约16%;深度强化学习方法兼顾了通行效率和路权公平性,训练所得DRLARM模型在动态交通条件下表现出良好的鲁棒性。

关 键 词:交通工程  自适应匝道控制  深度强化学习  高速公路  匝道排队管理  鲁棒性
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号