混合交通流环境下基于改进强化学习的可变限速控制策略期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

混合交通流环境下基于改进强化学习的可变限速控制策略

引用本文：	韩磊,张轮,郭为安.混合交通流环境下基于改进强化学习的可变限速控制策略[J].交通运输系统工程与信息,2023(3):110-122.

作者姓名：	韩磊张轮郭为安

作者单位：	1. 同济大学,道路与交通工程教育部重点实验室;2. 同济大学,电子与信息工程学院;3. 同济大学,中德工程学院

基金项目：	国家自然科学基金；;上海市自然科学基金~~；

摘要：	现有的可变限速(VSL)控制策略灵活性较差，响应速度较慢，对驾驶人遵从度和交通流状态预测模型的依赖性较高，且单纯依靠可变限速标志(VMS)向驾驶人发布限速值，难以在智能网联车辆(CAVs)与人工驾驶车辆(HDVs)混行的交通环境中实现较好的控制效果。对此，结合深度强化学习无需建立交通流预测模型，能自动适应复杂环境，以及CAVs可控性的优势，提出一种混合交通流环境下基于改进竞争双深度Q网络(IPD3QN)的VSL控制策略，即IPD3QN-VSL。首先，将优先经验回放机制引入深度强化学习的竞争双深度Q网络(D3QN)框架中，提升网络的收敛速度和参数更新效率；并提出一种新的自适应ε-贪婪算法克服深度强化学习过程中探索与利用难以平衡的问题，实现探索效率和稳定性的提高。其次，以最小化路段内车辆总出行时间(TTS)为控制目标，将实时交通数据和上个控制周期内的限速值作为IPD3QN算法的输入，构造奖励函数引导算法输出VSL控制区域内执行的动态限速值。该策略通过基础设施到车辆通信(I2V)向CAVs发布限速信息，HDVs则根据VMS上公布的限速值以及周围CAVs的行为变化做出决策。最后，在不同条件下验...
关键词：	智能交通可变限速控制改进竞争双深度Q网络混合交通流智能网联车辆深度强化学习

设为首页 | 免责声明 | 关于勤云 | 加入收藏