基于规则约束的深度强化学习智能车辆高速路场景下行驶决策期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于规则约束的深度强化学习智能车辆高速路场景下行驶决策

引用本文：	王新凯,王树凤,王世皓.基于规则约束的深度强化学习智能车辆高速路场景下行驶决策[J].汽车技术,2023(9):18-26.

作者姓名：	王新凯王树凤王世皓

作者单位：	1. 山东科技大学;2. 山东五征集团有限公司

基金项目：	山东省自然科学基金项目（ZR2019MF056）；

摘要：	针对强化学习算法下智能车辆训练中动作选择过程随机性强、训练效率低等问题，提出了基于规则约束和深度Q网络（DQN）算法的智能车辆行驶决策框架，将引入的规则分为与换道相关的硬约束和与车道保持相关的软约束，分别通过动作检测模块（Action Detection Module）与奖励函数来实现。同时结合竞争深度Q网络（Dueling DQN）和双重深度Q网络（Double DQN）对DQN的网络结构进行改进，并引入N步自举（N-Step Bootstrapping）学习提高DQN的训练效率，最后在Highway-env平台高速路场景下与原始DQN算法进行综合对比验证模型的有效性，改进后的算法提高了智能车辆任务成功率和训练效率。