基于逆向强化学习的铁路线路方案优选研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于逆向强化学习的铁路线路方案优选研究

引用本文：	马青松,朱颖,高天赐,罗圆,何庆,王平.基于逆向强化学习的铁路线路方案优选研究[J].铁道建筑,2023(7):1-7.

作者姓名：	马青松朱颖高天赐罗圆何庆王平

作者单位：	1.西南交通大学土木工程学院610031;2.西南交通大学高速铁路线路工程教育部重点实验室610031;3.中国中铁股份有限公司100039;4.中铁二院工程集团有限责任公司610031;

基金项目：	国家自然科学基金(U1934214,51878576)。

摘要：	铁路线路方案评价及比选多采用组合赋权法,其主观赋权过程计算冗杂。选取具备一定程度普适性的专家案例,采用最大熵逆向强化学习方法从专家案例中学习主观赋权“知识”,得到专家案例隐藏的“奖励”,从而获取可解释性的主观权重。将此主观权重与离差法所得客观权重组合并投入后续TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)评价流程,对线路方案进行最终评价。结合具体实例,建立设计阶段绿色铁路的评价指标体系。结果表明:该方法可以有效计算铁路线路方案评价的量化指标,减小现有赋权方法的计算复杂度,取得较好的评价效果,与真实案例比选结果一致。通过讨论该方法的适用性、局限性及原因,确定该方法在初步评价和泛用性评价中的定位。
关键词：	铁路选线方案决策评价模型最大熵逆向强化学习 TOPSIS 绿色铁路
本文献已被维普等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏