摘 要: | 机场出现航班延误会导致飞行器和乘客滞留机场,若航班延误恢复调度不当会扩大延误造成的损失。针对航班延误恢复调度的损失最小化问题,设计了延误总损失计算的目标函数,构建航班延误恢复马尔科夫决策过程,建立了机场航班延误恢复重排班模型。为了解决计算的复杂性问题,采用深度学习神经网络参数化策略函数对减小延误损失目标函数值的策略进行参数化,利用奖励函数和优势函数对其进行训练,提出了一种机场航班延误恢复强化学习算法。研究结果表明:该算法能够将航班延误总损失降低7.83%,将旅客延误时长降低7.23%,相比于其他算法,该算法在时间和性能上均取得优势。
|