基于生成对抗网络的追尾事故数据填补方法研究 |
| |
引用本文: | 周备,张莹,张生瑞,周千喜,汪琴.基于生成对抗网络的追尾事故数据填补方法研究[J].交通运输系统工程与信息,2024(1):132-137+198. |
| |
作者姓名: | 周备 张莹 张生瑞 周千喜 汪琴 |
| |
作者单位: | 1. 长安大学,运输工程学院;2. 北京清华同衡规划设计研究院有限公司 |
| |
基金项目: | 国家自然科学基金青年科学基金(52102404);;中央高校基本科研业务费专项资金(300102343204)~~; |
| |
摘 要: | 深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追尾事故数据为研究对象,将原始数据按照7∶3随机分为训练集和测试集。在训练集数据上,利用生成式插补网络(Generative Adversarial Imputation Network, GAIN)实现对缺失数据的填补。为对比不同数据填补方法的效果,同时选择多重插补(Multiple Imputation by Chained Equations, MICE)算法、期望最大化(Expectation Maximization, EM)填充算法、缺失森林(MissForest)算法和K最近邻(K-Nearest Neighbor, KNN)算法对同一数据集进行数据填补,并基于填补前后变量方差变化比较不同填补算法对数据变异性的影响。在完成数据填补的基础上,构建LightGBM三分类事故严重程度影响因素分析模型。使用原始训练集数据,以及填补后的训练集数据分别训练模...
|
关 键 词: | 城市交通 数据填补 生成对抗网络 追尾事故 LightGBM模型 |
|
|