基于ADASYN-XGBoost的交通事故自动检测方法 |
| |
引用本文: | 陈俊宇, 李金龙, 许伦辉, 吴攀, 林永杰. 基于ADASYN-XGBoost的交通事故自动检测方法[J]. 交通信息与安全, 2023, 41(3): 12-22. doi: 10.3963/j.jssn.1674-4861.2023.03.002 |
| |
作者姓名: | 陈俊宇 李金龙 许伦辉 吴攀 林永杰 |
| |
作者单位: | 1.华南理工大学土木与交通学院 广州 510641;2.广东科技学院计算机学院 广东 东莞 510812 |
| |
基金项目: | 国家自然科学基金项目(52072130)资助; |
| |
摘 要: | 基于数据驱动的交通事故自动检测对道路事故的及时救援与降低事故影响具有重要作用。为解决道路交通事故自动检测中的样本不均衡问题,研究了混合自适应过采样技术与极限梯度提升树算法的交通事故自动检测方法(ADASYN-XGBoost)。其中,为从不均衡的交通事故样本中有效挖掘数据的时空特征与事故发生之间的内在关联规律,构建了初始特征变量组合,引入自适应合成过采样方法(adaptive synthetic oversampling method,ADASYN)来平衡事故类与非事故类的样本数量,以增强训练数据的质量;其次,为提高检测效果,构建了基于XGBoost的交通事故检测模型,利用该模型对增强后的数据样本进行特征筛选;最后,为获取最佳参数组合,采用了贝叶斯优化算法对XGBoost进行参数的快速标定。本文使用波特兰高速公路数据集对ADASYN-XGBoost方法进行模型验证与实证研究。结果表明:与先进的基准模型相比,ADASYN-XGBoost的各项检测指标均最优,其F1分数达到94.47%且误检率低至8.95%。在模型训练样本数为2800,500(18%的初始样本量),150(5%的初始样本量)时,ADASYN-XGBoost的F1分数分别为94.47%,88.89%,81.93%。在进一步的消融实验中,均衡正负样本后各基准模型的性能指标提高了2.68%~44.85%。本文提出的方法能够有效解决道路交通事故检测中的样本不均衡问题,同时也为道路交通安全预防与事故处理等提供了技术保障。
|
关 键 词: | 智能交通 交通事故自动检测 样本不均衡 自适应过采样技术 极限梯度提升树算法 |
收稿时间: | 2022-09-22 |
|
| 点击此处可从《交通信息与安全》浏览原始摘要信息 |
|
点击此处可从《交通信息与安全》下载免费的PDF全文 |
|