首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
基于数据驱动的交通事故自动检测对道路事故的及时救援与降低事故影响具有重要作用。为解决道路交通事故自动检测中的样本不均衡问题,研究了混合自适应过采样技术与极限梯度提升树算法的交通事故自动检测方法(ADASYN-XGBoost)。其中,为从不均衡的交通事故样本中有效挖掘数据的时空特征与事故发生之间的内在关联规律,构建了初始特征变量组合,引入自适应合成过采样方法(adaptive synthetic oversampling method,ADASYN)来平衡事故类与非事故类的样本数量,以增强训练数据的质量;其次,为提高检测效果,构建了基于XGBoost的交通事故检测模型,利用该模型对增强后的数据样本进行特征筛选;最后,为获取最佳参数组合,采用了贝叶斯优化算法对XGBoost进行参数的快速标定。本文使用波特兰高速公路数据集对ADASYN-XGBoost方法进行模型验证与实证研究。结果表明:与先进的基准模型相比,ADASYN-XGBoost的各项检测指标均最优,其F1分数达到94.47%且误检率低至8.95%。在模型训练样本数为2800,500(18%的初始样本量),150(5%的初始样本量)...  相似文献   

2.
交通拥挤识别实质上是一种不平衡分类问题,通过解决不平衡分类问题,在数据层面对原始数据集进行重采样,并采用不同的采样倍率进行向上和向下采样,降低数据集类间不平衡程度,从而提高拥挤类识别精度.选取南京市虎踞路(主干道)某一路段作为研究对象,调查获得7:30-9:00交通流数据,并在此基础上,通过vissim软件仿真得到更多数据.借助weka软件平台运用朴素贝叶斯分类器进行分类试验,并对检测结果对比分析,结果表明重采样方法在对总体识别率影响较小的情况下,能够提高拥挤类的识别率.  相似文献   

3.
针对现有研究多基于病例对照的欠采样方法,即每起事故从连续交通流数据中按一定比例抽取对照的非事故数据构建模型,而该类模型在连续数据环境中的预测精度存在缺陷的状况,对城市交通连续观测并动态调控的技术环境(简称连续数据环境)开展道路交通事故风险预测模型构建研究。首先提出基于全样本交通流数据,结合“调整事故分类阈值”的方法解决事故风险预测研究中的非平衡数据分类问题;而后采用上海市城市快速路2014年5,6月的线圈检测交通流数据及历史事故数据开展实证研究,以受试者工作特征曲线下面积为评价指标,对比基于全样本和抽样样本构建的常用事故风险预测模型(逻辑回归、随机森林)的整体预测能力;以灵敏度和特异度的几何均数为评价指标,对比3种分类阈值计算方式(约登指数法、事故占比法和交叉点法)对事故/非事故综合预测精度的影响。结果表明:在连续数据环境下,采用全样本数据建模能使模型整体预测能力提高13.06%;基于约登指数法进行分类阈值计算可使模型的事故/非事故综合预测精度最佳。  相似文献   

4.
随着上海市规划建成区不断向郊区扩大,原有的二级公路很多转变为过境和集散功能兼具的城镇化道路。现收集了2017年上海市33条典型二级公路的历史事故数据和路段基础设施数据,对事故率进行了负二项分布拟合,拟合通过了K-S检验,以事故率为初始因变量,道路基础设施属性为变量,构建二级公路事故预测模型。将事故率进行风险等级划分作为最终因变量,构建事故风险等级预测模型。该模型训练集预测整体准确率为90.3%,测试集预测准确率为89.3%。通过模型结果对上海市二级公路事故致因进行分析,发现:路面宽度、人非隔离形式、机非隔离形式、接入口密度和机非分隔带开口密度对事故风险有显著的影响,应作为设计和管理中的控制对象。  相似文献   

5.
为解决不同类型的地铁施工事故关键致因识别,以便于支持事故相关方在风险分析、预防和控制进行决策的问题。在收集国内2011—2021年间发生的202起事故报告数据的基础上,采用树增强朴素贝叶斯(tree augmented naive, TAN)和EM算法,从事故经过、直接原因、间接原因3个角度分别对事故报告进行统计处理、风险指标提取及合并、风险指标筛选、模型图形结构构建、模型参数确定,并采用GENIE软件训练数据建立最终分析模型。贝叶斯模型分析结果表明: 1)通过正向推理明确不同类型事故的关键致险因素,并对各风险因素引发事故的总体影响程度进行重要度排序; 2)通过反向诊断说明所建模型在不同风险因素组合情境下对风险预测的决策支持作用; 3)10折交叉验证证实了模型的有效性。  相似文献   

6.
通过深入的事故数据分析,研究行人在与不同类型乘用车碰撞中的AIS 3+伤亡风险,采用仿真分析研究乘用车前部结构对行人损伤和致伤因素的影响。以市场上的128款乘用车作为样本,比较了轿车、运动型多功能车和微型厢式车前部结构的主要几何尺寸;基于详尽的行人事故数据,统计分析了各类乘用车-行人事故中的损伤分布和严重性,确定了车辆碰撞速度与行人伤亡风险的关系;利用多体动力学模型,分别在20、40和60km/h的碰撞速度下比较了不同车型的行人头部碰撞条件。结果表明:乘用车前部几何形状对行人头部动力学响应和损伤风险都有显著影响。研究结果可为不同类型乘用车更好地制定行人保护措施提供一定的理论依据。  相似文献   

7.
为了进行山区高速公路追尾事故预测并识别追尾事故突出诱导因素,在对两车追尾事故进行类别划分并确定出典型两车追尾事故的基础上,分析了典型两车追尾事故的事故率与线形指标、车速差、大型车混入率、交通量等单一因素间的相关关系。鉴于单一因素与追尾事故率间的关系不能准确描述追尾事故发生规律的缺陷,建立了线形与交通状态组合条件下的追尾事故次数负二项分布预测模型,并给出了模型变量弹性系数计算方法,用以确定追尾事故的突出诱导因素。研究结果表明:基于线形与交通状态的追尾事故负二项分布预测模型能够对追尾事故进行准确预测,利用弹性系数计算方法确定出车速差、年平均日交通量(AADT)以及竖曲线半径为典型两车追尾事故的突出诱导因素。  相似文献   

8.
连续长大下坡路段安全问题突出,大型重载货车失控事故频现,在对连续长大下坡路段交通事故数据和道路设计指标调查的基础上,分析了连续长大下坡路段交通事故特性与车辆运行特性,分析了平曲线半径与事故率的关系,运用数理统计方法建立了平均纵坡与事故率的回归模型.分析结果表明,连续长大下坡路段的事故原因是不同车型间速度差过大,部分车头间距不满足80 km/h的停车视距要求,平曲线曲率越大、平均纵坡越大事故率越高.  相似文献   

9.
为了提高面向不平衡数据集的交通事件检测综合性能,提出了两种基于GA启发式抽样方法的交通事件检测算法.基于GA的实例选择抽样方法(GA-IS),解决非启发式抽样方法人为设定抽样率导致的检测效果不稳定问题.基于GA的支持向量选择抽样方法(GA-SS),改善学习集数据量较大时的检测效率.实验采用新加坡AYE仿真数据库,以支持向量机作为分类器进行事件检测.结果表明,基于遗传算法实例选择抽样的检测模型检测率达到94%,平均检测时间为1.413 3 min,性能指标PI为0.157;基于遗传算法支持向量选择抽样的检测模型决策时间为4.55 s,综合性能最优,其PI为0.151;基于少数类过抽样算法(SMOTE)的检测模型决策时间为35.21 s,PI为0.329,与非启发式抽样方法相比,所提方法能有效改善面向不平衡数据集的事件检测综合性能.   相似文献   

10.
针对交通事故数据中人员伤亡严重程度的不平衡性,本文结合采样方法以及类别组合方法,改善数据的不平衡性,提高其在机器学习算法中的预测效果。本文首先分别使用了随机过采样、随机欠采样、Smote(Synthetic Minority Over-sampling Technique)采样算法对数据进行处理,然后使用三种分类算法,即决策树、随机森林和adaboost,对事故严重程度进行预测,并采用类别准确率以及几何平均值作为评价指标对比分析分类算法的性能。此外,本文还对五分类问题转变为三分类问题进行研究。结果表明,采样算法可以显著提高不平衡事故数据中少数类的预测准确率;在五分类问题中,使用随机森林和随机欠采样的组合预测效果最优,该组合在三分类的交通事故严重程度预测中也取得了最优的效果。  相似文献   

11.
近年来,高速公路事故发生率高居不下.同时,对于高速公路而言,其交通流检测器安装又较为普遍.因此研究如何深入挖掘交通流检测数据以实现对高速公路事故风险实时预测很有必要.基于美国加州2012年发生事故最多的4条高速公路I5,I10,I405和I15的全年事故数据和交通流数据,以病例对照基本思路选取事故组和对照组数据,选定交通流数据研究范围,并选用ADASYN算法处理不平衡数据集问题.基于随机森林模型,利用事故发生前10~40 min内的事故地上游4个检测器、下游2个检测器的3种基本交通流数据构建高速公路实时事故风险模型,事故预测准确率可达到88.02%.选取重要性前十的变量作为事故重要诱导因素,对事故重要诱导因素进行调值,将调值后的测试集放入之前构建的随机森林模型进行分类预测,结果显示减少了41.82%的事故,故可认为利用事故重要诱导因素可进行事故先兆预警工作,从而减少事故的发生.   相似文献   

12.
管浩  刘维  王峰  赵华菁  张功  张高海 《隧道建设》2022,42(Z1):331-341
为解决地铁盾构隧道施工引起的地表沉降预测过程中数据样本不足、对数据预处理较为粗糙的问题,选取北京地区32个地铁盾构隧道施工引起的地面沉降数据作为数据库,采用合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)算法对数据库进行扩增,并在此基础上选取BP神经网络(back propagation, BP)、随机森林(random forest, RF)、支持向量机(support vector machine, SVM)和K近邻(K-nearest neighbor, KNN)4种机器学习模型对沉降进行预测分析。分析结果表明: 1)经过预处理后的数据集预测能力显著增强,其中,KNN模型表现最佳,测试集平均绝对误差仅为1.60 mm; 2)采用KNN模型对北京轨道交通12号线西坝河—三元桥区间地层沉降进行预测,基于该模型预测值的Peck公式与实测值拟合度较高; 3)基于数据增强下的KNN模型对于盾构施工引起的地面沉降变形有良好的预测效果。  相似文献   

13.
深入理解高速公路的事故影响因素是进行安全改善的基础.单车(SV)和多车(MV)事故的发生机理不同,2类事故在空间分布上也存在显著差异,需要分别分析道路几何设计、交通运行和2类事故数的关系.数据异质性导致不同路段上同一变量对事故数的影响不一致的情况存在,仅通过事故分类难以解决,有限混合建模技术通过分组且允许各组数据服从不同分布来捕获数据的异质性.事故数据建模表明,单车、多车事故的影响因素有显著差别,后者的影响因素更复杂.将研究路段分为2组的有限混合模型最优,单车事故模型中划分的2组路段在纵坡变化值上有显著差异,纵坡变化值较小的1组中,随着中央分隔带变窄和大车比例减小,事故数增加;另1组中2个变量对事故数则无显著影响.多车事故模型中划分的2组路段在缓和曲线长度上有显著差异,缓和曲线较短的1组中,随着平曲线半径减小和竖曲线比例增大,事故数增加;另1组中随着变量的变化事故数减少.   相似文献   

14.
室内移动机器人是近年来研究的热点问题,同步定位与建图技术更是移动机器人的关键技术之一。为此文章设计了基于机器人操作系统(ROS)智能车的同步定位与建图系统,以Gmapping为核心算法,首先采用电机编码器构建的里程计对单线激光雷达的每帧数据进行运动畸变补偿,以运动畸变补偿后的激光雷达数据和里程计数据作为Gmapping算法输入;然后通过Gmapping算法粒子初始化,构建考虑观测量的提议分布并对粒子进行采样以估计智能车位姿,以重采样重要性系数对粒子进行重采样并设置重采样阀值,利用二值贝叶斯滤波器对每个粒子的地图状态更新;最后基于Gmapping算法输出智能车的位姿估计和地图数据。试验结果表明,所设计的同步定位与建图系统,在小尺寸环境下对智能车位姿估计和构建的地图较为准确,满足设计目标要求。  相似文献   

15.
交通流不同状态在实际中出现的频率存在很大差异,且不同交通状态之间的误判所造成的影响程度是不同的。因此,可以认为交通状态判别是一个类不平衡及代价敏感的分类问题。本文通过分析交通状态的类不平衡特性,结合了少数类样本合成的过采样技术和阈值移动方法,在给定的代价敏感矩阵引导下,对训练样本集进行过采样和对神经网络输出值进行阈值移动,并得到最终的判别结果。通过对广深高速公路上采集的数据进行测试,实验结果表明,所提出算法可以有效降低拥堵和缓慢状态的误判率。  相似文献   

16.
以实时采集的乘用车行驶数据为数据源,进行了城市道路汽车行驶工况构建方法的研究。分别运用运动学片段分析法、主成分分析法和K均值聚类分析法对实测数据进行降维和分类,提出以Silhouette函数实现对聚类结果的筛选,以减少人为选择的误差,并根据聚类中心的大小筛选所需运动学片段构建候选工况。在目标代表工况的遴选方面,提出了综合6个特征参数和最大SAFD差异值的评价标准。最后通过试验验证了该行驶工况构建方法的有效性和精确性。  相似文献   

17.
姚锐  王俊骅 《上海公路》2023,(3):116-120+125+219-220
针对城市道路开展高风险点位的判别和筛查,是交通安全改善工作的重要内容。以上海市为例,基于手机导航定位数据,提取了急减速事件、急加速事件、平均速度、速度变异系数和拥堵指数五种替代安全指标,进而分别构建了基于零截尾负二项的事故频率预测模型和基于多元logit的事故严重程度预测模型,可有效识别出城市道路交通高风险点位。模型具备较高的准确率和可解释性。该方法可为精细化的城市道路交通安全治理提供有效的技术支撑。  相似文献   

18.
成南高速公路交通事故特性研究   总被引:1,自引:0,他引:1  
79~80 km等几个路段是成(都)南(充)高速公路第二辖区典型的交通事故黑点,114~120 km路段是事故发生的密集区域;周五发生的事故最多,周一次之,7月~9月是事故的高发月份;大、中型货车的事故率最高,乘用车次之,微型、轻型货车的事故率最低;除雾天外,雨天发生事故的概率最大,阴天次之,晴天最低。辖区内主要是单车事故,以碰撞固定物为主,多车事故主要以追尾碰撞为主。追尾碰撞占事故总数的比例为16.4%,但造成的伤、死亡人数均超过总数的60%以上。论文还结合"人、车、路和环境"等因素分析了事故成因,提出了相应的控制策略。  相似文献   

19.
根据乌鲁木齐市2006~2010年的交通事故统计资料,分别以城市道路中9类不同的交通事故形态为因变量,从道路设施、道路环境等方面选取了9个因素作为自变量,通过二项logistic模型进行事故形态分析,建立事故形态与9个影响因素间的线性相关模型,对模型参数进行了估计,并对模型的拟合程度、可靠性进行了分析,研究了所有自变量单独/组合等不同情况下对因变量的影响。再通过多项Logistic模型对不同道路条件下,各种形态的事故发生几率进行了预测,并与实际情况进行对比,检验了模型拟合效果。   相似文献   

20.
为了识别高速公路事故黑点,基于历史交通事故数据,建立贝叶斯时空交互模型,估计高速公路路段事故率和超常事故率.根据其后验期望序号对路段安全性进行排序,将排序靠前的一定比例路段判定为事故黑点.利用该方法对广东开阳高速公路进行事故黑点判别,并与基于贝叶斯层级泊松模型的黑点判别结果进行对比.结果表明,时空交互模型和层级泊松模型的事故路段排序结果存在显著差异.以事故率为安全评价指标时,2个方法判别的事故黑点中有73%相同;以超常事故率为安全评价指标时,2个方法判别的事故黑点中仅有20%相同.这与类似研究的结论一致,体现了解析时空关联和交互对事故黑点判别的重要性.另外,还对比了基于评价指标后验期望序号和后验均值的事故路段排序序号.结果显示二者的一致性较高.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号