首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为充分利用交通数据低秩特性与局部近邻关系,准确恢复交通数据采集系统中的缺失数据,首先,应用基于核范数的低秩矩阵补全模型对交通数据矩阵进行预插补,以获得缺失值的初始估计,基于此,构建表征数据局部近邻结构的图模型;然后,提出融合图正则化和Schatten-p范数最小化的交通数据缺失值恢复模型;进一步,提出基于交替方向乘子框架的优化算法,求解缺失值恢复的最优化问题,得到最终的数据恢复结果;最后,用实际的高速公路交通流量和速度数据比较多种方法的恢复误差,同时给出所提方法的参数敏感性分析. 实验结果表明:在完全随机缺失、随机缺失和混合缺失模式下,缺失率为10% ~ 50%时,相比于局部最小二乘、概率主成分分析和低秩矩阵补全等方法,基于图正则化和Schatten-p范数最小化的算法恢复误差降低了3.02% ~ 28.49%.   相似文献   

2.
深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追尾事故数据为研究对象,将原始数据按照7∶3随机分为训练集和测试集。在训练集数据上,利用生成式插补网络(Generative Adversarial Imputation Network, GAIN)实现对缺失数据的填补。为对比不同数据填补方法的效果,同时选择多重插补(Multiple Imputation by Chained Equations, MICE)算法、期望最大化(Expectation Maximization, EM)填充算法、缺失森林(MissForest)算法和K最近邻(K-Nearest Neighbor, KNN)算法对同一数据集进行数据填补,并基于填补前后变量方差变化比较不同填补算法对数据变异性的影响。在完成数据填补的基础上,构建LightGBM三分类事故严重程度影响因素分析模型。使用原始训练集数据,以及填补后的训练集数据分别训练模...  相似文献   

3.
针对现阶段手机信令数据难以适用城市复杂出行环境,无法有效区分密集路网下机动化出行方式,本文提出一种考虑路径精准拟合与多维时空特征的双层识别模型。在出行路径识别层面,Savitzky-Golay(S-G)滤波能有效平滑信令数据相对实际出行路径的波动,线性插值算法能弥补信令数据时空缺失。在出行方式识别层面,探究了识别路径相似度、出行时间相似度、加速度、小波速度等关键因素,利用K-临近算法识别公交、小汽车。结果表明:本文提出方法能有效细分城市密集路网环境下的公交与小汽车出行,识别准确度分别达到88.29%和82.28%。在不同出行距离、出行时段、拥挤状态、道路等级、道路类型及识别路径相似度等角度,识别效果均优于随机森林等算法。研究支撑了基于信令数据的出行特征精准挖掘,为道路规划建设,公交线网规划等提供重要基础。  相似文献   

4.
为探究城市群多模式交通系统异常状态的影响范围,从需求端非常态客流变化和供给端运输能力下降两方面对多模式交通系统异常环境进行分类,提出了基于手机信令数据、意向出行调查及客票信息等多源数据的异常状态影响范围识别流程和分析方法;以京津冀城市群为例,确定强链接枢纽间通道客流动态安全阈值,提出了基于贝叶斯预测的通道客流异常检测方法;利用提升度、余弦相似度及其标准化值来区分枢纽关联规则的有效性,提出了基于强关联规则确定异常状态影响范围的方法。研究表明:基于贝叶斯预测的通道客流异常检测方法具有实时性,提高了客流安全阈值精度;基于实际手机数据和假定异常情况下的意向调查数据并结合关联规则确定枢纽影响范围,可为利用数据挖掘技术分析突发异常状态的影响和对策提供借鉴。  相似文献   

5.
为解决在利用灰色理论建模中,出现的数据缺失问题,本文提出综合利用SPSS软件的缺失值处理模块和稳健估计模块,针对数据的缺失机制进行处理的方法。使用该方法对缺失数据进行处理,以保证模型能够正常进行数据拟合。本文还利用了SPSS软件对某一实例中的缺失值进行了估计,并对缺失值填充后的结果进行了评价。  相似文献   

6.
针对船舶自动识别系统(Automatic Identification System,AIS)在实际应用中存在错误数据频发、数据丢包等问题,本文提出一种基于秩最小化矩阵去噪的船舶轨迹重构方法,利用去噪实现轨迹重构,同时,实现对轨迹的去噪和缺失补全。该方法通过线性插值实现经度对齐,将轨迹数据转化为轨迹矩阵,从而补全轨迹中的缺失值。由于补全结果存在非常大的误差,因此,引入 PLR(Patch-Based Low-Rank Minimization)算法去噪,消除误差。同时,为进一步提升补全效果,通 过2D-VMD(Two-Dimensional Variational Mode Decomposition)算法将矩阵分解为不同频率的IMF (Intrinsic Mode Function),并分别进行PLR去噪,合并去噪结果,得到最终重构后轨迹。本文以长江武汉段水域船舶AIS轨迹为研究对象,通过实验证明该方法在不同缺失比例以及随机缺失和连续缺失两种情境下具有鲁棒性和较强的稳定性;并与 HALRTC(High-Accuracy Low-Rank Tensor Completion)、TRMF(Temporal Regularized Matrix Factorization)等方法进行比较,结果表明, 该方法相较于HALRTC等方法具有更高的精度,并在高损失率下表现出较好的重构效果。  相似文献   

7.
依据数据的几何形态来推断变量间函数关系的原理和Fuzzy嵌入文法概念,提出以数据曲线特征为依据的商务数据识别及处理方法.该模式识别方法中,特征重心是在赋予原始数据不同特征度条件下实现的,更接近人为表述数据曲线的心理特征,适应于商务数据的预处理.同时重点讨论了处理商务数据过程中的W eb数据挖掘及有关的可行方法.  相似文献   

8.
应用相关性理论, 研究了交通流数据中缺失值与其他数据的相关性, 对与缺失值不同相关性的数据给予不同的权重值, 提出了基于交通流时空相关权重的重构算法, 并以北京市二环快速路为研究对象, 运用VISSIM仿真软件建立仿真模型, 利用仿真数据对新算法和现有算法进行了对比分析。研究结果表明: 在连续缺失1~10个数据时, 模型1的重构值与仿真值平均相对误差最大仅为1.8766%, 一般情况下, 平均相对误差均在1.0000%以下, 可见, 模型1算法优于现有的重构算法。  相似文献   

9.
为探究天气和道路等特征,以及交通流、天气、道路及时间等多维动态特征之间的交互作用对实时事故风险预测模型精度的影响,本文基于京哈高速公路北京段的事故数据,以及匹配的交通传感器数据、天气数据和道路特征等,构建4个数据集,分别为只包含交通流变量,包含交通流变量、天气及时间特征变量,包含交通流变量、道路及时间特征变量,包含交通流变量、天气、道路及时间特征变量。从考虑多维动态特征的交互效应出发,基于深度交叉网络,提出一种新的实时事故风险预测模型。结果显示,本文所构建的深度交叉网络模型比其他几种实时事故风险预 测方法显示出更高的精度。模型的AUC值(Area Under Curve)可达0.8562,在0.2的概率阈值下, 可以正确分类84.26%的非事故数据和77.55%事故数据。结论表明,本文采用的多维动态特征交互样本条件下的深度交叉网络模型能够有效地预测高速公路交通事故,可为我国高速公路安全管理部门提供理论与技术支持。  相似文献   

10.
为研究沥青混合料在多因素环境下疲劳性能的变化趋势,提出一种基于MATLAB软件的优化神经网络预测模型,结合帝国竞争优化算法(imperialist competitive algorithm,ICA)与径向基(radial basis function,RBF)神经网络的优势,构建ICA-RBF神经网络模型,采用拟合优度、平均相对误差、均方根误差分析RBF与ICA-RBF两种模型的预测结果,通过输出权值矩阵计算各影响因素的权重。在52组多变量因素实验数据中随机选取12组样本对模型进行检验,结果表明:ICA-RBF优化模型拟合优度为0.97,与RBF模型相比,ICA-RBF模型更稳定,且整体精度也较高。  相似文献   

11.
提出了一种低秩矩阵补全的改进方法以研究道路交通量数据缺失值插补问题。应用基于核范数的低秩矩阵补全对交通量数据矩阵中的缺失值进行第1轮插补; 通过层次聚类算法将交通量数据划分为不同类别, 使得同类中的数据具有较强相关性, 异类中的数据具有较弱的相关性; 在每类样本上应用低秩矩阵补全得到缺失值的第2轮插补; 为了减少聚类数的影响, 提出最小二乘回归集成学习方法将不同聚类数下的插补结果进行融合, 得到最终的交通量数据插补结果; 用美国俄勒冈州波特兰市的交通量数据比较了5种方法的插补误差, 并分析了不同聚类数和距离度量方法的影响。研究结果表明: 在完全随机缺失模式下, 缺失率为10%~60%时, 其相对于传统的低秩矩阵补全模型的插补误差降低了5.93%~9.11%;在随机缺失和混合缺失模式下, 插补误差也分别降低了8.32%~9.55%和8.14%~9.20%;集成不同聚类数下的多个插补结果比单一聚类数下的插补误差降低2.62%~4.76%。可见, 在3种数据缺失模式下, 改进低秩矩阵补全方法降低了交通量数据的插补误差, 能有效提高插补后交通量数据的有效性。  相似文献   

12.
针对固定检测器在采集动态交通数据过程中易发生交通数据异常、数据缺失等问题,为实现故障数据有效识别及修复,提出了基于离群距离检测的故障数据识别算法及改进的DE-LSTM数据修复模型。利用时序数据的自身连续性,采用直接离群点定位和离群距离检测对故障数据进行有效识别。采用差分进化算法优化长短期记忆神经网络的隐含层神经元个数和初始学习率,并引入自适应控制策略改进传统DE算法中的变异因子、交叉因子,建立了基于改进差分进化算法优化长短期记忆神经网络的修复模型,并与固定阈值结合交通流机理、LSTM神经网络模型及DE-LSTM修复模型进行对比。实例验证结果表明:与固定阈值结合交通流机理法相比,离群距离检测算法识别率更为高效,改进的DE-LSTM模型具有良好的计算效率及修复性能。  相似文献   

13.
针对路网交通数据采集过程中,采集设备稀缺或故障等原因造成路网交通流量数据缺失问题,提出基于对称残差U型网络(Residual U-Net,RU-Net)模型的大规模路网交通流量数据修复方法.通过将路网交通流量数据网格化和时序通道化操作,构成可供卷积操作的张量数据格式;利用RU-Net编码解码能力,对交通流量数据进行编码;在解码过程中保持失真度较小,使模型学习到交通流量数据内部多因素耦合特性.通过残差学习使交通流量数据编码后的信噪比提升,压缩率降低,提升模型修复精度.实验结果表明,RU-Net模型能够利用交通流量特性学习历史和非故障采集点数据与待修复数据的映射关系,在不同数据缺失率,不同缺失模式下,高效地完成对大规模路网交通流量数据的修复.  相似文献   

14.
为了掌握长春市道路交通运行状态,通过提取出租车GPS信息作为长春市浮动车数据源,以长春市浮动车原始数据为基础,探讨浮动车数据采集与处理的方法,并与长春市现状道路模型进行地图匹配。通过拥堵感知数据分析和浮动车速度数据分析两种方法互相校验确定各等级道路阈值,对长春市路网速度进行时空特征分析。数据表明:除极端天气可能导致大面积、系统性拥堵外,长春市道路交通拥堵主要表现为局部时段和局部区域,并有扩散的趋势。此外,探讨了目前长春市浮动车数据的不足及下一步研究方向,为相关部门政策制定提供数据支撑和决策依据。  相似文献   

15.
探索性数据分析统计图在桥梁健康监测动态数据质量评估中已有广泛应用。为了减少人工观察统计图的主观性,通过近似度量方法实现统计图的量化分析,得到多个指标对监测数据进行快速质量评估。在运营环境激励作用下,桥梁结构动力响应具有短时线性平稳性,近似服从正态分布。以某大跨斜拉桥振动数据为研究对象,首先,绘制样本数据直方图和Q-Q图,通过观察数据分布特征预先判断数据质量,确定优、良和差3个等级。然后,分别通过KL散度和余弦相似度2种近似度量方法对样本数据直方图和Q-Q图进行量化,得到数据服从正态分布程度的指标;通过箱线图检测样本数据全局异常点,得到正常数据占比;统计分析得到量化值和先验质量等级的对应关系,确定以直方图KL散度和余弦相似度为主、以箱线图正常数据占比为辅的数据质量评估标准。最后,取部分数据为验证集,进一步验证所提方法各个指标的合理性,并给出该方法在实际工程上的应用结果。  相似文献   

16.
大规模道路交通数据网络轻量化可视化方法   总被引:1,自引:0,他引:1       下载免费PDF全文
为提高网络环境下大规模道路交通数据动态可视化效率,提出一种在网络环境下使用流光线表达交通态势的轻量化可视化方法. 首先,提出顾及道路属性的路网分层组织方法,并绘制在不同视角高度下的道路;然后,提出基于WebGL (Web graghics library)技术线段索引特点的多道路合并方法,并结合视域剔除以及多线程技术对场景进行优化,设计实现了支持道路拥堵状态实时变换的渐变、动态流光线等动画效果;最后,研发了原型系统,并以全国道路网数据为例进行案例实验与分析. 实验结果表明:在网络环境下进行大规模道路交通数据动态可视化,本文方法可视化帧率稳定在40帧/秒以上,相较于百度ECharts GL可视化方法提高了20~30帧/秒.   相似文献   

17.
完整的交通路网数据是实现智能交通系统的前提,故本文提出一种基于图自编码-生成对 抗网络的方法对路网中缺失数据进行修复。首先,通过降噪图变分自编码器提取路网缺失数据 的时空特征,使其能最大程度捕获原始路网信息;其次,基于该时空特征利用生成对抗网络生成 路网数据,加入重建损失并优化生成对抗网络的目标函数,实现对缺失数据的有效插补;最后,采 用西雅图(Seattle)和加州(PEMS04)路网速度数据集,针对不同缺失类型和缺失率下的数据修复进 行对比实验。当随机缺失率在 10% ~70%时,Seattle 数据集的 MAE 指标在 2.38~3.25 之间, PEMS04 数据集的 MAE 指标在 1.46~2.38 之间;当聚集缺失率在 10%~70%时,Seattle 数据集的 MAE指标在2.51~2.82之间,PEMS04数据集的MAE指标在1.52~1.54之间。对比结果表明,本文 提出的路网数据修复方法均优于BP、DSAE、BGCP等模型。  相似文献   

18.
高负荷驾驶任务下驾驶员注意力状态概率模型   总被引:2,自引:0,他引:2  
为研究高负荷驾驶任务下驾驶员注意力状态转移规律,应用更新过程理论构建了短时段注意力状态概率模型,并给出了近似求解方法.对于长时间连续驾驶,该模型在状态转移点处难以满足齐次性特征要求,可用时段分割法处理.用实际数据对模型进行了仿真实验.结果表明,模型整体误差为2.83%.  相似文献   

19.
为提高发动机故障诊断的正确率与精确度,提出遗传算法和BP神经网络相结合的故障诊断模型。将发动机部分尾气信息和传感器数据作为BP神经网络诊断模型的输入变量,利用遗传算法的全局搜索能力优化BP神经网络的初始权值和阈值,采用优化后的BP神经网络建立发动机故障的诊断模型。实验结果表明该诊断模型可提高发动机故障诊断的正确率。  相似文献   

20.
在充分考虑分类变量有序性的前提下,通过建立有约束的对数线性模型研究有缺失数据的双向有序方列联表的统计推断问题.给出基于模型的EM算法以处理双向有序方列联表的缺失数据,并给出了一个具体算例,结果表明研究的问题得到了较为完满的解决.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号