首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
AdaBoostSVM容易受到离群点的干扰从而影响到算法的泛化性能.离群点是不反映一般规律的数据点,当被错分的数据含有离群点时,AdaBoostSVM会不断地给离群点赋予很大的权重,进而影响到提升的分类准确率.针对这一问题,提出了RAdaBoostSVM算法,通过对权重过大的误分类样本用和它相邻近的几个样本的中心来代替,有效地减小了离群点对提升效果的影响.与AdaBoostSVM算法相比,RAdaBoostSVM对离群点更加稳健更适合于噪声条件下的分类问题.在基准数据集上的实验结果验证了算法的有效性.  相似文献   

2.
为改进传统K-means聚类算法受初始聚类中心及异常点影响较大的问题,提出使用离群点检测(LOF)改进的K-means聚类算法,并应用到交通事故的黑点识别中.使用数据集为2018年7月1日至2018年12月31日于美国洛杉矶发生的交通事故数据.首先,利用LOF对事故点坐标数据集进行离群点检测;其次,剔除掉原数据集中的离...  相似文献   

3.
权重是点群选取的重要依据,它反映了点要素在点群中的重要性程度.针对现有的相关算法对点群权重信息顾及不足及计算缺乏科学依据等问题,提出了一种点群目标权重的计算与可视化表达方法.该方法的基本思路:1)选取影响范围与影响人群作为点群权重的衡量指标;2)利用新浪微博数据分析并获取点群的影响范围与影响人群数据;3)利用群组目标约束Delaunay三角剖分、动态阈值"剥皮"算法及聚类算法等对点群的影响范围及影响人群进行处理与可视化表达.实验表明:算法对点群权重进行了合理的计算与可视化表达,能够解决多种类型点群的权重的计算及表达问题,且得到的点群权重具有较高的现势性.同时,算法较好地克服了传统算法中点群权重受局部密度影响较大的缺陷.  相似文献   

4.
离群数据发现与分析是数据挖掘的重要组成部分,现有离群数据挖掘算法主要针对如何检测离群对象,缺乏对挖掘出的离群数据集进行解释与分析的有效方法.通过对离群数据来源及特性进行分析,定义了离群贡献度的概念,提出了一种基于特征赋权的离群数据再聚类算法.实验表明,该算法可以有效地揭示离群数据产生来源,有助于对整体数据集的更全面了解.  相似文献   

5.
带噪声的点云数据的隐式曲面重建算法   总被引:3,自引:0,他引:3  
针对三维扫描获取的带噪声和离群点的点云数据,提出了隐式曲面重建算法.用基于均值漂移的滤波算子,把每个采样点移动到核密度函数的局部最大值的点,以限制噪声并剔除离群点.然后,用自适应的八叉树空间划分方法将降噪后的采样点数据分成小的子域.最后,在每个子域内计算局部形状函数,并用单位分解法将所有的局部形状函数加权求和以逼近模型的全局函数.实验表明,该方法是鲁棒的,能用带噪声和离群点的点云数据实现多分辨三维重建,得到细节丰富的曲面.  相似文献   

6.
针对固定检测器在采集动态交通数据过程中易发生交通数据异常、数据缺失等问题,为实现故障数据有效识别及修复,提出了基于离群距离检测的故障数据识别算法及改进的DE-LSTM数据修复模型。利用时序数据的自身连续性,采用直接离群点定位和离群距离检测对故障数据进行有效识别。采用差分进化算法优化长短期记忆神经网络的隐含层神经元个数和初始学习率,并引入自适应控制策略改进传统DE算法中的变异因子、交叉因子,建立了基于改进差分进化算法优化长短期记忆神经网络的修复模型,并与固定阈值结合交通流机理、LSTM神经网络模型及DE-LSTM修复模型进行对比。实例验证结果表明:与固定阈值结合交通流机理法相比,离群距离检测算法识别率更为高效,改进的DE-LSTM模型具有良好的计算效率及修复性能。  相似文献   

7.
针对传统点云简化算法在精简散乱点云数据时经常丢失过多特征点的不足,提出了基于K近邻和法向精度的点云精简算法.该算法首先对输入的散乱点云数据建立K近邻索引,并剔除集群点及离群点,从而完成点云数据的预处理,然后对预处理后的数据进行Delaunay三角化,并重构三角网格面,最后依据法向精度进行非特征点剔除.仿真实验表明,该算法既能较大程度地精简点云数据,又能较好地保持原有模型的基本特征.  相似文献   

8.
AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明显.为此,利用多种特征评估函数建立不同的特征视图,生成多个有差畀的加权朴素贝叶斯(WNB)基分类器;尝试使用几种不同的方式将样本权重嵌入WNB基分类器的参数中,对WNB产生扰动,进一步增加基分类器的不稳定性.实验结果表明.对比AdaBoost所提算法.BoostMV-WNB能够明显提升WNB文本分类器的性能.  相似文献   

9.
为有效识别高速公路交通状态,提高路网服务水平,基于改进的模糊C均值(Fuzzy CMeans, FCM)聚类算法对高速公路交通数据进行分析。首先,采用熵权法确定交通流量、空间占有率、平均速度和路网充裕度4个交通状态分类指标的权重,并对每个样本赋予不同的加权系数。然后,将样本权重计算纳入算法迭代过程,进而实现高速公路交通状态识别。最后,比较改进FCM算法与传统FCM算法的目标函数值、迭代次数及运行时间,结果表明:与传统FCM算法相比,改进FCM算法的目标函数值较小,迭代次数较少,运行时间较短,在数据中表现出更好的适应性;由改进FCM算法得到的聚类结果能准确、全面地反映交通数据的变化情况,实现道路交通状态的有效识别。  相似文献   

10.
基于投影寻踪算法的基本原理和求解过程,提出互通立交方案设计综合评价方法,该方法直接从待评样本本身寻求各评价指标的客观权重,避免了主观评价法评价指标权重的确定存在着主观依赖性、评价结果受到人为赋权的干扰问题.采用实码加速遗传算法对投影指标函数进行优化,求解最优投影方向向量,可有效地解决高维数据全局寻优的难题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号