首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
付宏博  孙立明 《黑龙江交通科技》2010,33(10):166-166,168
公路收费数据在进行数据挖掘前需要进行预处理,结合实际收费系统数据的特点,对数据预处理工作的目的和过程进行了简要描述。  相似文献   

2.
提出了一种基于遗传算法的聚类数据挖掘新算法,并在某钢铁集团CIMS工程的销售管理系统中成功进行了应用,新算法与已有算法进行了对比研究。新方法对其他类似的实际应用也有参考价值。  相似文献   

3.
高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择 何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估 指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据 数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使 得IBCS 具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI 数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划 分.最后,基于IBCS 评估的西宝高速公路收费数据聚类结果表明,采用K-means 算法,簇 数为5时聚类模式最佳.  相似文献   

4.
提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,以获得用户感兴趣的近似网页簇系列。试验证明,该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,研究的算法时间和空间复杂度都不高,因此,有望成为一种实用、有效的信息检索技术。  相似文献   

5.
基于CLIQUE的聚类算法研究   总被引:4,自引:0,他引:4  
聚类分析是数据挖掘研究领域中一个非常活跃的研究课题.本文重点分析了高维度数据的自动子空间聚类算法(CLIQUE)及其各类改进算法,并对其未来发展方向进行了简要展望.  相似文献   

6.
提出了一种基于遗传算法的聚类数据挖掘新算法,并在某钢铁集团CIMS工程的销售管理系统中成功进行了应用,新算法与已有算法进行了对比研究.新方法对其他类似的实际应用也有参考价值.  相似文献   

7.
在智能交通系统的研究中,如何应用现代信息处理技术,努力使道路交通作为一个系统来实现智能化是核心的研究领域。联网收费系统的建立不但将大大改善和提高了国道主干线的收费水平,同时系统将收集和保存大量的道路交通信息数据,对这些数据进行充分有效的再利用,将为实现国道主干线的导航智能化、交通流量最佳化、安全驾驶支援提供必要的知识和信息,为收费策略的制定提供决策支持。  相似文献   

8.
基于粗约简的数据流增量聚类算法   总被引:1,自引:1,他引:0  
针对数据流聚类算法CluStream需预先指定微聚类数目无法准确描述数据流的变化,进而影响最终聚类结果的缺陷,提出了基于粗约简的数据流增量聚类算法RICStream(rough incremental clustering stream).该算法在保证聚类精度的前提下,对参与聚类的数据流属性进行动态调整,有效地减少了聚类时间和计算量.提出了一种可增量调整的网格结构以存储数据流,保证了聚类结果能有效反映数据流的变化情况.基于真实数据集和仿真数据集的实验结果表明,RICStream算法具有较高的效率和聚类精度.  相似文献   

9.
为了改善聚类分析的质量,提出了一种基于阈值和蚁群算法相结合的聚类方法.按此方法,首先由基于阈值的聚类算法进行聚类,生成聚类中心,聚类个数也随之初步确定;然后将蚁群算法的转移概率引入K-平均算法,对上述聚类结果进行二次优化.实验表明,与尽平均算法等相比,该聚类方法的F-测度值(F-measure)更高.  相似文献   

10.
1 研究意义 所谓聚类,是对数据集中的数据应用某种方法进行分组,使得每组内部的数据尽可能相似而不同组之间的数据尽可能不同,即“物以类聚”,从而发现数据集内在的结构。  相似文献   

11.
快速查找初始聚类中心的K_means算法   总被引:3,自引:0,他引:3  
传统的k_means算法对初始聚类中心十分敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优.为消除这种敏感性,针对k_means算法,提出了一种新的基于数据样本分布选取初始聚类中心的方法,对公共数据库UCI里面的数据实验表明改进后的k_means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性.  相似文献   

12.
密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标签分配存在链式问题,时间复杂度较高等。文章对DPC算法的研究现状进行了总结与整理,首先介绍了DPC的算法原理和流程;其次,针对DPC算法的不足对DPC算法的优化进行概括和分析,指出了优化算法的核心技术以及优缺点;最后,对DPC算法未来可能面对的挑战和发展趋势进行展望。  相似文献   

13.
14.
极大熵聚类算法的收敛性定理   总被引:2,自引:0,他引:2  
讨论了极大熵聚类算法的收敛性,构造了极大熵聚类算法的收敛点集,并证明了极大熵聚类算法的收敛性定理.结果表明,极大熵聚类算法不一定收敛到局部极小点,有时收敛到鞍点.同时,也给出了如何判断极大熵聚类算法的收敛点是局部极小点还是鞍点的方法。  相似文献   

15.
Lincoln实验室提出的SAR(synthetic aperture radar)ATR(automatic target recognition)算法由于其经典性而被广泛采用,该算法为三级结构模式,处于其中Prescreener级和Discriminator级之间的聚类算法对于检测算法整体性能有重要的影响,文中介绍了SAR ATR算法采用的常规聚类算法,分析了常规算法在聚类过程中存在的杂波干扰问题,针对问题在聚类前引入形态学操作方法,将待聚类图像中包含的孤立点删除而只保留团状分布的样本,从而消除了杂波点对聚类的干扰,基于实际SAR图像的聚类结果验证了应用形态学方法对提高聚类效果的有效性.  相似文献   

16.
通过收集大数据对汽车驾驶员的疲劳特征和疲劳参数进行学习,根据学习的参数将驾驶员的疲劳程度进行分类,提出了蚁群优化的模糊C均值聚类算法。在初步聚类中运用蚁群聚类产生聚类中心和簇的个数,提供给模糊C均值聚类;利用模糊C均值聚类再次进行聚类,克服了单个聚类算法的缺点。仿真结果表明:文中方法比一般方法具有更好的性能和聚类效果。利用BP神经网络模式识别功能可以识别疲劳驾驶类别。  相似文献   

17.
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

18.
本文阐述了智能化公路自动收费系统的功能,基本组成和工作原理,介绍了该系统运行可能遇到的问题,处理办法以及目前国际上智能化公路收费系统的发展动态。  相似文献   

19.
一种自动获得k值的聚类算法   总被引:1,自引:0,他引:1  
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

20.
基于层次聚类的改进FCM算法   总被引:4,自引:1,他引:3  
针对基本FCM算法只适用于球形或者类球形数据分布的特点,提出了基于层次聚类的改进FCM算法,首先对数据进行过划分,然后再进行凝聚,使之适用于不规则分布的数据。并且引入Ksoko子集度量使合并操作在计算时间上可以接受。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号