首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

2.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

3.
两阶段混合粒子群优化聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化的粒子编码方法,以减小样本维数对计算复杂度的影响;引入混沌的思想,以保持粒子种群的多样性,从而避免粒子群优化算法可能出现的早熟现象.通过两阶段聚类,有效地融合了粒子群优化、层次聚类与划分聚类算法的优点.在多个UCI数据集上的聚类结果表明,与几种对比算法聚类结果的最优值相比,其纯度分别提高了1%~8%,且耗时减少50%以上.   相似文献   

4.
针对城市快速路交通流状态分类的问题,提出了一种改进的模糊C均值(FCM)算法.结合层次聚类算法和FCM聚类算法,运用层次聚类算法得到最佳聚类数和初始聚类中心,并通过Relief F特征加权对影响交通状态的不同特征指标赋予相应的权值,最终用FCM算法再次聚类得出交通流状态的分类结果.以VISSIM为工具,对该方法进行了模拟.对比分析结果显示,所提出的方法能够提高城市快速路交通流状态分类的效果.  相似文献   

5.
针对一般的人工神经网络在静电除尘器运行参数预测中存在的网络规模及计算量大的问题,建立了改进的BP神经网络预测模型.在分析了静电除尘器运行参数特点的基础上,该模型利用K-means聚类算法分析得到运行参数的聚类中心,并用输入参数向量与聚类中心的欧氏距离代替原始输入数据作为神经网络的输入向量,将二雏的输入向量转化为一雏的向...  相似文献   

6.
一种自动获得k值的聚类算法   总被引:1,自引:0,他引:1  
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

7.
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

8.
针对城市快速路交通流状态分类的问题,提出了一种改进的模糊C均值(FCM)算法。结合层次聚类算法和FCM聚类算法,运用层次聚类算法得到最佳聚类数和初始聚类中心,并通过Relief F特征加权对影响交通状态的不同特征指标赋予相应的权值,最终用FCM算法再次聚类得出交通流状态的分类结果。以VISSIM为工具,对该方法进行了模拟。对比分析结果显示,所提出的方法能够提高城市快速路交通流状态分类的效果。  相似文献   

9.
针对传统K均值聚类算法在非均质路网划分应用中的不足,将路网连接性融入算法,解决其在路网划分应用中聚类结果不连续的问题.先使用最大最小距离算法确定初始聚类中心和路段差异性,并以聚类评价指标ANSK确定K值;然后统计连续时间间隔下路网划分结果的动态频数,合并和拆分不稳定的“噪声”路段,提高划分子区内路网的紧凑性.最后,基于现实路网中的车牌照自动识别实测数据,对改进的聚类方法进行了验证.将算法得到的划分效果与K均值聚类算法和Ncut算法进行对比,并对子区做宏观基本图分析.结果表明,改进后的K均值聚类算法在保证自身原有聚类优势下,可以有效实现连接性约束下的路网划分.  相似文献   

10.
基于粗约简的数据流增量聚类算法   总被引:1,自引:1,他引:0  
针对数据流聚类算法CluStream需预先指定微聚类数目无法准确描述数据流的变化,进而影响最终聚类结果的缺陷,提出了基于粗约简的数据流增量聚类算法RICStream(rough incremental clustering stream).该算法在保证聚类精度的前提下,对参与聚类的数据流属性进行动态调整,有效地减少了聚类时间和计算量.提出了一种可增量调整的网格结构以存储数据流,保证了聚类结果能有效反映数据流的变化情况.基于真实数据集和仿真数据集的实验结果表明,RICStream算法具有较高的效率和聚类精度.  相似文献   

11.
针对城市轨道交通事件量化分级的难题,本文提出了一种改进的 K-means聚类的突发事件分级方法.首先,从事件类型、持续时间、影响程度等方面分析各种类型事件的特征规律,提取 8个关键特征量用于聚类分析;其次,应用主成分分析法提取 4个主成分变量并提出权重系数计算方法,实现特征向量降维;提出了基于密度扫描的初始聚类中心确定方法,并将改进的 K-means聚类算法应用于地铁突发事件的分级.案例结果表明,与原始 K-means聚类方法对比,应用本文提出的改进方法聚类效果更佳.研究成果已应用于北京地铁应急指挥系统,验证了本文方法的可行性.  相似文献   

12.
针对城市轨道交通事件量化分级的难题,本文提出了一种改进的 K-means聚类的突发事件分级方法.首先,从事件类型、持续时间、影响程度等方面分析各种类型事件的特征规律,提取 8个关键特征量用于聚类分析;其次,应用主成分分析法提取 4个主成分变量并提出权重系数计算方法,实现特征向量降维;提出了基于密度扫描的初始聚类中心确定方法,并将改进的 K-means聚类算法应用于地铁突发事件的分级.案例结果表明,与原始 K-means聚类方法对比,应用本文提出的改进方法聚类效果更佳.研究成果已应用于北京地铁应急指挥系统,验证了本文方法的可行性.  相似文献   

13.
模糊聚类法在公路交通事故黑点 成因分析中的应用   总被引:5,自引:0,他引:5  
通过运用模糊c-划分空间方法,对事故黑点成因进行空间划分.采用模糊聚类ISODATA方法确定模糊划分矩阵和成因各特征指标聚类中心,并进行事故黑点成因聚类分析;利用划分系数Fc(U )和划分的平均棋糊摘Hc(U)对聚类效果进行评价.  相似文献   

14.
为了改善聚类分析的质量,提出了一种基于阈值和蚁群算法相结合的聚类方法.按此方法,首先由基于阈值的聚类算法进行聚类,生成聚类中心,聚类个数也随之初步确定;然后将蚁群算法的转移概率引入K-平均算法,对上述聚类结果进行二次优化.实验表明,与尽平均算法等相比,该聚类方法的F-测度值(F-measure)更高.  相似文献   

15.
IntroductionFuzzy clustering is one of the important methodsin pattern recognition. The most widely used fuzzyclustering is the fuzzy c-means (FCM) algorithm[1]which is conceived by Dunn[2]and generalized byBezdek[3]. Based on an objective function, the F…  相似文献   

16.
根据交通流特性的相似性进行交通路段划分对城市交通管理和控制具有重要作用。交通流数据具有时间序列特征,相似性度量问题是时间序列聚类中的最基本的问题之一。本文为交通流数据聚类给出了一种基于灰色关联的相似性度量方法,通过比较试验确定了它具有较高的聚类精度。在每个时段时间序列间的相似性差异、在某一个时段的异常数据等会影响到在整个时间区间的交通流数据聚类,为此本文提出了一种基于时段划分的交通流数据聚类方法。这个方法首先对每个时段数据进行聚类,然后采用最大频繁项集方法得到最终聚类结果(即交通路段划分),实例证明了方法的有效性。  相似文献   

17.
机车是铁路运输生产的重要牵引设备,通过整合利用机车各类数据,构建基于设备画像的机车标签体系,有利于客观、全面地掌握机车质量状态,实现机车的精准画像、差异化运维和精细化管理。本文通过总结机车设备画像的概念和标签技术的相关理论知识,提出满足机车质量分析、运维优化及安全决策等多个应用场景的机车设备画像3级标签体系技术架构,全面分析所包含的数据采集层、标签库层和标签应用层,详细阐释机车各级标签的内容及其生成、管理、优化和分析流程,形成机车设备画像研究方法。针对聚类这一标签的产生方式,通过改进K-means聚类算法的初始质心选取方法,提高标签获取的精度和稳定性。并在某铁路局开展机车设备画像实地应用研究,形成完整可行的机车标签体系。  相似文献   

18.
为了提高车辆配送初始解获得的效率,在不确定条件下,研究了上海世博会行李跟随系统需求点的空间特性,提出了基于空间特性的车辆调度方法,建立了需求点的空间特性SLINK聚类分析方法和聚类分析结果评估方法。计算结果表明:在需求点群聚状态下,采用基于空间特性的聚类分析法的调度初始解总距离为583,而传统SWEEP扫描法的调度初始解总距离为595,因此,在对车辆调度问题进行求解时,对需求点的空间分布特性进行分析有助于不确定环境下车辆调度问题的最终求解。  相似文献   

19.
针对模糊C均值算法随机选择初始聚类中心导致聚类结果对噪声样本点敏感性的不足, 采用局部密度加权的方法, 将初始聚类中心的选择范围限制在局部密度较高样本点区域, 优化初始聚类中心的选择方法; 利用样本点的局部密度改进目标函数, 提高局部密度较高的样本点在目标函数迭代过程中的影响力, 从而提升模糊C均值算法的聚类性能, 并采用人造数据集和鸢尾花真实数据集验证优化的局部密度模糊C均值算法的聚类效果; 通过计算锚泊船位置数据的局部密度, 分析了船舶锚泊偏好。试验结果表明: 对比模糊C均值算法, 优化的局部密度模糊C均值算法聚类精准率提高了2.9%, 召回率提高了3.8%, F度量值提高了3.9%, 说明优化的局部密度模糊C均值算法的性能优于模糊C均值算法; 在锚泊船位置数据上的聚类结果正确反映了天津港锚泊船的聚集特点和锚泊偏好, 其结果与船舶的常规做法一致, 说明优化的局部密度模糊C均值聚类算法是一种分析锚泊船聚集特性和锚泊偏好的有效方法。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号