首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

2.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

3.
为改进传统K-means聚类算法受初始聚类中心及异常点影响较大的问题,提出使用离群点检测(LOF)改进的K-means聚类算法,并应用到交通事故的黑点识别中.使用数据集为2018年7月1日至2018年12月31日于美国洛杉矶发生的交通事故数据.首先,利用LOF对事故点坐标数据集进行离群点检测;其次,剔除掉原数据集中的离...  相似文献   

4.
针对模糊C均值算法随机选择初始聚类中心导致聚类结果对噪声样本点敏感性的不足, 采用局部密度加权的方法, 将初始聚类中心的选择范围限制在局部密度较高样本点区域, 优化初始聚类中心的选择方法; 利用样本点的局部密度改进目标函数, 提高局部密度较高的样本点在目标函数迭代过程中的影响力, 从而提升模糊C均值算法的聚类性能, 并采用人造数据集和鸢尾花真实数据集验证优化的局部密度模糊C均值算法的聚类效果; 通过计算锚泊船位置数据的局部密度, 分析了船舶锚泊偏好。试验结果表明: 对比模糊C均值算法, 优化的局部密度模糊C均值算法聚类精准率提高了2.9%, 召回率提高了3.8%, F度量值提高了3.9%, 说明优化的局部密度模糊C均值算法的性能优于模糊C均值算法; 在锚泊船位置数据上的聚类结果正确反映了天津港锚泊船的聚集特点和锚泊偏好, 其结果与船舶的常规做法一致, 说明优化的局部密度模糊C均值聚类算法是一种分析锚泊船聚集特性和锚泊偏好的有效方法。   相似文献   

5.
一种自动获得k值的聚类算法   总被引:1,自引:0,他引:1  
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

6.
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

7.
针对传统K均值聚类算法在非均质路网划分应用中的不足,将路网连接性融入算法,解决其在路网划分应用中聚类结果不连续的问题.先使用最大最小距离算法确定初始聚类中心和路段差异性,并以聚类评价指标ANSK确定K值;然后统计连续时间间隔下路网划分结果的动态频数,合并和拆分不稳定的“噪声”路段,提高划分子区内路网的紧凑性.最后,基于现实路网中的车牌照自动识别实测数据,对改进的聚类方法进行了验证.将算法得到的划分效果与K均值聚类算法和Ncut算法进行对比,并对子区做宏观基本图分析.结果表明,改进后的K均值聚类算法在保证自身原有聚类优势下,可以有效实现连接性约束下的路网划分.  相似文献   

8.
为解决模糊C-均值聚类(FCM)算法在医学图像分割中存在计算量大、运行时间过长以及样本集不理想会导致不好的聚类结果的问题,提出了相应的改进算法.利用收敛速度快的K均值聚类法得到的聚类中心作为FCM算法的初始聚类中心,并将样本对于各个聚类的隶属度之和为1这一约束条件,改变为所有样本对各类的隶属度总和等于样本总数.实验表明,该方法用于人脑磁共振图像分割时,运行速度提高了近3倍,分割准确度明显得到提高.  相似文献   

9.
针对城市快速路交通流状态分类的问题,提出了一种改进的模糊C均值(FCM)算法。结合层次聚类算法和FCM聚类算法,运用层次聚类算法得到最佳聚类数和初始聚类中心,并通过Relief F特征加权对影响交通状态的不同特征指标赋予相应的权值,最终用FCM算法再次聚类得出交通流状态的分类结果。以VISSIM为工具,对该方法进行了模拟。对比分析结果显示,所提出的方法能够提高城市快速路交通流状态分类的效果。  相似文献   

10.
针对城市快速路交通流状态分类的问题,提出了一种改进的模糊C均值(FCM)算法.结合层次聚类算法和FCM聚类算法,运用层次聚类算法得到最佳聚类数和初始聚类中心,并通过Relief F特征加权对影响交通状态的不同特征指标赋予相应的权值,最终用FCM算法再次聚类得出交通流状态的分类结果.以VISSIM为工具,对该方法进行了模拟.对比分析结果显示,所提出的方法能够提高城市快速路交通流状态分类的效果.  相似文献   

11.
模糊聚类法在公路交通事故黑点 成因分析中的应用   总被引:5,自引:0,他引:5  
通过运用模糊c-划分空间方法,对事故黑点成因进行空间划分.采用模糊聚类ISODATA方法确定模糊划分矩阵和成因各特征指标聚类中心,并进行事故黑点成因聚类分析;利用划分系数Fc(U )和划分的平均棋糊摘Hc(U)对聚类效果进行评价.  相似文献   

12.
通过收集大数据对汽车驾驶员的疲劳特征和疲劳参数进行学习,根据学习的参数将驾驶员的疲劳程度进行分类,提出了蚁群优化的模糊C均值聚类算法。在初步聚类中运用蚁群聚类产生聚类中心和簇的个数,提供给模糊C均值聚类;利用模糊C均值聚类再次进行聚类,克服了单个聚类算法的缺点。仿真结果表明:文中方法比一般方法具有更好的性能和聚类效果。利用BP神经网络模式识别功能可以识别疲劳驾驶类别。  相似文献   

13.
快速查找初始聚类中心的K_means算法   总被引:3,自引:0,他引:3  
传统的k_means算法对初始聚类中心十分敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优.为消除这种敏感性,针对k_means算法,提出了一种新的基于数据样本分布选取初始聚类中心的方法,对公共数据库UCI里面的数据实验表明改进后的k_means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性.  相似文献   

14.
高速公路事故多发点鉴别及诱发因素识别   总被引:2,自引:0,他引:2  
为了提高事故多发点鉴别的客观公正性及自动化识别水平,提出了在公路沿线上划分初始评估地点的动态聚类算法,建立了鉴别事故多发点的自组织神经网络模型,给出了基于离散多变量算法与概率分布相结合的事故多发点突出事故诱发因素识别过程. 方法应用结果表明,基于动态聚类的初始评估点划分方法能够客观地描述出事故点在公路沿线上的集中与分散状况,而神经网络鉴别模型能够对初始评估地点的安全状况进行自动分类且结果较合理. 在掌握了能够满足统计分析要求的事故样本点数量的基础上,能够应用突出事故诱发因素识别方法建立一套评估标准,并用来识别事故多发点的突出事故诱发因素.  相似文献   

15.
两阶段混合粒子群优化聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化的粒子编码方法,以减小样本维数对计算复杂度的影响;引入混沌的思想,以保持粒子种群的多样性,从而避免粒子群优化算法可能出现的早熟现象.通过两阶段聚类,有效地融合了粒子群优化、层次聚类与划分聚类算法的优点.在多个UCI数据集上的聚类结果表明,与几种对比算法聚类结果的最优值相比,其纯度分别提高了1%~8%,且耗时减少50%以上.   相似文献   

16.
为提升高速公路交通运行状态评价的效果,提出GA-KFCM(genetic algorithm-kernel fuzzy C-means,基于遗传算法改进的核模糊C均值)聚类算法,并结合实例数据对不同方案的分类效果开展验证分析。首先,分析高速公路交通运行状态评价的范围及等级;然后,提出核函数改进的KFCM(kernel fuzzy C-means,核模糊C均值)聚类算法。在此基础上,采用遗传算法弥补初始化聚类中心随机的缺陷,考虑到在选取不同参数时判别模型的差异较大,结合实例数据对改进前后模型的交通运行状态开展聚类分析,并采用综合指标评估不同试验方案的优劣。试验结果表明:与FCM(fuzzy C-means,模糊C均值)聚类算法相比,GA-KFCM算法的聚类效果提升5倍左右;三维交通参数的交通运行状态判别可靠度最高。  相似文献   

17.
通过阐述事故黑点现有鉴别方法的基础上,进一步提出了基于交通冲突技术的灰色评价法在公路交通事故黑点鉴别中的应用,通过引入严重冲突次数评价指标提高了数据和评价结果的可信度和准确性,并用灰色评价法对各种灰类的聚类值进行归类,为公路交通事故黑点的鉴别提供了新思路。最后通过实例对该方法进行了验算并与其它同类鉴别方法进行比较,得出其优异性。  相似文献   

18.
由于医学图像生成容易受到空间时间影响,噪声较大,具有不确定性,传统的硬分割方法很难取得理想的分割结果.模糊分类技术能很好地处理医学图像中的不确定性,却由于计算量大不能保证实时性.灰度统计方法和通用计算图形处理器技术的引入,保证了初始聚类中心的准确性.又由于模糊C均值聚类算法是可并行的,将其改进并在图形处理器上完成计算,降低了算法迭代次数和计算时间,保证了实时性.实验结果表明,使用该方法对医学图像分割得到了良好的结果.  相似文献   

19.
为了改善聚类分析的质量,提出了一种基于阈值和蚁群算法相结合的聚类方法.按此方法,首先由基于阈值的聚类算法进行聚类,生成聚类中心,聚类个数也随之初步确定;然后将蚁群算法的转移概率引入K-平均算法,对上述聚类结果进行二次优化.实验表明,与尽平均算法等相比,该聚类方法的F-测度值(F-measure)更高.  相似文献   

20.
基于粒子群算法的投影寻踪分类模型研究   总被引:4,自引:0,他引:4  
投影寻踪分类模型将高维分析问题的数据投影到最佳投影方向上,将其转化为一维问题进行分析研究,其实质是一种降维处理技术,以达到在低维空间分析高维非线性数据的目的.寻找最佳投影方向是一个优化搜索过程,PSO算法可以有效地应用于投影寻踪分类模型中最佳投影方向的搜索.用最佳投影方向计算样本数据的最佳投影值,根据K-均值聚类算法对投影值进行聚类,获取聚类结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号