首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 563 毫秒
1.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

2.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

3.
两阶段混合粒子群优化聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化的粒子编码方法,以减小样本维数对计算复杂度的影响;引入混沌的思想,以保持粒子种群的多样性,从而避免粒子群优化算法可能出现的早熟现象.通过两阶段聚类,有效地融合了粒子群优化、层次聚类与划分聚类算法的优点.在多个UCI数据集上的聚类结果表明,与几种对比算法聚类结果的最优值相比,其纯度分别提高了1%~8%,且耗时减少50%以上.   相似文献   

4.
通过收集大数据对汽车驾驶员的疲劳特征和疲劳参数进行学习,根据学习的参数将驾驶员的疲劳程度进行分类,提出了蚁群优化的模糊C均值聚类算法。在初步聚类中运用蚁群聚类产生聚类中心和簇的个数,提供给模糊C均值聚类;利用模糊C均值聚类再次进行聚类,克服了单个聚类算法的缺点。仿真结果表明:文中方法比一般方法具有更好的性能和聚类效果。利用BP神经网络模式识别功能可以识别疲劳驾驶类别。  相似文献   

5.
基于混合遗传模拟退火的模糊C-均值聚类算法   总被引:2,自引:2,他引:0  
一般模糊C-均值聚类算法存在易于陷入局部最优的缺陷,基于此,提出了一种基于混合遗传模拟退火的模糊C-均值聚类算法,并利用UIC机器学习数据库中的Car、Iris和Wine数据集验证了算法的有效性。  相似文献   

6.
为提升高速公路交通运行状态评价的效果,提出GA-KFCM(genetic algorithm-kernel fuzzy C-means,基于遗传算法改进的核模糊C均值)聚类算法,并结合实例数据对不同方案的分类效果开展验证分析。首先,分析高速公路交通运行状态评价的范围及等级;然后,提出核函数改进的KFCM(kernel fuzzy C-means,核模糊C均值)聚类算法。在此基础上,采用遗传算法弥补初始化聚类中心随机的缺陷,考虑到在选取不同参数时判别模型的差异较大,结合实例数据对改进前后模型的交通运行状态开展聚类分析,并采用综合指标评估不同试验方案的优劣。试验结果表明:与FCM(fuzzy C-means,模糊C均值)聚类算法相比,GA-KFCM算法的聚类效果提升5倍左右;三维交通参数的交通运行状态判别可靠度最高。  相似文献   

7.
为解决模糊C-均值聚类(FCM)算法在医学图像分割中存在计算量大、运行时间过长以及样本集不理想会导致不好的聚类结果的问题,提出了相应的改进算法.利用收敛速度快的K均值聚类法得到的聚类中心作为FCM算法的初始聚类中心,并将样本对于各个聚类的隶属度之和为1这一约束条件,改变为所有样本对各类的隶属度总和等于样本总数.实验表明,该方法用于人脑磁共振图像分割时,运行速度提高了近3倍,分割准确度明显得到提高.  相似文献   

8.
一种自动获得k值的聚类算法   总被引:1,自引:0,他引:1  
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

9.
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

10.
为了改善模糊C-均值聚类算法(FCM)对噪声图像的分割效果,Stelios等提出了鲁棒性的模糊局部C-均值聚类算法(FLICM),通过引入模糊因子,充分利用邻域像素的灰度信息和空间信息,提高了算法对噪声的鲁棒性,但因每次迭代必须计算邻域像素到聚类中心的距离,导致耗时高、效率低.针对该问题,提出了基于组合隶属度的快速模糊聚类算法,通过构造组合隶属度函数,对迭代中的隶属度矩阵直接进行滤波处理,避免了计算邻域信息耗时较高的缺点,组合隶属度函数不仅考虑了隶属度的局部信息,而且考虑了隶属度的空间信息,在确保算法对图像分割精度的前提下,降低了算法的时间复杂度.实验表明,基于组合隶属度的快速模糊聚类算法可在较短时间内完成高精度的图像分割.  相似文献   

11.
For the question that fuzzy c-means(FCM)clustering algorithm has the disadvantages of being too sensitive to the initial cluster centers and easily trapped in local optima,this paper introduces a new metric norm in FCM and particle swarm optimization(PSO)clustering algorithm,and proposes a parallel optimization algorithm using an improved fuzzy c-means method combined with particle swarm optimization(AF-APSO).The experiment shows that the AF-APSO can avoid local optima,and get the best fitness and clustering performance significantly.  相似文献   

12.
Fuzzy c-means(FCM) clustering algorithm is sensitive to noise points and outlier data, and the possibilistic fuzzy c-means(PFCM) clustering algorithm overcomes the problem well, but PFCM clustering algorithm has some problems: it is still sensitive to initial clustering centers and the clustering results are not good when the tested datasets with noise are very unequal. An improved kernel possibilistic fuzzy c-means algorithm based on invasive weed optimization(IWO-KPFCM) is proposed in this paper. This algorithm first uses invasive weed optimization(IWO) algorithm to seek the optimal solution as the initial clustering centers, and introduces kernel method to make the input data from the sample space map into the high-dimensional feature space. Then, the sample variance is introduced in the objection function to measure the compact degree of data. Finally, the improved algorithm is used to cluster data. The simulation results of the University of California-Irvine(UCI) data sets and artificial data sets show that the proposed algorithm has stronger ability to resist noise, higher cluster accuracy and faster convergence speed than the PFCM algorithm.  相似文献   

13.
在基于聚类分析算法的入侵检测技术中,聚类的划分方法直接影响入侵检测的检测率。文章在基于分箱统计的HCM算法研究的基础上,针对模糊C-均值(FCM)算法的局限性,设计出一种改进的FCM算法。实验表明该算法比已有的FCM算法在对聚类的划分情况又有所改善,从而能提高检测率,且能较好地发现新的攻击类型。  相似文献   

14.
快速查找初始聚类中心的K_means算法   总被引:3,自引:0,他引:3  
传统的k_means算法对初始聚类中心十分敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优.为消除这种敏感性,针对k_means算法,提出了一种新的基于数据样本分布选取初始聚类中心的方法,对公共数据库UCI里面的数据实验表明改进后的k_means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性.  相似文献   

15.
This paper presents an advanced fuzzy C-means (FCM) clustering algorithm to overcome the weakness of the traditional FCM algorithm, including the instability of random selecting of initial center and the limitation of the data separation or the size of clusters. The advanced FCM algorithm combines the distance with density and improves the objective function so that the performance of the algorithm can be improved. The experimental results show that the proposed FCM algorithm requires fewer iterations yet provides higher accuracy than the traditional FCM algorithm. The advanced algorithm is applied to the influence of stars’ box-office data, and the classification accuracy of the first class stars achieves 92.625%.  相似文献   

16.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

17.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号