首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Fuzzy c-means(FCM) clustering algorithm is sensitive to noise points and outlier data, and the possibilistic fuzzy c-means(PFCM) clustering algorithm overcomes the problem well, but PFCM clustering algorithm has some problems: it is still sensitive to initial clustering centers and the clustering results are not good when the tested datasets with noise are very unequal. An improved kernel possibilistic fuzzy c-means algorithm based on invasive weed optimization(IWO-KPFCM) is proposed in this paper. This algorithm first uses invasive weed optimization(IWO) algorithm to seek the optimal solution as the initial clustering centers, and introduces kernel method to make the input data from the sample space map into the high-dimensional feature space. Then, the sample variance is introduced in the objection function to measure the compact degree of data. Finally, the improved algorithm is used to cluster data. The simulation results of the University of California-Irvine(UCI) data sets and artificial data sets show that the proposed algorithm has stronger ability to resist noise, higher cluster accuracy and faster convergence speed than the PFCM algorithm.  相似文献   

2.
Support Vector Clustering (SVC) is a kernel-based unsupervised learning clustering method. The main drawback of SVC is its high computational complexity in getting the adjacency matrix describing the connectivity for each pairs of points. Based on the proximity graph model, the Euclidean distance in Hilbert space is calculated using a Gaussian kernel, which is the right criterion to generate a minimum spanning tree using Kruskal‘s algorithm. Then the connectivity estimation is lowered by only checking the linkages between the edges that construct the main stem of the MST ( Minimum Spanning Tree), in which the non-compatibility degree is originally defined to support the edge selection during linkage estimations. This new approach is experimentally analyzed.The results show that the revised algorithm has a better performance than the proximity graph model with faster speed, optimized clustering quality and strong ability to noise suppression, which makes SVC scalable to large data sets.  相似文献   

3.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

4.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

5.
Kernal factor analysis (KFA) with vafimax was proposed by using Mercer kernel function which can map the data in the original space to a high-dimensional feature space, and was compared with the kernel principle component analysis (KPCA). The results show that the best error rate in handwritten digit recognition by kernel factor analysis with vadmax (4.2%) was superior to KPCA (4.4%). The KFA with varimax could more accurately image handwritten digit recognition.  相似文献   

6.
针对支持向量机对训练样本内的噪声和孤立点比较敏感,影响了支持向量机分类性能的弱点,利用模糊支持向量机的学习方法,构建了变压器故障诊断模型.采取一种基于二叉树的多分类方法,使用模糊C均值聚类算法求取模糊支持向量机的模糊隶属度,采用径向基核函数,并利用遗传算法对模糊支持向量机的参数进行寻优.实验结果表明,基于二叉数的模糊支持向量机模型相比BP神经网络、支持向量机有更高的诊断准确率,基于二叉树模糊支持向量机的变压器故障诊断方法是可行的.  相似文献   

7.
为估计数据集的聚类数目及获得较好的聚类性能,提出了一种基于灰关联测度的分裂式层次聚类算法.该算法用灰关联测度衡量数据对象之间的相似程度,以基于密度扩展的方式自顶向下分裂成不同层次的数据集划分;然后,根据灰关联测度定义聚类有效性指标;最后将有效性指标曲线极值点对应的聚类划分用于估计最佳聚类数目.实际数据和合成数据集的实验表明,与FCM聚类相比,该算法的聚类正确率平均提高3.7%,并且能够识别任意形状的簇.  相似文献   

8.
利用模糊聚类分析方法将边坡进行安全等级分类,在提高变形监测效率的基础上可降低工作量。FCM聚类分析算法更具科学性,是理论最为完善且应用较多的算法。利用边坡的坡角、高度、边坡所处的水文地质条件作为影响边坡稳定的影响指标,来对边坡监测点的安全等级分类,从而降低工作量,提高工作效率。  相似文献   

9.
针对传统K均值聚类算法在非均质路网划分应用中的不足,将路网连接性融入算法,解决其在路网划分应用中聚类结果不连续的问题.先使用最大最小距离算法确定初始聚类中心和路段差异性,并以聚类评价指标ANSK确定K值;然后统计连续时间间隔下路网划分结果的动态频数,合并和拆分不稳定的“噪声”路段,提高划分子区内路网的紧凑性.最后,基于现实路网中的车牌照自动识别实测数据,对改进的聚类方法进行了验证.将算法得到的划分效果与K均值聚类算法和Ncut算法进行对比,并对子区做宏观基本图分析.结果表明,改进后的K均值聚类算法在保证自身原有聚类优势下,可以有效实现连接性约束下的路网划分.  相似文献   

10.
高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择 何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估 指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据 数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使 得IBCS 具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI 数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划 分.最后,基于IBCS 评估的西宝高速公路收费数据聚类结果表明,采用K-means 算法,簇 数为5时聚类模式最佳.  相似文献   

11.
针对模糊C均值算法随机选择初始聚类中心导致聚类结果对噪声样本点敏感性的不足, 采用局部密度加权的方法, 将初始聚类中心的选择范围限制在局部密度较高样本点区域, 优化初始聚类中心的选择方法; 利用样本点的局部密度改进目标函数, 提高局部密度较高的样本点在目标函数迭代过程中的影响力, 从而提升模糊C均值算法的聚类性能, 并采用人造数据集和鸢尾花真实数据集验证优化的局部密度模糊C均值算法的聚类效果; 通过计算锚泊船位置数据的局部密度, 分析了船舶锚泊偏好。试验结果表明: 对比模糊C均值算法, 优化的局部密度模糊C均值算法聚类精准率提高了2.9%, 召回率提高了3.8%, F度量值提高了3.9%, 说明优化的局部密度模糊C均值算法的性能优于模糊C均值算法; 在锚泊船位置数据上的聚类结果正确反映了天津港锚泊船的聚集特点和锚泊偏好, 其结果与船舶的常规做法一致, 说明优化的局部密度模糊C均值聚类算法是一种分析锚泊船聚集特性和锚泊偏好的有效方法。   相似文献   

12.
In the field of magnetic tile surface detection, artificial detection efficiency is low, and the traditional image segmentation algorithm cannot show good performance when the gray scale of the magnetic tile itself is small, or the image is affected by uneven illumination. In view of these questions, this paper puts forward a new clustering segmentation algorithm based on texture feature. This algorithm uses Gabor function spectra to represent magnetic tile surface texture and then uses a user-defined local product coefficient to modify Gabor energy spectra to get the center number of fuzzy C-means(FCM) clustering. Moreover, the user-defined Gabor energy spectra image is segmented by clustering algorithm. Finally, it extracts the magnetic tile surface defects according to the changes of regional gray characteristics. Experiments show that the algorithm effectively overcomes the noise interference and makes a good performance on accuracy and robustness, which can effectively detect crack,damage, pit and other defects on the magnetic tile surface.  相似文献   

13.
为有效解决高流量终端区内标准飞行模式、非标准飞行模式和异常飞行模式难以自动分离的问题,采用广泛记录的广播式自动相关监视(ADS-B)数据,构建了基于稳健深度自编码器(RDAE)和快速搜索并寻找密度峰值的聚类(CFSFDP)算法的航迹聚类模型; 使用RDAE降维提取终端区内航迹集的非线性特征,利用多种正则化手段约束内部低维流形,以重建更紧密的航迹并将其作为CFSFDP算法的输入,利用轮廓系数选取不同密度飞行模式的聚类中心,并调节边缘密度参数识别出异常航迹; 选取主成分分析(PCA)结合有噪声的空间密度聚类(DBSCAN)算法、动态时间规整(DTW)结合DBSCAN的2种常用航迹聚类模型作为对比项,分别在广州白云机场1 d的少量数据和45 d的大量数据上进行试验。分析结果表明:DTW与CFSFDP的结合模型在少量数据集上具有最优的航迹聚类性能,轮廓系数比对比项分别提升了62%和28%,且可以自动识别出遵循区域导航标准飞行模式的航班和特定环境下遵循管制偏好的非标准飞行模式的航班,识别异常航迹的精确度也分别提高了57%和10%;大量数据下,提出的RDAE结合CFSFDP模型的聚类性能比经典的PCA结合DBSCAN算法提升了13%,且具备可接受的时间复杂度。由此可见,建立的终端区飞行模式区分模型可为空域级交通流性能评估和航班级航迹预测与优化提供数据提取平台。   相似文献   

14.
基于船舶自动识别系统(Automatic Identification System, AIS)数据的船舶典型轨迹挖掘需要经过两个重要步骤,一是压缩 AIS 数据,二是聚类压缩后的 AIS 数据。传统的DP(DouglasPeucker)压缩算法,只考虑船舶轨迹的压缩形状,忽视了船舶航行中其他重要信息。为解决此问题,把对地航速和航向加入到DP算法的压缩过程中。在AIS轨迹聚类方面,传统谱聚类方法只对船舶轨迹的位置进行相似性度量,没有考虑船舶轨迹的其他维度,针对此问题,提出多属性轨迹相似性度量方法。由于不同的输入参数影响着最终的聚类质量,引入Calinski-Harabasz指标评价谱聚类算法,实现聚类参数的自适应选择。利用山东威海水域的实际AIS数据进行实例研究,并与传统谱聚类算法做比较实验。实验结果表明,利用该方法提取到的典型轨迹符合真实水域的交通情况,相较于传统谱聚类方法具有更高的聚类质量。  相似文献   

15.
This paper presents an advanced fuzzy C-means (FCM) clustering algorithm to overcome the weakness of the traditional FCM algorithm, including the instability of random selecting of initial center and the limitation of the data separation or the size of clusters. The advanced FCM algorithm combines the distance with density and improves the objective function so that the performance of the algorithm can be improved. The experimental results show that the proposed FCM algorithm requires fewer iterations yet provides higher accuracy than the traditional FCM algorithm. The advanced algorithm is applied to the influence of stars’ box-office data, and the classification accuracy of the first class stars achieves 92.625%.  相似文献   

16.
提出了一种结合区域分割和Wishart分类器的极化合成孔径雷达图像机场跑道区域快速检测方法; 利用简单线性迭代聚类算法分割极化合成孔径雷达图像, 并将分割得到的超像素作为后续分类处理的基本单元; 采用一种优化后的距离度量方式给超像素分配类别标签, 解决了传统Wishart距离度量因子冗余运算量大的问题; 分析了机场跑道区域像素的极化散射特性, 利用机场跑道区域的弱散射特性从分类结果中提取感兴趣区域; 利用机场跑道的结构特征筛选辨识感兴趣区域, 进而确定机场跑道区域的准确位置; 利用极化合成孔径雷达实测数据测试了算法的有效性, 并与传统基于像素的检测结果进行对比。试验结果表明: 该算法在复杂大场景下能够快速有效检测出机场跑道区域, 检测出的跑道轮廓清晰, 结构比较完整; 采用简单线性迭代聚类算法预处理图像极大地降低了后续处理的复杂性; 针对墨西哥湾试验数据, Wishart分类器处理单元个数分别是Freeman+Wishart算法和FCM+Wishart算法的1.0%和2.4%, 整个检测过程耗时分别为Freeman+Wishart算法和FCM+Wishart算法的9.9%和27.1%;针对大岛试验数据, Wishart分类器处理单元个数分别是Freeman+Wishart算法和FCM+Wishart算法的1.0%和2.6%, 整个检测过程耗时分别为Freeman+Wishart算法和FCM+Wishart算法的14.0%和31.8%。可见, 所提检测方法的实时性能优于基于像素的检测方法。   相似文献   

17.
针对自组织映射(Self-Organizing Map,SOM)算法在进行流形学习时容易陷入局部极值和产生“拓扑缺陷”问题的原因,提出了一种新的基于SOM的流形学习算法:TO-SOM(Training Orderly-SOM).根据流形的局部欧氏性,TO-SOM算法从一个局部线性或近似线性的数据子集出发,按照数据的内在流形结构对其进行有序训练,可以避免局部极值、克服“拓扑缺陷”.根据SOM算法的鲁棒性,TO-SOM算法在成功学习数据内在流形结构的同时,对邻域大小参数和噪声也不像ISOMAP和LLE等现有流形学习算法那样敏感,从而更容易得到实际应用.  相似文献   

18.
基于KPCA和ANFIS的色彩校正   总被引:1,自引:0,他引:1  
提出结合核主成分分析(KPCA)和自适应神经模糊推理系统(ANFIS)的色彩校正(KPCA_ANFIS)算法.首先将数据通过核函数映射到高维空间,再通过KPCA提取主成分,最后通过ANFIS学习达到色彩校正的目的.实验结果验证了ANFIS用于色彩校正的可行性和有效性,KPCA_ANFIS算法的精度和鲁棒性均优于传统ANFIS.对测试数据(训练数据)的平均误差、最大误差和标准差较传统ANFIS分别下降了37%(45%),34%(40%)和35%(40%).  相似文献   

19.
Aiming at the nonlinear system identification problem, a parallel recursive affine projection (AP) adaptive algorithm for the nonlinear system based on Volterra series is presented in this paper. The algorithm identifies in parallel the Volterra kernel of each order, recursively estimate the inverse of the autocorrelation matrix for the Volterra input of each order, and remarkably improve the convergence speed of the identification process compared with the NLMS and conventional AP adaptive algorithm based on Volterra ,series. Simulation results indicate that the proposed method in this paper is efficient.  相似文献   

20.
考虑交通流的时空因素进行短时交通流预测,能够提高预测的精度.为此,引入径向基核函数,将复杂的预测问题转化为高维空间的回归问题;然后,基于支持向量回归机并考虑时空因素影响作用建立在线的短时交通量预测模型,通过网格搜索的方法对模型参数进行优化;最后,构造时间-空间状态向量,通过不同的状态向量对时间和空间维度的影响进行了分析.利用高速公路检测器数据,对比不同模型的精度,对在线短时交通量预测模型的有效性和可行性进行了验证.结果表明:在线模型精度优于传统的支持向量回归模型,考虑时空因素影响后交通量预测模型具有更高的精度和稳定性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号