首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 968 毫秒
1.
一种自动获得k值的聚类算法   总被引:1,自引:0,他引:1  
针对k均值算法局限于k值和初始中心点选取的情况,提出了一种基于k均值的自动获得k值的KDM算法.该算法整体沿用k均值算法的思想,利用最大最小距离法选择初始聚类中心,并且选择聚类中心与划分对象同时进行.通过不断改变类中心,来达到较好的聚类效果.  相似文献   

2.
针对模糊C均值算法随机选择初始聚类中心导致聚类结果对噪声样本点敏感性的不足, 采用局部密度加权的方法, 将初始聚类中心的选择范围限制在局部密度较高样本点区域, 优化初始聚类中心的选择方法; 利用样本点的局部密度改进目标函数, 提高局部密度较高的样本点在目标函数迭代过程中的影响力, 从而提升模糊C均值算法的聚类性能, 并采用人造数据集和鸢尾花真实数据集验证优化的局部密度模糊C均值算法的聚类效果; 通过计算锚泊船位置数据的局部密度, 分析了船舶锚泊偏好。试验结果表明: 对比模糊C均值算法, 优化的局部密度模糊C均值算法聚类精准率提高了2.9%, 召回率提高了3.8%, F度量值提高了3.9%, 说明优化的局部密度模糊C均值算法的性能优于模糊C均值算法; 在锚泊船位置数据上的聚类结果正确反映了天津港锚泊船的聚集特点和锚泊偏好, 其结果与船舶的常规做法一致, 说明优化的局部密度模糊C均值聚类算法是一种分析锚泊船聚集特性和锚泊偏好的有效方法。   相似文献   

3.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

4.
K-均值算法聚类速度快,易于实现,且对数据依赖度低,在文本聚类中得到广泛应用.然而,由于聚类初始中心点选择的随机性,传统K-均值算法以及其变种的聚类结果会产生较大的波动.文章对K-均值算法进行了改进,通过自适应选择最佳密度半径进而优化聚类初始中心选择的方法,得到一种适合文本数据聚类分析的改进算法.实验表明,该算法能够生成质量较高而且波动性较小的聚类结果.  相似文献   

5.
K-均值聚类算法由于其简单高效被广泛应用,但其聚类结果易受初始聚类中心和聚类数的影响。现就其不足之处展开研究,提出一种基于传统K-均值算法自动确定初始聚类中心的改进方法,并应用于宁波市鄞州区联丰西路区域交通事故黑点的识别。结果表明,改进的K-均值聚类算法可以准确地识别出事故黑点的位置,具有良好的应用效果和现实意义。  相似文献   

6.
针对城市快速路交通流状态分类的问题,提出了一种改进的模糊C均值(FCM)算法.结合层次聚类算法和FCM聚类算法,运用层次聚类算法得到最佳聚类数和初始聚类中心,并通过Relief F特征加权对影响交通状态的不同特征指标赋予相应的权值,最终用FCM算法再次聚类得出交通流状态的分类结果.以VISSIM为工具,对该方法进行了模拟.对比分析结果显示,所提出的方法能够提高城市快速路交通流状态分类的效果.  相似文献   

7.
针对传统K均值聚类算法在非均质路网划分应用中的不足,将路网连接性融入算法,解决其在路网划分应用中聚类结果不连续的问题.先使用最大最小距离算法确定初始聚类中心和路段差异性,并以聚类评价指标ANSK确定K值;然后统计连续时间间隔下路网划分结果的动态频数,合并和拆分不稳定的“噪声”路段,提高划分子区内路网的紧凑性.最后,基于现实路网中的车牌照自动识别实测数据,对改进的聚类方法进行了验证.将算法得到的划分效果与K均值聚类算法和Ncut算法进行对比,并对子区做宏观基本图分析.结果表明,改进后的K均值聚类算法在保证自身原有聚类优势下,可以有效实现连接性约束下的路网划分.  相似文献   

8.
快速查找初始聚类中心的K_means算法   总被引:3,自引:0,他引:3  
传统的k_means算法对初始聚类中心十分敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优.为消除这种敏感性,针对k_means算法,提出了一种新的基于数据样本分布选取初始聚类中心的方法,对公共数据库UCI里面的数据实验表明改进后的k_means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性.  相似文献   

9.
中国铁路货物运输由于诸多因素的影响,在客户和货源数量上受到了冲击,需要在客户关系管理及营销等方面不断完善,其中客户细分是精确营销的重要手段.本文提出了基于RFM模型的,新的客户分类KFAV模型,并对货运客户价值进行了计算.之后引入了局部密度值ρ和斥类值δ,对传统K均值(K-means)聚类方法在初始聚类中心选取方面进行了优化.通过搭建hadoop集群环境,采用spark计算框架,对选取的大量货票数据进行仿真.仿真结果显示,基于KFAV模型的铁路货运客户细分方法更加具有针对性,并且改进的K均值聚类方法提升了算法的效率,同时基于大数据分析的spark+hadoop平台极大地降低了客户细分的运行时间.  相似文献   

10.
两阶段混合粒子群优化聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确率较高的子簇集合,作为粒子群优化K均值聚类算法初始聚类中心的搜索空间,进行第2阶段聚类.提出了一种简化的粒子编码方法,以减小样本维数对计算复杂度的影响;引入混沌的思想,以保持粒子种群的多样性,从而避免粒子群优化算法可能出现的早熟现象.通过两阶段聚类,有效地融合了粒子群优化、层次聚类与划分聚类算法的优点.在多个UCI数据集上的聚类结果表明,与几种对比算法聚类结果的最优值相比,其纯度分别提高了1%~8%,且耗时减少50%以上.   相似文献   

11.
考虑船舶行为的时序相关性,提出了一种基于上下文自编码的船舶行为语义表征(SRCAE)模型;提取船舶经度、纬度、航速、航向等行为特征参量,建立了行为特征序列;借助连续词袋模型将行为特征序列划分为中心船舶行为和上下文船舶行为,利用深度自编码网络构建了船舶上下文行为的语义表征模型,将得到的中心船舶行为编码作为表征向量输出,通过聚类算法构建船舶行为词典;选取长江口南槽交汇水域作为研究对象,利用船舶自动识别系统产生的数据对提出的模型和方法进行了验证。分析结果表明:所提出的SRCAE模型能有效表征船舶行为之间的上下文联系,与传统自编码器和长短期记忆网络自编码器等模型相比SRCAE模型具有更低的表征误差;分别采用k均值(k-Means)、高斯混合模型(GMM)与核k均值(Kernel k-Means)3种聚类算法提取船舶行为词典,与原始数据相比SRCAE模型产生的表征向量更易于区分不同船舶行为模式,其中k-Means效果最优,轮廓系数、卡林斯基-哈拉巴斯指数和戴维森堡丁指数指标分别达到了0.384、18.308、0.531,共产生转向加速、转向减速、直行加速、直行减速等30种复合行为,有效提取了不同行为模式下船舶行为词组合关系。   相似文献   

12.
为解决模糊C-均值聚类(FCM)算法在医学图像分割中存在计算量大、运行时间过长以及样本集不理想会导致不好的聚类结果的问题,提出了相应的改进算法.利用收敛速度快的K均值聚类法得到的聚类中心作为FCM算法的初始聚类中心,并将样本对于各个聚类的隶属度之和为1这一约束条件,改变为所有样本对各类的隶属度总和等于样本总数.实验表明,该方法用于人脑磁共振图像分割时,运行速度提高了近3倍,分割准确度明显得到提高.  相似文献   

13.
基于指标体系的扇区复杂性评估方法   总被引:2,自引:0,他引:2  
为了全面分析扇区复杂性,将其分解为结构复杂性和运行复杂性.借鉴已有的研究成果,围绕结构特征和运行特征,分别建立了多维指标体系.利用主成分分析方法提炼指标信息,评估扇区的结构复杂性和运行复杂性.最后采用k-means 聚类算法对多个扇区进行聚类分析,选取Dunn 指标评价聚类质量,实现了对扇区复杂程度的最佳等级划分,同时对复杂性指标分析结果进行了验证.实例表明,复杂性计算结果能够较好地体现多个指标的综合影响,区分不同扇区的复杂程度,聚类结果与实际情况相符.该结论可以为空域规划和管理提供参考意见.  相似文献   

14.
采用均值聚类的算法为三维数据场直接体绘制的传递函数中的各类分界自动产生关键点。该方法为传递函数关键点的初选提供了合理的依据和参考,将器官组织的灰度自动分为C类,传递函数的关键点取在边界点处,并使分界点处的透明度为较大值,这样使器官组织的分割自动达到较好状态。实验显示,通过自动产生的传递函数比手动选择的传递函数提供了表达更清晰组织的重构的显示效果。  相似文献   

15.
为了解决传统交通标志检测算法针对小目标交通标志检测时存在误检与漏检的问题,提出了一个基于金字塔多尺度融合的交通标志检测算法;为了提高算法对交通标志的特征提取能力,引入ResNet残差结构搭建算法的主干网络,并增加网络浅层卷积层数,以提取较小尺度交通标志目标更准确的语义信息;基于特征金字塔结构的思想,在检测结构中引入4个不同预测尺度,增强深层和浅层特征融合;为了进一步提高算法检测精度,引入GIoU损失函数定位交通标志的锚点框,利用k-means算法对交通标志标签信息进行聚类分析并生成更精准的先验框;为了验证算法的泛化性与解决试验所用数据集TT100K的类间不平衡问题,增强与扩充了数据集。试验结果表明:本文算法的精确率、召回率与平均精度均值分别达到了86.7%、89.4%与87.9%,与传统目标检测算法相比有显著提高;多尺度融合检测机制、GIoU损失函数与k-means的引入能够不同程度提高算法的检测性能,使算法检测精确率分别提升4.7%、1.8%与1.2%;提出算法针对不同尺度交通标志检测时均有更优越的性能表现,在TT100K数据集中的(0, 32]、(32, 96]与(96, 400]尺度下的检测召回率分别达到90%、93%与88%;与YOLOv3相比,提出算法在不同天气、噪声与几何变换等干扰下均能实现对交通标志的正确定位与分类,证明了提出算法具有良好的鲁棒性与泛化性,适用于道路交通标志检测。   相似文献   

16.
多层网络(Multilayer Network)是国际研究领域正在兴起的概念,着眼于以不同准则叠加聚合的互补性网络的系统特征和影响力.以全球物流枢纽城市为研究对象,在构建海运、空运、物流企业组织及国际贸易网络的基础上,借助Gephi分析工具,试图从网络结构特性及节点物流运行能力揭示多层物流网络的复杂性特征,实现网络聚合并运用t-SNE与聚类算法,评估城市发育水平并探索其空间分布规律.结果表明:物流网络表现出显著的小世界及无标度特性;呈现以“欧洲西部-亚洲东部及南部-亚洲西部-北美洲东部”为核心的菱形空间结构;其分布具有明显的层级性,不同等级城市分布具有空间异质性.  相似文献   

17.
为提高恶劣雨天交通环境下车辆目标检测精度,提出一种基于PReNet和YOLOv4融合的深度学习网络DTOD-PReYOLOv4,融合了改进的图像复原子网D-PReNet和改进的目标检测子网TOD-YOLOv4;将多尺度膨胀卷积融合模块和添加了挤压激励块的注意机制残差模块引入PReNet,获得的D-PReNet可更有效提取雨纹特征; 使用轻量化的CSPDarknet26代替YOLOv4骨干模块CSPDarknet53,为YOLOv4的颈部路径聚合网络模块添加复合残差块,同时采用k-means++算法取代原始网络聚类算法,获得的TOD-YOLOv4可在改善交通小目标检测精度的同时进一步提高检测效率; 基于构建的雨天交通场景车辆目标数据集VOD-RTE对DTOD-PReYOLOv4进行了验证。研究结果表明:与当前YOLO系列主流网络相比,提出的DTOD-PReYOLOv4对原浅层ResBlock_body1叠加残差块,可以更好地提取分辨率较小的特征; 对原深层ResBlock_body3、ResBlock_body4和ResBlock_body5进行裁剪,获得ResBlock_body3×2、ResBlock_body4×2和ResBlock_body5×2,可以有效降低卷积层冗余,提高内存利用率; 为PANet中的Concat+Conv×5添加跳跃连接形成CRB模块,可以有效缓解网络层数加深引起的小目标检测效果退化问题; 采用k-means++算法,在多尺度检测过程中为较大的特征图分配更加适合的较小先验框,为较小的特征图分配更加适合的较大先验框,进一步提高了目标检测的精度; 与MYOLOv4相比,精确率和召回率的调和平均值、平均精度、检测速度分别提升了5.02%、6.70%、15.63帧·s-1,与TOD-YOLOv4相比,分别提升了3.51%、4.31%、2.17帧·s-1,与YOLOv3相比,分别提升了46.07%、48.05%、18.97帧·s-1,与YOLOv4相比,分别提升了31.06%、29.74%、16.26帧·s-1。   相似文献   

18.
用Spreadsheet解决配送中心选址问题   总被引:1,自引:0,他引:1  
配送中心是集物流、信息流和资金流为一体的流通型节点。在整个物流中作用显著。故科学合理地进行配送中心的选址是非常重要的。目前,多种科学理论方法已被广泛应用到这一领域,Spreadsheet即是其中相对简单、直观的一种,它有助于企业进行配送中心选址决策。  相似文献   

19.
单一物流配送中心选址分析   总被引:1,自引:0,他引:1  
物流配送中心的选址对物流系统的运营效率起着至关重要的作用。针对单一物流配送中心选址,提出了单一物流配送中心选址的原则,介绍了单一物流配送中心选址的程序、方法,并对选址影响因素做了分析,最后总结了选址时应该注意的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号