首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
随着网络规模的快速增长,传统社区发现算法难以处理大规模网络数据和满足复杂网络的可扩展分析需求. 本文提出一种适用于大规模复杂网络的重叠社区发现算法PHLink. 该算法根据复杂网络的无标度特性将节点建立连边的原因进行分析和归类,用以识别网络中具有重叠性的社区结构,并采用MapReduce计算框架对网络进行分割和冗余存储,减弱了图计算的耦合性,解决了社区发现算法的分布式计算问题. 通过真实网络测试,PHLink算法可以大幅度降低边计算的复杂度,对于无标度特性明显的复杂网络提取0.1%的枢纽节点即可节省94%以上的计算量,较传统算法具有较高的稳定性和准确性,并且在Hadoop平台有良好的加速性和伸缩性,可以处理千万级连边规模的大规模复杂网络.   相似文献   

2.
提出了一种基于遗传算法的聚类数据挖掘新算法,并在某钢铁集团CIMS工程的销售管理系统中成功进行了应用,新算法与已有算法进行了对比研究。新方法对其他类似的实际应用也有参考价值。  相似文献   

3.
提出了一种基于遗传算法的聚类数据挖掘新算法,并在某钢铁集团CIMS工程的销售管理系统中成功进行了应用,新算法与已有算法进行了对比研究.新方法对其他类似的实际应用也有参考价值.  相似文献   

4.
基于粗约简的数据流增量聚类算法   总被引:1,自引:1,他引:0  
针对数据流聚类算法CluStream需预先指定微聚类数目无法准确描述数据流的变化,进而影响最终聚类结果的缺陷,提出了基于粗约简的数据流增量聚类算法RICStream(rough incremental clustering stream).该算法在保证聚类精度的前提下,对参与聚类的数据流属性进行动态调整,有效地减少了聚类时间和计算量.提出了一种可增量调整的网格结构以存储数据流,保证了聚类结果能有效反映数据流的变化情况.基于真实数据集和仿真数据集的实验结果表明,RICStream算法具有较高的效率和聚类精度.  相似文献   

5.
基于CLIQUE的聚类算法研究   总被引:4,自引:0,他引:4  
聚类分析是数据挖掘研究领域中一个非常活跃的研究课题.本文重点分析了高维度数据的自动子空间聚类算法(CLIQUE)及其各类改进算法,并对其未来发展方向进行了简要展望.  相似文献   

6.
设计的启发式算法从图的合并操作出发, 降低了计算复杂度, 从应用效果看接近最优的程度也较以往算法好  相似文献   

7.
在对公路收费数据进行数据挖掘中经常用到聚类算法,具体应用时需要对聚类技术的种类及各自的应用范围和特点、适用的挖掘目标和数据特征进行研究,以便合理制定相关的知识发现工作目标并明确挖掘项目预处理要求,进而提高挖掘项目实施的合理性与可控性。  相似文献   

8.
k-means算法的改进和在保险业CRM中的应用   总被引:2,自引:0,他引:2  
针对k-means算法存在的不足,提出了一种改进算法.针对目前保险业CRM系统的特点提出了用聚类分析方法进行客户群细分模型设计,通过实验验证了本文提出的k-means改进算法的高效性;实验结果证明聚类分析算法在CRM中实施类分析方法的客户群细分过程模型是行之有效的.  相似文献   

9.
密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标签分配存在链式问题,时间复杂度较高等。文章对DPC算法的研究现状进行了总结与整理,首先介绍了DPC的算法原理和流程;其次,针对DPC算法的不足对DPC算法的优化进行概括和分析,指出了优化算法的核心技术以及优缺点;最后,对DPC算法未来可能面对的挑战和发展趋势进行展望。  相似文献   

10.
从社区物流的配送问题着手,在总结社区物流配送特点和要求的基础上,提出了基于邮政网络对社区物流进行分区规划的问题.基于假设邮政网点足够密集的研究思想,即配送中心随地可取的情况下,对有社区物流需求的某个地区做分区规划.利用Weight-K-means算法,对划分好的每个区域做一次TSP计算,从而满足在每一个聚类中,不仅车载量均衡,而且车辆所走里程也大致相同.算例分析表明该算法能够得到满意的解.  相似文献   

11.
高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择 何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估 指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据 数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使 得IBCS 具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI 数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划 分.最后,基于IBCS 评估的西宝高速公路收费数据聚类结果表明,采用K-means 算法,簇 数为5时聚类模式最佳.  相似文献   

12.
基于图的频繁闭项集挖掘算法   总被引:5,自引:0,他引:5  
为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph—based frequent closed itemset generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁闭项集,从而只需扫描数据库2次,不产生候选集;引入扩展频繁项集的概念,大大减小了检查频繁项集是否闭的搜索空间.用1个真实数据库和2个合成数据库对GFCG进行了测试,并与A-close和CLOSET算法的结果进行了比较,结果表明,该算法具有良好的速度和可伸缩性性能.  相似文献   

13.
Many existing product family design methods assume a given platform, However, it is not an in-tuitive task to select the platform and unique variable within a product family. Meanwhile, most approachesare single-platform methods, in which design variables are either shared across all product variants or not atall. While in multiple-platform design, platform variables can have special value with regard to a subset ofproduct variants within the product family, and offer opportunities for superior overall design. An informationtheoretical approach incorporating fuzzy clustering and Shannon's entropy was proposed for platform variablesselection in multiple-platform product family. A 2-level chromosome genetic algorithm (2LCGA) was proposedand developed for optimizing the corresponding product family in a single stage, simultaneously determiningthe optimal settings for the product platform and unique variables. The single-stage approach can yield im-provements in the overall performance of the product family compared with two-stage approaches, in which thefirst stage involves determining the best settings for the platform and values of unique variables are found foreach product in the second stage. An example of design of a family of universal motors was used to verify theproposed method.  相似文献   

14.
覃频频  牙韩高 《ITS通讯》2005,7(2):39-43
结合固定型交通检测器空间配置的四条原则和配置密度优化步骤,提出固定型交通检测器配置优化的数据挖掘方法。设计6种高速公路出口匝道的固定型交通检测器配置密度方案作为实例研究对像,运用数据挖掘技术的时间序列指数平滑方法、ARIMA方法和神经网络方法分别建立高速公路出口匝道小时交通量Winters预测模型,ARIMA预测模型及神经网络预测模型。采用网络搜索技术确定Winters模型参数,设计一种比传统ARIMA模型参数估计方法更精确的算法程序估计ARIMA模型参数,采用三项误差指标评价模型预测效果,根据预测结果及高速公路事件管理交通参数精度要求确定可行方案及最佳方案,研究结果表明:在保证满足ITS对交通参数精度要求的同时,通过数据挖掘技术降低了交通流信息采集固定型检测器的配置密度及成本,为固定型交通检测器配置密度的优化提供了一种简单可行的新方法。  相似文献   

15.
研究铁路到站集装箱吊车作业优化,如何规划龙门吊的作业顺序,减少作业次数成为衡量堆场工作效率的关键。通过分析问题建立一个计划期内以倒箱次数最少为目标的多时段动态集装箱堆场箱位分配模型,减少龙门吊的作业次数,设计遗传算法求解。算例表明:该模型及算法能够有效地优化堆场内零散箱的箱位分配,提高集装箱堆场的作业效率。  相似文献   

16.
集卡动态调度路径优化算法   总被引:1,自引:0,他引:1  
从整体调度的角度出发, 分析了整个码头作业面的动态调度方案, 提出了一种新的集装箱卡车(集卡)动态调度路径的自适应蚁群算法。运用码头GPRS系统, 以集卡速度、流量、位置等相关数据建立了感知链。通过判断阻塞状况和调整可行点集, 确定了信息素浓度更新策略与转移概率计算方法。针对码头路网的复杂性和蚁群算法的实时计算效率, 设计了蚁群算法的步骤。将信息熵引入到蚁群算法中, 运用MATLAB软件, 对集卡的动态调度方案进行了仿真计算。计算结果表明: 当初始集卡速度分别为50、75 km·h-1, 初始集卡流量分别为800、1 000 veh·h-1时, 集卡行驶的最短路径为4.3 km, 行驶时间为0.057 h;集卡行驶的最优路径为8.3 km, 行驶时间为0.111 h。可见, 该算法能有效缓解码头阻塞问题, 提高集卡利用率和码头作业效率。  相似文献   

17.
从BW功能结构出发,结合中国北车运营指标数据集成以及模型创建的实践,提出企业决策支持数据模型的优化创建方法,给出合理的创建数据模型的原则.该建模方法与原则已经成功应用于北车集团运营指标分析业务,经过实践证明这些方法与原则具有实施便捷、结构清晰、查询快速的优势.  相似文献   

18.
在分析关联规则的数据挖掘算法基础上,针对Apriori算法进行深入研究,提出了改进算法FA,并在实际项目中加以应用.算法FA在计算选项集支持度所涉及的记录数目将小于事务数据库中原记录数目,提高了原算法的效率,具有一定的实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号