共查询到16条相似文献,搜索用时 46 毫秒
1.
基于向量矩阵的频繁项集挖掘算法 总被引:1,自引:0,他引:1
为减少冗余候选项集的产生,提出了一种基于向量矩阵的频繁项集挖掘算法FIS-Miner.在该算法中,将所有频繁1-项集按支持度升序进行排序并存储其对应的二进制位向量,将这些二进制位向量映射到向量矩阵进行分析找出所有的频繁项集,既实现了数据库的一次扫描又避免了大量候选项集的产生.探讨了该算法的实现步骤,并给出实例验证了该算法的有效性. 相似文献
2.
为提高数据挖掘效率,提出了一种基于分布式的频繁闭合模式挖掘算法——PFCI-Miner.该算法采用任务分布的主从方式,其中主处理器通过发送提出的前缀路径表(PrePthx)将挖掘任务合理划分,而从处理器借助提出的存储树(Trac-tree)挖掘局部频繁闭合模式,最后由主处理器挖掘出全局频繁闭合模式.此外,采用星形拓扑结构,使数据通信只存在于主处理器与从处理器之间,而各从处理器之间无数据通信且不需要同步.在由3台PC机构成的分布式环境下,对合成与蘑菇数据集的实验表明,PFCI-Miner较DP-FP算法、AFCIM算法和DFCIM算法的执行效率分别平均提高了43.66%、42.17%、53.48%和51.86%、47.62%、62.78%. 相似文献
3.
ψ—频繁闭项目挖掘问题及其算法 总被引:1,自引:1,他引:0
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,ψ-关联规则挖掘问题是它的一种推广形式,利用闭项目集的思想,提出了了ψ-频繁闭项目挖掘问题,它是ψ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决ψ-关联规则挖掘问题产生大量规则的问题。ψψψ 相似文献
4.
一种新的高效关联规则数据挖掘算法 总被引:9,自引:2,他引:9
在分析关联规则的数据挖掘算法基础上,针对Ariori算法进行了深入研究,提出了改进算法FA,并在实际项目中加以应用,算法FA在计算选项集支持度所涉及的记录数目将小于事务数据库中原记录数目,提高了原算法的效率,具有一定的实用性。 相似文献
5.
提出了基于位对象的最大频繁模式挖掘算法.算法中,用位对象表示数据,并用位对象概念改进FP-Tree.用深度优先搜索策略,通过压缩数据库,并用位对象的特性简化模式支持度的计数,使挖掘时不需产生条件FP-Tree和候选项目集,以提高最大频繁模式的挖掘效率.实验结果验证了BFP-Miner的有效性. 相似文献
6.
基于图的频繁闭项集挖掘算法 总被引:5,自引:0,他引:5
为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph—based frequent closed itemset generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁闭项集,从而只需扫描数据库2次,不产生候选集;引入扩展频繁项集的概念,大大减小了检查频繁项集是否闭的搜索空间.用1个真实数据库和2个合成数据库对GFCG进行了测试,并与A-close和CLOSET算法的结果进行了比较,结果表明,该算法具有良好的速度和可伸缩性性能. 相似文献
7.
在分析关联规则的数据挖掘算法基础上,针对Apriori算法进行深入研究,提出了改进算法FA,并在实际项目中加以应用.算法FA在计算选项集支持度所涉及的记录数目将小于事务数据库中原记录数目,提高了原算法的效率,具有一定的实用性. 相似文献
8.
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,φ-关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想,提出了φ-频繁闭项目挖掘问题。它是φ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决φ-关联规则挖掘问题中产生大量规则的问题。 相似文献
9.
对APriori算法的一个改进 总被引:6,自引:0,他引:6
介绍了关联规则挖掘的研究情况,并在分析关联规则的数据挖掘算法的基础上,针对Apriori算法进行深入研究,提出了Apriori—1算法,新算法在计算候选大项集支持度所涉及的记录数目将小于事务数据库中原始的记录数目,提高了原算法的效率,具有一定的实用性. 相似文献
10.
Apriori算法作为一种典型的关联规则算法,将其应用在CRM中,对于促进CRM进一步向智能化发展,提升CRM价值起到非常重要的作用.本文从关联规则的概念、算法着手,介绍关联规则的概念与关联规则的几种方法;然后对Apriori算法的基本原则、方法的步骤,以及在CRM中应用的流程进行了论述;最后结合例子对Apriori算法的应用进行了探讨,介绍了具体的应用方法以及应用范围. 相似文献
11.
影响关联规则挖掘的关键问题是最大频繁项目序列集的生成问题,而传统的算法往往要求对事务数据库进行多次扫描,从而提高了I/O代价.阐述了项目序列集和它的基本操作的定义,然后详细描述了ISS-DM的最大频繁项目序列集生成算法,并在此基础上提出了一种改进的ISS-DM算法,最后进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效率较高. 相似文献
12.
陈红丽 《华东交通大学学报》2007,24(2):106-109
提出一种求精简规则的带支持信息的增量式算法IDMA,该算法改进了传统挖掘算法的缺点,可充分利用已挖掘出的规则集来对新增实例进行决策规则挖掘,同经典Rough集挖掘算法比较,算法IDMA计算过程简单,而且效率较高. 相似文献
13.
A New Algorithm for Mining Frequent Pattern 总被引:3,自引:0,他引:3
Mining frequent pattern in transaction database,time-series databases,and many other kinds of databases have been studied popularly in data mining research.Most of the previous studies adopt Apriori-like candidate set generation-and-test approach.However,candidate set generation is very costly.Han J.proposed a novel algorithm FP-growth that could generate frequent pattern without candidate set.Based on the analysis of the algorithm FP-growth,this paper proposes a concept of equivalent FP-tree and proposes an improved algorithm,denoted as FP-growth,which is much faster in speed,and easy to realize,FP-growth adopts a modifeid structure of FP-tree and header table,and only generates a header table in each recursive operation and projects the tree to the original FP-tree,The two algorithms get the same frequent pattern set in the same transaction database,but the performance study on computer shows that the speed of the improved algorithm,FP-growth,is at least two times as fast as that of FP-growth. 相似文献
14.
讨论了可辩识矩阵的内容的深层次含义,分析了它与属性值约简的关系,并提出了一种利用可辩识矩阵实现属性值约简的方法,分析了利用可辩识矩阵实现属性约简和属性值约简的方法,设计了基于可辩识矩阵的最佳约简的算法,使得属性约简和属性值约简得以一致计算,使知识推理过程变得统一且相对简单. 相似文献
15.
基于粗糙集的最小规则生成算法 总被引:2,自引:0,他引:2
讨论了可辩识矩阵的内容的深层次含义,分析了它与属性值约简的关系,并提出了一种利用可辩识矩阵实现属性值约简的方法,分析了利用可辩识矩阵实现属性约简和属性值约简的方法,设计了基于可辩识矩阵的最佳约简的算法,使得属性约简和属性值约简得以一致计算,使知识推理过程变得统一且相对简单. 相似文献
16.
Reliability parameter selection is very important in the period of equipment project design and demonstration. In this paper, the problem in selecting the reliability parameters and their number is proposed. In order to solve this problem, the thought of text mining is used to extract the feature and curtail feature sets from text data firstly, and frequent pattern tree (FPT) of the text data is constructed to reason frequent item-set between the key factors by frequent patter growth (FPG) algorithm. Then on the basis of fuzzy Bayesian network (FBN) and sample distribution, this paper fuzzifies the key attributes, which forms associated relationship in frequent item-sets and their main parameters, eliminates the subjective influence factors and obtains condition mutual information and maximum weight directed tree among all the attribute variables. Furthermore, the hybrid model is established by reason fuzzy prior probability and contingent probability and concluding parameter learning method. Finally, the example indicates the model is believable and effective. 相似文献