首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 15 毫秒
1.
关联规则挖掘算法一般用于发现强关联规则,对于小支持度规则的挖掘则缺少有效的算法.利用事务数据的时间特性,将事务数据集划分成若干子集,对子集进行挖掘,并在得到的规则集基础上建立规则矩阵,过滤矩阵,得到一种挖掘事务数据集中小支持度布尔关联规则的新方法.  相似文献   

2.
一种新的频集发现算法P&FP   总被引:1,自引:0,他引:1  
在分析已有关联规则挖掘算法的基础上,提出了应用于Web 文本集的特征关联规则挖掘框架,详细地论述了该框架所涉及的主要技术和实现过程中涉及的诸多问题,据此给出了该框架主要模块的实现算法.在该框架中,Web 文本集的特征关联规则挖掘以Web 文本的结构化处理和特征化处理为前提,核心的挖掘模块由频集发现算法P&FP 和关联规则生成算法GenNoRedundantRule 构成,算法P&FP 结合了Partition 算法的数据分片思想和FP-生成树算法的高效性,算法GenNoRedundantRule 可以避免大量冗余规则的产生.这两个算法较之已有的算法是比较高效的,而且它们还具有较好的扩展性和并行性.  相似文献   

3.
针对具有决策属性的数据库模型,提出了高效挖掘关联规则算法,即矩阵划分算法:根据决策属性将扫描后的数据库划分成两个包含不同决策属性的矩阵,分别采用向量法挖掘频繁项目集.关联规则的生成可充分利用“与”运算的优点,查找规则前件或后件的支持度.所提出的算法减少了候选二项频集的生成,以及“与”运算的大小,与apriori算法及传统的向量法挖掘关联规则相比,效率明显提高.  相似文献   

4.
基于决策属性的关联规则挖掘   总被引:1,自引:0,他引:1  
针对具有决策属性的数据库模型,提出了高效挖掘关联规则算法,即矩阵划分算法:根据决策属性将扫描后的数据库划分成两个包含不同决策属性的矩阵,分别采用向量法挖掘频繁项目集.关联规则的生成可充分利用"与"运算的优点,查找规则前件或后件的支持度.所提出的算法减少了候选二项频集的生成,以及"与"运算的大小,与apriori算法及传统的向量法挖掘关联规则相比,效率明显提高.  相似文献   

5.
关联规则的挖掘目标是发现数据项集之间的关联关系或相关关系,是数据挖掘中的一个重要课题.对于超大数据集,传统算法效率较低,对其加以改进,给出了一种基于图论与最大路径的关联规则挖掘算法.该算法将事务集构造成布尔矩阵,经矩阵清理后,将其转换为图的形式,根据关联规则图生成邻接矩阵.当取步长为k且k>2时,按行从第一个非0元素开...  相似文献   

6.
为有效提高关联规则挖掘算法效率,提出了一种基于矩阵的多段支持度关联规则挖掘算法,该算法通过一次数据库扫描将事务数据存放在矩阵中,利用矩阵进行支持度的计算和频繁集的寻找,同时将项集支持度分段计算的思想应用其中,减少候选集生成,实验表明,算法效率得到了较大提高。  相似文献   

7.
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,φ-关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想,提出了φ-频繁闭项目挖掘问题。它是φ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决φ-关联规则挖掘问题中产生大量规则的问题。  相似文献   

8.
ψ—频繁闭项目挖掘问题及其算法   总被引:1,自引:1,他引:0  
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,ψ-关联规则挖掘问题是它的一种推广形式,利用闭项目集的思想,提出了了ψ-频繁闭项目挖掘问题,它是ψ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决ψ-关联规则挖掘问题产生大量规则的问题。ψψψ  相似文献   

9.
粗集理论是一种新型的数据挖掘方法,其中约简是它的重要概念.粗集理论的主要思想是在保持分类能力不变的前提下,通过属性约简和值约简,导出问题的决策或分类规则.本文不同于目前将属性约简作为决策规则挖掘的重点,而是在属性约简的基础上又进一步提出了值约简算法,大大提高了规则的挖掘效率.该算法对原有算法进行了改进,最终可获得更简的决策规则.实例分析表明了该算法是较优的、有实用价值的.  相似文献   

10.
均对粒模型的构建问题,提出了基于Rough集的一种粒表示方法:文章首先对于时间序列作了粒的描述,采用SAX符号表示不仅因为它的适用于粒的描述,更重要的是为后面的逻辑推理打下良好的基础.然后用基于SAX距离的相似性找出相近的模式,利用Rough集的规则发现算法找出关联规则.通过实验证明,本文中所提出的时间序列挖掘方法以及时序粒挖掘的算法基本上可满足实际时序挖掘的需要.  相似文献   

11.
模糊关联规则的挖掘算法   总被引:3,自引:0,他引:3  
为了提高模糊关联规则挖掘的效率,定义了冗余模糊关联规则,并分析了强模糊关联规则的冗余性质,提出了通过删除冗余模糊关联规则提高挖掘效率的新算法.此外,针对利用支持度和蕴涵度定义的强模糊关联规则挖掘问题,将删除冗余模糊关联规则和不删除冗余模糊关联规则的计算结果与实验结果进行了比较.结果表明,当数据库中项目数较多时,删除冗余模糊关联规则能提高挖掘效率.  相似文献   

12.
IntroductionDataminingistheprocessofidentifyinguseful,valid,novelandultimatelyunderstandablepat-ternsindata[1],andis“themostd...  相似文献   

13.
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小.最大精确规则基和无冗余最小.最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

14.
The problem of association rule mining has gained considerableprominence in the data mining community for its use as an important tool of knowledge discovery from large-scale databases. And there has been a spurt of research activities around this problem. However, traditional association rule mining may often derive many rules in which people are uninterested. This paper reports a generalization of association rule mining called φ-association rule mining. It allows people to have different interests on different itemsets that are the need of real application. Also, it can help to derive interesting rules and substantially reduce the amount of rules. An algorithm based on FP-tree for mining φ-frequent itemset is presented. It is shown by experiments that the proposed method is efficient and scalable over large databases.  相似文献   

15.
对Apriori算法的进一步改进   总被引:3,自引:0,他引:3  
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,针对Apriori算法和Apriori-1算法进行深入研究,提出了Apriori-2算法,新算法在计算候选大项集支持度所涉及的记录数目将小于事务数据库中原始的记录数目,提高了原算法的效率,具有一定的实用性.  相似文献   

16.
广义关联规则基及其挖掘算法   总被引:4,自引:0,他引:4  
为了解决传统的关联规则挖掘中产生大量规则的问题,提出了项目集上闭集和广义关联规则基的概念,并得出了闭项目集的上闭集是它本身、上闭集是惟一的等性质.基于这些性质,给出了事物数据库的广义关联规则基,不仅保留了数据库中所有关联规则的信息,而且规则有一致的结构,从而最大限度地减少了规则生成的数量.此外,还设计了广义关联规则基的挖掘算法,并通过实例验证了它的正确性.  相似文献   

17.
在分析关联规则的数据挖掘算法基础上,针对Apriori算法进行深入研究,提出了改进算法FA,并在实际项目中加以应用.算法FA在计算选项集支持度所涉及的记录数目将小于事务数据库中原记录数目,提高了原算法的效率,具有一定的实用性.  相似文献   

18.
文章以4S店客户信息数据库作为研究对象,利用数据挖掘中关联规则挖掘算法Apriori,挖掘出已成交的客户特征和规则,对分类结果进行分析,并在某品牌4S店销售汽车过程中借鉴这些规则,有针对性的地进行引导销售,从而提高了销售成功率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号