首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
关联规则挖掘算法一般用于发现强关联规则,对于小支持度规则的挖掘则缺少有效的算法.利用事务数据的时间特性,将事务数据集划分成若干子集,对子集进行挖掘,并在得到的规则集基础上建立规则矩阵,过滤矩阵,得到一种挖掘事务数据集中小支持度布尔关联规则的新方法.  相似文献   

2.
均对粒模型的构建问题,提出了基于Rough集的一种粒表示方法:文章首先对于时间序列作了粒的描述,采用SAX符号表示不仅因为它的适用于粒的描述,更重要的是为后面的逻辑推理打下良好的基础.然后用基于SAX距离的相似性找出相近的模式,利用Rough集的规则发现算法找出关联规则.通过实验证明,本文中所提出的时间序列挖掘方法以及时序粒挖掘的算法基本上可满足实际时序挖掘的需要.  相似文献   

3.
广义关联规则基及其挖掘算法   总被引:4,自引:0,他引:4  
为了解决传统的关联规则挖掘中产生大量规则的问题,提出了项目集上闭集和广义关联规则基的概念,并得出了闭项目集的上闭集是它本身、上闭集是惟一的等性质.基于这些性质,给出了事物数据库的广义关联规则基,不仅保留了数据库中所有关联规则的信息,而且规则有一致的结构,从而最大限度地减少了规则生成的数量.此外,还设计了广义关联规则基的挖掘算法,并通过实例验证了它的正确性.  相似文献   

4.
提出一种基于语义模型关联规则的局域网数据检索方法.首先基于概念树描述语义模型并建立FP-树频集算法,通过概念映射将数据源与语义模型进行语义关联,在此基础上,进行噪声过滤并列出主题关键词,从而提高局域网的数据检索速度和一次查询效率.  相似文献   

5.
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,φ-关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想,提出了φ-频繁闭项目挖掘问题。它是φ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决φ-关联规则挖掘问题中产生大量规则的问题。  相似文献   

6.
影响关联规则挖掘的关键问题是最大频繁项目序列集的生成问题,而传统的算法往往要求对事务数据库进行多次扫描,从而提高了I/O代价.阐述了项目序列集和它的基本操作的定义,然后详细描述了ISS-DM的最大频繁项目序列集生成算法,并在此基础上提出了一种改进的ISS-DM算法,最后进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效率较高.  相似文献   

7.
ψ—频繁闭项目挖掘问题及其算法   总被引:1,自引:1,他引:0  
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,ψ-关联规则挖掘问题是它的一种推广形式,利用闭项目集的思想,提出了了ψ-频繁闭项目挖掘问题,它是ψ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决ψ-关联规则挖掘问题产生大量规则的问题。ψψψ  相似文献   

8.
为填补不完备数据集中的缺失数据,提出一种基于关联分析的填补方法.首先挖掘已有数据集的包含缺失属性值作为后件的关联规则,然后从得到的规则中选取满足条件的规则集;最后求得总体贡献度最大的后件作为缺失数据的填补.采用脑卒中数据集进行实验,其结果表明所提出的方法能够达到较好的填补效果.  相似文献   

9.
粗集理论是一种新型的数据挖掘方法,其中约简是它的重要概念.粗集理论的主要思想是在保持分类能力不变的前提下,通过属性约简和值约简,导出问题的决策或分类规则.本文不同于目前将属性约简作为决策规则挖掘的重点,而是在属性约简的基础上又进一步提出了值约简算法,大大提高了规则的挖掘效率.该算法对原有算法进行了改进,最终可获得更简的决策规则.实例分析表明了该算法是较优的、有实用价值的.  相似文献   

10.
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小.最大精确规则基和无冗余最小.最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号