首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
模糊关联规则的挖掘算法   总被引:3,自引:0,他引:3  
为了提高模糊关联规则挖掘的效率,定义了冗余模糊关联规则,并分析了强模糊关联规则的冗余性质,提出了通过删除冗余模糊关联规则提高挖掘效率的新算法.此外,针对利用支持度和蕴涵度定义的强模糊关联规则挖掘问题,将删除冗余模糊关联规则和不删除冗余模糊关联规则的计算结果与实验结果进行了比较.结果表明,当数据库中项目数较多时,删除冗余模糊关联规则能提高挖掘效率.  相似文献   

2.
广义关联规则基及其挖掘算法   总被引:4,自引:0,他引:4  
为了解决传统的关联规则挖掘中产生大量规则的问题,提出了项目集上闭集和广义关联规则基的概念,并得出了闭项目集的上闭集是它本身、上闭集是惟一的等性质.基于这些性质,给出了事物数据库的广义关联规则基,不仅保留了数据库中所有关联规则的信息,而且规则有一致的结构,从而最大限度地减少了规则生成的数量.此外,还设计了广义关联规则基的挖掘算法,并通过实例验证了它的正确性.  相似文献   

3.
一种新的频集发现算法P&FP   总被引:1,自引:0,他引:1  
在分析已有关联规则挖掘算法的基础上,提出了应用于Web 文本集的特征关联规则挖掘框架,详细地论述了该框架所涉及的主要技术和实现过程中涉及的诸多问题,据此给出了该框架主要模块的实现算法.在该框架中,Web 文本集的特征关联规则挖掘以Web 文本的结构化处理和特征化处理为前提,核心的挖掘模块由频集发现算法P&FP 和关联规则生成算法GenNoRedundantRule 构成,算法P&FP 结合了Partition 算法的数据分片思想和FP-生成树算法的高效性,算法GenNoRedundantRule 可以避免大量冗余规则的产生.这两个算法较之已有的算法是比较高效的,而且它们还具有较好的扩展性和并行性.  相似文献   

4.
影响关联规则挖掘的关键问题是最大频繁项目序列集的生成问题,而传统的算法往往要求对事务数据库进行多次扫描,从而提高了I/O代价.阐述了项目序列集和它的基本操作的定义,然后详细描述了ISS-DM的最大频繁项目序列集生成算法,并在此基础上提出了一种改进的ISS-DM算法,最后进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效率较高.  相似文献   

5.
本文讨论在海量数据中挖掘数据项之间的关联规则,剖析典型算法——Apriori算法。根据算法的基本思想,给出它的形式化的描述,并且通过分析实例给出关联规则的挖掘步骤及算法实现,最后对该算法进行了评价。  相似文献   

6.
PSO算法在关联规则挖掘中的应用   总被引:1,自引:0,他引:1  
提出了一种新的大型数据库中关联规则挖掘策略,利用PSO算法对原始数据库进行划分,将原始数据库分为n个子数据库,再使用FP-Growth算法对每个子数据库进行关联规则挖掘.实验证明:该方法有效的改善了FP-Growth挖掘算法的效率,尤其是对大型数据库进行着挖掘时,该方法相比于其它算法具有更高的效率.  相似文献   

7.
油液监测故障诊断关联规则的挖掘研究   总被引:7,自引:0,他引:7  
叙述了基于规则推理的传统专家系统对规则提取的局限性,介绍了数据挖掘的概念,并就柴油机故障诊断问题指出关联规则的必要性,确定了挖掘关联规则所需的数据库结构.并讨论了柴油机系统单层次故障和多层次故障关联规则的挖掘.  相似文献   

8.
关联规则的挖掘目标是发现数据项集之间的关联关系或相关关系,是数据挖掘中的一个重要课题。对于超大数据集,传统算法效率较低,对其加以改进,给出了一种基于图论与最大路径的关联规则挖掘算法。该算法将事务集构造成布尔矩阵,经矩阵清理后,将其转换为图的形式,根据关联规则图生成邻接矩阵。当取步长为k且k2时,按行从第一个非0元素开始遍历,寻找最大权值路径,此时连接所得元素的行列索引即频繁k+2项集。实验结果表明该算法减少了对数据集的扫描次数,针对大数据集,相较于传统的Apriori算法能够显著缩短时间,大大提高效率。  相似文献   

9.
在分析数据特性的基础上,提出了一种基于异几率属性的可视化关联规则挖掘算法,不仅提高了原算法的运行效率,而且提供了一个可视化的交互平台,使用户主动地挖掘感兴趣的关联规则.  相似文献   

10.
基于图的频繁闭项集挖掘算法   总被引:5,自引:0,他引:5  
为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph—based frequent closed itemset generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁闭项集,从而只需扫描数据库2次,不产生候选集;引入扩展频繁项集的概念,大大减小了检查频繁项集是否闭的搜索空间.用1个真实数据库和2个合成数据库对GFCG进行了测试,并与A-close和CLOSET算法的结果进行了比较,结果表明,该算法具有良好的速度和可伸缩性性能.  相似文献   

11.
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,φ-关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想,提出了φ-频繁闭项目挖掘问题。它是φ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决φ-关联规则挖掘问题中产生大量规则的问题。  相似文献   

12.
The problem of association rule mining has gained considerableprominence in the data mining community for its use as an important tool of knowledge discovery from large-scale databases. And there has been a spurt of research activities around this problem. However, traditional association rule mining may often derive many rules in which people are uninterested. This paper reports a generalization of association rule mining called φ-association rule mining. It allows people to have different interests on different itemsets that are the need of real application. Also, it can help to derive interesting rules and substantially reduce the amount of rules. An algorithm based on FP-tree for mining φ-frequent itemset is presented. It is shown by experiments that the proposed method is efficient and scalable over large databases.  相似文献   

13.
对Apriori算法的进一步改进   总被引:3,自引:0,他引:3  
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,针对Apriori算法和Apriori-1算法进行深入研究,提出了Apriori-2算法,新算法在计算候选大项集支持度所涉及的记录数目将小于事务数据库中原始的记录数目,提高了原算法的效率,具有一定的实用性.  相似文献   

14.
对APriori算法的一个改进   总被引:6,自引:0,他引:6  
介绍了关联规则挖掘的研究情况,并在分析关联规则的数据挖掘算法的基础上,针对Apriori算法进行深入研究,提出了Apriori—1算法,新算法在计算候选大项集支持度所涉及的记录数目将小于事务数据库中原始的记录数目,提高了原算法的效率,具有一定的实用性.  相似文献   

15.
为有效提高关联规则挖掘算法效率,提出了一种基于矩阵的多段支持度关联规则挖掘算法,该算法通过一次数据库扫描将事务数据存放在矩阵中,利用矩阵进行支持度的计算和频繁集的寻找,同时将项集支持度分段计算的思想应用其中,减少候选集生成,实验表明,算法效率得到了较大提高。  相似文献   

16.
为解决类别属性数据流异常点检测问题,针对事务数据流环境,提出了基于属性关联及匹配差异度的数据流异常检测模型AAMDD(attribute associations and match difference degree).AAMDD模型离线构建一个关联规则库,并对其进行增量式更新.同时,利用时间敏感型滑动窗口(time-sensitive sliding windows,TimeSW)维护数据流数据,每经过一个时间跨度,就将当前窗口中每条数据包含的项集与关联规则库进行匹配,计算匹配差异度,根据匹配差异度的不同在线检测异常点.此外,给出了与AAMDD模型相对应的算法AAMDD-algorithm.实验结果表明,AAMDD-algorithm比FODFP-Stream算法的效率和检测精确度分别平均提高了37.43%和5.51%,并且AAMDD-algorithm的查全率保持在77%以上,可用于事务型数据流异常检测.   相似文献   

17.
为了提高齿轮副磨损状态评估的准确率,基于数据挖掘技术提出了一种新的齿轮副磨损状态评估方法.该方法通过设计直齿圆柱齿轮副磨损实验,提取实验齿轮副全寿命周期内的油液参数和振动参数,对齿轮副磨损状态进行聚类划分,建立了监测参数与齿轮副磨损状态之间的关联规则集及齿轮副磨损状态关联规则匹配算法,用于识别齿轮副的磨损状态.研究结果表明:基于数据挖掘的齿轮副磨损状态评估方法对齿轮副磨损状态的识别率达90%,能有效地评估齿轮副磨损状态.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号