首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
基于向量矩阵的频繁项集挖掘算法   总被引:1,自引:0,他引:1  
为减少冗余候选项集的产生,提出了一种基于向量矩阵的频繁项集挖掘算法FIS-Miner.在该算法中,将所有频繁1-项集按支持度升序进行排序并存储其对应的二进制位向量,将这些二进制位向量映射到向量矩阵进行分析找出所有的频繁项集,既实现了数据库的一次扫描又避免了大量候选项集的产生.探讨了该算法的实现步骤,并给出实例验证了该算法的有效性.  相似文献   

2.
一种基于trie的频繁项集发现算法   总被引:1,自引:1,他引:1  
挖掘频繁项集是关联规则算法中的关键步骤.分析了hash树作为数据结构实现寻找频繁项集的方法,讨论了数据结构trie及其特性,并提出用trie作数据结构实现频繁项集的快速发现。其特点是:不依赖用户定义的支持度阀值;只需扫描一遍数据库;可以快速计算项集的支持度;支持动态数据库。  相似文献   

3.
分析了基于关联规则的增量数据挖掘算法,指出其效率低下的原因,针对传统数据挖掘算法多次迭代扫描,每次迭代产生数目更大的频繁项集的不足,提出链表增量数据挖掘算法LIUA,并将该算法应用于区域性车辆自动识别管理系统中,有效地挖掘出系统中的关联规则,对挖掘出的关联规则进行了分析.通过测试结果表明该算法是合理有效的.  相似文献   

4.
为有效提高关联规则挖掘算法效率,提出了一种基于矩阵的多段支持度关联规则挖掘算法,该算法通过一次数据库扫描将事务数据存放在矩阵中,利用矩阵进行支持度的计算和频繁集的寻找,同时将项集支持度分段计算的思想应用其中,减少候选集生成,实验表明,算法效率得到了较大提高。  相似文献   

5.
一种城市公交查询的算法及其应用   总被引:10,自引:0,他引:10  
本文分析了常用赋权有向图和城市公交网络的特点及其拓扑模型,认为用现有的数据结构表示公交网络比较困难,不适合用经典的最短路径算法来求解公交线路查询;作者提出利用数据库技术可以简单清晰的描述公交网络,并给出了公交网络的一种数据库结构;在此基础上,给出利用数据库的公交网络查询的算法;最后,通过一个实例证实了该算法是有效的.  相似文献   

6.
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小.最大精确规则基和无冗余最小.最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

7.
为解决物体表面重建中的轮廓拼接问题,将其转化为在有向图中寻求最优路径问题.提出了基于遗传算法的适用各种目标函数的轮廓拼接算法,其中对初始种群的产生、交叉算子和变异算子等做了改进,以确保产生的个体均能代表有效解.算例模拟结果表明,该算法简单可行,在优化性能、收敛速度及鲁棒性等方面优于模拟退火算法.  相似文献   

8.
求简单有向图所有基本回路的强核图论算法   总被引:6,自引:0,他引:6  
求系统动力学模型的所有反馈环等价于求对应的简单有向图的所有基本回路,其核心问题是算法的时间复杂度,针对这一问题,提出强核的概念,基于强核概念设计了求简单有向图所有基本回路的算法,给出相应算例,并分析了算法复杂性.在时间复杂度上,本算法优于基于核概念的有向图的行列式算法。  相似文献   

9.
多模式部分量子搜索算法   总被引:2,自引:1,他引:1  
为了提高数据库的搜索速度,提出了多模式部分量子搜索算法。该算法把数据库的搜索项分成若干等份,通过舍弃不重要信息,再用多模式量子搜索算法,加快搜索速度,并可在数据库中同时搜索到多个模式.实例表明,当数据库有7.206×10^16个搜索项时,采用部分搜索算法比全局搜索算法可以减少1.325×10^6次搜索迭代.  相似文献   

10.
提出了基于位对象的最大频繁模式挖掘算法.算法中,用位对象表示数据,并用位对象概念改进FP-Tree.用深度优先搜索策略,通过压缩数据库,并用位对象的特性简化模式支持度的计数,使挖掘时不需产生条件FP-Tree和候选项目集,以提高最大频繁模式的挖掘效率.实验结果验证了BFP-Miner的有效性.  相似文献   

11.
为提高数据挖掘效率,提出了一种基于分布式的频繁闭合模式挖掘算法——PFCI-Miner.该算法采用任务分布的主从方式,其中主处理器通过发送提出的前缀路径表(PrePthx)将挖掘任务合理划分,而从处理器借助提出的存储树(Trac-tree)挖掘局部频繁闭合模式,最后由主处理器挖掘出全局频繁闭合模式.此外,采用星形拓扑结构,使数据通信只存在于主处理器与从处理器之间,而各从处理器之间无数据通信且不需要同步.在由3台PC机构成的分布式环境下,对合成与蘑菇数据集的实验表明,PFCI-Miner较DP-FP算法、AFCIM算法和DFCIM算法的执行效率分别平均提高了43.66%、42.17%、53.48%和51.86%、47.62%、62.78%.   相似文献   

12.
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,φ-关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想,提出了φ-频繁闭项目挖掘问题。它是φ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决φ-关联规则挖掘问题中产生大量规则的问题。  相似文献   

13.
The problem of association rule mining has gained considerableprominence in the data mining community for its use as an important tool of knowledge discovery from large-scale databases. And there has been a spurt of research activities around this problem. However, traditional association rule mining may often derive many rules in which people are uninterested. This paper reports a generalization of association rule mining called φ-association rule mining. It allows people to have different interests on different itemsets that are the need of real application. Also, it can help to derive interesting rules and substantially reduce the amount of rules. An algorithm based on FP-tree for mining φ-frequent itemset is presented. It is shown by experiments that the proposed method is efficient and scalable over large databases.  相似文献   

14.
广义关联规则基及其挖掘算法   总被引:4,自引:0,他引:4  
为了解决传统的关联规则挖掘中产生大量规则的问题,提出了项目集上闭集和广义关联规则基的概念,并得出了闭项目集的上闭集是它本身、上闭集是惟一的等性质.基于这些性质,给出了事物数据库的广义关联规则基,不仅保留了数据库中所有关联规则的信息,而且规则有一致的结构,从而最大限度地减少了规则生成的数量.此外,还设计了广义关联规则基的挖掘算法,并通过实例验证了它的正确性.  相似文献   

15.
模糊关联规则的挖掘算法   总被引:3,自引:0,他引:3  
为了提高模糊关联规则挖掘的效率,定义了冗余模糊关联规则,并分析了强模糊关联规则的冗余性质,提出了通过删除冗余模糊关联规则提高挖掘效率的新算法.此外,针对利用支持度和蕴涵度定义的强模糊关联规则挖掘问题,将删除冗余模糊关联规则和不删除冗余模糊关联规则的计算结果与实验结果进行了比较.结果表明,当数据库中项目数较多时,删除冗余模糊关联规则能提高挖掘效率.  相似文献   

16.
A new real-time model based on parallel time-series mining is proposed to improve the accuracy and efficiency of the network intrusion detection systems. In this model, multidimensional dataset is constructed to describe network events, and sliding window updating algorithm is used to maintain network stream. Moreover, parallel frequent patterns and frequent episodes mining algorithms are applied to implement parallel time-series mining engineer which can intelligently generate rules to distinguish intrusions from normal activities. Analysis and study on the basis of DAWNING 3000 indicate that this parallel time-series mining-based model provides a more accurate and efficient way to building real-time NIDS.  相似文献   

17.
社会网络分析方法将社会行动者映射为图的节点,社会行动者之间的关系映射为图的边,然后利用图论的相关知识来解决社会网络问题.将数据挖掘方法应用于社会网络分析是数据挖掘研究领域的一个新方向.本文主要在算法改进和系统实现层面展开数据挖掘在社会网络分析中的应用,提出了基于权重的Jaccard相似度度量的方法及处理多链接属性的实体识别算法.最后基于电信分析系统平台,使用上述算法在电信数据集上进行测试,实验结果表明上述算法的有效性和实用性.  相似文献   

18.
针对具有决策属性的数据库模型,提出了高效挖掘关联规则算法,即矩阵划分算法:根据决策属性将扫描后的数据库划分成两个包含不同决策属性的矩阵,分别采用向量法挖掘频繁项目集.关联规则的生成可充分利用“与”运算的优点,查找规则前件或后件的支持度.所提出的算法减少了候选二项频集的生成,以及“与”运算的大小,与apriori算法及传统的向量法挖掘关联规则相比,效率明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号