首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
提出了基于位对象的最大频繁模式挖掘算法.算法中,用位对象表示数据,并用位对象概念改进FP-Tree.用深度优先搜索策略,通过压缩数据库,并用位对象的特性简化模式支持度的计数,使挖掘时不需产生条件FP-Tree和候选项目集,以提高最大频繁模式的挖掘效率.实验结果验证了BFP-Miner的有效性.  相似文献   

2.
影响关联规则挖掘的关键问题是最大频繁项目序列集的生成问题,而传统的算法往往要求对事务数据库进行多次扫描,从而提高了I/O代价.阐述了项目序列集和它的基本操作的定义,然后详细描述了ISS-DM的最大频繁项目序列集生成算法,并在此基础上提出了一种改进的ISS-DM算法,最后进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效率较高.  相似文献   

3.
以web技术和A^*算法为基础,通过改进A^*算法、优化存储结构和提高数据搜索的效率,实现了运输线路的优化选择,使用Java语言给出了具体的应用实例。  相似文献   

4.
为提高数据挖掘效率,提出了一种基于分布式的频繁闭合模式挖掘算法——PFCI-Miner.该算法采用任务分布的主从方式,其中主处理器通过发送提出的前缀路径表(PrePthx)将挖掘任务合理划分,而从处理器借助提出的存储树(Trac-tree)挖掘局部频繁闭合模式,最后由主处理器挖掘出全局频繁闭合模式.此外,采用星形拓扑结构,使数据通信只存在于主处理器与从处理器之间,而各从处理器之间无数据通信且不需要同步.在由3台PC机构成的分布式环境下,对合成与蘑菇数据集的实验表明,PFCI-Miner较DP-FP算法、AFCIM算法和DFCIM算法的执行效率分别平均提高了43.66%、42.17%、53.48%和51.86%、47.62%、62.78%.   相似文献   

5.
刷卡数据为研究公共交通乘客长期出行规律提供了数据基础.利用北京市2018年 4~5月的刷卡数据,通过提取乘客活动地,推断居住地位置和识别活动类型3个步骤构建乘客个体活动链;基于PrefixSpan算法提取普通卡、老年卡、学生卡乘客活动链的频繁序列模式,采 用Levenshtein距离度量3类乘客活动链日维度的相似性.结果表明:每类用户中约70%乘客的频繁活动序列是对称模式;普通卡和学生卡用户的相似性高于老年卡用户,平均值分别为 0.645、0.649和0.530;3类乘客的工作日与非工作日活动链具有明显差异,而工作日之间或非工作日之间具有较高相似性.本文有助于定量解析公共交通乘客的出行活动规律,为科学优化公共交通服务提供依据.  相似文献   

6.
刷卡数据为研究公共交通乘客长期出行规律提供了数据基础.利用北京市2018年 4~5月的刷卡数据,通过提取乘客活动地,推断居住地位置和识别活动类型3个步骤构建乘客个体活动链;基于PrefixSpan算法提取普通卡、老年卡、学生卡乘客活动链的频繁序列模式,采 用Levenshtein距离度量3类乘客活动链日维度的相似性.结果表明:每类用户中约70%乘客的频繁活动序列是对称模式;普通卡和学生卡用户的相似性高于老年卡用户,平均值分别为 0.645、0.649和0.530;3类乘客的工作日与非工作日活动链具有明显差异,而工作日之间或非工作日之间具有较高相似性.本文有助于定量解析公共交通乘客的出行活动规律,为科学优化公共交通服务提供依据.  相似文献   

7.
基于卡口数据,设计道路交通分析任务和数据挖掘算法,探索分析结果在宏观、中观、微观层面对城市交通规划、建设和管理的工程应用。基于所有车辆一日经过的卡口序列,提出毗邻区域交通量、车流轨迹和道路运行状况三大分析任务和技术方案。提出毗邻区域交通量概念,计算有道路连接的毗邻区域间的车流量,得到宏观路网交通量分布特征。采用频繁子序列挖掘算法得到满足特定条件的车辆群频繁经过的卡口集合和顺序,得到车辆群的活动范围和重要路径。基于车辆到达路段起点和终点的时间间隔,得到随着时间变化的路段车辆行程时间分布。以湖北省宜昌市为例阐述工程应用,总结提出卡口数据挖掘与道路交通分析系统框架。  相似文献   

8.
为有效提高关联规则挖掘算法效率,提出了一种基于矩阵的多段支持度关联规则挖掘算法,该算法通过一次数据库扫描将事务数据存放在矩阵中,利用矩阵进行支持度的计算和频繁集的寻找,同时将项集支持度分段计算的思想应用其中,减少候选集生成,实验表明,算法效率得到了较大提高。  相似文献   

9.
为发现高速公路下自由换道过程中眼睛感知-手脚操作之间的时序关联性,探索感知与操作相互作用的内在机理,采用驾驶模拟舱进行高速公路驾驶实验,采集眼动数据和车辆运行数据;分别提取换道瞬时和换道全过程的眼睛感知-手脚操作的特征;采用Aprior算法从换道瞬时和换道全过程两个角度发现眼睛感知-手脚操作的频繁模式,挖掘它们的关联规...  相似文献   

10.
均对粒模型的构建问题,提出了基于Rough集的一种粒表示方法:文章首先对于时间序列作了粒的描述,采用SAX符号表示不仅因为它的适用于粒的描述,更重要的是为后面的逻辑推理打下良好的基础.然后用基于SAX距离的相似性找出相近的模式,利用Rough集的规则发现算法找出关联规则.通过实验证明,本文中所提出的时间序列挖掘方法以及时序粒挖掘的算法基本上可满足实际时序挖掘的需要.  相似文献   

11.
A New Algorithm for Mining Frequent Pattern   总被引:3,自引:0,他引:3  
Mining frequent pattern in transaction database,time-series databases,and many other kinds of databases have been studied popularly in data mining research.Most of the previous studies adopt Apriori-like candidate set generation-and-test approach.However,candidate set generation is very costly.Han J.proposed a novel algorithm FP-growth that could generate frequent pattern without candidate set.Based on the analysis of the algorithm FP-growth,this paper proposes a concept of equivalent FP-tree and proposes an improved algorithm,denoted as FP-growth,which is much faster in speed,and easy to realize,FP-growth adopts a modifeid structure of FP-tree and header table,and only generates a header table in each recursive operation and projects the tree to the original FP-tree,The two algorithms get the same frequent pattern set in the same transaction database,but the performance study on computer shows that the speed of the improved algorithm,FP-growth,is at least two times as fast as that of FP-growth.  相似文献   

12.
A new real-time model based on parallel time-series mining is proposed to improve the accuracy and efficiency of the network intrusion detection systems. In this model, multidimensional dataset is constructed to describe network events, and sliding window updating algorithm is used to maintain network stream. Moreover, parallel frequent patterns and frequent episodes mining algorithms are applied to implement parallel time-series mining engineer which can intelligently generate rules to distinguish intrusions from normal activities. Analysis and study on the basis of DAWNING 3000 indicate that this parallel time-series mining-based model provides a more accurate and efficient way to building real-time NIDS.  相似文献   

13.
Reliability parameter selection is very important in the period of equipment project design and demonstration. In this paper, the problem in selecting the reliability parameters and their number is proposed. In order to solve this problem, the thought of text mining is used to extract the feature and curtail feature sets from text data firstly, and frequent pattern tree (FPT) of the text data is constructed to reason frequent item-set between the key factors by frequent patter growth (FPG) algorithm. Then on the basis of fuzzy Bayesian network (FBN) and sample distribution, this paper fuzzifies the key attributes, which forms associated relationship in frequent item-sets and their main parameters, eliminates the subjective influence factors and obtains condition mutual information and maximum weight directed tree among all the attribute variables. Furthermore, the hybrid model is established by reason fuzzy prior probability and contingent probability and concluding parameter learning method. Finally, the example indicates the model is believable and effective.  相似文献   

14.
关联规则挖掘问题是数据挖掘领域一个重要的研究方向,φ-关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想,提出了φ-频繁闭项目挖掘问题。它是φ-关联规则挖掘问题的一种替代,并给出了一种有效的挖掘算法,有效解决φ-关联规则挖掘问题中产生大量规则的问题。  相似文献   

15.
探讨了Dreamweaver网页制作教学设计如何根据学生的知识结构、接受能力、应用水平、创新思维能力等的差异,通过任务驱动模式来激发学生学习的主动性和创造性,使学生积极主动地获得网页知识和用Dreamweaver制作网页的技能。  相似文献   

16.
基于图的频繁闭项集挖掘算法   总被引:5,自引:0,他引:5  
为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph—based frequent closed itemset generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁闭项集,从而只需扫描数据库2次,不产生候选集;引入扩展频繁项集的概念,大大减小了检查频繁项集是否闭的搜索空间.用1个真实数据库和2个合成数据库对GFCG进行了测试,并与A-close和CLOSET算法的结果进行了比较,结果表明,该算法具有良好的速度和可伸缩性性能.  相似文献   

17.
随着网上信息的急剧膨胀,如何让用户快速、高效地检索出所需信息显得极其重要。文章介绍了一种基于向量空间模型的站内搜索优化设计方案,实现了对网站搜索系统的优化设计。  相似文献   

18.
随着互联网的广泛应用,网页制作已成为热门,Dreamweaver是网页制作的主流软件。在dreamweaver课程教学中,应以培养学生实践能力、创新能力为目的。本文结合教学经验谈谈该课程教学中应注意的几个问题。  相似文献   

19.
依据数据的几何形态来推断变量间函数关系的原理和Fuzzy嵌入文法概念,提出以数据曲线特征为依据的商务数据识别及处理方法.该模式识别方法中,特征重心是在赋予原始数据不同特征度条件下实现的,更接近人为表述数据曲线的心理特征,适应于商务数据的预处理.同时重点讨论了处理商务数据过程中的W eb数据挖掘及有关的可行方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号