首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 140 毫秒
1.
首先阐述基于矩阵的Apriori数据挖掘,指出此算法具有占用内存大的问题,并针对此问题进行改进。最后在仿真实验过程中,搭建Hadoop云平台,利用IBM实验室提供的数据集进行仿真。仿真结果表明,与传统的数据挖掘算法相比,此方法运行时间增长速度比较平缓,数据挖掘时间短。  相似文献   

2.
随着大数据时代的来临,数据挖掘过程中的隐私泄露给数据挖掘工作者带来了很多问题和挑战.在数据挖掘过程中,如何在保护敏感信息的同时,高效地挖掘出符合精确度的结果,是隐私保护数据挖掘领域的热点问题.文中首先介绍了AOPAM隐私保护关联规则挖掘算法,通过分析该算法的缺陷和不足,引入了递推和分治策略,提出了一种新的改进算法.通过利用已知项求解未知项的思维,简化了高阶矩阵的求逆运算,有效减少了数据库的扫描次数,降低了AOPAM算法在计算重构项集支持度时的时间复杂度.实验表明,以同类型数据测试,与原算法相比,改进后算法在运行时间效率上得到了有效提高.  相似文献   

3.
基于邻域的覆盖粗糙集已经被用于构建数值型数据分类器.文中将该理论应用于针对名词性数据的代价敏感分类器.首先,用对象间的相似关系确定每个对象的相似度阈值,并通过该阈值确定每个对象的邻居以及邻域;然后,通过覆盖约简算法选举出一组称为代表的对象;最后,当需要对新对象进行分类时,计算它与各代表之间的曼哈顿距离,并综合误分类代价向量制定不同分类策略,以最小化误分类代价期望值.在UCI数据库中的数据集之上与主流的代价敏感ID3和C4.5算法对比,结果表明新算法能取得更好的分类效果.  相似文献   

4.
陈加顺 《中国水运》2007,7(9):131-133
文章首先介绍CRM与数据挖掘关系,接着重点分析数据挖掘中的关联规则算法,即Apriori算法以及改进的Apriori,通过讨论关联规则算法在到房地产CRM中的应用,并结合实际数据,在此基础上提出数据挖掘技术对房地产CRM具有潜在的价值。  相似文献   

5.
针对大众标注网站推荐系统中存在的数据矩阵稀疏性影响推荐效果的问题,文中采取如下策略:对标注数据进行K-means聚类,将具有相似标签特征的项目进行归类以保证数据具有初始聚合性;聚类完成后运用高阶奇异值分解(high order singular value decomposition,HOSVD)对聚类后的标注数据建立多维张量模型.该策略重点利用张量分解方法对含有用户、标签和项目的三元数据组进行分析,可以进一步改进稀疏性问题,同时形成对项目资源的个性化推荐.通过对社交书签网站Delicious.com的标注数据的处理,验证该方法对解决推荐系统中矩阵稀疏性问题以及提高推荐效果具有改进效果.  相似文献   

6.
数据挖掘技术应用于作战指挥挖掘系统,能为指挥员的决策分析提供智能化的、自动化的辅助手段。在分析数据挖掘问题中的分类算法的基础上,利用流形结构对分类算法进行了改进。从而避免全局线性对分类信息造成的丢失,保留完整的数据结构信息,在一般意义下完成针对数据集的各项任务。  相似文献   

7.
为了更好地保障船舶航行安全,有效提高船舶的故障定位和检测能力,提出了使用数据挖掘实现舰船故障数据定位方法,通过对舰船故障数据进行实时采集和分类挖掘获取船舶航行过程中的异常数据,实现对船舶故障数据关联规则特征的准确提取。在进行故障定位的过程中,合理并利用电磁探测器和声敏传感器等设备进行故障诊断,并对不同类别船舶故障数据的高维特征融合的研究采用数据挖掘分析算法,利用数据挖掘分类器对船舶故障数据进行分类识别和定位挖掘,从而有效保障船舶故障数据定位的精确度和有效性。最后通过实验结果表明,使用数据挖掘实现舰船故障数据定位方法具有较高的故障定位精度。可以应用于船舶故障实时诊断,有效提高船舶故障诊断的实时性。  相似文献   

8.
目前应用的舰船数据挖掘准确度较低,因此设计一种聚类分析算法的海上舰船数据挖掘。在数据挖掘中应用聚类分析算法,需要对数据进行预处理,得到文本数据特征向量集,利用模糊集体现近似关系,根据隶属度的取值将模糊聚类的思想演变为目标函数,将数据集按照目标函数,划分为具有较小差距的群组,初步得到数据挖掘结果,经过评估后,筛选出准确度最高的数据,作为数据挖掘的最终结果。至此完成了聚类分析算法的海上舰船数据挖掘的研究。通过实验表明,设计的数据挖掘准确度平均为92%,比传统的数据挖掘准确度高17.2%,验证了设计的聚类分析算法的海上舰船数据挖掘在提高挖掘准确度方面的可靠性。  相似文献   

9.
云计算物联网体系的数据挖掘模式设计   总被引:2,自引:2,他引:0  
现代海洋运输及海上开发中基于物联网架构的信息系统应用越来越多,其各个应用信息处理中心平台呈现分布异构﹑动态的特性,处理的信息量呈指数增加。利用传统的数据挖掘模型及算法越来越不能满足各应用的时效性要求。云计算集分布式架构与并行计算于一体,在信息处理的速率及数据存储的容量方面都有了极大提高。本文在研究现有的云计算架构及数据挖掘技术的基础上,改造Apriori算法,提出一种基于云计算的高性能数据挖掘算法,并进行仿真。  相似文献   

10.
传统的舰船营运数据挖掘算法存在着性能较差的缺陷,为此提出基于协同过滤的舰船营运数据挖掘算法研究与实现。将采集的多种数据来源的舰船营运数据进行集成,以得到的舰船营运数据集成为依据,构建矩阵分解模型,得到用户对舰船营运数据预测评分矩阵,采用分层随机梯度下降法对预测评分矩阵进行求解,以得到的预测评分为基础采用协同过滤算法实现了舰船营运数据的挖掘。通过实验得到,提出的舰船营运数据挖掘算法的RMSE参数平均值比传统算法小了0.34,说明提出的舰船营运数据挖掘算法具备更好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号