首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Hadoop平台下Mahout随机森林算法的分析与实现
引用本文:曹蒙蒙,郭朝有.Hadoop平台下Mahout随机森林算法的分析与实现[J].舰船电子工程,2018(9).
作者姓名:曹蒙蒙  郭朝有
作者单位:海军工程大学动力工程学院
摘    要:为了验证Mahout随机森林算法的评估效果,文章基于Hadoop平台以UCI数据库中的Banknote Authentication数据集为应用背景,对该算法进行了验证分析。首先阐述了Hadoop云计算平台的重要组成部分——HDFS分布式文件系统和Map Reduce计算框架,同时搭建了完全分布式的Hadoop物理集群实验环境。然后,对随机森林算法在Mahout算法库中的实现过程及其原理进行分析。最后,用UCI数据集在Hadoop平台上进行验证。实验结果表明,随机森林模型对BanknoteAuthentication数据集的分类准确率稳定在96%以上,当决策树的数目为5的时候,效果最优,准确率达98.5401%。此外,实例还通过选择不同的决策树数目,验证了随机森林算法具有较高的稳定性和鲁棒性。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号