- · 图书馆乐享数字资源主题活动[11/26]
- · 图书馆共享党员之家活动室启用[11/26]
- · 转发:教育系统“美好‘食’光””校园系列活动主题作品征集活动通知[11/03]
- · 红柳法学大讲堂第二十八期[11/03]
- · 关于举办兰州理工大学“红柳之星”2020校园新生才艺大赛的通知[10/30]
- · “科学家精神报告团”进校园活动通知[10/28]
- · 兰州理工大学2020年秋季学期国家普通话水平测试报名通知[10/27]
- · 2020年秋季学期至2021年寒假国内外线上线下交流项目报名通知[10/20]
基于R+Hadoop的中药材大数据的分析及预测
作者: 朱昶胜 王莎莎 王永贤 兰州理工大学计算机与通信学院.甘肃兰州730050 兰州理工大学甘肃省中医药大数据工程研究中心 甘肃兰州730050
关键词: 中药材 R语言 数据建模 Hadoop技术 决策树
摘要:Hadoop具有海量数据并行存储能力和高效并行计算架构,但缺乏数据建模和数据统计能力.针对Hadoop架构的数据统计分析能力的局限性,结合R语言和Hadoop框架的优点,提出一种基于R+Hadoop环境的大数据分析及预测方法.以甘肃惠森药业电子商务平台“药材盈”采集的大数据为例,通过采用Hadoop集群并行处理中药材文本数据、RHadoop进行预处理并获取样本数据、R语言对样本数据建模,获得较为可靠的预测中药材市场价格的模型,对中药材市场价格的变化规律及影响因素进行分析和预测.采用线性模型和决策树模型对中药材大数据进行建模,并通过实验验证和比较得到预测中药材市场价格的最佳模型.