版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《大数据导论》大数据分析的基本方法(1)预测性分析预测分析涵盖了各种统计学技术,包括利用预测模型,机器学习,数据挖掘等技术来分析当前及历史数据,从而对未来,或其他不确定的事件进行预测。(2)预测性分析——案例麻省理工学院研究者约翰·古塔格(JohnGuttag)和柯林·斯塔尔兹(CollinStultz)创建了一个计算机模型来分析之心脏病病患丢弃的心电图数据。他们利用数据挖掘和机器学习在海量的数据中筛选,发现心电图中出现三类异常者一年内死于第二次心脏病发作的机率比未出现者高一至二倍。这种新方法能够识别出更多的,无法通过现有的风险筛查被探查出的高危病人。(3)可视化分析可视化分析,也称为数据可视化,主要指的是利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。
最常见的就是图表展现。(4)可视化分析——案例1一家医院的住院费分析(5)可视化分析——案例2天猫双11数据实时展示(6)数据挖掘数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算。为了创建模型,算法将首先分析您提供的数据,并查找特定类型的模式和趋势。经典十大算法为:C4.5,K-Means,SVM,Apriori,EM,PageRank,AdaBoost,KNN,NB和CART(7)数据挖掘算法——案例啤酒和尿布:
20世纪90年代,美国沃尔玛超市管理人员分析销售数据时,发现了一个令人难以理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品,会经常出现在同一个购物篮中,且大多出现在年轻的父亲身上。沃尔玛就在卖场尝试将啤酒与尿布摆放在相同区域,让年轻
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2034年中国调合油燃料未来趋势预测分析及投资规划研究建议报告
- 2024-2034年中国血糖仪测试片行业供需趋势及投资风险研究报告
- 2024-2034年中国萘醌行业竞争格局分析及投资规划研究报告
- 2024-2034年中国自来水净化器市场供需格局及未来发展趋势报告
- 2024-2034年中国聚氯乙烯行业市场深度调研分析及投资前景研究预测报告
- 2024-2034年中国美替诺龙醋酸酯行业市场现状分析及竞争格局与投资发展研究报告
- 2024-2034年中国红薯行业市场深度分析及投资前景展望报告
- 2024-2034年中国类风湿性关节炎药物市场供需格局及未来发展趋势报告
- 2024-2034年中国稻谷加工市场竞争态势及行业投资潜力预测报告
- 2024-2034年中国社会化媒体行业全景评估及投资规划建议报告
- 会议室智能化及节能方案
- 加工中心机械换刀手结构设计毕业设计(论文)
- 主动脉夹层急救与护理进展
- 73项单位产品能耗限额标准
- 新概念第二册 单元测试2答案
- 沪教牛津版七年级下册全册单词表
- 高中三年成绩单模板(新留学)
- 楼入伙交房交楼工作复盘报告
- (完整word版)机械加工工艺卡片模板
- 门店商品损耗管理规定
- 欧盟热泵热水器能效标准测试简要
评论
0/150
提交评论