下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、“大数据大数据”与生活的联系与生活的联系人类世界,有很多个“时代”。如原始社会时代、奴隶主时代、封建帝国时代、资本主义、社会主义时代。信息时代是我们目前所处的时代。在这个时代,信息(也是数据)极大膨胀和爆炸,因此诞生了“大数据时代”在这个时代,数据的处理、加工、生产、流通、管理成为了数据人必不可少的一部分。是生活,也是工作,更是娱乐。数据是人的一部分,人也是数据的一部分。可以说,人类在这个“数据大时代”,任何行为、任何事物、任何人类信息都被数据化、电子化了。云计算、云存储是应对数据大膨胀而提出的数据存储、管理、计算所提出的优化的解决方案。而物联网则是将人类行为、物品行为信息收集起来,存放在网络
2、中的一种终端解决方案。不管是哪一个解决方案,都是将人类世界信息化、数据化、电子化进行到底的解决方案。我们生活在一个充满“数据”的时代,这里的“数据”并不仅仅指数字,理论上讲,一切可以以文件形式储存于计算机硬盘的东西, 包括数字、 文字、 图像、 声音、 视频等, 均可称为“数据”。我们打电话,使用微博、QQ、博客等社交工具,都是在不断增加着社会总体数据量。据权威预测,未来每隔 18 个月,整个世界的数据总量就会翻倍。IBM 的研究称,整个人类文明所获得的全部数据中,有 90%是过去两年内产生的。数据,除了它第一次被使用时提供的价值以外,那些积累下来的数据海洋并不是无用的废物,它还有着无穷无尽的
3、“剩余价值”,关于这一点,人们已经有了越来越多的认识。事实上,大数据已经开始并将继续影响我们的生活,下面我们不妨试举几例。精准广告投放已很普遍很多女性可能有这样的经历, 使用某浏览器在淘宝、 京东等购物网站上购买过一本关于怀孕的书籍后,在之后十个月左右的时间里,你的浏览器两侧的广告栏里不断出现怀孕所需要的东西,如营养食品、对胎儿无影响的孕妇用药、胎心监测仪、体温计、血压计等产品广告,登录原来的购物网站,也会在首页向你推荐这类产品。而且,在十个月之后,你会发现,以上这些广告开始变成婴儿用品了。你以前可能对浏览器广告非常讨厌,但对这类广告,你却欣然接受,因为它推荐的产品正是你所需要的。 这实际上就
4、是大数据应用的一个简单案例。 你的浏览经历已经被浏览器和电商所记录,通过对用户浏览记录进行大数据分析,就可以推测出你目前是一种什么状态,今后又将经历哪些状态,于是,专为你定制的广告就在你需要的时候出现在你的眼前。大数据最本质的应用就在于预测, 即从海量数据中分析出一定的特征, 进而预测未来可能会发生什么。实际上,上述例子仅仅是大数据应用的最初级阶段。因为它所涉及的数据的范围并不广泛,其分析原理也非常简单。而如前言所述,大数据有数据量大、数据多样性等特征,实际是将各个维度的数据进行综合分析进而进行一定的预测。 当不同的数据流被整合到大型数据库中后,预测的广度和精度都会大规模的提高。例如,当一个数
5、据库从不同的数据来源获得了你使用手机的时间和地点、信用卡购物、银行卡电子收费系统、使用 QQ 等聊天工具的对象、你的 QQ好友关系图、你在新浪微博、腾讯微博的收听及被收听关系图谱、你交纳的水、电、燃气费等各方面的数据,数据分析师就能通过匹配获得你生活的不同侧面。通过大数据,数据分析可以发现各种各样的关联。通过分析,可以发现你多方面的需求,并不仅仅是诸如怀孕书籍和尿不湿之间的简单关联了。在数据足够“大”的情况下,你生活中几乎所有的需求都可能会被预测出来。例如,从数据分析出你可能会约会,于是会向你推荐衣服;从数据推测出你会出去旅游,于是向你推荐相关装备及旅行方式等。医疗卫生体系会更加精密通过分析大
6、量用户的搜索记录,比如“咳嗽”、“发烧”等特定词条,谷歌公司能准确预测美国冬季流感传播趋势。和官方机构相比,谷歌能提前一两周预测流感爆发,预测结果与官方数据的相关性高达 97%。2009 年,在甲型 H1N1 流感爆发的几周前,谷歌的工程师们公开发表了一篇论文,不仅预测流感即将爆发,并且其预测还精确到美国特定的地区和州。这让人们感到十分震惊。准确预测流感疫情,说起来并不复杂,谷歌一直致力于对用户检索数据的分析。用户求医问药等搜索数据可谓海量, 把这些数据再拿来与美国疾控中心往年记录的实际流感病例信息相比对,就帮助谷歌作出了准确预测。在日本也有相似的应用, 日本国内有一个网站, 你只要打开这个网
7、站用自己的社交网站账号登录,就可以在短时间内通过数万条社交网站记录找出可能感冒的人,并通过过去的感冒情况和今日的感冒情况进行分析,另外该程序还会结合气温和湿度的变化来预测将来感冒的流行情况,并制作一个“易感冒日历”。目前,此类服务正在日本陆续展开。对个体而言,大数据可以为个人提供个性化的医疗服务。过去我们去看病,医生只能对我们的当下身体情况做出判断,而在大数据的帮助下,将来的诊疗可以对一个患者的累计历史数据进行分析,并结合遗传变异、对特定疾病的易感性和对特殊药物的反应等关系,实现个性化的医疗。还可以在患者发生疾病症状前,提供早期的检测和诊断。早期发现和治疗可以显著降低肺癌给卫生系统造成的负担,
8、因为早期的手术费用是后期治疗费用的一半。个性化教育可能真正实现在传统教育模式下,分数就是一切,一个班上几十个人,使用同样的教材,同一个老师上课,课后布置同样的作业。 然而, 学生是千差万别的, 在这个模式下, 不可能真正做到“因材施教”。举例来说,一个学生考试得了 88 分,这个分数仅仅是一个数字,它能代表什么呢?88 分背后是家庭背景、 努力程度、 学习态度、 智力水平等, 把它们和 88 分联系在一起, 这就成了“数据”。大数据因其数据来源的广度,有能力去关注每一个个体学生的微观表现一一他在什么时候开始看书,在什么样的讲课方式下效果最好,在什么时候学习什么科目效果最好,在不同类型的题目上停留多久等等。这些数据对其他个体都没有意义,是高度个性化表现特征的体现。同时,这些数据的产生完全是过程性的:课堂的过程,作业的过程,师生或同学的互动过程而最有价值的是,这些数据完全是在学生不自知的情况下被观察、收集的,只需要一定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年度执法资格过关检测试卷含答案详解【模拟题】
- 2024-2025学年度电工预测复习含答案详解(黄金题型)
- 轮毂美容行业发展趋势
- 中小学留守儿童教育关爱工作指南与经验分享
- 中小学教师违反职业道德行为处理办法案例解析
- 跟骨骨折预防再次受伤护理
- 2024-2025学年公务员考试《常识》模拟题库带答案详解(黄金题型)
- 2024-2025学年商洛职业技术学院单招《英语》通关考试题库(典型题)附答案详解
- 2024-2025学年度环境影响评价工程师之环境影响评价相关法律法规题库检测试题打印附答案详解【培优B卷】
- 2024-2025学年度医院三基考试自我提分评估附参考答案详解(突破训练)
- 《汽车商品性主观评价方法 客车》
- 【MOOC】知识创新与学术规范-南京大学 中国大学慕课MOOC答案
- 小区修建性详细规划汇报
- 《习近平新时代中国特色社会主义思想学生读本》第2讲《实现社会主义现代化和中华民族伟大复兴》-教案
- 2024年天翼云从业者认证考试题库大全(含答案)
- 中医护理骨干进修汇报
- 风电、光伏项目前期及建设手续办理流程汇编
- 低血糖护理新技术新进展
- GB/T 44577-2024商用电动洗碗机性能测试方法
- 五育并举-立德树人始于行润品育心成于思
- 能源管理体系机械制造企业认证要求
评论
0/150
提交评论