1-5数据与大数据课件-浙教版(2019)高中信息技术必修1《数据与计算》_第1页
1-5数据与大数据课件-浙教版(2019)高中信息技术必修1《数据与计算》_第2页
1-5数据与大数据课件-浙教版(2019)高中信息技术必修1《数据与计算》_第3页
1-5数据与大数据课件-浙教版(2019)高中信息技术必修1《数据与计算》_第4页
1-5数据与大数据课件-浙教版(2019)高中信息技术必修1《数据与计算》_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.5数据与大数据1大数据

问题提出导航上交通拥堵情况怎么判断?导航上最佳路线怎么计算的?导航根据什么来确定未来用时?

一、大数据概念★大数据:代表着数据量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。在大数据时代,任何微小的数据都可能产生不可思议的价值

二、大数据4V特征数量(volume)大数据4V特征速度(Velocity)多样(Variety)价值(Value)速度(Velocity):数据产生的速度快,数据处理的速度快价值(Value):价值高,但价值密度低,且价值与数量成反比

二、大数据4V特征数量(volume):数据体量巨大,TB\PB\EB\ZBK

1KB=1024ByteM(兆)字节

1MB=1024KBG(吉)字节

1GB=1024MBT(太)字节

1TB=1024GBP(拍)字节

1PB=1024TBE(艾)字节

1EB=1024PBZ(泽)字节

1ZB=1024EBY(尧)字节

1YB=1024ZB

二、大数据4V特征数量(volume):数据体量巨大,TB\PB\EB\ZB1Byte1KB1MB1GB1TB1PB1EB1ZB1YB1PB相当于50%的全美学术研究图书馆藏书信息内容5EB相当于至今全世界人类所讲过的话语1ZB如同全世界海滩上的沙子数量总和1YB相当于7000位人类体内的微细胞总和一般情况下,大数据以PB、EB、ZB为单位进行计量

二、大数据4V特征速度(Velocity):数据产生的速度快,数据处理的速度快“1秒定律”或者秒级定律,就是说对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值了。这个速度要求是大数据处理技术和传统的数据挖掘技术最大的区别。道路监控摄像头24小时不间断地记录着视频数据,根据第3节中图像数据的计算公式,引入帧频参数进行计算,对于1个720p(1280×720像素、24位色)的高清摄像头,按25FPS拍摄,可以计算出每秒的数据量,乘以86400秒就是1天的数据量。若按200:

1的压缩比进行存储,大致可以估算出1个720p高清摄像头1天产生的数据量。

二、大数据4V特征多样(Variety):数据来源多,有人工产生的+机器自动产生,所以数据类型多。短信、微信、视频、语音、电子邮件结构化、半结构化、非结构化结构化——数据库中数据;非结构化——word、ppt、图片和视频等半结构化——电子邮件等。拓展知识10结构化数据行数据,是由二维表结构来进行逻辑表达和实现的数据严格遵守数据格式与长度规范通过关系型数据库进行存储和管理半结构化数据介于结构化数据和非结构化数据之间的数据具有一定的结构性非结构化数据数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据各类格式的办公文档、文本、图片、HTML、各类报表、图像、音频、视频等。

二、大数据4V特征价值(Value):价值高但价值密度低,且价值与数量成反比挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息;价值密度低,是大数据的一个典型特征;

二、大数据4V特征三、大数据思维大数据是一场变革,

改变的不仅是数据,还有人们的思维。

大数据要分析的是全体数据,而不是抽样数据。

对于数据不再追求精确性,而是能够接受数据的混杂性。

不一定强调对事物因果关系的探求,而是更加注重它们的相关性。

三、大数据与传统数据的区别对比项采集方法分析方法表示方法……大数据传统数据采用自动化方法采集数据采用分布式数据库对数据进行处理PB(拍字节)以上数量级表示GB(吉字节)或TB(太字节)表示采用手工方法采集数据大多采用关系型数据库和并行数据仓库即可处理大数据:认识全面、信息详尽传统数据:样本随机、结论不准大数据:关注关联,较为准确传统数据:样本少、局限多传统数据:容错低、数据量小大数据:容错强、弱化个体样本的影响四、大数据对社会的影响

大数据已经渗入到社会的各个层面,不断提高工作效率与生活便利性

大数据让决策更加精准

大数据带来新的就业机会

大数据带来新的社会问题一起讨论★

大数据背景下,我们该如何保护自己信息不被泄露?保护自己的隐私不被偷窥?★下列关于大数据思维的描述,错误的是()A.大数据时代,人们可以采集全体数据进行分析,避免样本不同导致结论不同B.基于大数据技术,我们能够接受数据的混杂性,个别数据的不准确不影响数据分析C.数据总量变大会导致大量不相干的数据增加,大数据具有价值密度低的特点D.使用大数据思维,我们更强调事物因果关系的探求,而不仅仅是数据之间的相关性课堂练习D★下列数据中属于大数据的是()①各地交通摄像头记录的全部数据②学生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论