大数据的阅读交流-大数据在生活中的应用_第1页
大数据的阅读交流-大数据在生活中的应用_第2页
大数据的阅读交流-大数据在生活中的应用_第3页
大数据的阅读交流-大数据在生活中的应用_第4页
大数据的阅读交流-大数据在生活中的应用_第5页
已阅读5页,还剩118页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据与我们的生活关于大数据的阅读交流关于大数据的阅读交流开篇引言:毕达哥拉斯开篇引言:毕达哥拉斯“万物皆数万物皆数” 25002500年前,古希腊哲年前,古希腊哲学家毕达哥拉斯曾提学家毕达哥拉斯曾提出过出过“万物皆数万物皆数”的的哲学观,认为:数字哲学观,认为:数字是世界的本质,并支是世界的本质,并支配着人类社会乃至整配着人类社会乃至整个自然界。个自然界。 -毕达哥拉斯定理毕达哥拉斯定理 -数字与美,黄金分数字与美,黄金分割数:割数:0.6180.618,等。,等。 今天,随着互联网、物联网等技术的广泛今天,随着互联网、物联网等技术的广泛应用,我们的世界真正进入了应用,我们的世界真正进入了“

2、万物皆数万物皆数 数即万物数即万物”大数据时代大数据时代内容提要内容一:大数据知识内容一:大数据知识ABCABC 为使大家更好地理解今天的讲课内容,先介为使大家更好地理解今天的讲课内容,先介绍一些有关大数据的基本知识,如:什么是绍一些有关大数据的基本知识,如:什么是大数据,大数据究竟有多大,大数据来自哪大数据,大数据究竟有多大,大数据来自哪里,大数据又有什么作用?还有经常听到的里,大数据又有什么作用?还有经常听到的一些用语的含义,如:传感器,一些用语的含义,如:传感器,RFIDRFID(射频识别(射频识别标签)标签),物联网,云计算,互联网,物联网,云计算,互联网+ +,智慧城,智慧城市,三网

3、融合,等。市,三网融合,等。内容二:大数据与小数据的比较内容二:大数据与小数据的比较 既有大数据这个概念,是不是还有既有大数据这个概念,是不是还有“小数小数据据”呢?大数据与小数据有什么不同呢?呢?大数据与小数据有什么不同呢?大家知道,统计是专门与数字打交道的一大家知道,统计是专门与数字打交道的一个行当与一门科学,顺便讲一讲统计的那个行当与一门科学,顺便讲一讲统计的那些事吧;阿拉伯数字是我们经常使用的,些事吧;阿拉伯数字是我们经常使用的,阿拉伯数字是阿拉伯人发明的吗?阿拉伯数字是阿拉伯人发明的吗?内容三:大数据与我们的生活内容三:大数据与我们的生活 悄然来临的大数据时代,你觉察到了吗?悄然来临

4、的大数据时代,你觉察到了吗?大数据正在改变着我们的生活:从购物到大数据正在改变着我们的生活:从购物到交通,从食品到环境,从医疗到教育;从交通,从食品到环境,从医疗到教育;从变革社会管理方式到聆听我们的身心变革社会管理方式到聆听我们的身心,大数据将会怎样影响我们的未来社会?,大数据将会怎样影响我们的未来社会?大数据知识大数据知识ABCABC1 1、什么是大数据?、什么是大数据? 大数据,是指无法在一定时间内用常规软件大数据,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据工具对其内容进行抓取、管理和处理的数据集合。集合。 维基百科维基百科 大数据是难以用现有的数据库管理工具处

5、理的,兼大数据是难以用现有的数据库管理工具处理的,兼具海量特征和复杂性特征的数据集成。具海量特征和复杂性特征的数据集成。 大数据带来的挑战包括获取、存储、搜索、共享、大数据带来的挑战包括获取、存储、搜索、共享、分析和可视化。分析和可视化。 大数据大数据 (作者:美国(作者:美国KIT SolutionsKIT Solutions软件公司中国事务软件公司中国事务主任涂子沛)主任涂子沛) 那些大小已经超出了传统意义上的尺度,一般的那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。软件工具难以捕捉、存储、管理和分析的数据。 并没有普遍适用的定义来确定具体多大的数据才

6、并没有普遍适用的定义来确定具体多大的数据才能称为大数据。一般认为,大数据的数量级应该能称为大数据。一般认为,大数据的数量级应该是是“太字节太字节”的。的。 大数据时代大数据时代 (作者:维克托(作者:维克托迈尔迈尔- -舍恩伯格)舍恩伯格) 大数据把数学算法运用到海量的数据上来,做出分大数据把数学算法运用到海量的数据上来,做出分析,并对事情发生的可能性做出洞见。与传统数据析,并对事情发生的可能性做出洞见。与传统数据比较,大数据的数据量更多,有时甚至是纷繁混乱比较,大数据的数据量更多,有时甚至是纷繁混乱无序,将注意力更多地放在相关关系的发现和使用无序,将注意力更多地放在相关关系的发现和使用上。上

7、。 IBM 3V3V:大量化(:大量化(VolumeVolume)、多样化()、多样化(VarietyVariety)和快)和快速化(速化(VelocityVelocity)。)。 大数据的大数据的4V4V特点:特点:VolumeVolume(大量)、(大量)、VelocityVelocity(高速)、(高速)、VarietyVariety(多样)、(多样)、ValueValue(价值)。(价值)。 大数据在政府统计中的应用研究大数据在政府统计中的应用研究(国家统计局)(国家统计局) 是指汇集不同数据源,通过采用现代信息技术和架是指汇集不同数据源,通过采用现代信息技术和架构能够高速分析处理的、

8、具有高度应用价值和决策构能够高速分析处理的、具有高度应用价值和决策支持功能的多种类型的数据及其技术集成。支持功能的多种类型的数据及其技术集成。2.2.大数据有多大?大数据有多大? 衡量大数据的大小通常以衡量大数据的大小通常以“太字节(太字节(TBTB)”或者或者“拍字节(拍字节(PBPB)”为单位量级。为单位量级。 1 1个太字节数据量有多大呢?为个太字节数据量有多大呢?为1024G1024G个字节或个字节或10.710.7亿个字节。亿个字节。 数据的存储单位从小到大的次序为:数据的存储单位从小到大的次序为: KBKBMBMBGBGBTBTBPBPBZBZBYBYB(千字节(千字节兆兆字节字节

9、吉字节吉字节太字节太字节拍字节拍字节泽字节泽字节尧字节),每提高一个量级的存储量扩大尧字节),每提高一个量级的存储量扩大10241024倍。倍。2.2.大数据有多大?大数据有多大? 千字节(千字节(KBKB):):1 1个个KBKB是是10241024字节,一页字节,一页A4A4纸纸上小上小4 4号的汉字大概是号的汉字大概是2 2千字节,千字节,1 1千个汉字;千个汉字; 兆头节(兆头节(MBMB):):一首普通一首普通MP3MP3格式的流行歌曲格式的流行歌曲大概是大概是4 4兆字节;兆字节; 吉字节(吉字节(GBGB):):一部电影大概是一部电影大概是1 1吉字节;吉字节; 太字节(太字节(

10、TBTB):):美国国会图书馆所有登记的印美国国会图书馆所有登记的印刷版书本的信息量为刷版书本的信息量为1515太字节;太字节; 拍字节(拍字节(PBPB):):谷歌每小时处理的数据为谷歌每小时处理的数据为1 1拍;拍; 艾字节(艾字节(PBPB):):1 1个个EBEB是是1024PB1024PB,相当于,相当于1313亿中亿中国人人手一本国人人手一本500500页的书加起来的信息量;页的书加起来的信息量; 泽字节(泽字节(ZBZB):):1 1个个ZBZB是是1024EB1024EB,截至,截至20102010年,年,人类拥有的信息总量大概是人类拥有的信息总量大概是1.21.2泽字节;泽字

11、节; 尧字节(尧字节(YBYB):):1 1个个YBYB是是1024ZB1024ZB,超出想象,无,超出想象,无法描述与比喻。法描述与比喻。3.3.大数据来自于哪里呢?大数据来自于哪里呢?第一个来源,是传感器。第一个来源,是传感器。 重要名词:传感器传感器 传感器,是传感器,是“能感能感受规定的被测量件受规定的被测量件并按照一定的规律并按照一定的规律转换成可用信号的转换成可用信号的器件或装置,通常器件或装置,通常由敏感元件和转换由敏感元件和转换元件组成元件组成”。 任何可以监测、任何可以监测、数据化、传输的数据化、传输的工具,都是传感工具,都是传感器。如手机、手器。如手机、手环、大街上的探环、

12、大街上的探头等,都是传感头等,都是传感器。器。 射频识别标签射频识别标签(Radio Frequency Identification,RFID),生活中常见传感器:手机、探头、天眼、门生活中常见传感器:手机、探头、天眼、门卡、饭卡、卡、饭卡、ICIC卡、银行卡,等等。卡、银行卡,等等。 20052005年,全世界使用的传感器只有年,全世界使用的传感器只有1.31.3亿个,亿个,到到20102010年就发展到了年就发展到了3030亿个,目前大概有亿个,目前大概有4545亿个。预计到亿个。预计到20302030年将有年将有100100万亿个传感器连万亿个传感器连接在物联网上。接在物联网上。 重要

13、名词:物联网物联网 物联网,是在互联网的基础上,将其用户端延伸物联网,是在互联网的基础上,将其用户端延伸和扩展到任何物品与物品之间,进行信息交换和和扩展到任何物品与物品之间,进行信息交换和通信的一种网络概念。通过射频识别标签(通信的一种网络概念。通过射频识别标签(RFIDRFID)、红外感应器、全球定位系统、激光扫描器等)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议信息传感设备,按约定的协议把任何物品与互联把任何物品与互联网相连接网相连接,进行信息交换和通讯,以实现智能化,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络概念识别、定位、跟踪、监控和管

14、理的一种网络概念。物联网的核心和基础仍然是互联网,是在互联。物联网的核心和基础仍然是互联网,是在互联网基础上的用户端延伸和扩展到物品层面。网基础上的用户端延伸和扩展到物品层面。 环境监测物联网环境监测物联网第二个来源,是互联网。第二个来源,是互联网。第三个来源,是社交网络。第三个来源,是社交网络。第四个来源,是政府统计部门以及各专业部第四个来源,是政府统计部门以及各专业部门、金融部门、科研等的数据。门、金融部门、科研等的数据。4.4.大数据大数据又有什么作用又有什么作用呢?呢? 数据的价值数据的价值 人类对于数据价值的认识大致可分为三个阶段:人类对于数据价值的认识大致可分为三个阶段: 一是以经

15、验科学为基础判断数据价值的一是以经验科学为基础判断数据价值的“小数小数据据”时代;时代; 二是以计算机为基础追求数据精细化时代,也二是以计算机为基础追求数据精细化时代,也就是从小数据向大数据过渡时期;就是从小数据向大数据过渡时期; 三是以系统性数据资源为基础深入挖掘数据关三是以系统性数据资源为基础深入挖掘数据关系的大数据时代。系的大数据时代。 没有调查,就没有发言权没有调查,就没有发言权 毛泽东毛泽东 我们信靠上帝。除了上帝,任何人都必须我们信靠上帝。除了上帝,任何人都必须用数据来说话。用数据来说话。 爱德华爱德华戴明(戴明(1900190019931993)美国著名的)美国著名的管理学家、统

16、计学家管理学家、统计学家 大大数据数据的的价值价值 从从大数据产业链看:大数据产业链看: 第一层是数据层,主要是数据的采集、存储、第一层是数据层,主要是数据的采集、存储、传输、扩散;传输、扩散; 第二层是信息层,把数据背景融入数据,形成第二层是信息层,把数据背景融入数据,形成价值密度更高的信息;价值密度更高的信息; 第三层是知识层,在信息基础上进行提炼,形第三层是知识层,在信息基础上进行提炼,形成有价值的知识。成有价值的知识。 通过分析大数据,寻找相关性,发现规律通过分析大数据,寻找相关性,发现规律性,增强预见性,带来性,增强预见性,带来“大知识大知识”“大科技大科技”“大利润大利润”“大发展

17、大发展” 大数据被誉为未来社会的新大数据被誉为未来社会的新“石油石油”和新和新“金矿金矿”。大数据挖掘与应用的大数据挖掘与应用的经典案例经典案例案例1:尿布与啤酒放在一起卖案例1:尿布与啤酒放在一起卖 在美国,沃尔玛公司曾在对商品进行市场类组在美国,沃尔玛公司曾在对商品进行市场类组分析的过程中意外发现:跟尿布一起购买最多分析的过程中意外发现:跟尿布一起购买最多的商品竟是啤酒!后经研究发现其中原委:美的商品竟是啤酒!后经研究发现其中原委:美国的太太们常叮嘱她们的丈夫下班后为小孩买国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了两瓶尿布,而丈夫们在买尿布后又随手带回了两

18、瓶啤酒。既然尿布与啤酒一起购买的机会最多,啤酒。既然尿布与啤酒一起购买的机会最多,沃尔玛就将啤酒和尿布并排摆放在一起,结果沃尔玛就将啤酒和尿布并排摆放在一起,结果是尿布与啤酒的销售量双双增长。是尿布与啤酒的销售量双双增长。案例2:美国每日网上价格指数预测国际金融危机爆发案例3:向高中女生邮寄婴儿服装和孕妇服装的优惠券 20122012年年2 2月月1616日,日,纽约时报纽约时报刊登了一篇题刊登了一篇题为为这些公司是如何知道您的秘密的这些公司是如何知道您的秘密的的报的报道。文中介绍了这样一个故事:道。文中介绍了这样一个故事: 一天,一位男性顾客怒气冲冲地来到一家折一天,一位男性顾客怒气冲冲地来

19、到一家折扣连锁店向经理投诉:该店竟然给他还在读扣连锁店向经理投诉:该店竟然给他还在读高中的女儿邮寄婴儿服装和孕妇服装的优惠高中的女儿邮寄婴儿服装和孕妇服装的优惠券。在随后父亲与女儿进一步沟通发现,自券。在随后父亲与女儿进一步沟通发现,自己女儿真的已经怀孕了!父亲又回到商店向己女儿真的已经怀孕了!父亲又回到商店向经理道歉。经理道歉。案例3: 这一故事,经常被作为大数据挖掘能力的典型这一故事,经常被作为大数据挖掘能力的典型例证。例证。 但有观点认为,这一案例体现出的并不是大数但有观点认为,这一案例体现出的并不是大数据的据的“聪慧聪慧”,而是大数据的,而是大数据的“傲慢傲慢”,个人,个人隐私并没有得

20、到足够尊重。产生了数据安全问隐私并没有得到足够尊重。产生了数据安全问题:要防止数据被滥用。题:要防止数据被滥用。案例4:太阳能发电与智能电表 在德国,为了鼓励利用太阳能,在家庭安装太阳在德国,为了鼓励利用太阳能,在家庭安装太阳能板,当家庭的太阳能有多余电的时候还可以买能板,当家庭的太阳能有多余电的时候还可以买回来。通过电网每隔五分钟或十分钟收集一次数回来。通过电网每隔五分钟或十分钟收集一次数据,收集来的这些数据可以用来预测客户的用电据,收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来习惯等,从而推断出在未来2 2到到3 3个月时间里,整个月时间里,整个电网大概需要多少电。有了这个

21、预测后,就可个电网大概需要多少电。有了这个预测后,就可以向发电或者供电企业购买一定数量的电。像期以向发电或者供电企业购买一定数量的电。像期货一样,如果提前买就会比较便宜,买现货就比货一样,如果提前买就会比较便宜,买现货就比较贵。较贵。重要名词:重要名词:数据废气数据废气( (Data Exhaust) ) 数据废气,是用来描述人们在网上留下的数字数据废气,是用来描述人们在网上留下的数字轨迹的,是用户在线交互的副产品,包括浏览轨迹的,是用户在线交互的副产品,包括浏览网页、停留时间、鼠标光标停留的位置、输入网页、停留时间、鼠标光标停留的位置、输入信息等。数据废气可以被循环利用,用来改善信息等。数据

22、废气可以被循环利用,用来改善服务和开发新的服务。服务和开发新的服务。 电商利用数据废气进行商品的:电商利用数据废气进行商品的: 网络推荐网络推荐大数据的重要作用 第一,对大数据的处理分析已成为新一代信息技术第一,对大数据的处理分析已成为新一代信息技术融合应用的结点。融合应用的结点。 第二,大数据是信息产业持续高速增长的新引擎。第二,大数据是信息产业持续高速增长的新引擎。 第三,大数据利用是提高核心竞争力的关键因素。第三,大数据利用是提高核心竞争力的关键因素。 第四,大数据将成为降成本、增效益、促转型、稳第四,大数据将成为降成本、增效益、促转型、稳增长的新途径与新动力。增长的新途径与新动力。 第

23、五,大数据将促进统计方法、科学研究与实验的第五,大数据将促进统计方法、科学研究与实验的方法手段发生重大改变,成为方法手段发生重大改变,成为政府统计收集数据的政府统计收集数据的第二轨。第二轨。 麦肯锡全球经济研究院报告:麦肯锡全球经济研究院报告: 2013 2013年中国互联网经济(年中国互联网经济(iGDPiGDP)已占到国内生)已占到国内生产总值的产总值的4.4%4.4%以上,预计从以上,预计从20132013年至年至20252025年,年,互联网将帮助中国提升国内生产总值互联网将帮助中国提升国内生产总值0.30.3至至1 1个个百分点。百分点。 贵阳大数据交易所贵阳大数据交易所201520

24、15年中国大数据产业白年中国大数据产业白皮书:皮书: 预计到预计到20202020年中国大数据产业市场规模将由年中国大数据产业市场规模将由20142014年的年的767767亿元扩大至亿元扩大至82288228亿元。亿元。 进度时间:9:55(9:30+25)大数据大数据VSVS小数据小数据1.1.小数据定义小数据定义 小数据,是指在传统技术和方法的条件下收小数据,是指在传统技术和方法的条件下收集、处理和分析的数据。包括政府部门组织集、处理和分析的数据。包括政府部门组织的统计调查,企业开展的市场调查,等。的统计调查,企业开展的市场调查,等。 百度搜索:百度搜索: 吕兰涛定义:吕兰涛定义:“小数

25、据(小数据(Small Data),或称个),或称个体资料,是指需要新的应用方式才能体现出具有体资料,是指需要新的应用方式才能体现出具有高价值的个体的、高效率的、个性化的信息资产高价值的个体的、高效率的、个性化的信息资产”。2.2.大数据与小数据有什么不同呢?大数据与小数据有什么不同呢? 首先,首先,从数据的体量来看,大数据体量巨从数据的体量来看,大数据体量巨大,规模已经超出了在常规方法和时间内搜大,规模已经超出了在常规方法和时间内搜集、利用、管理和处理数据的能力。集、利用、管理和处理数据的能力。 小数据体量则小得多。小数据体量则小得多。2.2.大数据与小数据有什么不同呢?大数据与小数据有什么

26、不同呢? 其次,其次,从数据形态来看,传统的数据通常是从数据形态来看,传统的数据通常是结构化数据,结构化数据(行数据)是指存结构化数据,结构化数据(行数据)是指存储在数据库里可以用二维表结构来逻辑表达储在数据库里可以用二维表结构来逻辑表达实现的数据,大数据则是实现的数据,大数据则是混合形态的数据。混合形态的数据。在大数据中,结构化数据占在大数据中,结构化数据占15%15%,更多的则是,更多的则是非结构化的数据,如图片、日志、音频、视非结构化的数据,如图片、日志、音频、视频、地理位置等数据,这些数据大都是非结频、地理位置等数据,这些数据大都是非结构化的。构化的。2.2.大数据与小数据有什么不同呢

27、?大数据与小数据有什么不同呢? 第三,第三,小数据是目标导向数据,价值密度较小数据是目标导向数据,价值密度较高。自古以来,一些重要数据都是由政府组高。自古以来,一些重要数据都是由政府组织收集的,通常是目标导向数据,有非常明织收集的,通常是目标导向数据,有非常明确的目的,有非常明确的价值。比如说我国确的目的,有非常明确的价值。比如说我国的的GDPGDP核算,城乡住户收支抽样调查,核算,城乡住户收支抽样调查,CPICPI、PPIPPI等价格抽样调查,都是围绕着具体的目标等价格抽样调查,都是围绕着具体的目标开展数据收集的。开展数据收集的。 而大数据则是记录导向的,价值密度低。仅而大数据则是记录导向的

28、,价值密度低。仅仅是为记录数据,而不是为了得到或解释某仅是为记录数据,而不是为了得到或解释某个特定事件的数据。如个特定事件的数据。如交通摄像头里的记录交通摄像头里的记录。2.2.大数据与小数据有什么不同呢?大数据与小数据有什么不同呢? 第四,第四,大数据即时产生,随时可用。数据本大数据即时产生,随时可用。数据本身在线上,不在你的计算机或移动硬盘中。身在线上,不在你的计算机或移动硬盘中。小数据生产的时间长,从测量到可用,需要小数据生产的时间长,从测量到可用,需要相当长的时间。小数据在计算机、年鉴、文相当长的时间。小数据在计算机、年鉴、文本上。本上。 大数据的获取省略了抽样设计环节,基本不大数据的

29、获取省略了抽样设计环节,基本不介入调查对象的行为,不直接与调查对象发介入调查对象的行为,不直接与调查对象发生博弈,始终以观察者的角色出现,可以直生博弈,始终以观察者的角色出现,可以直接对整体进行分析。接对整体进行分析。2.2.大数据与小数据有什么不同呢?大数据与小数据有什么不同呢? 第五,第五,从数据占有主体来看,在传统社会里,从数据占有主体来看,在传统社会里,政府部门拥有大多数公民数据。小数据拥有的政府部门拥有大多数公民数据。小数据拥有的主体是政府(包括政府统计部门和各专业部门主体是政府(包括政府统计部门和各专业部门)、企业、民间调查机构、科研机构等。)、企业、民间调查机构、科研机构等。 大

30、数据则主要掌握在互联网公司手中,目前我大数据则主要掌握在互联网公司手中,目前我国国内互联网三巨头国国内互联网三巨头BATBAT:百度、阿里、腾讯掌:百度、阿里、腾讯掌握了大数据的大部分。握了大数据的大部分。3 3、大数据是怎样收集利用的?、大数据是怎样收集利用的? 对大数据的开发利用,只有具有技术能力的对大数据的开发利用,只有具有技术能力的网络公司才能做到,通过网络爬虫在网络上网络公司才能做到,通过网络爬虫在网络上抓取数据,然后经过数据清洗,进行数据挖抓取数据,然后经过数据清洗,进行数据挖掘分析掘分析, ,实现数据的价值。实现数据的价值。 不具备大数据挖掘利用能力的一般个人或者不具备大数据挖掘

31、利用能力的一般个人或者企业、机构,通过向这些公司付费后购买数企业、机构,通过向这些公司付费后购买数据和服务,这就是我们日益熟悉的云计算、据和服务,这就是我们日益熟悉的云计算、云平台、云服务;未来的地方政府或许将不云平台、云服务;未来的地方政府或许将不得不向私营部门购买数据。得不向私营部门购买数据。重要名词:重要名词:云计算云计算(云平台、云服务)(云平台、云服务) 云计算云计算(Cloud Computing),),是基于互联网的是基于互联网的相关服务的增加、使用和交付模式。云是网络、相关服务的增加、使用和交付模式。云是网络、互联网的一种比喻说法。互联网的一种比喻说法。 美国国家标准与技术研究

32、院定义:云计算是一种美国国家标准与技术研究院定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源捷的、按需的网络访问,进入可配置的计算资源共享池(网络,服务器,存储,应用软件,服务共享池(网络,服务器,存储,应用软件,服务),只需投入很少的管理与成本,这些资源能够),只需投入很少的管理与成本,这些资源能够被快速提供。被快速提供。 大数据时代大数据时代:“自来水公司与用户的关系自来水公司与用户的关系”展开话题一:展开话题一:统计的那些事统计的那些事-数字起源与统计发展数字起源与统计发展人类早期的计数工具:

33、人类早期的计数工具:结绳记事小石子计数伏羲氏伏羲氏“制作八卦制作八卦”计数工具计数工具 远古时代的结绳记事、远古时代的结绳记事、刻木为号、小石头,都刻木为号、小石头,都是计数的工具与计数的是计数的工具与计数的活动。活动。 人类神话时期:三皇五人类神话时期:三皇五氏之伏羲氏:氏之伏羲氏:“制作八制作八卦卦”,八卦是我国最早,八卦是我国最早的计数文字,后来被星的计数文字,后来被星象家用来占卜象家用来占卜”。 (柏杨,(柏杨,中国人史纲中国人史纲) 黄帝时期:隶首作数黄帝时期:隶首作数 传说,算盘和算数是黄传说,算盘和算数是黄帝大臣帝大臣隶首隶首发明创造的发明创造的。据说,至今在农村还。据说,至今在

34、农村还流传着隶首当初算账时流传着隶首当初算账时发明的中国式的发明的中国式的“阿拉阿拉伯伯”字母。字母。 这十个字母的写法:这十个字母的写法:、十。比、十。比如:三斤八两的写法如:三斤八两的写法“”。统计的那些事统计的那些事 自古以来,数据在管理国家方面作用重大。 齐国管仲:齐国管仲: 不明于计数而欲举不明于计数而欲举大事,犹无舟楫大事,犹无舟楫j而欲经于水,险也而欲经于水,险也。统计的那些事统计的那些事 秦国商鞅:秦国商鞅: “欲国强知十三数欲国强知十三数” 仓口之数,壮男、壮仓口之数,壮男、壮女之数,老弱之数,女之数,老弱之数,官士之数,以言说取官士之数,以言说取食者之数,利民之数食者之数,

35、利民之数,马、牛、刍、稿之,马、牛、刍、稿之数。数。古代统计制度古代统计制度 鱼鳞册鱼鳞册黄黄 册册统计的那些事统计的那些事 明清时期统计机构明清时期统计机构 中央行政机构中直中央行政机构中直接对皇帝负责的六部接对皇帝负责的六部中的户部,其重要的中的户部,其重要的职能之一就是掌管统职能之一就是掌管统计事务。计事务。 清末光绪年间统计清末光绪年间统计 清廷设宪政调查局,清廷设宪政调查局,负责国家统计事务,负责国家统计事务,开展了部分统计活动开展了部分统计活动,以外贸统计较为完,以外贸统计较为完备。备。统计的那些事统计的那些事 民国时期统计民国时期统计 上世纪上世纪3030年代初,年代初,国民政府

36、正式设立国民政府正式设立和开展初具现代意和开展初具现代意义的统计机构和统义的统计机构和统计活动,开始传播计活动,开始传播和引入西方统计思和引入西方统计思想与方法。想与方法。 新中国统计新中国统计 建国后,特别是改革开建国后,特别是改革开放后的放后的3030多年,我国统多年,我国统计事业在多个方面都实计事业在多个方面都实现了前所未有的大转型现了前所未有的大转型、大发展,计划经济条、大发展,计划经济条件下形成的统计体系已件下形成的统计体系已被打破,适应社会主义被打破,适应社会主义市场经济体制的统计体市场经济体制的统计体系初步形成。系初步形成。统计的那些事统计的那些事 统计主体体系化:统计主体体系化

37、:政府综合统计、部门统计、政府综合统计、部门统计、企业统计和民间统计;企业统计和民间统计; 统计调查方法多元化:统计调查方法多元化:抽样调查、普查、全面抽样调查、普查、全面报表、典型与重点调查、科学测算;报表、典型与重点调查、科学测算; 统计核算方法国际化:统计核算方法国际化:MPSMPS核算体系向核算体系向SNASNA核算核算体系转换,与国际标准基本衔接的国民经济核体系转换,与国际标准基本衔接的国民经济核算体系;算体系; 统计生产:统计生产:信息化、网络化、利用大数据;信息化、网络化、利用大数据; 统计法制化。统计法制化。统计的那些事统计的那些事 统计部门不仅为各级党政领导进行宏观管理统计部

38、门不仅为各级党政领导进行宏观管理和科学决策提供了大量的统计数据和分析资和科学决策提供了大量的统计数据和分析资料,同时还为社会各界提供了较为广泛的统料,同时还为社会各界提供了较为广泛的统计信息与咨询服务。今天的统计,真正成为计信息与咨询服务。今天的统计,真正成为了国家管理的重要工具,并日益走进了大众了国家管理的重要工具,并日益走进了大众的生活。的生活。统计的那些事统计的那些事(统计科学)(统计科学) 统计科学统计科学300300年历史年历史 随着人类统计实践的积累,特别是资本主义经济随着人类统计实践的积累,特别是资本主义经济的发展,为满足经济社会发展对统计的需求,统的发展,为满足经济社会发展对统

39、计的需求,统计科学与技术应时而生。计科学与技术应时而生。1717世纪以来,先后经过世纪以来,先后经过了威廉了威廉配第的配第的政治算术政治算术与赫尔与赫尔曼康令的曼康令的国势学国势学古典统计学时期,雅克古典统计学时期,雅克凯特莱把古凯特莱把古典概率论引入统计的近代统计学时期,数理统计典概率论引入统计的近代统计学时期,数理统计学与学与抽样调查抽样调查广泛运用的现代统计学时期。统计广泛运用的现代统计学时期。统计这个由多个专业和学科交叉融合中发展起来的科这个由多个专业和学科交叉融合中发展起来的科学,成为当今人类运用十分广泛的一门科学。学,成为当今人类运用十分广泛的一门科学。统计误差与平均数的困惑统计误

40、差与平均数的困惑 任何一个统计指标的数据都有一个客观存在的任何一个统计指标的数据都有一个客观存在的真值,可称之为真值,可称之为X X,真值在理论上是无法企及但,真值在理论上是无法企及但又是客观存在的。如果把统计调查所得到的数又是客观存在的。如果把统计调查所得到的数据称之为据称之为x x,x-Xx-X,称为统计数据的误差称为统计数据的误差,x x就是对就是对X X的估计。统计所做的是在既定的条的估计。统计所做的是在既定的条件下尽量缩小误差而已,使件下尽量缩小误差而已,使x x尽量接近尽量接近X X,或在,或在可容忍的误差范围内取得统计数据。可容忍的误差范围内取得统计数据。 统计误差就像人行走在阳

41、光下的影子, 人走到那里,影子就跟随到那里。 展开话题二:展开话题二:是谁发明的阿拉伯数字?是谁发明的阿拉伯数字?-阿拉伯数字的演化与传播阿拉伯数字的演化与传播常用数字形式:常用数字形式:阿拉伯数字:阿拉伯数字: 1 1、2 2、3 3、4 4、5 5、6 6、7 7、8 8、9 9、0 0中文数字:中文数字:一、二、三、四、五、六、七、八、九、十、百、一、二、三、四、五、六、七、八、九、十、百、千、万、亿千、万、亿中文大写数字:(会计用)中文大写数字:(会计用)壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟仟 罗马数字罗马数字(1-10)(1-10

42、):I I、IIII、IIIIII、IVIV、V V、VIVI、VIIVII、VIIIVIII、IXIX、X X是谁发明的阿拉伯数字?是谁发明的阿拉伯数字? 大约公元大约公元1 1世纪时,古印度发明了一种数字世纪时,古印度发明了一种数字系统,后传播到波斯,得到改进;后又传到系统,后传播到波斯,得到改进;后又传到阿拉伯国家,得到极大改进,是今天我们使阿拉伯国家,得到极大改进,是今天我们使用的阿拉伯数字的前身。十字军东征,把阿用的阿拉伯数字的前身。十字军东征,把阿拉伯数字带到了地中海东部;拉伯数字带到了地中海东部;公元公元10001000年的年的时候,罗马教皇倡导使用阿拉伯数字;时候,罗马教皇倡导

43、使用阿拉伯数字;1212世世纪,介绍阿拉伯数字的书籍被翻译成拉丁文纪,介绍阿拉伯数字的书籍被翻译成拉丁文,传播到整个欧洲,欧洲人只知道这些数字,传播到整个欧洲,欧洲人只知道这些数字是从阿拉伯地区传入的,所以便把这些数字是从阿拉伯地区传入的,所以便把这些数字叫做阿拉伯数字。叫做阿拉伯数字。是谁发明的阿拉伯数字?是谁发明的阿拉伯数字? 后来,阿拉伯数字又从欧洲传到世界各国,阿后来,阿拉伯数字又从欧洲传到世界各国,阿拉伯数字的广泛使用,开启了算术的腾飞。阿拉伯数字的广泛使用,开启了算术的腾飞。阿拉伯数字传入我国大约是在拉伯数字传入我国大约是在1313到到1414世纪。由于世纪。由于当时我国有一种数字

44、叫当时我国有一种数字叫“筹码筹码”(多用竹子制(多用竹子制成),写起来比较方便,所以那时阿拉伯数字成),写起来比较方便,所以那时阿拉伯数字在我国没有得到广泛推广运用。直到在我国没有得到广泛推广运用。直到2020世纪初世纪初,随着我国对西方数学成就的引进与应用,阿,随着我国对西方数学成就的引进与应用,阿拉伯数字在我国逐渐推广开来。拉伯数字在我国逐渐推广开来。数字“0”的故事 “0 0”这个数字是到了印度这个数字是到了印度笈笈jj 多王朝(多王朝(公元公元320320550550年年)时期才出现的。公)时期才出现的。公元元4 4世纪印度人完成的数世纪印度人完成的数学著作学著作太阳手册太阳手册中,中

45、,开始使用开始使用“0”0”这一符号这一符号,只不过当时是实心的小,只不过当时是实心的小圆点圆点“”。其意是。其意是“空空”或或“空白空白”,这与印度的,这与印度的文化与宗教思想有关。文化与宗教思想有关。 在罗马数字中没有“0”这个符号,当它传入罗马时,罗马教皇凶残守旧,他不允许使用这个符号。有一位罗马学者在笔记中记载了关于使用“0”的一些好处,就被教皇剁了手。 进度时间:10:10(9:55+15)结束时间:11:00大数据与我们的生活大数据与我们的生活 (一)大数据改变传统生活方式(一)大数据改变传统生活方式1 1、网络购物。、网络购物。 网上购物,是指通过互联网检索商品信息,并网上购物,

46、是指通过互联网检索商品信息,并通过电子订购单发出购物请求,购买人填上信通过电子订购单发出购物请求,购买人填上信用卡号码预付金额,厂商通过邮购或是通过快用卡号码预付金额,厂商通过邮购或是通过快递公司送货上门,购买人检查商品合格确认成递公司送货上门,购买人检查商品合格确认成交后,通过交后,通过第三方支付第三方支付(支付宝)付款的购物(支付宝)付款的购物方式。方式。 特点:选择多、少费力、节省钱、节省时间特点:选择多、少费力、节省钱、节省时间 一般省钱一般省钱10%10%到到20%20%,多的省,多的省50%50%。“不出自家门,淘尽天下货”重要名词:“互联网+ + ”传统产业的信息化传统产业的信息

47、化 “互联网互联网+ +”= =“互联网互联网+ +各个传统行业各个传统行业”,是利,是利用信息通信技术以及互联网平台,让互联网与传用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合,充分发挥互联网在社会资统行业进行深度融合,充分发挥互联网在社会资源配置中的优化和集成作用,将互联网的创新成源配置中的优化和集成作用,将互联网的创新成果深度融合于经济、社会各领域之中,提升全社果深度融合于经济、社会各领域之中,提升全社会的创新力和生产力,形成更广泛的以互联网为会的创新力和生产力,形成更广泛的以互联网为基础设施和实现工具的经济发展新形态。当前大基础设施和实现工具的经济发展新形态。当前大众最熟

48、悉的电子商务、互联网金融、在线旅游、众最熟悉的电子商务、互联网金融、在线旅游、在线影视、在线房产等行业都是在线影视、在线房产等行业都是“互联网互联网+ +”的的杰作。杰作。信息化;从信息化;从“新四化新四化”同步到同步到“新五化新五化”同步。同步。CCTV-4CCTV-4报道:报道:“互联网互联网+ +”的事例:的事例: 事例一:事例一:互联网互联网+ +猪;(养猪企业通过互联网猪;(养猪企业通过互联网卖猪,市民买猪肉卖猪,市民买猪肉) ) 商家:猪肉涨价,先卖小猪,筹集资金;商家:猪肉涨价,先卖小猪,筹集资金; 消费者:猪肉涨价,先购买期货。消费者:猪肉涨价,先购买期货。 事例二:事例二:互

49、联网互联网+ +甜柚;(浙江淘宝村)甜柚;(浙江淘宝村) 截至截至20142014年底,中国网购人数已达年底,中国网购人数已达3.63.6亿人,占亿人,占全国人口比例近全国人口比例近1/41/4,已连续第二年成为全球最,已连续第二年成为全球最大的网络零售市场,大的网络零售市场,20142014年全国网上零售额高年全国网上零售额高达达2789827898亿元,同比增长亿元,同比增长49.7%49.7%,占全国社会消,占全国社会消费品零售总额的费品零售总额的10.6%10.6%。其中限额以上单位网上。其中限额以上单位网上零售额零售额44004400亿元,增长亿元,增长56.2%56.2%。大大高于

50、当年全。大大高于当年全国全年社会消费品零售总国全年社会消费品零售总12.0%12.0%的增速;消费对的增速;消费对当前我国经济的贡献率提高到了当前我国经济的贡献率提高到了60%60%。(一)大数据改变传统生活方式(一)大数据改变传统生活方式2 2、餐桌上的安全餐桌上的安全。 从田间到餐桌的安全监控。从田间到餐桌的安全监控。 促进大数据发展行动纲要促进大数据发展行动纲要十项工程十项工程:政府数:政府数据资源共享开放工程、国家大数据资源统筹发展据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工工程、政府治理大数据工程、公共服务大数据工程、工业和新兴产业大数据工程、

51、程、工业和新兴产业大数据工程、现代农业大数现代农业大数据工程据工程、万众创新大数据工程、大数据关键技术、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程。提升工程、网络和大数据安全保障工程。(一)大数据改变传统生活方式(一)大数据改变传统生活方式3 3、大数据大数据与环境监测。与环境监测。 20152015年年7 7月月2626日,国务院办公厅下发日,国务院办公厅下发关于印发关于印发生态环境监测网络建设方案的通知生态环境监测网络建设方案的通知 国办发国办发201520155656号号 “(八

52、)构建生态环境监测大数据平台。加快(八)构建生态环境监测大数据平台。加快生态环境监测信息传输网络与大数据平台建设生态环境监测信息传输网络与大数据平台建设,加强生态环境监测数据资源开发与应用,开,加强生态环境监测数据资源开发与应用,开展大数据关联分析,为生态环境保护决策、管展大数据关联分析,为生态环境保护决策、管理和执法提供数据支持。理和执法提供数据支持。”(一)大数据改变传统生活方式(一)大数据改变传统生活方式4 4、大数据与智慧交通。、大数据与智慧交通。4 4、大数据与智慧交通。、大数据与智慧交通。 滴滴打车颠覆了路边拦车方滴滴打车颠覆了路边拦车方式。利用移动互联网将线式。利用移动互联网将线

53、上与线下相融合,从打车上与线下相融合,从打车初始阶段到下车使用线上初始阶段到下车使用线上支付车费,最大限度优化支付车费,最大限度优化乘客打车体验,让司机根乘客打车体验,让司机根据乘客目的地情况据乘客目的地情况“接单接单”,节约司机与乘客沟通,节约司机与乘客沟通成本,降低空驶率,节省成本,降低空驶率,节省司乘双方资源与时间。司乘双方资源与时间。4 4、大数据与智慧交通。、大数据与智慧交通。 目前,滴滴打车已覆盖目前,滴滴打车已覆盖全国全国400400多个城市。多个城市。 未来的滴滴打车还能够未来的滴滴打车还能够为用户设计智能出行方为用户设计智能出行方案,当你输入出发地和案,当你输入出发地和目的地

54、,系统便会给你目的地,系统便会给你方案:是打车、拼车、方案:是打车、拼车、公交还是地铁,哪种搭公交还是地铁,哪种搭配组合更经济方便。配组合更经济方便。 通过大数据技术系统缓通过大数据技术系统缓解拥堵难题。解拥堵难题。公交站点公交站点的电子指示牌,告诉大的电子指示牌,告诉大家下一趟公交什么时候家下一趟公交什么时候能到,可以非常精准。能到,可以非常精准。 据报道:据报道:四川绵阳市四川绵阳市通通过大数据系统,交通拥过大数据系统,交通拥堵缓解堵缓解20%20%以上。以上。4 4、大数据与智慧交通。、大数据与智慧交通。 解决停车难问题。解决停车难问题。停车停车难是目前城市普遍存在难是目前城市普遍存在的

55、问题,怎么找到有效的问题,怎么找到有效停车位?深圳等停车位?深圳等1515个城个城市利用传感技术解决停市利用传感技术解决停车难的问题,通过采集车难的问题,通过采集停车大数据,可以通过停车大数据,可以通过手机找车位,方便了市手机找车位,方便了市民出行。民出行。 汽车保养维修更便捷。汽车保养维修更便捷。车主可在家里通过手机车主可在家里通过手机APPAPP或电话,找人上门或电话,找人上门来做保养;还可以通过来做保养;还可以通过手机手机APPAPP查看爱车行驶查看爱车行驶轨迹,车内使用环境以轨迹,车内使用环境以及汽车行驶耗时、油耗及汽车行驶耗时、油耗、功率、行驶时间、里、功率、行驶时间、里程等相关数据

56、。程等相关数据。 大数据监控交通违章大数据监控交通违章 最近最近(2015.082015.08),由,由“ 乐行南昌乐行南昌”发布的发布的“大数大数据版南昌最易违章地点排行榜据版南昌最易违章地点排行榜”,公布了南昌,公布了南昌市机动车违法行为查获量与重点地段:市机动车违法行为查获量与重点地段: TOP1TOP1:外地车闯禁行外地车闯禁行4.94.9万起,最易发生该违万起,最易发生该违法行为的路段:阳明路、八一大桥;法行为的路段:阳明路、八一大桥; TOP2TOP2:违法变道违法变道3.53.5万起,最易发生该违法行万起,最易发生该违法行为的路段:八一大道南京西路口、八一大道孺为的路段:八一大道

57、南京西路口、八一大道孺子路口、八一大道的民德路口、洪城大市场门子路口、八一大道的民德路口、洪城大市场门口、站前西路路口;口、站前西路路口; TOP3TOP3:黄标车闯禁行黄标车闯禁行3 3万起,最易发生该违法万起,最易发生该违法行为的路段:南昌大桥;行为的路段:南昌大桥; TOP4TOP4:违法停车违法停车1.31.3万起,最易发生该违法行为万起,最易发生该违法行为的路段:南昌西站大街北广场、凤凰中大道;的路段:南昌西站大街北广场、凤凰中大道; TOP5TOP5:逆行逆行63006300起,最易发生该违法行为的路起,最易发生该违法行为的路段:农夫路(进贤县的一条单行道)。段:农夫路(进贤县的一

58、条单行道)。(一)大数据改变传统生活方式(一)大数据改变传统生活方式 5 5、大数据与医疗健康。、大数据与医疗健康。 目前,全国有目前,全国有2 2亿人次住院,已经诊断出的慢病亿人次住院,已经诊断出的慢病发病人数有发病人数有2.62.6亿,其中高血压亿,其中高血压1.61.6亿,糖尿病亿,糖尿病1.141.14亿,还有未被发现和诊断的。亿,还有未被发现和诊断的。 如果把这些患者的医药数据、患者的用药数据,如果把这些患者的医药数据、患者的用药数据,包括电子监管码的销售、医保数据,汇集到一个包括电子监管码的销售、医保数据,汇集到一个综合平台,当输入某一个患者的身份证号,可以综合平台,当输入某一个患

59、者的身份证号,可以知道他得了什么疾病、最近用药情况、健康状况知道他得了什么疾病、最近用药情况、健康状况等,就可以把社会医疗资源合理分配,而不是任等,就可以把社会医疗资源合理分配,而不是任何一个病都要到大医院去排队。何一个病都要到大医院去排队。就医就医160160平台平台 国内知名互联网医疗服务平台国内知名互联网医疗服务平台就医就医160160平平台,起源于深圳,并迅速发展到其他城市,现台,起源于深圳,并迅速发展到其他城市,现已接入全国已接入全国278278个城市、个城市、22102210家大型医院,医生家大型医院,医生资源超过资源超过3030万,实名注册用户超过万,实名注册用户超过140014

60、00万。该万。该平台通过开发使用手机平台通过开发使用手机APPAPP就医预约挂号,深圳就医预约挂号,深圳平均每日有平均每日有3 3万以上的患者预约挂号。万以上的患者预约挂号。 南昌:南昌: 南昌大学一、二附院,江西中医学院附属医院南昌大学一、二附院,江西中医学院附属医院等加入就医等加入就医160160平台。平台。(一)大数据改变传统生活方式(一)大数据改变传统生活方式 6 6、大数据与教育学习。、大数据与教育学习。 互联网在线教育就是在网络上学习,即通过课件互联网在线教育就是在网络上学习,即通过课件、视频等学习,实时互动讨论问题。互联网在线、视频等学习,实时互动讨论问题。互联网在线教育是传统教

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论