版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1新版互联网、大数据:改变生活北京大学学士、高级统计师:刘平
2015年2月8日
全球最美北京大学校园(未名湖)语义网传播大数据信息成为新版本的互联网。语义网或数据智能网络就是新版的互联网、简称互联网;新版互联网的内容就是大数据。智能手机定位找人是典型的新版互联网与大数据服务,不但改变生活、而且使生活变得更美好。文字的底色显示黄色、这是语音讲话的非重点可省略部分、供讲座后参考阅读;本文分为19个小标题、对标题实行编号有序化管理。)互联网主要有三种形态:一、电脑互联网(或有线个人计算机PC互联网。二、移动互联网(或无线智能手机互联网)。三物物互联网(或感应器物联网)。这也是大数据的三个主要来源。这三个网或三种机通常都有集成电路IC智能卡。智能手机同时也有感应器。互联网三阶段:第一阶段以网络为标志,国外与国内的计算机之间建立国际互联网络,电脑机个体形成静态电脑机集体;实现机与机对话。第二阶段以社交媒体电子邮箱等为顶峰,人与机、人与人互动,人与机形成动态生态系统;实现在机网上人与人交流。第三阶段以语义网为基础,人与机动态地不断地互联互通,电脑持续不断地自动地产生大量的系统性数据;实现不同的数据与数据之间信息资源的计算系统共享,这就是新版互联网“大数据网”时代。要全面、完整、真实、准确地理解数据与大数据的概念,必须了解人类进化、电脑机网工具进步、文字数字根据变化等三大历程的转折。猿(猴)、猿人、人类等三段进化历史。笔与纸、算盘等人工信息工具;计算机与电脑网络等机器自动化信息工具;产生电子式大量动态数据的网络智能化信息工具。苹果牌等智能手机通讯录按26个字母排序自动集合。李姓和刘姓的汉语拼音首字母均为L,其它字母不同,李姓自动化排序靠前;压缩文件目录按阿拉伯数字排序自动集合,数字1在前,数字2在后;这是单台个体电脑机软件的部分数据智能化。大数据则是电脑机互联网系统内全部数据智能化的大集合。体育教师嘴巴吹响金属口哨,全班同学集体合并集中,这是典型的集合概念;全班共50人就是50个不同的元素(n),基数为50,这是有限自然数N的集合。大数据就是一种数据的集合。
本文分五个部份19个小标题。全文布局:第一部份:序言。小标题1。1、大数据的慨念及举例。第二部份:共四个小标题2、3、4、5,介绍电脑机互联网等的具体设备,也是大数据的硬件软件。小标题分别是2、手机互联网与定位找人:大数据服务案例。3、全球卫星定位系统与智能手机定位原理。4、普适计算与集成电路IC卡。5、传感器是位置等数据信息的集散工具。目录目录第三部份:共五个小标题6、7、8、9、10,介绍电脑机互联网等的具体计算原理。6、云计算是互联网上对(电子)数据云流的量化。7、中国网络计算创新模式“透明计算“。8、二进制是计算机接受执行的数学化语言。9、新版本互联网“语义网”是数据智能网络。10、创建本体是实体单元数据化的基础工作目录第四部份:共五个小标题11、12、13、14、15,介绍大数据的区域性应用。11、大数据物流人流有序化、中行N号e超市预防网购节货物堵塞、建议组建统计与计划改革委、n元素集合管理。12、人体生物工具、人脑是大数据时代的始点或终结工具。13、推广中轴线往右行和“十右绿行”交通法则。14、大数据文明之种子在江西龙头企业生根开花.。15、人群聚集风险大数据电子预警系统。目录第五部份:共四个小标题16、17、18、19,展望大数据的美好未来。16、大数据是众多运动物质最复杂性的最简单化、大数据是众多运动物质在意识上的美妙变形、时空浓缩。17、网购思维使物质意识高度对立、统一于商品物质。18、人人创新、数据兴国。19、大数据之花自由开放、地球村公民共享美丽。第一部份:序言。1、大数据的慨念及举例和三种互联网形态(1).
电脑互联网是什么工具、大的数据是什么?
电脑互联网是信息工具。网络购物的巨大数字就是大数据的一种。2014年11月11日“双十一”光棍节,中国电子商务巨头阿里巴巴的成交额达到了创纪录的571亿元人民币,也就是93.4亿美元,创造了全世界最大的网络购物日成交额记录。这受益于全球化战略,阿里巴巴联合很多国际品牌,包括CalvinKlein、好市多和AmericanEagle,集合了2.7万个品牌共同吸引国际消费者的兴趣。2014年9月19日阿里巴巴的股票在美国纽约证交所开始交易,交易代码为BABA。9月23日,阿里巴巴在IPO中的融资总额达到250亿美元,阿里巴巴已经正式成为有史以来规模最大的企业IPO(首次公开招股)。所有相关人都成为了阿里巴巴IPO的赢家,承销商从这笔交易中获得的收入超过3亿美元。阿里巴巴旗下有面向消费者和企业的多种在线市场平台,主要通过向寻求推销自己产品的商户收取广告费获取收入。阿里巴巴总活跃买家数为2.79亿,活跃卖家数为850万。阿里巴巴控制着中国80%的电商市场。该公司的淘宝和天猫市场2014年处理了2480亿美元的在线交易,这一数字比亚马逊和eBay(中文电子湾、亿贝、易贝)二者成交额总和还要多。阿里巴巴的盈利能力也远强于许多美国互联网公司,2014年第二财季该公司运营利润率为43%,而亚马逊为0%。中国阿里巴巴集团、是国际化的互联网公司,服务来自超过240个国家和地区的互联网用户;集团及其关联公司在大中华地区、印度、日本、韩国、英国及美国70多个城市共有20400多名员工。互联网大数据企业是创富神话与造福人类的榜样。从以上举例可以得出结论:互联网及大数据是信息时代的先进工具、是客户满意和商家赚钱的双赢工具。本讲座的核心就是大数据。要准确理解大数据概念,必须在数学或哲学上对数据或大数据进行概括。大数据就是一种数据。在哲学上,数据或大数据就是一种意识或主观思维。在数学上大数据就是一种数据集合。数据是大数据集合中的元素。上述网购571亿元就是大的数据;网购的商品是事实,571亿元是数字。显然,数据(data)是能够客观反映事实的数字和资料;数据是客观对象的符号表示。语言文字、数字、符号、图像等既是数据也是具体的意识形式。可见数据就是一种意识或主观思维的具体化。数据通信就是指传输介质把数据从一个地方向另一个地方传送;数据在传送之前需要经过编码转变为信号才能在介质上传播。数据和程序一样,是软件的基本对象。信息与数据是不可分离的。数据是信息的表现形式。信息是数据的内涵。数据和信息两个词经常替换使用但有区别。数据是对信息数字化的记录,其本身并无意义;数据只有对实体行为产生影响时才成为信息。1、大数据的慨念及举例和三种互联网形态(2).
信息是指把数据放置到一定的背景下,对数字进行解释、赋予意义。例如,1.75是个数据,其人身高1.75米则是一则信息。通常把所有存储在计算机上的信息,无论是数字还是音乐视频,都统称为数据。上述网购571亿元就是大数据;这是每一个阿里巴巴网民当天网购的全体数据。可见,大数据(bigdata)就是全数据模式,样本(数量)=总体(全体)。被研究的对象的全体为(数据)总体。从总体中抽取的一部分个体,叫做(数据)样本。样本中所含个体的多少叫样本量。这与小数据时代不同,小数据是随机采样,是随机性的部分样本,最少的信息推断全体、是估计的信息。智能手机十几亿部、同时被定位置,每一部之间互联互通,每位手机都有定位服务,一个不漏,毫无例外,这是大数据与互联网文明。大数据使互联网进入数据化智能化时代。人工抽样进行人口普查,各部分有代表性的部分人口数相加后按比例放大后估计人口总数,这是小数据与手工统计文明。大数据可以被计算机数学化处理,可以被网络云计算。定位的智能手机系统大数据就是众多手机数据的集合。集合是指具有某种特定性质的具体的或抽象的对象汇总成的集体,这些对象称为该集合的元素。例如全中国人的集合,它的元素就是每一个中国人。我们通常用大写字母如A,B,X,Y,...表示集合,而用小写字母如a,b,x,y,...表示集合的元素。把含有有限个元素的集合叫做有限集,含无限个元素的集合叫做无限集。N:非负整数集合或自然数集合{0,1,2,3,…};N*或N+:正整数集合{1,2,3,…};Z:整数集合{…,-1,0,1,…}。集合A中不同元素的数目称为集合A的基数,记作card(A)。当其为有限大时,集合A称为有限集,反之则为无限集。1、大数据的慨念及举例和三种互联网形态(3).1、大数据的慨念及举例和三种互联网形态(4).
2014年,全球网民超30亿,其中中国网民达6.5亿;中国手机用户数12.86亿;其中中国智能手机用户(手机移动网民)首次超过5亿人(超过传统台式电脑网民规模),中国成为智能手机用户最多的国家。预测2015年全球智能手机用户将超19亿。预计2018年全球功能手机将逐渐成为移动手机的少数派。中国每一部智能手机的用户就是集合中的一个元素;中国智能手机用户集合N的基数是5亿多,该大数据的具体数量也是5亿多用户。手机与所在的地理位置或网购商品(物质)就是一种物质或客观存在。物质与意识是对立统一的。宏观的庞大的现实物理世界与微观的浓缩的互联网虚拟世界是对立统一的。互联网大数据网上网下或线上线下也是对立统一的。互联网大数据时代在物质(或存在或商品)与意识(或信息或数据)上促进了信息流、资金流、商品物流、人流等相对有序化、大规模化、批量化、高效率化,这是哲学物质统一性原理照亮着信息世界。现实物理世界物质(或商品)在规模、批量、计算、效率上的难问题、大问题通过互联网虚拟世界可以不断得到解决、不断提高水平和质量,从而实现物质(或商品)流动流通大规模化、大批量化、大数量准确化、高效率的目的。手机是物质(机器)与意识(信息)对立统一的具体化一体化形式。
第二部份:大数据(工科)技术设备.
2、手机互联网与定位找人:大数据服务案例(1).千里之外俩个人是否可以像电线一样连接起来进行说话、有线固定电话诞生。无线可移动电话、功能手机诞生。有线计算机诞生。个人计算机PC机之间有线电脑互联网诞生。功能手机和电脑IC卡组合成智能手机。演示智能手机。(预约好)本人正在打通某人的手机;滴……滴响;已接机;“你好!我有急事向你求助……。”智能手机就是移动互联网;互联互通手机就可以分别找到此两个手机持有人的地理位置,这就是大数据计算找人的理论结果;适当的时间差、手机地理位置范围内就是被找人的实际结果。本文就从手机定位找人开始讲述互联网与大数据的美好故事。主动打手机的人在什么位置、被动接手机的人在什么地方,马上可以分别被及时确定地理位置:在某城市某大楼,误差在几米以内。本人手持智能iphone4s[̀aifәun](苹果手机)进行演示,请大家看一下:点击手机屏面“地图”,查看电子版谷歌google地图,轻点地图显示的闪亮的蓝色(园圈)小球,会弹出“当前位置”及“具体地址”,在地址后面有一个向后推动的标志,轻点一下,出现当前位置的“简介”、“公交车路线”等。搜索地图的结果,我的手机和本人所在的位置是:江西省(数字)图书馆;具体地址:南昌市洪都北大道198号。手机大数据找人的结果与我真正准确地在“赣图大讲堂”上课的事实完全相符,地图可以指引我们共同到达了目的地。大数据(工科)技术设备.
2、手机互联网与定位找人:大数据服务案例(2).再点击手机屏面“工具”,查看电子版“指南针”,显示江西省南昌市北纬N28°411东经E115°521、北纬28.68东经115.89;手机顶部指向、指南针显示正确方向、天晴早上指向太阳方向(东方)时、手机的指南针还具体显示东100°等、这是跳动后显示的方位数字、同时指南针红线段指明的刻度也是东100°等,红色小三角形指向北(北极星)0°或360°;这样在指南针帮助下人就可避免在陌生地迷失方向。再点击手机中的“设置”,接着点击“云”图旁的英语单词icloud[aiklaud],通过输入两个不同的自己的电子邮箱地址后,即可关闭手机的云服务功能,防止手机和主人被他人跟踪,保护自己的隐私。向警方报案找到手机持有人后、利于解决纠纷。手机定位找人案例,是典型的三角形大数据解决方案。(移动)互联网(电脑端)之一(包括PC机个人电脑或智能手机芯片IC卡电脑端),智能手机(感应器)物联网端之二,GPS全球定位系统端之三。传感器是地面物体端接触的直接小测量工具;GPS是天空端发射无线电信号的间接大测量工具;互联网(或手机IC芯片)是云计算、信息集散端的大数据显示结果工具。三点动态平衡,良性循环,不断产生大数据、信息、知识,为人类目的服务。手机定位找人案例,两个手机接通,输入或显示两个手机号码,手机感应器初次测量,数学问题提出:GPS卫星或互联网云计算,数学问题分析;(PC机)互联网或手机(移动)互联网(手机IC)输出位置信息,电子地图显示南昌市某大楼等;问题解决就有答案。全世界十几亿部智能手机是一个大数据,刚才两部手机互联互通就是此大数据之一之二,手机定位所处的位置在南昌市某大楼,这是大数据的痕迹与问题之理论答案。大数据(工科)技术设备.2、手机互联网与定位找人:大数据服务案例(3).
移动互联网、静态互联动态互通。手机是大数据时代海量数据的来源和数据创新发展中心。普通手机定位、基于智能手机的地理位置服务,可以准确记录一个人的地理位置,手机和用户如影随形,这意味着无数商机。。全球每部手机同时响起,每部手机位置分别确定,数亿部手机即时定位数据就是大数据的一种;每部手机位置等数据及信息还会时刻处处不断变化与刷新,动态大数据信息更是海量且为人类服务更好。手机定位成功的案例,为大数据普及与创新增添信心、动力和目标。大数据之所以产生,是因为现在时时刻刻无处不在的传感器和微处理器IC卡,智能手机中的苹果手机等具有传感器和微处理器IC卡,产生着大数据和信息。像手机一样,智能的机械或电子设备都可以留下数据痕迹,这些痕迹表明了它的地理位置、性能或状态。这些使用它的人、通过设备、通过互联网互相交流,又形成了另外一个庞大的数据源,像输入手机号码、到手机定位网站找人等;当这些数据和来自其他媒体、无线或有线电话、有线电视、卫星等来源的数据相结合的时候,显得庞大无比。美国苹果公司是全世界私有企业中赚钱的首富,在全球市场科技创新的竞争中处于大哥大位置。
大数据(工科)技术设备.
3、全球卫星定位系统与智能手机定位原理(1).现在介绍一下,地理位置的数据化。地球本身构成了世界上最基础的信息。1978年,构成全球定位系统(GPS)的24颗卫星第一次发射成功;卫星距地面约2万公里(20372千米);地面上智能手机中的接收器通过计算接收卫星信号所需时间的差异(间隔)而进行手机自我三角定位,每时每刻持续不断地对手机所处的位置进行定位并生成信息;用GPS进行定位一般仅需要几秒钟的时间,它使用的是标准化坐标表示法;显示经度纬度,说明手机的主人所在的区域(AreaN)。iphone本身就是一个移动“间谍”,手机用户不断地被收集位置和无线数据然后传回手机商户“美国苹果公司”;微软的手机操作系统和谷歌的安卓手机也在收集这一类数据。每一颗定位卫星都载有位置及时间讯号,卫星讯号不断传递轨道运行(距离)资料,其所载之原子钟不停产生精确的时间资料。大数据(工科)技术设备.
3、全球卫星定位系统与智能手机定位原理(2).利用卫星基本三角定位原理,接收到3个卫星信号,就可以确定GPS接收装置之位置;由每颗卫星的所在位置,测量每颗卫星至接受器间距离,即可算出接受器所在位置之三维空间坐标值。GPS接受装置以量测无线电信号的传输时间来测量距离。GPS接收器收到数据“提示”给手机,手机不断收到这些信息、快速不断地修正自己的位置。依靠测量卫星发射之无线电讯号至接受器所需时间再乘以光速所得之距离,就是卫星至接收器之间的距离,再计算出接收器所在位置的三维坐标值(立体空间解析几何)。求解x、y、z;这是三元一次方程组问题,要把含有相同的三个未知数的几(三)个三元一次方程联立起来(三颗卫星分别对应手机)。前提是必须知道由卫星星历轨道资料计算出的每颗卫星位置(及相关的三颗卫星分别的位置),即可得知每个接收器的正确位置。输入对方手机号码、两部手机(及两个号码)互通,两部手机号码就是问题大数据之一之二;通过互联网云计算,就可确定两部手机的位置、就是答案大数据之一之二。基本公式是:距离(路程)=速度乘以时间;s=vt。其中无线电传播速度=光速;光速大约30万公里每秒,近似值;光速c=299,792,458米/秒。大数据(工科)技术设备.3、全球卫星定位系统与智能手机定位原理(3).大数据解题三步走:数据信息输入、加工、输出。手机中的号码或感应器等的信息输入,卫星、互联网云计算等的信息加工,手机地图的位置显示等的信息输出。由手机定位案例,说明了互联网中的大数据是数学运算的电脑化自动化;机器化数学理论的答案准确,可操作可享受成果;数学机器化、手机位置的答案,看得见摸得着,容易运用、掌握。人人可享用手机带来的大数据服务。大数据(工科)技术设备.
4、普适计算与集成电路IC卡.通过在日常环境中广泛部置微小的计算设备,人们能够在任何时间和任何地点获取并处理信息,计算将最终和环境融为一体,这就是普适计算。IC就是集成电路(IC,integratedcircuit),泛指所有的电子元器件,是在硅板上集合多种电子元器件实现某种特定功能的电路模块;它是电子设备中最重要的部分,承担着运算和存储的功能。IC智能化。移动互联网、手机、PC机、物联网、车联网、云计算、平板电脑以及遍布地球各个角落的各种各样的传感器,无一不是大数据来源或者承载的方式。利用已知的今天去预测明天的未来。大数据(工科)技术设备.
5、传感器是位置、重量等数据信息的集散工具.超市电子称就是重量传感器的具体应用;输入商品代码、含有单价信息;重量乘以单价等于付款金额、采购的零散商品刷上条形码付款OK。万事万物,凡存在,皆可联网;凡联网,皆可计算。无处不在的微小计算设备和无处不在的互联网相结合,实现无处不在的信息自动采集,传递与计算。这种微小的计算设备,就是传感器。智能手机中的传感器和物联网,就是普适计算的典型例子。随着无线网络技术的发展,计算机器、传感器等从人们的视线逐渐消失或隐身,计算将最终和环境融为一体。实现普适计算的根本,是在人类生活的物理环境当中广泛部置微小的计算设备。传感器是位置等数据信息的集散工具。智能传感器是微型计算机技术与检测技术相结合的产物。小计算器可以解决简单的小数据算术运算。互联网、手机感应器等物联网、GPS卫星系统三角融合则可以解决复杂的大数据统计等数学难题,这是电子互联网云计算的神奇智慧。初始数据(号码等)输入手机等感应器,GPS卫星测量位置等,(PC机)互联网(或手机芯片IC卡)进行云计算并输出大数据信息之一等。号码与手机部分条件已知,卫星定位与云计算解决未知条件,手机互联网输出地图位置信息这个最终答案。科技魅力,即时显示。
第三部份:大数据(理科)科学原理.6、问题数据+云计算=答案数据、云计算是互联网上对(电子)数据云流的量化(1).上饶市中行有发电机独立发电可以为本单位供电、仅备急用;但通常使用电网上的供电。单台计算机可以独立进行简单的计算;跨计算机计算是创新;无数计算机之间互联成网络共同的问题数据通过云计算进行复杂的计算;问题数据的集合通过云计算产生答案数据新的集合。仰望星空、嫦娥奔月,中国人实现了登月探测的梦想。仰望天空、天宽地阔;风吹云飘、乌云压顶;人工降雨、大旱逢甘霖;互联网云计算的理想照进了现实。中国阿里巴巴集团阿里云众多合作伙伴能够提供完整的云计算解决方案、全面的全方位服务、专业的行业应用,助力跨入云计算数据时代。金融云助力互联网金融创新。(电子)云是对互联网网络的一种比喻说法。云计算是互联网上对(电子)数据云流的量化。云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。用户通过PC机(笔记本或台式)、手机等方式接入数据中心,按自己的需求进行运算。大数据(理科)科学原理.
6、问题数据+云计算=答案数据、云计算是互联网上对(电子)数据云流的量化(2).云计算是分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡、热备份冗余等传统计算机和网络技术发展融合的产物。云计算是通过互联网进行传输的,计算能力可以作为一种商品进行流通,就像水电、煤气一样,取用方便、费用低廉。物联网就是物物相连的互联网;物联网的核心和基础自然是互联网,是在互联网基础上的延伸或扩展的网络;其用户端延伸和扩展到了任何物品和物品之间,进行信息交换和通信。大数据和云计算的关系密切,大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构和依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。云服务包括基础设施即服务、平台即服务和软件即服务。移动云服务。自然“云”是指停留在大气层上的水滴或水晶胶体的集合体;云是地球上庞大的水循环的有形的结果。云计算(cloudcomputing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。云计算可以将每一个地区或每一部手机的个别数据,储成一个大的数据库,有助于更迅速广泛地搜索、计算、利用。大数据(理科)科学原理.6、问题数据+云计算=答案数据、云计算是互联网上对(电子)数据云流的量化(3).典型的云计算提供商往往提供通用的网络业务应用,可以通过浏览器等软件或其他web服务来访问,而软件和数据都存储在服务器上;云计算服务通常提供通用的通过浏览器访问的在线商业应用,软件和数据可存储在数据中心。第三部份:大数据(理科)科学原理7、中国网络计算创新模式“透明计算”.中国网络计算创新模式“透明计算”理论的最大突破,是实现了运算和存储的分离。如果把透明计算应用到智能家居如电视、空调、冰箱等上面,我们都不需要太多的遥控器,一个就够了。大数据用事实、数字、数量、数据说话,告别“差不多”先生、拍脑袋决策的糊涂与愚昧。大数据(理科)科学原理8、二进制是计算机接受执行的数学化语言.二进制使计算机内部的数据组织形式有序化定向运动。二进制解决了在没有情感、智能、生命的物理机器中表达、计算、传送数据这个大难题。有了二进制,软件的运行才有了支点。二进制解决了数据在计算机内部传送“理解”和“流动”的问题。二进制是计算机接受执行的数学化语言。数字化指的是把模拟数据转换成用0和1表示的二进制码,这样电脑就可以处理这些数据了。数据就是有根据的数字。数字化是把模拟数据变成计算机可读的数据。数字化带来了数据化,但是数字化无法取代数据化。当文字变成数据,人可以用之电子化数字化阅读,机器也可用之分析。通过数据化,在很多情况下,我们就能全面采集和计算有形物质和无形物质的存在信息,并对其进行处理。将世界看作信息,看作可以理解数据的海洋,为我们提供了一个从未有过的审视现实的视角。数据是可以渗透到所有生活领域的另一种世界直观。各种各样的现实可以转化为数据,万千事物就转化成数据形式。理解数据的存储单位。单位:位(二进制位、计算机的最小信息单位)、英语标识Bit比特,大小1或0;含义和例子——计算机二进制存储和处理数据,一位是指一个二进制数位0或1,这是存储信息的逻辑单元。字节Byte,8位;这是计算机存储信息的基本物理单位,存储一个英文字母在计算机上,其大小就是一个字节。千字节KB,1024字节或210(=25·25=32×32=1024)个字节;一页纸上的文字大概是5千字节。计算机(电脑)电路系统只具有最简单、最机械、不断重复循环的两种状态:接通与断开。二进制计数法正好适合这种电子计算机的电路系统。二进制只用0和1两个符号记数,相当于分别表示电路的开与关两种情形。在二进制里是逢二进一;它与十进制记数可以相互转换,在十进制里是逢十进一。大数据(理科)科学原理.9、新版本互联网“语义网”是数据智能网络(1).1946年,第一台电子计算机在美国宾夕法尼亚大学问世。1969年美国ARPANET建成,标志着互联网的诞生。1973年ARPANet扩展成国际互联网;第一批接入的有英国和挪威的计算机。1994年中国全功能接入互联网。2005年以前是传统互联网时代,之后进入智能手机移动互联网时代。互联网发展第一阶段:以网站为标志的信息传播共享。第二阶段:以社交媒体为顶峰的信息交流和协同。第三阶段:以语义网为基础的数据智能网络;这就是当今兴起的大数据,这是现阶段再造创新的新版本互联网,能更好地为全人类提供周全的信息自动化服务。在万维网(worldwideweb)上,网页是信息资源的基本组织单位和组织形式,各个网页都有一个地址,即“统一资源标准”(URI),通过开发者定义的链接连接起来,用户可以从一个网页跳跃切换到另一个网页,即网上冲浪。对用户而言,语义网意味着可以从一片数据自由地跳转到其他数据,这是数据冲浪;这个跳转是本质关系上与本体的联结,这不是人为的链接,也不需要人工外力,而是机器自动化。大数据(理科)科学原理
9、新版本互联网“语义网”是数据智能网络(2).语义网就是“数据网”,是当代大数据时代新一代互联网阶段的别称。所谓“语义”,就是遵循一个统一的(分类)标准,给每一片信息赋予一个计算机都能理解的“意义”,这个标准的“意义”,用术语说,则是“元数据”(母数据),也可以形象地理解为给信息贴上各种标准化的“标签”(或分类归属)。在语义网上,数据(取代网页)成为组织资源的单位,一个数据(取代网页)可以获得一个地址(即统一资源标识),还有统一的语义对不同的数据进行描述。语义网上的数据是一个活的细胞,而不是一个死的数字(或网页)。每一个数据可以被定位,还拥有和其他数据语义一致的标签,不同数据之间可以相联,这是有机联系,而不是物理相连。通过数据之间内在的关系挂起钩来,动态组合,这种语义关系不是随便定义的,而是基于数据的含义和属性产生的,这是数据分类归属,且计算机可以理解、自动分类与联系。第三部份:大数据(理科)科学原理.
9、新版本互联网“语义网”是数据智能网络(3).元数据是大数据时代的一个重要概念,它是指描述解释数据属性的数据(母数据、母工具),是为支持一致性的数据描述所定义的统一准则(数据分类规则)。语义(数据)网,就像一个全球性的数据库,不仅把数据放在互联网上,它还要在数据之间创建联接,数据之间一旦互相联接,自由流动,计算机和人都可以对数据进行探索,重新组合、重复利用、动态把握数据,通过一个数据发现另外一些相关的数据。万维网是一个网页的集合体,这些网页,即使内容相似、主题相同,由于分属不同的网站、存储在不同的服务器上,他们之间就没有链接和联系,这就必须分别借助搜索引擎找到不同的网页,而网页之间不会自由流动、相对静止。但语义网的智能平台将触发呼唤一些崭新的服务。有大量关于元数据的标准需要制定、统一。元数据是语义网建设的关键。元数据系列是计算机能理解的语义标记(符号),每一个片断就可以和其他的信息自动发生联系,揉捏整合,形成联结的关系。元数据作为一种计算机“标记语言”必须是标准的、一致的、统一的,而且是灵活的、可扩展的,适用于万事万物;元数据是大数据化的母工具。大数据(理科)科学原理.10、创建本体是实体单元数据化的基础工作(1).为了保持元数据“标记语言”的一致性,计算机工作者对全世界万事万物的基本特点及其关系进行规范和定义,这个过程叫做创建本体(Ontology)。所谓本体,就是世界上所有的常见事物。创建本体是对人类社会每一个实体进行概念化、标准化的定义(分类)过程。创建本体是实体单元数据化的基础工作。在各种各样本体的基础之上,为数据加上语义一致的数据标签,这是语义网最基础最繁琐的工作之一。元数据相当于将数据分成多个大类,本体则是每一个具体的数据品种,各种本体数据归属不同的元数据大类,根据分类对各种具体数据进行动态联系链接。生物分类:界门纲目科属种。数据在网上自动整合、跳转,互联网将向我们主动推送信息,而不是我们在网上“搜索”信息。大数据时代中每一个数据都能在互联网上产生智能,获得新生命,不断散发活力,点亮信息世界。本体论是科学研究的基础,也是人工智能的基础,它在思维、信息传播、组织和检索中发挥着重要作用。建立本体的作用主要是:能够在人与软件代理之间对信息结构达成共同的认识,方便人机对话;能够使本领域的知识得到共享和重用;使领域内不同的系统、模型之间能够进行互操作。创建本体是具体的数据内容,元数据则是数据目录。大数据(理科)科学原理10、创建本体是实体单元数据化的基础工作(2).元数据(Metadata),又称中介数据、中继数据,元数据的特征和功能是为数字化信息资源建立一种机器可理解框架。元数据也是数据,为描述数据的数据,元数据是描述信息资源或数据等对象的数据。主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须描述并收藏数据的内容或特色,进而达成协助数据检索的目的。元数据首先是一种编码体系,元数据编码语言(MetadataEncodingLanguages)指对元数据元素和结构进行定义和描述的具体语法和语义规则,常称为定义描述语言(DDL)。大数据(理科)科学原理
10、创建本体是实体单元数据化的基础工作(2).元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。元数据是关于数据的数据,或关于数据的结构化的数据。元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,DublinCore是其典型代表。
第四部份:大数据应用工程.11、大数据物流人流有序化、中行N号e超市预防网购节货物堵塞、建议组建统计与计划改革委、n元素集合管理(1).本人创新的N号商品e超市物流有序化、循环化、有效防止了商品物流人流堵塞事件的发生。本人已在电子互联网上发表论文《中行N号商品统一e超市网购品名代码叫号服务系统论》156千字:百度一下。网购要在每一环节每一细节上高效率、需要相应的科学理论原理与有效的实践经验相洁合,构建网购系统工程;当走在超市地图分类区域上被选的货物面前、中行N号e超市在任意1秒钟之内可选定每一个应选择的商品品种、实现最快最准最好服务的系统整体目标。大数据应用工程.
11、大数据物流人流有序化、中行N号e超市预防网购节货物堵塞、建议组建统计与计划改革委、n元素集合管理(2).156千字论文与1万小时付出这一过程和原因,在超市分区上被选的货物面前、在任意1秒钟之内客户可选定每一个应选择的商品品种,商户服务员1秒钟服务OK这一目标和结果。原因与结果、过程与目标对立通一。2014年双十一购物节,中行上饶市婺源支行王氏在电子购物网购买了儿童服装,电商天猫8天后发货,再过7天后到货;王氏称赞上饶市中行网购超市创办人刘氏创新的N号商品叫号服务效率高,值得电商阿里巴巴等借鉴其成功经验。天猫等电商的商品品种是散落的珍珠、无序化、易混乱易混淆;上饶市中行网购超市(N号商品品种统一e超市)是项链的珍珠、N号有序化、循环化、不乱不混淆。上饶市中行网购超市商品信息流和商品物流有序化、代码化、规范化、标准化;线上菜单代码与线下物品代码一致化,品名与代码复制化、配套准确化、一品一号、分类分区,每1秒钟之内可选定每一个任意商品品种。中行网购超市的每种商品地理位置相对固定不变、商品品种有序化而不乱,进货出货动态平衡;商品进口(进货)、商品出口(出货)循环化因而商品物流有序化。进口运货人流与出口运货人流有序化因而循环化。中行仅200种商品已高效率,拥有几万品种的电商采用中行N号超市,更可显示神奇,商品品种越多,N号超市有序化更显魅力。个人综合能力、理论结合实践的能力助推创新发展。n号金融商品统一e超市系统商品品种叫号服务可向非商业领域广泛推广;刘平创新创办中行N号e超市实践证明了一万小时定律。通过专注的阅读、思考、研究、实践、写作、理论化、系统化,才有今日的N号e超市成功。大数据应用工程.
11、大数据物流人流有序化、中行N号e超市预防网购节货物堵塞、建议组建统计与计划改革委、n元素集合管理(3).
n个有序元素集中汇合成N系统整体;实行N集合n元素单元叫号服务;如全体之机构代码逐个点名管理;全体之人员身份代码逐个点名管理。N集合内对n元素(品种)不断进行历史统计预测未来计划。计划(商品)经济大锅饭缺泛人的积极性主动性创造性造成商品短缺;市场经济容易产能过剩、宏观上缺泛历史统计与未来计划的有机融合;建议各级政府组建统计与计划改革发展委员会,并下设统计局;建议各企业组建销售统计与生产计划部门。只有统计与计划有机结合,市场资源各要素配置才能合理、减免浪费,提高经济效益和社会效益。大数据应用工程12、人体生物工具、人脑是大数据时代的始点或终结工具(1).网络虚拟大数据信息世界要为大数据现实物质世界服务。现实物质世界工具与网络虚拟工具结合并用。大数据分析的结果也要靠人工运用和执行。做一个普通且优秀的人,必须首先善于运用人工的基本工具,口算估算、动笔、写纸质文章;具备综合能力、不断提高知识经验的利用率;在危机中具有化危为安的能力;具备坏处着想好处努力的处世哲学理念。要敢于善于利用人体本身各种生物工具、信息工具。要敢于善于组织、带头指挥群众处理突发事件。在电梯等运输工具上人或物的重量分布要均匀平衡、减免倾倒,需要指挥平衡“多嘴多舌”的人等;过斑马线时、人的双手必须伸出保持人体平衡、注意力集中、减免交通事故,怕冷将双手插在裤袋、不利人体平衡、增加了交通事故隐患。利用人体信息工具嘴巴、带头张口大声喊叫“往后退”可以化解人为踩踏事故的危机、转危为安。危机造就领袖人才。头、脑、眼、口(嘴巴)、舌、牙、鼻、耳、手、脚、身体等人体工具综合并用,缺一不可。大数据应用工程.
12、人体生物工具、人脑是大数据时代的始点或终结工具(2).人体生物工具既是始点工具也是终结工具。人体生物工具是人类生存发展的必要工具。人体生物工具是基础的根本的工具。综合利用人体生物工具和互联网、大数据工具,人类生活才能真正变得更美好。人类不能退化成不会喊“往后退”不会喊“救命”、更不能退化成哪里人多有危险还往哪里挤,更不能出现故意起哄的败类、不允许并制止捣乱者。人要有求生存的本能,大多数人要在社会危机中具有敢于担当指挥的勇气智慧。
大数据应用工程.
13、推广中轴线往右行和“十右绿行”交通法则.现实物理世界人口流量大数据控制应与互联网人流大数据电子远程控制相结合预防踩踏事故。立法执法、实行推广中轴线往右行和“十右绿行”交通法则。在公路(纵向车道)中轴线和斑马线(橫向人行道)中轴线垂直交叉线呈“十字形”,(斑马线平分后呈双吕形方块、双吕字交叉中间呈“十字形”空格)、这是“十字形”中轴线往右行第一交通法则。交通执法者配用红色旗或绿色旗进行指挥,十字路口配置“红色灯绿色灯或黄色灯等”,这是“红色停绿色行”第二交通法则。交通执法者应配备金属口哨或高音喇叭(张大嘴巴)、利于在危急时可能大喊“往后退”等;人行车行要一停二看(睁大眼睛)三通过;这是“大嘴大眼”第三交通法则。大城市中心地带(区域)的房屋建筑必须呈双吕形方块、双吕字交叉中间呈“十字形”空格、利于四通八达,单体建筑长与宽必须有上限、或最长为50米(或100米)、或重建达标、防安全隐患;单体大建筑应建四个出口或进口大门(其它各处配大窗口)、这四个进出口角落(东西南北)呈双吕形且足够大、利于人流物流有序化循环化;这是“四大门口”第四(或建筑)交通法则。建议将这四大交通法则正式纳入法律条文并广泛宣传、深入人心,人人皆知、人人做到。大数据应用工程14、大数据文明之种子在江西龙头企业生根开花大数据信息具有混杂性而不是纯精确性,繁杂的数据越多越好,大数据简单算法的大数准确度准确率远远胜过小数据复杂估计算法的小数准确度准确率,大数据侧重相关关系而非因果关系。根据大数据分析的结果,进行大数据预测性执法与预测性惩罚,汽车司机(驾驶员)必须系安全带,否则扣分罚款。因为对交通事故进行的大数据分析显示,系安全带与不系安全带的伤亡人数差别大,事故的概率大不一样。数据统计分析是让“昨天”为“明天”服务。一种大数据就是一种集合。普及大数据,必须普及传感器、IC卡、手机、电脑、物联网等。国家物联网重大应用示范工程确定,江西列入区域试点省,我省正邦科技的物联网技术在肉食品安全可溯源系统建设中的应用与示范;双胞胎集团的饲料安全可溯源物联网系统建设示范;思创数码的基于物联网的智慧港航重大应用示范;泰豪软件的物联网技术在配电网运行管理中的集成应用示范。这些应用示范有利于食品安全、交通安全、能源安全。大数据应用工程.
15、人群聚集风险大数据电子预警系统.利用大数据电子远程监控与现场指挥相结合,北京人群聚集风险预警系统覆盖天安门城楼等重点区域、提供人流监控信息。可指挥现场疏导、限流。北京该预警系统应可视化、应不断升级改善、应推广。
第五部份:大数据特点与推广.16、大数据是众多运动物质最复杂性的最简单化,大数据是众多运动物质在意识上的美妙变形、时空浓缩.
大数据的4个特点“V”,“V”——Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值)。数据与信息是反映物质存在的思维意识、语文形式;数据、信息就是思维、意识(主观),统一于物质(客观)世界。世界的本质是物质;物质决定意识,意识是物质的反映;意识对物质具有能动作用。意识活动具有主动创造性和自觉选择性。思维与存在的同一性是指(客观)存在决定(主观)思维,思维反作用于存在。存在与思维统一于存在;物质与意识统一于物质。坚持一切从实际出发,实事求是,要把发挥主观能动性和尊重数据的客观规律结合起来,把高度的革命热情同严谨踏实的科学态度结合起来,最大限度发挥数据的作用。大数据是众多运动物质系统最复杂性的最简单化、大数据是众多运动物质系统在意识上的时空浓缩、美妙变形成语言文字数字等信息符号。
大数据特点与推广.
17、网购思维使物质意识高度对立、统一于商品物质(1).爱因斯坦质能方程(公式)E=mc^2(形式1);E为能量,m为物质质量,c为光速。推论出物质具有"能量=质量与光速平方乘积"的关系。无线电传播速度=光速,光速大约30万公里每秒。能量和质量是可以互换的。副产品:原子弹。原子弹主要是利用核裂变释放出来的巨大能量来起杀伤功能作用的一种武器。它与核反应堆(核发电)一样,依据的同样是核裂变链式反应。互联网、大数据则是链式联接。互联网、卫星通过电讯传播信息、传播速度也和原子弹一样是光速,大数据相当于互联网信息的原子弹;大数据是互联网信息浓缩的集中集散、缩短时间空间;大数据是物质运动之众多数据形式在时间空间上缩短浓缩的结果。
大数据特点与推广17、网购思维使物质意识高度对立、统一于商品物质(2)例如,为了实现异地购买商品的目的,本客户可以多途径选择,或走路、或骑马、或驾驶汽车、或坐高铁火车、或乘飞机亲临超市商场,但网购更快更简单;网购缩短了选购商品的时间空间;选择网上的某商品品种信息(意识)就代表所选购商品品种(物质)被选择,众多商品品种信息浓缩成商品大数据;在意识上缩短了商品物质的时间空间;缩短了客户与商户的时间空间;网购思维使物质意识高度地既对立又统一、最终统一于商品物质。网购具有哲学审美价值、网购具有效率效益。大数据是人类生活的最美丽之花、是人类文明历史集大成的果实种子。大数据文明的种子在地球村必将遍地开花结果。大数据使众多运动物质系统在意识形式上的时间空间变形变小,充分利用大数据、人类生活不断变得更易控制更便捷更高效更美好。
大数据特点与推广.
18、人人创新数据兴国(1).为了国家信息安全,2000年到2003年我国成功发射了三颗北斗导航试验卫星,建立起北斗导航试验系统,成为继美国(GPS)、俄罗斯之后第三个拥有自主卫星导航系统的国家。之后成功发射了第四颗北斗导航卫星,并进入卫星密集发射组网阶段。到2020年左右,建成有5颗静止轨道卫星和30颗非静止轨道卫星组成的覆盖全球的北斗卫星导航系统。已有国产手机使用了北斗系统。中国国务院《关于促进云计算创新发展培育信息产业新业态的意见》,明确了统筹布局云计算基础设施,加强大数据开发与利用,提升安全保障能力等六项主要任务。依法治国;为了大数据发展,必须制订中国版的《信息自由法》、《数据质量法》;学美国、拿来主义、结合中国国情修订实施。改革开放是中国的基本国策,数据开放、公开数据刻不容缓。互联网是最伟大的信息开放工具。建议政府的数据用通用的格式推上互联网;让公民可以跟踪、查询政府的资金、专门款项、合同和相关信息,保证每一个政府机构都能跟上大数据的时代标准,设立信息技术官岗位。服务电子商务,开展网络金融;
大数据特点与推广.
18、人人创新数据兴国(2).中国银行“中银易商”已成为中行互联网金融的品牌,利用传统银行数据成果,利用第三方合作数据,合理引用互联网信息,构建客户360°画像,实现精准营销,在局部地区取得了良好的试点效果,逐渐构建起了中行业务大数据能力框架体系,为中国银行大规模开展企业大数据建设打下了良好的基础。太阳每天都是新鲜的。人类每天都在进步。
大数据特点与推广.
18、人人创新数据兴国(3).新版大数据网、网络云计算、互联互通信息共享,人类处于大数据信息前沿时代。依法治国数据兴国,实现中国梦,必须政府、企业、个人等共同为大数据创新作贡献,提高各行各业各人各事对大数据网的覆盖面和利用频率。落后就会挨打;大数据信息落后就会被动并被历史淘汰。面向大数据之互联网,就是面向世界、面向现代化、面向未来。人高山为峰,站在大数据之网的高峰,无限风光在峰上。人类文明发展史,是工具、信息工具的进化史。人类信息工具发展基因、遗传与变异、向善向好,更高效率更大规模、更好服务。手写纸质文字、雕版印刷、活字印刷、激光照排印刷、步步高效。电子复印、电子打印、网页搜索、数据冲浪;阶阶精彩。活字印刷与数据冲浪的共同点是重复利用信息、效率高。大数据冲浪使数据自动化链接。历史文明与当代文明互补共存、手工与机电工具、网络工具互助共享。
大数据特点与推广19、大数据之花自由开放、地球村公民共享美丽(1).
大数据、智能化、移动互联网、云计算共同构成大智移云系统。这降低了信息化的门槛。移动互联网与物联网结合,使大数据的产生与收集成为可能;移动互联网与物联网的应用需要云计算支撑:大数据的分析挖掘助推移动互联网与物联网的发展,促使软件硬件更加智能化。互联网的发展没有国界限制。全球互联网十大企业、中国占四家,BAT(百度、阿里巴巴、腾讯)与京东;阿里巴巴股价盘中最高市曾超过3000亿美元,这是移动互联网用户借网造富的模范。中国金融IC卡累计发行超10亿张。2014年中国大陆第三方支付企业互联网收单交易额(网上支付)近九万亿元、达88161亿元;其中银联网上支付占14.65%,财付通占18.08%,支付宝占46.15%。移动金融集智能终端与金融IC卡芯片于一体;通过银行卡受理网络与移动通信网络互联互通,实现银行卡业务与网上银行业务融合,为大众提供普惠金融服务。实物货币、金属货币、信用货币、电子货币等货币形态适应不同商品(交换、交易)经济形式。网购商品与网上支付货币就是现实物质世界与网络虚拟意识世界对立统一的表现形式;统一于商品(物质)世界;统一于信用货币(或现金、物质)世界。这是大数据哲学理论原理;大数据实践世界美如画。
大数据特点与推广.19、大数据之花自由开放、地球村公民共享美丽(2).生活在大数据时代的地球村公民真幸福。“穿戴式智能设备”是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,如眼镜、手表、服饰、手套及鞋等。形成每个人随身移动设备上独一无二的专属数据计算结果,并以此找准直达用户内心真正有意义的需求,最终通过与中心计算的触动规则来展开各种具体的针对性服务。手机无线互联网与PC机电脑有线互联网互联互通、手工键盘打字产生的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年季度财报审阅确认函3篇
- 快递配送无接触优化方案
- 北师大版四年级下册小数点搬家教案设计
- 可再生能源项目成功落地承诺书范文4篇
- 《太阳与生活》 教学设计科学一年级下册冀人版
- 企业级大数据处理技术指南
- 跨境电商支付风险防范预案
- 八年级英语下册 Unit 10 I've had this bike for three years Section B第5课时(3a-3b)教案(新版)人教新目标版
- 北师大版(2015)八年级全册第十八课感悟生命教学设计
- 高中地理 第二章 海岸与海底地形 第二节 海底地形的分布教学设计 新人教版选修2
- 2026年青海省西宁市社区工作者考试试题解析及答案
- 2026年中国兵器审计中心(西安中心)招聘(5人)笔试备考题库及答案解析
- 2026年中国物流集团招聘考试专业题库
- 2026年高校教师资格证题库综合试卷及参考答案详解【新】
- 反恐怖联防联动联治工作制度
- 2026年中考云南试卷及答案物理
- 2026年香港房屋租赁合同(1篇)
- 2026脑机接口技术突破课件
- 档案管理制度与执行记录
- 2026年贵州省安顺市辅警招聘考试题(含答案)
- 公路工程安全生产标准化监理单位制度汇编
评论
0/150
提交评论