FW李德毅院士谈云计算.doc_第1页
FW李德毅院士谈云计算.doc_第2页
FW李德毅院士谈云计算.doc_第3页
FW李德毅院士谈云计算.doc_第4页
FW李德毅院士谈云计算.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

FW 李德毅院士谈云计算3FW:李德毅院士谈云计算32010-08-19 09:19互联网的促成,集中统一的调度,顺序的、确定性的输入,不能描述互联网的工作机理。互联网成功实现了一群实现自我价值的人。有博客、播客和派克、博客成为面向公众的个人信息发布系统,还衍生出移动博客、图片博客、群体博客等。是一个很好的东西,我帮人人,人人帮我。互联网是什么?它一定不是一台图灵机,互联网成为人人感知和认知不可或缺的装备,使得人的感知能力和认知能力挣脱了时间和距离的束缚,得到极大的延伸;互联网成为人与人之间沟通不可或缺的装备,使得人与人之间、人与社会之间沟通质量和效率得到极大的提升。社区是什么?社区成为网上从事某种专项事物的人群,或者从事某种专项服务。我特别想讲的是社区的思想,最好的社区,可大可小,专项可粗可细,而且这个社区是无穷无尽。社区的出现巧妙地解决了人工智能中无法解决的常识知识的界定和表达问题。这是我讲的互联网的发展改变了计算机和软件的工作模式。第二,网络科学的十年形成对互联网新的认识在1998年在资产杂志上有一个作者,他发表了一个模型,叫做小世界模型。他认为包括互联网在内的网络具有小世界的特点。不到一年,另外一个科学家在科学杂志上又发表了一篇文章,他发现二八定率。一批物理学家们很快转入对网络科学的研究,并又回到物理学家的门槛,这一批人很可敬可爱。网络是无界的,网络是一个无厘头。怎么样理解一些网络?我把这个结果告诉大家,理解一些包括互联网和社会关系网在内的这些网,如果它具有以下几个假设的话,它往往表现得很好的疏离度。互联网不是交响乐,没有总指挥,没有人为它规定开始、中间和结尾,在互联网发展史的任一时刻,都有协议和规范来定义它的架构,可是这一架构从来没有完整的规划,没有所谓的顶层设计。万维网亦然。如果具有以上性质的话,包括互联网、万维网在内,常常具有小世界现象的,无标度和不均匀性、脆弱性和鲁棒性并存,级联失效和连锁崩溃。所以,真正推动网络发展的,我认为应该是青年人,是一些70后们。好比举一个例子,Google的这个笑嘻嘻的小伙子,他发明了一个算法PageRank算法,因为这个算法,所以Google的搜索引擎取得了巨大的成就。中间这个小伙子他发明了HITS算法,现在成为美国最年轻的工程研究院院士。右边这个小伙子,他发明了GN算法。尤其是乔恩克莱恩伯格2006年获得信息学领域最杰出数学成就奖。所以可以看到70后他们是推动网络前进的主力军。任何人,作为网络的端用户,其端机上的资源,包括计算资源、存储资源、软件资源和信息资源等和网络上的资源相比,都变得微不足道。无论用户是在进行网络计算、对等计算、还有信息搜索,哪些事情由端机承担?哪些事情由边缘网承担?我们看两个极端状况,一是,网络上没有任何信息资源,网络仅仅实现即时的交换,回到传统通信的交换时代。二是,所有信息资源都在主计算机(虚拟机)上,端机仅仅是人机即时交互,回到传统的主机/终端模式。然后迅速提出一个网格计算和云计算。我们看看网格计算的区别:依托专网或互联网,将部分处于不同地域的、资源参加的计算机组织起来,统一调度,利用闲散的计算资源,组成一台虚拟的超级计算机,形成超级计算能力。云计算:广大用户依托互联网上某些结点强大的信息资源,包括存储资源、计算资源、软件资源、数据资源、管理资源、为我所用,强调需求驱动、用户主导、按需服务,即用即付,用完即散,不对用户集中控制,用户不关心服务者在什么地方。所以这个可以叫做One for many。有了云计算,广大用无需自购软、硬件,无需将自己的软硬件系统交给他人托管,甚至无需知道是谁提供的服务,只关注自己真正需要什么样的资源或者得到什么样的服务。对于大量的中小企业,不再需要一开始就花费大量的投资来购买部署计算机软硬件设备和聘用维护人员;不必担心因为高估自身业务受欢迎的程度而过度部署造成资源浪费。买单买什么?买知识产权(许可证)?买硬设备?买软件?买配制?买电?买电子垃圾?买服务:通信带宽、存储空间、计算能力成为社会的公共基础设施。中小企业是云计算的最大受益者,用户应用成本的降低以及应用自由度的增加,是云计算带来的基本驱动力。很多地方都在说云计算就像水电一样,水电大家都知道是一个基础设施,信息是不会损失的,但是要求服务的时候我们是很仔细的。所以,信息的传输是双向的,不像电一样,你是发电的,我是用户,我只是耗电的,并不发电。但是在互联网当中,可能每个人都会产生信息,双重角色,是个性化、工业化的需求。在这种情况之下,我们看到由于通讯的发展、网络的发展,由于人的介入,网络是怎样超出了图灵机的模型的呢?第三,超出图灵机的云计算从初始字符串到终态字符串,可认为是确定空间点到点的映射,无法解决不确定性问题;通过时钟频率把模拟量近似为数值量,并解决了读写磁头等动作的快慢,等粒度的细分决定了数字化程度,至于这样的近似是否可行,数值量如何返回模拟量,均不在图灵模型考虑之内;图灵模型中没有考虑输入输出的形式化方法,输入输出、人机交互没有出现在计算过程中。举一个例子,比如说在Google上打一个云计算,他给我们的答案是一样的,你打和我打都是一样的。我们现在是要知道你是一个退休干部,你只是想了解什么是云计算,给你500个解你可能都觉得多了,我可能是一个云计算的开发商,我可能要五万亿都不够,你怎么知道我们俩个用户之间的角色不一样,你给我们安排不同的方案?这叫做粒度计算。整个图灵的模式根本就没有人介入,输入和输出根本就没有,现在网络时代要把输入输出作为一个最重要的形式,所以图灵太局限了。我们这些科技工作者,尤其是计算机科技工作者不小心把图灵设成了一个可计算的模型,实在是有点悲哀。因为图灵说并不是所有的数据问题都在图灵上可解的,有一些是可解的,例如图灵模型。我们现在原有的人把图灵当成了老祖师爷,认为他解决了图灵技术的问题。图灵要是活着的话肯定很不高兴。所以我们可以看到这30年来,我们软件IT产业是怎么变化的,现在我们从软件定制到软件产品到企业解决方案,然后面向大众的成套软件,然后到网络增值服务,最后到云计算。从以产品带服务向以服务带产品方向发展。以前我是给你卖软件,给你做培训服务,叫做以产品带服务。现在我们以服务带产品,我替你杀病毒,以服务带产品。现在手机也是发展到了这个程度,你只要买几百块钱的花费,我把手机送给你。所以,以服务带产品的时代到来了。软件工程危机归根到底是图灵危机,由于我们过渡的关注CPU,忽视了人机交互,忽视了机器行为通过人群的参。图灵模型作用的扩大化,尽管图灵命题主要说的是数学的弱点在解决数学问题时图灵机不能够做什么,如停机的不可判定问题。但是计算机科学家们却逐渐开始讲图灵机用来说明可计算能力的模型,进而作为一种解决所有计算问题的模型,把图灵机作用扩大化了。我们看看图灵在发明了图灵模型之后,他自己做了一些什么事。图灵自己也认为图灵机并不适于作为解决计算问题的通用模型。包括图灵和图灵将获得者米尔纳,他们开始尝试试用交互机来扩展图灵的模型。所以这种情况已经很多了,包括图灵本人的尝试。所以,今天我来给各位CIO讲一个公式,希望你们能够记住,网络不等于世界上最大的计算机;网络不等于图灵机。超图灵计算模式,Wegner、Leenwen等人提出基于图灵机的交互机器模型,如SITe机、交互机、多流交互机、持续图灵机等,企图扩展图灵机使其具有动态输入和输出能力。尽管已经证明这些模型的表达远远比图灵机强,但是他们是描述单个交互机系统,而不设计符合系统。实际上在图灵模式出来以后,很多人都在研究,但是都没有好好的用互联网这样的一种形势。网络计算强调把计算机嵌入到网络、环境或日常工作中去,让电脑笔记本消失,人们注意的中心回归到要完成的任务本身。1991年施乐公司前首席科学家Mark Weiser提出普适计算思想。例如,他在办公室门前建造了一个喷水池,用喷水量和水柱高度来模拟显示网络上的当年全球股价的走势。关注大众人机交互,我们可以看到一个游戏,我们举一个例子,好比说我们在网络上做一个游戏,有人说你看到这个图片有什么感想?我们两个人猜问题,大家可以看到图片上是一个小孩子在一个车上戴着一个帽子,好像在做一个游戏,实际上你是对这个图片在做一个图片标注。因为现在网络上我们需要的是图片的处理,图片处理就要进行标注,标注是谁标?是大家来标。比如说我给你一幅图,你说这个图是讲什么的?仁者见仁,智者见智,因此不同的人说出不同的场景,有的说是海滩、有的人说是大海,有的人说是人群,也有的人说是谈话,也有的人说是天空。如果这个图片要正好是卖铃铛的人,他肯定会想到这是一个铃铛。但是更多人认为这是一个海边的谈话。所以,云计算一个很重要的思想就是利用大众的人,你在这个过程当中,你是在做游戏吗?不对,你是在做程序的开发者,你是在编程,你是在帮他的忙。深圳有一家公司专门提供MP3的下载,你下载五首音乐,我就收你一点点小钱,但是你下载了五首音乐以后,我看这五首音乐都是谁的粉丝,我马上给你推荐这五首音乐的人。然后你看这还有好的,我要,然后又点了几首。这个公司一个老板六个员工,一年八亿人民币。你以为是你在做他的用户吗?不对。你点了这五首歌,我就知道有人对这五首歌很关注,你在做社会标注,我马上把你的标注拿出来作为一分子放在我的库里面。于是别人跟你这个步骤相关三首歌的时候,我就把另外两首歌也推荐给你。这个做法多聪明。我们想想人工智能,人工智能我干了一辈子,我就是搞人工智能的,我也写了一本书跟人工智能有关的。因为我们应对的就是把人类智能用图灵机能够理解的算法和语言符号填到图灵机里面去。从这个意义上来讲,人工智能工程师们就是图灵机的奴隶,很悲哀的。通过群体标注,图片如此分类;社区常识决定不同社区不同标注;对文本进行群体标注会如何?对视频图像进行群体标注又会如何?通过标注可否实现跨媒体检索?因此,互联网给我们一个很好的机会,就是用群体智能来捕捉图灵机智能。因此,云计算要是超出了图灵机计算,云计算的可能性更大,这就是我今天要讲的这个题目。因此一个新的理念出现了,大众既是软件的使用者,也是软件的开发者;既是服务的消费者,也是服务的提供者。图灵没有考虑过这样的群体智能产生的模式。维基百科的创始人吉米威尔士想到了。我想我们的CIO都参加的大会很多,我建议你们多看看维基百科,不要光看Google,Google是老百姓看的,CIO要看的至少是看维基百科。为什么大家都喜欢云?天空中大量云滴构成的云,远观有形,近观无边,千姿百态,漂移不定,有时如朵朵棉花,有时一泻千里,或淡或浓。量子物理中的电子云,云计算一定是基于网络的。网络为大众提供了一个个虚拟的、丰富的、按需即取的数据存储池、软件下载和维护池、计算能力池、多媒体信息资源池、客户服务池,提供一个人与人沟通的便利点。我列了一个图表说明什么叫做云计算,我把它列举用水的生态循环。在地球上有很多的水库,Google也有水库,就是数据中心,或者叫做搜索引擎,它需要蒸发,蒸发形成就是服务的发布。服务可以聚合,而且聚合的大小与云滴可大可小,但是有用户需求的时候,又落到地面上。所以,人是调剂水生态环境不可或缺的一个社会群体。云计算是调节它的信息资源相互服务的一个不可或缺的社会。人工生命之父克里斯兰顿有一个大胆的设想,他说,生命的本质在于物质的组织形式,而不在于物质的自身。把这一句话用到网络上就是,信息资源网络的本质在于信息资源之间的组织形式,而不在于承载信息的图灵机自身。云计算的提出有可能导致软件工程的重大变革,突破图灵机模型的束缚:不在于单台图灵机上的软件,而在于网络上软件之间相互作用。因此,引发对计算机CPU核、操作系统、交互这三者关系再认识。软件的网络化性质比单台图灵机上软件单元的性质更强烈地影响着网络软件的整体行为和特性,甚至出现涌现,如计算机病毒在全网的突然泛滥等。有了软件的几种服务之后,版本的概念消失了。因为所谓的版本是作为产品卖出去打一个包。因此软件将没有版本的概念,采用永远在用的软件开发模式。谷歌的Gmail,Gdoc已经采用。这种模式淡化了软件产品的生命周期,服务商可以无数次在线更新软件。因此,我们在云计算里面运用了三句话:一是,Saas改变了操作系统、中间件等作为产品配制在客户端的传统,软件可以租用;用户端可以零安装、零维护、零剩余。二是,出现同一个应用软件系统,同时租给许多不同用户使用。三是,PaaS:比如说亚马逊的一个虚拟计算单元,相当于1.2Ghz的Intel Xeon的32位处理器、1.7GB内存、160GB存储器,付费为每小时0.1美元,在S3上存储1GB的数据每个月只需0.16美元。第四,云计算的基本任务网络环境下信息资源的感知、存储、处理、发布、传播和租用;这个资源当然云包括计算在内。网络化数据挖掘:用户主导、面向领域的跨系统、跨媒体、即时定制的服务或者服务组合。其实我们已经感受到,现在手机上都做了定制服务,说你要什么单程的时刻表吗,定制一下,要航班和气象吗,只要定制一下就可以了。因为通讯相对来说便宜,再说,你通讯不用,他赚不到钱,他当然鼓励你多发短信。目前,太多的定义和太多的解释,使云计算成为皇帝的新衣。迫切需要业界的合理布局。所以,我们成立了云计算专家委员会。李开复、张亚勤等等这人都来到了云计算组。他们在做一些什么呢?第一个是虚拟计算。第二个是变粒度和粗粒度计算;云滴在不同粒度上提供服务,云滴的弥散性-雾;云滴的聚合-云团;对服务资源不同层次的管理和动态扩大,从不同的粒度上对云所提供的服务资源进行处理,形成面向不同社区用户、不同使用目的、表现形态各异的云滴和云。WEB服务聚合,分布在网络中的WEB服务是云计算中的一个个云滴。这样一来,云计算用户才能选择不同的服务。第三个是:不确定性计算。不确定性有多种:随机性、模糊性。好比我们通过索索引擎进行搜索,同一个云计算关键字,我们有几千个几万个搜索结果,这就是搜索结果的不确定性。第四个是:软计算。根本上是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论