



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、中国工程院院士李德毅:大数据时代的认知计算摘要:中国工程院院士李德毅在 MDCC 2013 大会上发表了题为大数据时代的认知计算的演讲。他分析了认知究竟可不可以计算, 他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。MDCC 2013 移动开发者大会于 2013 年 11 月 13-14 日在北京国家会议中心隆重召开,本届大会由 CSDN 和创新工场联合主办。逾百位国内外移动互联网领域的领军人物与核心技术专家,以“全民移动,重塑世界”为主题,分享最新实践经验,探讨移动互联网发展趋势。此外,智能硬件、移动娱乐游戏、微APP 三大主题峰会成为本次大会新亮点。中国工
2、程院院士李德毅发表了题为 大数据时代的认知计算 的演讲。 他分析了认知究竟可不可以计算,并阐述了大数据时代、 移动时代,认知计算应该何去何从。他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。以下为演讲实录:李德毅:各位同行大家好。移动生活、移动品质,给我们带来的变化很大。这一年社会上的人,拿个手机,有说有笑有拍照,这就是给我们带来的变化。人活着就要动, 移动的速度是多少, 把移动速度搞清楚, 移动产品才搞得清楚。我们靠两条腿动,靠轮子动,靠高铁动,靠飞机动,主要还是低速移动,所以我们叫移动,不叫运动。但是背个笔记本是个负担,所以我就想一想,大数据时代对我们移动
3、生活带来了什么变化,也就是大数据时代人的认知,认知最简单的是说话、听、看、写。认知可不可以计算?这是一个很古老的命题。 因为老科学家认为人是世界上最高级的精品, 比其他东西都强, 认知是不可计算的。我们希望提高人的生活品质,我们希望智慧。说把智慧城市变成智能城市,智能是个技术,我们要的是智慧。 我们说你这个良心大大的坏了或者我心情不好学不进去, 说明这个认知和心态有关系。但是作为人工智能的科学,作为认知科学来说,我们长期以来强调的是智商,脑智,依据现有知识进行分析、联想、推导或归纳,产生新知。我们认为人的认知主要靠大脑。后来说不对, 你这个人智商很高, 情商太低不行。 面试的时候老板要通过意象
4、、 直觉、想象、情感等进行直观、综合的思考, 在创新中起着至关重要的作用。这就是二元。更多的人说成功等于 40%的智商和 60%情商的相互作用。所以认知科学到现在还有很多没有解读的地方。1936 年,天才科学家图灵建立了图灵机概念,任何形式系统可以通过图灵机准确刻画。老百姓通常把计算工作交给电脑,它是基于人脑的智能吗? IBM 研究了一个生产计算机。人们把人的思维能力放到机器里去, 前台是机器, 后台是人。 从这个意义上,认知应该是可以计算的。我们的程序问题、 停机问题、 程序验证问题本质上是不可以计算的。 所以我们打了补丁还有漏洞。数学自身是机器程序不可穷尽的。并不是所有的数学问题都可以用计
5、算机来做的。所以人脑不能被物化变成电脑, 重要是人脑能不能被形式化。 好多诺贝尔获得者都在这个方面获得了重大贡献。但计算性是不依赖于形式系统的选择的。因此, IT 工作者千万不能用行政化的方法来研究思维和意识。意识怎么理解?灵魂怎么理解?宗教怎么理解?信仰怎么理解?它们和思维是什么关系?脑里面有分工,这块干什么,那块干什么, 后来研究的成果发现, 人的意识和精神活动, 是由大脑不同区域共同作用产生的。怎么样才能共同作用,这个问号到现在还很大。生命科学家喜欢物理, 喜欢化学, 难道人的思维是由物质和化学规律支配的吗?这个令人怀疑。有人认为,人是不可能自己把自己搞清楚的。你要研究一个东西,要站在一
6、个东西之外。大数据时代的挑战在这样的情况之下,自然杂志登出了一篇重要文章,里面一个小标题 BD (大数据)时代的科学,我们应该怎么做,这是我们时代的挑战。大数据的来源分为三大块:第一块是地球,我们叫数字地球,自然大数据把我们的地球、宇宙搞清楚。第二是生命,包括各种动物,尤其包括我们人类,这本身也是大数据。第三就是社交, 互联网, 尤其是移动互联网, 我们的日常生活都是大数据, 这样的大数据使你对科学,认知科学提供了挑战。我们去看病,现在不是看医生,医生很宝贵,主要是看仪表。到了医院还没坐三分钟,医生一大堆化验单出来,让做X 光、 B 超、内镜检查、核磁,你还得排队,排了两个星期,才把这些检查做
7、了。 你拿着化验结果去找医生, 医生不到三分钟把药开出来, 现在看病不是看医生,现在就是查,诊查的治疗。医生跟你说一句话,你还没听懂就接待下一个病人,这就是我们日常看病,花钱看仪器,这就是大数据带来的现实。这些年来, 医学诺贝尔奖很多颁给了医学企业的发明, 所以现在的高明医生, 要么是器械的发明, 要么他们能从医疗数据发现价值。 你排队 5 分钟, 医生一看没问题, 他从这个数据里发现了价值。大数据时代你会发现,你只要知道了是什么,就知道怎么做。这样问题就淡化了, 为什么不仔细诊断了,常清楚,所以怎么做很简单。因为这么多病案,你这个情况在他的病人库里非我们认为科学是解决的形而上, 技术解决的是
8、形而下,我们研究的对象是认知、智慧。 现在把我们的对象是什么的问题, 可以用大数据来解决, 在这样的情况下, 对大数据对不同案例对象的处理,也可以用大数据来解决。因此这个社会更多研究的是关联,把科学放在后面。科学解决因果问题, 要解决主次问题, 解决前后问题。 所以人们能更多的解决问题就是好汉。我们对曾经认为的科学是技术的先导产生了怀疑。在当今情况下,因为 IT 技术的发展,技术也可以成为科学的先导, 要求认知自学的数字化, 这是我们大数据对认知科学的认识, 以及认知计算的不同。认知计算是技术。这样的情况下,大数据时代对计算正在告别认知科学。对人的认知而言, 欧盟在上世纪就进行了脑科学的研究。
9、 今年澳门又提出了人类大脑计划的,奥巴马也发动了脑计划。 这和我们信息工作者关联得太少, 全是生命科学家, 我觉得我们人类的大脑, 从生命科学的角度来讲, 大家和猴子的大脑区别不是太大, 因为已经有研究表明,脑结构差不多。我就在想, 我是在英国学习的, 撒切尔后来得了老年痴呆症, 我个人认为她的老年痴呆和一般人的老年痴呆没有多大的区别。因为我认为脑计划的研究有一点偏了。人类和其他动物相比,都有灵感,有语言,唯独人有文字,因为有文字,才有文明,才有传承。我们的青年人到大学,都要学习知识,学习文明,这个很重要。如果没有文字,我们和其他动物差不多。另外还要研究人类认知的社会属性,这两个不清楚, 认知
10、科学搞不清楚,我建议要把这两点作为人类认知的切入点。要研究脑认知的后天属性,认知不仅是前面的天性所决定的, DNA 后天学习和积累的结果,是与社会环境、社会实践,群体交互相关联的。、基因、遗传,还要看在移动生活时代,我们怎么办呢?大数据时代自然语言处理技术正在改变我们的移动生活。语言是思想的直接现实, 这句话是马克思讲的, 语言是人类思维的载体, 语言是认知科学和认知计算要应对的首要问题。 我们的移动生活首先要讲语言, 你哪一天不说话不行, 能听会说是我们必须具备的能力。 让我们迎接语音时代的到来。 人类走向文明的四个重大里程碑中,语言和文字占了重要的地位。人类运用自然语言进行交流获得的效果。
11、 你跟人家沟通得到的效果当中, 很重要的就是你的强度和语调,要占 38%,还有你的面部表情,它有情感在里面。从我们认知科学来说,半个世纪的自然语言理解的研究中,我们对此关注了多少?人们在思考和解决任何问题时, 通常是定性的, 对量的规定性往往是是非数值。 我们研究大数据, 它有一个定性,定量转换的问题。 科学研究当中, 人们用对象语言表达一个特定的精确学科,比如物理数学、C 语言,都是用自然语言来表达。我们就变成两个学派的争论,脑科学认为自然语言是不可计算的。如果一个问题不能全部形式化, 那么其中的局部问题可不可以形式化?自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。研究不确定
12、性,我认为是一条道路。科大讯飞做了一个客服中心, 移动客服录音大数据, 可实现一秒钟对 100 万小时音频数据的检查。这就是一个很大的变化。 你是雇佣 500 位客服人员还是启用一台服务器?所以还是用一台服务器。在半个世纪的自然语言理解的研究中,我们对此关注了多少?我们看报纸,有这么一段文章, 但是你仔细看的时候,发现这个字序不对, 但是它又能影响我们多少东西?在半个世纪的自然语言理解的研究中,我们对此关注了多少?再看一个例子, 我们网上动不动要区分对方是人, 我们经常出来一个识别码, 叫你再输入一遍识别码,证明你是人。在半个世纪的语言文本理解的研究中,我们对此又研究了多少?我觉得要创新,要新
13、思维才能解决。机器人能听会说,能看会想,正在改变我们的生活,这就是移动生活的产品。有一个产品你们可以做做,叫在线服务机器人。将来IT 行业里面,随着智能技术的发展,移动客服中心可以裁减到50 人。我们能不能有个智能耳机,这是我个人想的,你戴着耳机,我说话,我的口音比较重,你的耳机听到的是普通话,你能不能做这个?这个很好,特别是广东话北方人听不懂,尤其是语言翻译。假如两国元首会谈,奥巴马的话是普通话,但是是奥巴马的语音。 这是一个多大的改变。实际上现在已经有了,这时候就需要云计算,需要一个方案服务中心,需要一个中文翻译服务中心,位置服务中心等等。语音到文字,文字到文字,我们要让数据说话,这就是大
14、数据给我们移动生活带来的变化。所以有人说先干掉短信。我这个年龄对五笔字型输入是情有独钟, 我们有两代人都是用五笔字型输入。 从搜索引擎到个性化搜索,从规则学习到统计学习,从智能计算到情感计算,从形式语言学到智能翻译。我们想象将来电视台主持人他拿到就能念,这个虚拟主持人在形象、情感、动作、语音、语调、风格都像某一个人多好,那我们演员也可以失业了。这样的时代也许会到来。以大数据形态反映的语言,是可交互和理解的、是带毛的、鲜活的、有情感的原生态语言。智能驾驶下面讲讲和我们移动生活相关的智能驾驶,智能驾驶为什么火起来呢?因为它跟云计算,移动互联网, 大数据密切相关,你只要做了这个东西,政府肯定会支持你
15、。因为是战略性新兴产业。 当初自然科学基金会在确定这个项目的时候,提出了科学的任务,解决实际的计算问题。后来把这个科学问题明确地用一个载体来表现,叫做科学任务, 在正常的情况下北京开到天津,你能不能做得到?我们用了很多雷达, 我们要有驾驶行为数, 在这个过程当中我们遇到了很多的困难, 好比说要不要研制一个三维成像,怎么样有自学习功能。我们取得了可喜的成果。我们有详细的实验报告、 实验环境, 以及超车的次数,我们今年还和韩国车做了比赛,在车子里做了一个交互鉴定。我们我们想想以后怎么打的?手机目前来讲是人用的, 所以以后是人和机器交互, 将来你用手机打的,你把手机往汽车来一插,汽车就开跑了,到了一个地方,钱一付你就可以走了,你改变路径,你就用手机跟机器人对话, 我们在座的企业家能不能做成,人、手机和轮式机器人之间的关系。如果这个做得了就不得了。我现在的想法是想做这两个事情,北京从天安门到首都机场做一个实验,混在正常路径当中,目前我们有5 辆车。上海我们希望从虹桥机场到浦东再到人民商场,我们准备了6 辆车。 一种是电动车,一种是混合动力车,一种是国产车。 一个类型两辆。 如果有一天北京城出现了飙车机器人,当然这是违法的,你还要问认知可以计算吗?大数据时代, 技术的有效性要比科学的完整性更重要。所以我建议这张图(见下面的PPT),给一些中小企业一些参考,我认为以人为本的认知物联网
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基础业务能力考核试题及答案
- 中外饮食文化知到智慧树答案
- 新生儿疾病的诊疗与护理考核试题及答案
- 2025版企业设备融资租赁抵押合同规范范本
- 2025版法院离婚协议书范本撰写与离婚协议书变更条件
- 2025版人防工程合同履约担保及风险控制合同
- 2025年度航空航天电子工程合同模板
- 2025年度汽车租赁及自驾游服务合同样本
- 2025年度试卷印刷保密协议执行监督机制
- 2025二手楼赎楼担保与房产市场调研服务合同
- 2025年秋季学期第一次中层干部会议上校长讲话:凝心聚力明方向沉心落力干实事
- 医院患者身份识别核查流程规范
- 2025年北京市综合评标专家库专家考试历年参考题库含答案详解(5套)
- 2025年全国特种设备安全管理人员A证考试题库(含答案)
- 烟酒行经营合作合同范本
- 第23课 全民族抗战与抗日战争的胜利 2024-2025学年中职高一上学期高教版
- DGJ08-81-2015 现有建筑抗震鉴定与加固规程
- 《人为因素与航空法规》课件(共九章)
- 部编新课标培训课件
- 非工作时间行为协议
- 老年病人麻醉管理
评论
0/150
提交评论