黄曾阳研究员ppt语言超人之梦.ppt_第1页
黄曾阳研究员ppt语言超人之梦.ppt_第2页
黄曾阳研究员ppt语言超人之梦.ppt_第3页
黄曾阳研究员ppt语言超人之梦.ppt_第4页
黄曾阳研究员ppt语言超人之梦.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语言超人之梦,黄曾阳(中科院声学所HNC实验室)2006年8月23日,目录,1网络世界需要语言超人2从语言超人反思图灵检验3语言超人基因之梦4一个语言超人基因的介绍5一个句群的考察6一丝曙光的体验,1网络世界需要语言超人,后工业时代正在出现与传统世界并存的另一种世界,那就是网络世界。这已经是一个活生生的存在,是人类社会前所未有的一个特殊存在。这个特殊存在会引发新的哲学课题么?会。但问题究竟是什么还没有凝聚出来。,网络世界与传统世界的比较,传统世界网络世界亚当和夏娃出生接近“万岁”尚未出生政治、经济、文化的分野十分清晰一片模糊导演与演员有明确分工没有这种分工有序无序后工业时代史前时代(政治舞台的导演是政治家和军事家,经济舞台的导演是企业家,文化舞台的导演主要是哲学家),网络世界怎样才能从无序状态进入有序状态即脱离史前时代呢?,关键在网络人的诞生。这里的网络人不是指当前意义下的网民,而是指那些能够理解自然语言、只在网上生存、无肉体而能思维的网络人。网络人的诞生将彻底改变网络世界的面貌,使网络世界脱离“史前”时代。没有网络人的诞生,网络世界就不可能脱离“史前”时代,脱离“史前”时代的网络世界才会大放异彩,使传统世界发生无愧于后工业时代的巨大变化,如同工业时代之如农业时代。,网络人的基本特征,记忆力超人“一目千行,过目不忘”(张松和黄蓉的妈妈算什么?)故名之语言超人,中国人的智力描述,记忆力“一目十行,过目不忘”敏捷力“七步成诗”、“眉头一蹙,计上心来”领悟力“举一反三”、“明察秋毫”、“愤启悱发”,判断力“神机妙算”“料事如神”“锦囊妙计”行动力“势如破竹”、“以柔克刚”、“四两拨千斤”(想象力、创造力),中国人对五力表现情有独钟,章太炎先生曾依据“五力”标准而评定其门生中的五王天王黄侃(季刚)(1886-1935)东王汪东(旭初)(1890-1963)西王朱希祖(逖先)(1879-1944)南王钱玄同(翼王)(1887-1939)北王吴承士(检斋)(1884-1939),网络人的记忆力确实可畏,其敏捷力也许可惊,但其领悟力、判断力、行动力、想象力、创造力肯定可控因此不必担心:这种“一目千行,过目不忘”语言超人会起来造反。,在西方确实有人担心网络世界的这种潜在性灾难,万一这些网络人偷食了那伊甸园里善恶树上的果子怎么办呢?那网络世界岂不是要重演圣经里的灾难故事了么?因此他们试图抵制甚至扼杀网络亚当和夏娃的诞生。担心者们既不了解智能科学和技术的本性,也不了解即使真的出现了网络人,届时向网络社会注入文明基因并不难办到。因此担心者的担心是多余的,我们可以放心地去从事语言超人的探索。,2从语言超人反思图灵检验,计算机的原创者原创过人工智能的伟大构思,提出过人工智能的智能标准,那就是著名的图灵检验。图灵检验:检验者向一间黑屋子的两个对象分别以书面语方式进行盘问,检验者知道其中一个对象不是人而是机器人,检验目的在于确定谁是谁。如果检验者在经过充分盘问后仍不能确定谁是谁,则该机器人就是具有人工智能的机器人。,图灵先生是伟大的天才,但图灵检验的设计却过于天才了!表面上问题出在图灵先生对盘问内容的限定不当。(该限定的重点放在掩饰人的弱点,而不考虑掩饰机器人的弱点,这实际上就是对机器人提出了过高的智能要求。)实质上问题出在图灵先生对人工智能的科学探索方向还来不及深思熟虑,就英年早逝(1912-1954)了。,但是图灵先生的崇拜者实在是太多了,自然语言理解的探索就存在着图灵检验的鲜明烙印,著名的CYC计划就是明证。自然语言理解的悲观论实质上大都采用了图灵检验标准,尽管某些悲观论者或许不知道图灵其人。,智能是概念空间的全方位表现,上一讲里谈到概念空间的五大坂块,图灵检验基本上是对五大坂块综合智能的全面模拟,这肯定不是本世纪的课题,更遑论上个世纪了。,但是这并不是说我们应该抛弃图灵检验,相反应该深入领会图灵检验的启示意义。黑屋子和两个盘问对象只是形式,重要的是盘问本身。盘问是一门学问,这才是图灵检验的本质。也许只有现代心理学家做到了对图灵检验的心领神会和科学运用,而计算机学界、特别计算语言学界反而忽视了。你去盘问“太平洋和青蛙谁大”有什么意义?去盘问“咬死了猎人的狗”是什么歧义结构又有多少意义?,盘问的第一号学问是盘问使用的语言单位,第二号是盘问使用的文本形式,第三号是盘问的内容。什么语言单位是合适的、科学的盘问单位?字或词语?短语或小句?句子或段落?篇章?什么语言文本是合适的、科学的盘问文本?童话和诗歌?红楼梦或三国演义?鲁迅的杂文或朱自清的散文?什么内容是盘问的“大场”与“急所”(将简称“大急”)?,盘问的合适语言单位是句群,盘问的合适语言文本是媒体信息,盘问内容的“大急”是领域、情景和背景。为什么?,因为:,第一句群与语境单元对应(明晰性)。第二媒体信息是最广大受众能够理解的信息(可行性),(其信息表述方式已经考虑了受众的理解力,消解了需要专家知识才能理解的专业表达方式,比较适合语言超人的知识状态。)第三语境单元存在世界知识的先验知识框架(科学性),这一知识框架可以事先存入语言超人之脑。第四经过语境单元萃取以后语境单元框架里已经填入了领域、情景和背景的具体知识。(可操作性)第五理解力的集中体现(“大急”性),一个具体句群里面包含的领域、情景和背景知识经常是不完备的,但语境单元框架可以给出这种不完备性的提示,对这一提示的运用能力是语言超人理解力的根本标志,这一提示运用力可以量化么?语言超人可以通过盘问过程进行学习而得到提高么?这一点这关键性的一点这需要中华文明的特殊智慧才能看明白的一点(冯友兰先生的观点)已经出现了曙光么?,3语言超人的基因之梦,语言超人必须看作是一种特殊的生命形态,生命需要基因。语境单元就是语言超人的基因。语境单元萃取SGU就是培育这个基因。语言超人之梦的征程要从语言超人的基因之梦起步。,我们都十分熟悉生命的多样性,没有生命的多样性就没有生命,生命的多样性来源于基因的多样性,语言超人当然也具有基因多样性。这里说的语言超人基因当然只涉及理解基因,而且是指理解基因的团块,也可称语言超人的胚胎,简称语言超人基因。那么语言超人基因的“多”对应着语境概念树的226么?不是!因为语境单元不是对应于概念树,而是对应于语境概念树的延伸概念,每一个这样的延伸概念就对应着语言超人的一个基因。,研究语境概念树的延伸概念就是研究语言超人的基因,这确实是一个探索之梦!我们已经确定地知道语言超人基因的数量必然小于226*i+226*i*j+226*i*j*k个这个数字与动物或人类基因数字十分巧合,这是否具有什么哲学意义?我不知道但请记住10,848=226*4*4*3这个数字。,4一个语言超人基因的介绍,这个基因的名字叫做民务a123e2m3她属于领域概念树“政治治理与管理a12”里的一个三级延伸概念。她的领域句类代码是ReT01Y802*322J=Re+T0A+T01Y802+T0C+Y802B1(她就是语言超人的一个基因,语义块里的符号(要素)大体对应于DNA),民务,4-1民务符号a123e2m3所蕴涵的世界知识4-2民务领域句类代码所蕴涵的世界知识4-3民务的概念关联性表示式4-4民务符号的“坐标”,4-1民务符号a123e2m3所蕴涵的世界知识,a专业活动(第二类劳动)a1政治活动a12国家的治理与管理(治国)a123治国面临的基本关系a123e2m治国中的官民关系a123e2m3民务,国家的治理与管理a12简称治国。农业时代出现过“政治就是夺取和巩固政权”的政治公式。现代政治公式是“政治主要是国家的治理与管理”,因为a12体现政治活动a1的作用效应侧面,政权活动a11只是a1的过程转移侧面。政治活动中心应为a12而不是a11。,其对应的概念关联式如下:a11:=(1,2)ga1(政权活动对应于政治活动过程转移侧面)a12:=(0,3)ga1(治国对应于政治活动的作用效应侧面)a12:=j72e51ga1(治国是政治活动的主体),4-2民务领域句类代码蕴涵的世界知识,SCD=Re+T0A+T01Y802+T0C+Y802B1民方T0A(例如登记者)向官方Y802B1(例如登记受理者)办理T01Y802(例如登记)一件需要得到官方认同的活动T0C(例如登记内容)这一活动必须有所参照Re,两个对象官与民官是老大Y802B1、民是老二T0A(蕴涵在符号a123e2m里)一项内容老二是该内容的直接参与者,老大并不直接参与,但老二必须将该内容T0C通知老大(蕴涵在符号T0C和T01Y802*322J里)句式汉语句式(格式代码)必须采用规范格式,而不能采用基本格式。(铁律),4-3民务的概念关联性表示式,a123e2m3:=(jruj719),l0144e61,4012e21)(民务具有不对称性,主宰者是官方)a123e2m3=a12im(民务与治国基本方式的推动与抑制强交式关联),4-4民务符号的“坐标”,治国a12的概念延伸结构表示式a12:(t=a,3,7,k=3;9t=a,ae2m,3(e2m,eam,n),7(m,e2m),1e2m,2*t=a,3k=4;3e2m(e1n,3),3e21i,3ea1d01,3ea2c01,3ne2n,347,713,727,1e2me2n;3ne2n3)a12t治国的基本课题a123治国面临的基本关系a12i治国基本方式a12k治国谋略,a12t=a治国的两项基本课题a129国家治理a129t=a国家治理的两项永恒课题a1299开拓性治理a129a整顿性治理a12a国家管理a12ae2m国家管理的两个基本侧面a12ae21横向管理a12ae22纵向管理,a123治国面临的基本关系a123:(e2m,eam,n;)a123e2m官民关系a123eam层级关系a123n军政关系,a123e2m官民关系a123e2me1n税a123e2me1ni税制a123e2m3民务a123e21i国家救助a123e21e7n民意回应a123eam层级关系a123ea1d01最高层级a123ea2c01最低层级,a123n军政关系a1234k=2军政关系对立统一状态的时代性a123ne2n军政关系的积极与消极状态a123n7军政关系的特殊状态a123n7k=x特殊军政关系的基本类型a123n71绝对优势执政党与军队的关系,a12i治国基本方式a12i:(m,e2m)a12im推动与抑制a12ie2m权力的集与分a12im推动与抑制a12i1奖励a12i1i授予a12i2惩罚a12i23禁止a12i0规范a12ie2m集权与分权a12ie2me4m集权与分权的度,a12k治国谋略a12k=3治国谋略的三项特定内容a121意识形态治理a122政治应变a123政治待遇,a121意识形态治理a121*t=a理念宣传与舆论监督a121*te2n宣传与监督的多样性和单一性a122政治应变a122e2m政治应变的对内和对外两侧面a122*t=a政治应变的两项特定内容a122*9情报活动(a122*9)反情报活动a122*a警卫活动,a123政治待遇a123k=x政治待遇的基本类型a1231对特殊人物的政治待遇a1232对前政权代表的政治待遇a1233对少数民族的政治待遇a1234对宗教力量的政治待遇a1235对特定社会力量的政治待遇,“民务”这个词语是本全书为延伸概念a123e2m3的表述而引入的,包括民政a123e213和民事a123e223两个概念。应该指出民政与民事并不对称,官方具有对民方进行管理的权力,而民方不具有对官方进行管理的权力。官民关系的这一基本特征与制度无关,符号本身a123e2m3并未给出对这一不对称性的描述,而体现在下面的概念关联式里:,a123e213:=(a12a,l10,rc30ara123e223;l01,a119)(民政定义为政府对民间事务的管理)a123e2m3:=(jruj719),l0144e61,4012e21)(民务具有不对称性,主宰者是官方)a123e2m3=a12im(民务与治国基本方式的奖励、惩罚与规范强交式关联)a123e2m3=a527(民务与法治的民众侧面强交式关联),5一个句群实例的考察,社会力量|设立|,-应当在科学技术行政部门|办理登记手续。具体办法|由国务院科学技术行政部门|规定。,|在奖励活动中|不得收取|任何费用。SG-C=!111T0aY8022*21J#T0C=XY10*22J+&%!112D01X4*22J+f44T19Ya0*21J&Cn#TA=,Theestablishmentofsociety-orientedscienceandtechnologyprizesbysocialnon-governmentalsectors|shallbethroughregistrationprocedures|withadministrativedepartmentsofscienceandtechnology.+&%Thespecificmeasures|aretobeformulated|bytheadministrativedepartmentofscienceandtechnologyoftheStateCouncil.+Non-governmentalsectors|establishing|society-orientedscienceandtechnologyprizes|uponregistration|shallnotcharge|anyfees|inprizeingactivities.SG-E=T0aY8022*21J+&%!027D01X4*22J+f44T19Yb0*21JCn#TA=!0pXY10*22JWy,汉语英语!111T0aY8022*21J=!0#T0C=XY10*22JMLC+&%!112D01X4*22J=+&%!027D01X4*22J+f44T19Yb0*21J&Cn=+f44T19Yb0*21JCn#TA=#TA=XY10*22Jwy,本句群的突出难点逗号之难(逗号多功能难点,10号难点)“在”字之难(主辅变换难点,9号难点)“奖”与“收取”的不相容之难(复杂省略难点,15号难点),本句群由5个语段构成,第一语段是小句么?社会力量|设立|,第二语段里的省略容易判定和恢复么?其中的“在科学技术行政部门”是辅块么?(-应当在科学技术行政部门|办理登记手续。)第三语段里的省略容易判定和恢复么?(具体办法|由国务院科学技术行政部门|规定。)第四语段是小句么?(,)第五语段里的省略容易判定和恢复么?(|在奖励活动中|不得收取|任何费用。),6一丝曙光的体验,1第二语段的“科学技术行政部门”与“办理登记手续”同时出现,这足以引发民务语境单元的联想,基于该语境单元的先验知识官方还需要进一步确认,民方要找出“证据”。2前者得到第三语段的“国务院科学技术行政部门”的进一步确认3后者得到第一语段里的“社会力量”的印证。4于是语境单元得以认定。,SCD=Re+T0A+T01Y802+T0C+Y802B15运用语境单元的先验知识语言超人可以认定第一语段是对T0A和T0C的映射,第二语段里的“科学技术行政部门”是对Y802B1的映射,“办理登记手续”是对T01Y802的映射,第四和第五语段组合起来是对Re的映射。6在上述认定的基础上,语言超人有希望给出上面的HNC标注,这意味着句类分析的20项难点可以通过句群分析SGU得到比较彻底的解决。,SCD=Re+T0A+T01Y802+T0C+Y802B17语言

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论