黄曾阳研究员ppt语言超人之梦.ppt_第1页
黄曾阳研究员ppt语言超人之梦.ppt_第2页
黄曾阳研究员ppt语言超人之梦.ppt_第3页
黄曾阳研究员ppt语言超人之梦.ppt_第4页
黄曾阳研究员ppt语言超人之梦.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语言超人之梦,黄曾阳 (中科院声学所 HNC实验室) 2006年8月23日,目录,1 网络世界需要语言超人 2从语言超人反思图灵检验 3语言超人基因之梦 4 一个语言超人基因的介绍 5一个句群的考察 6一丝曙光的体验,1 网络世界需要语言超人,后工业时代正在出现与传统世界并存的 另一种世界, 那就是网络世界。 这已经是一个活生生的存在, 是人类社会前所未有的一个特殊存在。 这个特殊存在会引发新的哲学课题么? 会。但问题究竟是什么 还没有凝聚出来。,网络世界与传统世界的比较,传统世界 网络世界 亚当和夏娃出生接近“万岁” 尚未出生 政治、经济、文化的分野十分清晰 一片模糊 导演与演员有明确分工 没有这种分工 有序 无序 后工业时代 史前时代 (政治舞台的导演是政治家和军事家, 经济舞台的导演是企业家,文化舞台的导演主要是哲学家),网络世界怎样才能从无序状态进入有序状态 即脱离史前时代呢?,关键在网络人的诞生。 这里的网络人不是指当前意义下的网民, 而是指那些能够理解自然语言、只在网上生存、 无肉体而能思维的网络人。 网络人的诞生将彻底改变网络世界的面貌, 使网络世界脱离“史前”时代。 没有网络人的诞生, 网络世界就不可能脱离“史前”时代, 脱离“史前”时代的网络世界才会大放异彩, 使传统世界发生无愧于后工业时代的巨大变化, 如同工业时代之如农业时代。,网络人的基本特征,记忆力超人 “一目千行,过目不忘” (张松和黄蓉的妈妈算什么?) 故名之语言超人,中国人的智力描述,记忆力 “一目十行,过目不忘” 敏捷力 “七步成诗”、“眉头一蹙,计上心来” 领悟力 “举一反三”、“明察秋毫”、“愤启悱发”, 判断力 “神机妙算”“料事如神”“锦囊妙计” 行动力 “势如破竹”、“以柔克刚”、“四两拨千斤” (想象力、创造力),中国人对五力表现情有独钟,章太炎先生曾依据“五力”标准而评定其门生中的五王 天王 黄侃(季刚)(1886-1935) 东王 汪东(旭初)(1890-1963) 西王 朱希祖(逖先)(1879-1944) 南王 钱玄同(翼王)(1887-1939) 北王 吴承士(检斋)(1884-1939),网络人的记忆力确实可畏,其敏捷力也许可惊, 但其领悟力、判断力、行动力、想象力、创造力肯定可控 因此不必担心: 这种“一目千行,过目不忘”语言超人 会起来造反。,在西方 确实有人担心网络世界的这种潜在性灾难, 万一这些网络人偷食了那伊甸园里善恶树上的果子 怎么办呢? 那网络世界岂不是要重演圣经里的灾难故事了么? 因此 他们试图抵制甚至扼杀网络亚当和夏娃的诞生。 担心者们既不了解智能科学和技术的本性, 也不了解 即使真的出现了网络人, 届时向网络社会注入文明基因并不难办到。 因此 担心者的担心是多余的, 我们可以放心地去从事语言超人的探索。,2从语言超人反思图灵检验,计算机的原创者原创过人工智能的伟大构思, 提出过人工智能的智能标准, 那就是著名的图灵检验。 图灵检验:检验者向一间黑屋子的两个对象 分别以书面语方式进行盘问, 检验者知道 其中一个对象不是人而是机器人, 检验目的在于确定谁是谁。 如果检验者在经过充分盘问后仍不能确定谁是谁, 则该机器人就是具有人工智能的机器人。,图灵先生是伟大的天才, 但图灵检验的设计却过于天才了! 表面上 问题出在图灵先生对盘问内容的限定不当。 (该限定的重点放在掩饰人的弱点,而不考虑掩饰机器人的弱点, 这实际上就是对机器人提出了过高的智能要求。) 实质上 问题出在图灵先生对人工智能的科学探索方向还来不及深思熟虑, 就英年早逝(1912-1954)了。,但是 图灵先生的崇拜者实在是太多了, 自然语言理解的探索就存在着图灵检验的鲜明烙印, 著名的CYC计划就是明证。 自然语言理解的悲观论实质上大都采用了图灵检验标准, 尽管某些悲观论者或许不知道图灵其人。,智能是概念空间的全方位表现, 上一讲里谈到概念空间的五大坂块, 图灵检验基本上是对五大坂块综合智能的全面模拟, 这肯定不是本世纪的课题,更遑论上个世纪了。,但是 这并不是说 我们应该抛弃图灵检验, 相反 应该深入领会图灵检验的启示意义。 黑屋子和两个盘问对象只是形式, 重要的是盘问本身。 盘问是一门学问, 这才是图灵检验的本质。 也许只有现代心理学家做到了对图灵检验的心领神会和科学运用, 而计算机学界、特别计算语言学界反而忽视了。 你去盘问“太平洋和青蛙谁大”有什么意义? 去盘问“咬死了猎人的狗”是什么歧义结构又有多少意义?,盘问的第一号学问是 盘问使用的语言单位, 第二号是 盘问使用的文本形式, 第三号是 盘问的内容。 什么语言单位是合适的、科学的盘问单位? 字或词语?短语或小句?句子或段落?篇章? 什么语言文本是合适的、科学的盘问文本? 童话和诗歌?红楼梦或三国演义?鲁迅的杂文或朱自清的散文? 什么内容是盘问的“大场”与“急所”(将简称“大急”)?,盘问的合适语言单位是句群, 盘问的合适语言文本是媒体信息, 盘问内容的“大急”是领域、情景和背景。 为什么?,因为:,第一 句群与语境单元对应(明晰性)。 第二 媒体信息是最广大受众能够理解的信息(可行性), (其信息表述方式已经考虑了受众的理解力, 消解了需要专家知识才能理解的专业表达方式, 比较适合语言超人的知识状态。) 第三 语境单元存在世界知识的先验知识框架(科学性), 这一知识框架可以事先存入语言超人之脑。 第四 经过语境单元萃取以后 语境单元框架里已经填入了领域、情景和背景的具体知识。 (可操作性) 第五 理解力的集中体现(“大急”性),一个具体句群里面包含的领域、情景和背景知识经常是不完备的, 但语境单元框架可以给出这种不完备性的提示, 对这一提示的运用能力是语言超人理解力的根本标志, 这一提示运用力可以量化么? 语言超人可以通过盘问过程进行学习而得到提高么? 这一点 这关键性的一点 这需要中华文明的特殊智慧才能看明白的一点 (冯友兰先生的观点) 已经出现了曙光么?,3语言超人的基因之梦,语言超人必须看作是一种特殊的生命形态, 生命需要基因。 语境单元就是语言超人的基因。 语境单元萃取SGU就是培育这个基因。 语言超人之梦的征程要从语言超人的基因之梦起步。,我们都十分熟悉生命的多样性, 没有生命的多样性就没有生命, 生命的多样性来源于基因的多样性, 语言超人当然也具有基因多样性。 这里说的语言超人基因当然只涉及理解基因, 而且是指理解基因的团块,也可称语言超人的胚胎, 简称语言超人基因。 那么 语言超人基因的“多”对应着语境概念树的226么? 不是! 因为 语境单元不是对应于概念树, 而是对应于语境概念树的延伸概念, 每一个这样的延伸概念就对应着语言超人的一个基因。,研究语境概念树的延伸概念就是研究语言超人的基因, 这确实是一个探索之梦! 我们已经确定地知道 语言超人基因的数量必然小于 226*i+226*i*j+226*i*j*k个 这个数字与动物或人类基因数字十分巧合, 这是否具有什么哲学意义? 我不知道 但请记住10,848=226*4*4*3这个数字。,4一个语言超人基因的介绍,这个基因的名字叫做民务a123e2m3 她属于领域概念树“政治治理与管理a12”里的一个三级延伸概念。 她的领域句类代码是 ReT01Y802*322J=Re+T0A+T01Y802+T0C+ Y802B1 (她就是语言超人的一个基因,语义块里的符号(要素)大体对应于DNA),民务,4-1 民务符号a123e2m3所蕴涵的世界知识 4-2 民务领域句类代码所蕴涵的世界知识 4-3 民务的概念关联性表示式 4-4 民务符号的“坐标”,4-1 民务符号a123e2m3所蕴涵的世界知识,a 专业活动(第二类劳动) a1 政治活动 a12 国家的治理与管理(治国) a123 治国面临的基本关系 a123e2m 治国中的官民关系 a123e2m3 民务,国家的治理与管理a12简称治国。 农业时代出现过“政治就是夺取和巩固政权”的政治公式。 现代政治公式是“政治主要是国家的治理与管理”, 因为 a12体现政治活动a1的作用效应侧面, 政权活动a11只是a1的过程转移侧面。 政治活动中心应为a12而不是a11。,其对应的概念关联式如下: a11:=(1,2)ga1 (政权活动对应于政治活动过程转移侧面) a12:=(0,3)ga1 (治国对应于政治活动的作用效应侧面) a12:=j72e51ga1 (治国是政治活动的主体),4-2 民务领域句类代码蕴涵的世界知识,SCD= Re+T0A+T01Y802+T0C+ Y802B1 民方T0A(例如登记者) 向官方Y802B1(例如登记受理者) 办理T01Y802(例如登记) 一件需要得到官方认同的活动T0C(例如登记内容) 这一活动必须有所参照Re,两个对象 官与民 官是老大Y802B1、民是老二T0A (蕴涵在符号a123e2m里) 一项内容 老二是该内容的直接参与者,老大并不直 接参与, 但老二必须将该内容T0C通知老大 (蕴涵在符号T0C和T01Y802*322J里) 句式 汉语句式(格式代码)必须采用规范格式, 而不能采用基本格式。 (铁律),4-3 民务的概念关联性表示式,a123e2m3:=(jruj719),l0144e61,4012e21) (民务具有不对称性,主宰者是官方) a123e2m3=a12im (民务与治国基本方式的推动与抑制强交式关联),4-4 民务符号的“坐标”,治国a12的概念延伸结构表示式 a12:(t=a,3,7,k=3; 9t=a,ae2m,3(e2m,eam,n),7(m,e2m),1e2m,2*t=a,3k=4; 3e2m(e1n,3),3e21i,3ea1d01,3ea2c01,3ne2n,347,713,727,1e2me2n; 3ne2n3) a12t 治国的基本课题 a123 治国面临的基本关系 a12i 治国基本方式 a12k 治国谋略,a12t=a 治国的两项基本课题 a129 国家治理 a129t=a 国家治理的两项永恒课题 a1299 开拓性治理 a129a 整顿性治理 a12a 国家管理 a12ae2m 国家管理的两个基本侧面 a12ae21 横向管理 a12ae22 纵向管理,a123 治国面临的基本关系 a123:(e2m,eam,n;) a123e2m 官民关系 a123eam 层级关系 a123n 军政关系,a123e2m 官民关系 a123e2me1n 税 a123e2me1ni 税制 a123e2m3 民务 a123e21i 国家救助 a123e21e7n 民意回应 a123eam 层级关系 a123ea1d01 最高层级 a123ea2c01 最低层级,a123n 军政关系 a1234k=2 军政关系对立统一状态的时代性 a123ne2n 军政关系的积极与消极状态 a123n7 军政关系的特殊状态 a123n7k=x 特殊军政关系的基本类型 a123n71 绝对优势执政党与军队的关系,a12i 治国基本方式 a12i:(m,e2m) a12im 推动与抑制 a12ie2m 权力的集与分 a12im 推动与抑制 a12i1 奖励 a12i1i 授予 a12i2 惩罚 a12i23 禁止 a12i0 规范 a12ie2m 集权与分权 a12ie2me4m 集权与分权的度,a12k 治国谋略 a12k=3 治国谋略的三项特定内容 a121 意识形态治理 a122 政治应变 a123 政治待遇,a121 意识形态治理 a121*t=a 理念宣传与舆论监督 a121*te2n 宣传与监督的多样性和单一性 a122 政治应变 a122e2m 政治应变的对内和对外两侧面 a122*t=a 政治应变的两项特定内容 a122*9 情报活动 (a122*9) 反情报活动 a122*a 警卫活动,a123 政治待遇 a123k=x 政治待遇的基本类型 a1231 对特殊人物的政治待遇 a1232 对前政权代表的政治待遇 a1233 对少数民族的政治待遇 a1234 对宗教力量的政治待遇 a1235 对特定社会力量的政治待遇,“民务”这个词语是本全书为延伸概念a123e2m3的表述而引入的, 包括民政a123e213和民事a123e223两个概念。 应该指出 民政与民事并不对称, 官方具有对民方进行管理的权力, 而民方不具有对官方进行管理的权力。 官民关系的这一基本特征与制度无关, 符号本身a123e2m3并未给出对这一不对称性的描述, 而体现在下面的概念关联式里:,a123e213:=(a12a,l10,rc30ara123e223;l01,a119) (民政定义为政府对民间事务的管理) a123e2m3:=(jruj719),l0144e61,4012e21) (民务具有不对称性,主宰者是官方) a123e2m3=a12im (民务与治国基本方式的奖励、惩罚与规范强交式关联) a123e2m3=a527 (民务与法治的民众侧面强交式关联),5一个句群实例的考察,社会力量|设立|, -应当在科学技术行政部门|办理登记手续。 具体办法|由国务院科学技术行政部门|规定。 , |在奖励活动中|不得收取|任何费用。 SG-C=!111T0aY8022*21J#T0C=XY10*22J +&%!112D01X4*22J +f44T19Ya0*21J&Cn#TA=,The establishment of society-oriented science and technology prizes by social non- governmental sectors| shall be through registration procedures| with administrative departments of science and technology. +&%The specific measures| are to be formulated |by the administrative department of science and technology of the State Council. +Non-governmental sectors| establishing| society-oriented science and technology prizes| upon registration| shall not charge |any fees| in prizeing activities. SG-E= T0aY8022*21J+&%!027D01X4*22J+f44T19Yb0*21JCn#TA=!0pXY10*22JWy,汉语 英语 !111T0aY8022*21J =!0 #T0C=XY10*22J MLC +&%!112D01X4*22J =+&%!027D01X4*22J +f44T19Yb0*21J&Cn =+f44T19Yb0*21JCn #TA= =#TA=XY10*22Jwy,本句群的突出难点 逗号之难(逗号多功能难点,10号难点) “在”字之难(主辅变换难点,9号难点) “奖”与“收取”的不相容之难(复杂省略难点,15号难点),本句群由5个语段构成, 第一语段是小句么? 社会力量|设立|, 第二语段里的省略容易判定和恢复么? 其中的“在科学技术行政部门”是辅块么? (-应当在科学技术行政部门|办理登记手续。) 第三语段里的省略容易判定和恢复么? (具体办法|由国务院科学技术行政部门|规定。) 第四语段是小句么? (,) 第五语段里的省略容易判定和恢复么? (|在奖励活动中|不得收取|任何费用。),6 一丝曙光的体验,1 第二语段的“科学技术行政部门”与“办理登记手续”同时出现, 这足以引发民务语境单元的联想, 基于该语境单元的先验知识 官方还需要进一步确认,民方要找出“证据”。 2 前者得到第三语段的“国务院科学技术行政部门”的进一步确认 3 后者得到第一语段里的“社会力量”的印证。 4 于是 语境单元得以认定。,SCD= Re+T0A+T01Y802+T0C+ Y802B1 5 运用语境单元的先验知识 语言超人可以认定 第一语段是对T0A和T0C的映射, 第二语段里的“科学技术行政部门”是对Y802B1的映射, “办理登记手续”是对T01Y802的映射, 第四和第五语段组合起来是对Re的映射。 6 在上述认定的基础上,语言超人有希望给出上面的HNC标注, 这意味着句类分析的20项难点 可以通过句群分析SGU得到比较彻底的解决。,SCD= Re+T0A+T01Y802+T0C+ Y802B1 7 语言超人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论