自然语言理解-语义知识的形式化表示.ppt_第1页
自然语言理解-语义知识的形式化表示.ppt_第2页
自然语言理解-语义知识的形式化表示.ppt_第3页
自然语言理解-语义知识的形式化表示.ppt_第4页
自然语言理解-语义知识的形式化表示.ppt_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语义知识的形式化表示,什么是意义?,关于意义的许多说法,指称论意念论行为论情境论实证论真值论用法论境况论,从计算机的角度看意义,计算机只能在符号世界里转圈圈;意义就是符号变换的游戏;纯粹从符号世界的角度看,“A的意义是B”意味着什么?所谓知道一个符号串的意义,包含两层意思:1你可以把一个符号串A变换为符号串B;2原则上,关于这个符号串A的变换游戏没有止尽;,意义:符号之间的变换关系,a.在一种语言内进行的符号变换“张三打了李四”“李四被张三打了”b.在不同语言之间进行的符号变换“张三用手打了李四”“ZhangSanhitLiSiwithhishand”c.在不同性质的符号系统之间进行的符号变换“这是残疾人通道”,意义:符号之间无止尽的变换关系,“我买了辆车”意思1:我付钱从某处购买了一辆车意思2:我拥有了一辆车意思3:我可以使用这辆车意思4:我的钱都花完了,如何确定符号之间的变换关系,问题1:如何让计算机知道“A的意思是B”?问题2:如何让计算机把符号A变换为符号B?问题1问题2,困难:形式与意义的非一一对应性,一个形式多个意义自然语言理解必须面对的问题一个意义多个形式“意义”怎么能论“个”呢?自然语言生成必须面对的问题把上述问题换种表述法:符号A对应着多个可能的变换结果B1,B2,B3,,在特定场合下,到底选哪一个?,一个形式多个意义(多义词),这个编辑很不错他每年要编辑一百万字的书兼名、动两个词性的多义词这小伙子是干警察的好材料把这个小伙子的材料送人事部这是一种新型材料只有名词一个词性的多义情形这是我刚买的字典我刚查的字典,难道还有错虚词的多义情形,一个形式多个意义(多义词?多义句式?),许多读者给编辑部打来了电话X1+有+Y1:空间关系这本书有许多读者X2+有+Y2:领有关系编辑部有许多读者张老大有很多手下许多人给编辑部打来了电话读者1:0价*这本书有许多人读者2:1价编辑部有许多人手下:0/1价?张老大有很多人,一个形式多个意义(指代消解),张三i把他j出卖了张三i把他i,j的朋友出卖了老张i有个漂亮的女儿j,i,j很骄傲老张i买了辆新车j,j很贵老张i中了头奖j,i很高兴,一个形式多个意义(泛指与特指),人是会死的苏格拉底是人苏格拉底是会死的鲁迅的作品不可能在一天之内全部读完祝福是鲁迅的作品祝福不可能在一天之内全部读完,一个形式多个意义(量化词组),驴子句(donkeysentence)IfJohnownsadonkey,hebeatsit.Everyfarmerwhoownsadonkeybeatsit.Johnownsadonkey.,一个形式多个意义(结构、关系),发现了敌人的哨兵牛奶饼干反对的是他他正在上课开刀的是张大夫在火车上写标语小明的信,一个形式多个意义(隐喻),董永这回算是背上口大黒锅了这家伙真是个狐狸白天不懂夜的黒送温暖办教育董永终于抹平了七仙女心头的创伤教堂的钟又敲响了卧室的钟慢了整整一个小时,一个意义多个形式(同义词),不没(有)我不去西藏我没去西藏我不知道结果*我没知道结果*我不病我没病这锅肉还不烂这锅肉还没烂,一个意义多个形式(同义结构),A马文才害死了梁山伯B1梁山伯被马文才害死了B2马文才把梁山伯害死了1)AB2*B1,又抢走了祝英台。2)*A*B2B1之后,一家人整日以泪洗面。,语义知识的性质和作用,语义知识跟句法知识的性质差别主要在于知识颗粒度的粗细不同语义知识就是细化了的句法知识;句法知识就是非常概括的语义知识;宏观而言,语义知识跟句法知识的作用是相同的都是为了正确地进行符号串的变换操作,依赖语义知识进行结构分析,例1发现宝藏的人v+n1+的+n2例2知道敌军的意图v+n1+的+n2,依赖语义知识进行词义消歧,多义词义项释义英语译词例1想主意想1思索,思考think例2想女儿想2想念,怀念miss,依赖语义知识进行推理,例1乡长买了一瓶茅台乡长拥有了一瓶茅台例2乡长给了村长一瓶茅台村长得到了一瓶茅台乡长失去了一瓶茅台例3乡长正在打鼾乡长正在睡觉例4Everyfarmerwhoownsadonkeybeatsit.Johnisafarmer.Pandoraisadonkey.DoesJohnbeatPandora?-Yes.-Idontknow,语义理解语义知识,理解符号串A的意思将A变换为符号串B对A进行句法结构分析在机器看来,只不过是在做符号串变换的操作对A进行词义排歧分析对A进行推理要进行上述符号变换操作,除了需要句法知识外,还需要语义知识,语义知识的类型及其形式化表示,关于词义聚类关系的知识(纵向)关于词义组合关系的知识(横向)属性名:属性值型语义知识(静态)词典条件-动作型语义知识(动态)规则句法知识与语义知识的一体化(同样的形式化表示),关于词义聚类关系的知识,同义(近义)关系反义关系同位关系上、下位关系,语义特征表示,语义场描述,语义场是对语义特征的系统化表述顺序,循环,层级,语义场为结构化的语义特征值提供了描述手段一月,二月,十二月星期一,星期二,星期日钱,两,斤,公斤,吨学士,硕士,博士国,省,市,县,镇,乡,村,语义场描述,颜色语义场,Xvpnp:$.内部结构=述宾,IF%vp.受事=%npTRUE,IF%vp.结果=%npTRUE,R2np-vpunp:,IF%vp.内部结构=述宾THEN%vp.施事=%npENDIF,发现宝藏的人发现宝藏的人知道敌军的意图知道敌军的意图发现敌人的哨兵发现敌人的哨兵发现敌人的哨兵,广义配价模式,纵向拓展从词到短语在两个方向上对标准配价模式进行扩展横向拓展从“动名”关系拓展到“动形”关系,“形名”关系,“名名”关系,“副形”关系,,短语结构的组配性质,买买衣服买贵了这件衣服你买贵了*你买贵了这件衣服晾晾衣服晾阳台上晾干晾干衣服*晾干阳台上,“动形”语义组配描述,买便宜的布*买便宜染红,洗干净了洗胖了洗聪明了*洗僻静了*洗适宜了*洗远了?洗浓了动词形容词动词形容词名词,其他词类之间的组配约束,名名组配(n+n)整体部分关系“没有盖儿的杯子”“没有杯子盖儿”集合成员关系“北大的学生”*“学生的北大”实体材料关系“塑料凉鞋”*“凉鞋塑料”个体亲属关系“老张的女儿”*“老张的”副词/形容词动词(短语)*正在知道*马上买贵了*认真地懂得了,格语法,CaseGrammarCharlesJ.Fillmore,1966TowardsamodernTheoryofcaseThecaseforcase格辨SomeProblemsforCaseGrammar,格的含义,传统语言学中的格是表层格词尾变化词干音变格语法中的格是“深层格”体词与谓词的及物性关系句法语义关系,例子,Thedooropened.Thekeyopenedthedoor.Theboyopenedthedoor.Thedoorwasopenedbytheboy.Theboyopenedthedoorwithakey.Theboy:施事格Thedoor:客体格Thekey:工具格,格语法,基本规则词汇部分转换部分,基本规则,S-M+PP-V+C1+C2+CnC-K+NP,基本规则,S-M+P一个句子S可以改写成情态和命题两大部分情态部分包括否定、时、式、体、以及其他被理解为全局情态成分的状语命题牵涉到动词和名词短语、动词和内嵌小句之间的关系,基本规则,P-V+C1+C2+Cn任何命题P都可改写成一个动词V和若干个格C。动词是广义上的动词,包括:动词、形容词、甚至包括名词、副词和连词,基本规则,C-K+NPK为格标,是各格范畴在底层结构中的标志。,格表,施事格Agentive工具格Instrumental承受格Dative使成格Factitive方位格Locative客体格Objective收益格Benefactive源点格Source终点格Goal伴随格Comitative,词汇部分,在词库中标明词汇的底层格的特征Street+LocativeIdea-Locative标出动词的框架特征Cry+Arun+ACry和run可以带有一个表示施事的NP区分必选格和可选格,转换部分,和转换语法类似移动删除插入复写,格语法与汉语,有局限性汉语不是动词中心流水句、无动局、连动、紧缩等结构,无法用一个动词统率一个句子的模式来描述。,义素分析法,丹麦语言学家叶姆斯列夫L.Hjelmslev美国语言学家卡茨J.Katz和福多尔J.A.Fodor提出解释语义学,义素分析法,义素是意义的基本要素义素是词的理性意义的区别特征词的理性意义是一系列语义特征的总和,例1,男人:+人、+成年、+男性女人:+人、+成年、-男性男孩:+人、-成年、+男性女孩:+人、-成年、-男性,例2,陆军:军队在陆地作战f通常由组成步兵炮兵装甲兵工程兵各专业部队海军:军队在海上作战f通常由组成水面舰艇潜艇海军航空兵海军陆战队各专业部队同一类型的义素写在同一花括弧f:适用范围“各”是一个标志,它表示被标志的义素可以分解为若干同类的义素。,义素分析法,了解词与词搭配是在语义上受到什么样的限制用于判断同义词、近义词之间的差别,蒙太古语法,MontagueGrammar语义研究的形式化问题蒙太古认为自然语言研究必须是数学的一个分支组成部分句法翻译语义,MG理论模式,词库,有意义的词语,义类,内涵逻辑表达式,语义规则,特定模型中的外延或内涵所指,对应函数f,翻译规则,基本词语,语类,句法规则,树形图,MG句法部分,语类categorye和t以及它们之间关系的一组集合e:表示个体词语(individualexpression)或实体词语(entityexpression)不同于名词或者名词短语e.g.chair不属于e语类,只有具体的某把椅子的词语才属于e语类t:表示具有真值的语言单位,真值词语(truthvalueexpression)或陈述语句(declarativesentence),语类,如果A和B位语类标记,则A/B、A/B均为语类标记所有语类都是从e和t中推出A/B表示一个可以与B语类词语结合而产生A语类标记的语类A/B和A/B表示属于不同句法范畴而具有相同语义范畴的语类,语类一览表,句法规则,句子依照费雷格原理,通过短语有小到大的结合而逐渐产生短语之间的结合通过句法规则来实现典型的句法规则Sn如果PA,PB,那么Fm(,)PC,且Fm(,)=,基本规则,S1对于任何A语类来说,BA(即A类基本词语)PA(即A类短语)S3如果PCN,Pt,那么F3,n(,)PCN,且F3,n(,)=s.t.,其中来自,并根据中第一个BCN的阳、阴、中性,用he、she、it或him、her、it来提换中的每一个hen或himn。S2如果PCN,那么F0(),F1(),F2()PT,且F0()=every,F1()=the,F2()=不是a就是an,具体情况依中第一词和或搭配形式而定。,合取和析取规则,S11和S13处理有and或or连接的合取或析取短语S11如果,Pt,那么F8(,),F9(,)Pt,且F8(,)=and,F9(,)=or,量化规则,S14至S16为量化规则S14PT,PT,那么F10(,)PT,且:如果不是hek形式短语(即不是传统意义上的人称代词),那么F10(,)就等于将中第一个hen或himn用代替,其后出现的hen或himn则根据中第一个BCN或BT的性用he,she,it或him,her,it替换如果=hek,则F10(,)等于将中所有的hen或himn用hek或himk来替换,时态及记号规则,S17为时态及记号规则,MG翻译部分,MG为表示句法和语义的同态性,通常将句子翻译成内涵逻辑表达式每一条句法规则都有相对应的一条翻译规则,MG翻译部分,表示的内涵,表示的外延Pa=P(a)叫做括号等式=谓词变项P表示个体集合的属性人名和代词在MG中的依法分别为:PP,PPhen,变换,变换指的是把主目代入含有算子指定的那个变项的表达式中,并消掉及变项。xx(a)=a,函数应用规则,S4至S10将A/B语类的短语与B语类的短语结合而产生A语类的短语S4如果Pt/IV,PIV,那么F4(,)Pt,且F4(,)=,其中是将中的第一个动词替换成第三人称单数形式的结果。,MG语义部分,MG内涵逻辑有句法和语义两部分组成句法部分主要确定内涵逻辑表达式义类问题语义部分主要有语义规则组成,这些规则根据模型来确定内涵逻辑表达式中的所指问题。,MG内涵逻辑句法部分,内涵逻辑的句法主要确定内涵逻辑表达式的逻辑义类(logicaltype)问题基本义类有两个:e和te表示个体t表示真值义类和语类是不同的概念,义类的递归性的定义,t是一个义类;e是一个义类;如果a和b是义类,那么是一个义类;如果a是义类,则是一个义类其中表示一个由a向b映射的函数,表示a的内涵。,义类与语类的对应关系,义类与语类一一对应,有一个函数关系,用f表示f(t)=tf(e)=e对于任何A、B语类来说,f(A/B)=f(A/B)=,f(A),MG内涵逻辑句法,基本成分常项变项内涵逻辑句法部分的作用主要是确定内涵逻辑表达式的义类,其规则表述如下:义类中的每一个变项都属于ME(即义类的有意义词语);义类中的每一个常项都属于ME;如果ME,u为b义类变项,则uME;如果ME,ME,则()MEb;等等,MG内涵逻辑语义部分,内涵逻辑模型语义规则,主要确定内涵逻辑表达式的所指问题,内涵逻辑模型,具体表述如下Da=ADt=0,1D=D=其中Da表示a的所指(denotation)。E的所指为模型中的个体集合,t的所指为一个真值集合,的所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论