自然语言理解-语义知识的形式化表示ppt课件_第1页
自然语言理解-语义知识的形式化表示ppt课件_第2页
自然语言理解-语义知识的形式化表示ppt课件_第3页
自然语言理解-语义知识的形式化表示ppt课件_第4页
自然语言理解-语义知识的形式化表示ppt课件_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、语义知识的形式化表示,什么是意义?,关于意义的许多说法,指称论 意念论 行为论 情境论 实证论 真值论 用法论 境况论 ,从计算机的角度看意义,计算机只能在符号世界里转圈圈; 意义就是符号变换的游戏; 纯粹从符号世界的角度看,“A的意义是B”意味着什么? 所谓知道一个符号串的意义,包含两层意思: 1 你可以把一个符号串A变换为符号串B; 2 原则上,关于这个符号串A的变换游戏没有止尽;,意义:符号之间的变换关系,a. 在一种语言内进行的符号变换 “张三打了李四”“李四被张三打了” b. 在不同语言之间进行的符号变换 “张三用手打了李四” “Zhang San hit Li Si with hi

2、s hand” c. 在不同性质的符号系统之间进行的符号变换 “这是残疾人通道”,意义:符号之间无止尽的变换关系,“我买了辆车” 意思1:我付钱从某处购买了一辆车 意思2:我拥有了一辆车 意思3:我可以使用这辆车 意思4:我的钱都花完了 ,如何确定符号之间的变换关系,问题1:如何让计算机知道“A的意思是B”? 问题2:如何让计算机把符号A变换为符号B? 问题1 问题2,困难:形式与意义的非一一对应性,一个形式多个意义 自然语言理解必须面对的问题 一个意义多个形式 “意义”怎么能论“个”呢? 自然语言生成必须面对的问题 把上述问题换种表述法: 符号A对应着多个可能的变换结果B1,B2,B3,,在

3、特定场合下,到底选哪一个?,一个形式多个意义(多义词),这个编辑很不错 他每年要编辑一百万字的书兼名、动两个词性的多义词 这小伙子是干警察的好材料 把这个小伙子的材料送人事部 这是一种新型材料只有名词一个词性的多义情形 这是我刚买的字典 我刚查的字典,难道还有错虚词的多义情形,一个形式多个意义(多义词?多义句式?),许多读者给编辑部打来了电话 X1+ 有+ Y1:空间关系 这本书有许多读者 X2+ 有+ Y2:领有关系 编辑部有许多读者 张老大有很多手下 许多人给编辑部打来了电话读者1:0价 * 这本书有许多人读者2:1价 编辑部有许多人手下:0/1价? 张老大有很多人,一个形式多个意义(指代

4、消解),张三i把他j出卖了 张三i把他i,j的朋友出卖了 老张i有个漂亮的女儿j,i,j 很骄傲 老张i买了辆新车j,j 很贵 老张i中了头奖j,i 很高兴,一个形式多个意义(泛指与特指),人是会死的 苏格拉底是人 苏格拉底是会死的 鲁迅的作品不可能在一天之内全部读完 祝福是鲁迅的作品 祝福不可能在一天之内全部读完,一个形式多个意义(量化词组),驴子句(donkey sentence) If John owns a donkey, he beats it. Every farmer who owns a donkey beats it. John owns a donkey.,一个形式多个意义

5、(结构、关系),发现了敌人的哨兵 牛奶饼干 反对的是他 他正在上课 开刀的是张大夫 在火车上写标语 小明的信,一个形式多个意义(隐喻),董永这回算是背上口大黒锅了 这家伙真是个狐狸 白天不懂夜的黒 送温暖 办教育 董永终于抹平了七仙女心头的创伤 教堂的钟又敲响了 卧室的钟慢了整整一个小时,一个意义多个形式(同义词),不没(有) 我不去西藏我没去西藏 我不知道结果* 我没知道结果 * 我不病我没病 这锅肉还不烂这锅肉还没烂,一个意义多个形式(同义结构),A 马文才害死了梁山伯B1 梁山伯被马文才害死了 B2 马文才把梁山伯害死了 1) A B2 * B1 ,又抢走了祝英台。 2) *A *B2

6、B1 之后,一家人整日以泪洗面。,语义知识的性质和作用,语义知识跟句法知识的性质差别主要在于知识颗粒度的粗细不同语义知识就是细化了的句法知识;句法知识就是非常概括的语义知识; 宏观而言,语义知识跟句法知识的作用是相同的都是为了正确地进行符号串的变换操作,依赖语义知识进行结构分析,例1发现宝藏的人v + n1+ 的+ n2 例2知道敌军的意图v + n1+ 的+ n2,依赖语义知识进行词义消歧,多义 词义项 释义 英语译词 例1 想主意 想1 思索,思考 think 例2 想女儿 想2想念,怀念 miss,依赖语义知识进行推理,例1 乡长买了一瓶茅台 乡长拥有了一瓶茅台 例2 乡长给了村长一瓶茅

7、台 村长得到了一瓶茅台 乡长失去了一瓶茅台 例3 乡长正在打鼾 乡长正在睡觉 例4 Every farmer who owns a donkey beats it. John is a farmer. Pandora is a donkey .Does John beat Pandora? -Yes. -I dont know,语义理解语义知识,理解符号串A的意思将A变换为符号串B 对A进行句法结构分析在机器看来,只不过是在做符号串变换的操作 对A进行词义排歧分析 对A进行推理 要进行上述符号变换操作,除了需要 句法知识外,还需要语义知识,语义知识的类型及其形式化表示,关于词义聚类关系的知识(

8、纵向) 关于词义组合关系的知识(横向) 属性名:属性值 型语义知识(静态)词典 条件- 动作 型语义知识(动态)规则 句法知识与语义知识的一体化(同样的形式化表示),关于词义聚类关系的知识,同义(近义)关系 反义关系 同位关系 上、下位关系,语义特征表示,语义场描述,语义场是对语义特征的系统化表述顺序,循环,层级, 语义场为结构化的语义特征值提供了描述手段 一月,二月,十二月 星期一,星期二,星期日 钱,两,斤,公斤,吨 学士,硕士,博士 国,省,市,县,镇,乡,村,语义场描述,颜色语义场,XY 的意思是:如果一种语言包含Y,则一定也包含X Berlin,B. Sex(Y)=F 哥哥O(Y,

9、X) 争吵、对话、 语义属性层次 吃: 施事:语义类:人|动物,受事:语义类:食物 词例层次 嗑:施事:语义类:人,受事:词语:*瓜子 正面描述与反面描述 变卖:施事:语义类:人|集体,受事:语义类: -人,论旨角色与句法结构的对应关系,动词各论旨角色可以出现的句法位置 S3: A + 用+ I + _ + P 例如:妈妈用小刀切西瓜 S4: I + A + _ + P 例如:这把刀我切肉 S5: Ma + A + _ + P 例如:那些白菜我都包饺子了 S6: A + 用+ Ma + _ + R 例如:姐姐用细毛线织了一件上衣 S7: A + 把+ Ma + _ + R 例如:妈妈把板栗全包

10、了粽子 S8: A + _ + I 例如:我切这把大刀 S9: A + _ + Ma 例如:我包韭菜馅儿,你包肉馅儿 S10: A + _ + M 例如:我包小包,你包大包 A-施事;I-工具;P-受事;Ma-材料;M-方式;R-结果;,论旨角色与句法结构的对应关系(续),R1vp-vp np : $.内部结构=述宾, IF %vp.受事=%np TRUE, IF %vp.结果=%np TRUE, R2np-vp u np : ,IF %vp.内部结构=述宾 THEN %vp.施事=%np ENDIF, 发现宝藏的人 发现宝藏 的人 知道敌军的意图知道敌军的意图 发现敌人的哨兵发现敌人的哨兵

11、发现敌人 的哨兵,广义配价模式,纵向拓展 从词到短语在两个方向上对标准配价模式进行扩展 横向拓展 从“动名”关系拓展到“动形”关系, “形名”关系,“名名”关系, “副形”关系,,短语结构的组配性质,买买衣服 买贵了这件衣服你买贵了 * 你买贵了这件衣服 晾晾衣服晾阳台上 晾干晾干衣服* 晾干阳台上,“动形”语义组配描述,买便宜的布* 买便宜染红,洗干净了洗胖了 洗聪明了 * 洗僻静了* 洗适宜了 * 洗远了?洗浓了 动词形容词 动词形容词 名词,其他词类之间的组配约束,名名组配(n + n) 整体部分关系“没有盖儿的杯子”“没有杯子盖儿” 集合成员关系“北大的学生”* “学生的北大” 实体材

12、料关系“塑料凉鞋”* “凉鞋塑料” 个体亲属关系“老张的女儿”* “老张的” 副词/形容词动词(短语) * 正在知道 * 马上买贵了 * 认真地懂得了 ,格语法,Case Grammar Charles J. Fillmore, 1966 Towards a modern Theory of case The case for case 格辨 Some Problems for Case Grammar,格的含义,传统语言学中的格是表层格 词尾变化 词干音变 格语法中的格是“深层格” 体词与谓词的及物性关系 句法语义关系,例子,The door opened. The key opened t

13、he door. The boy opened the door. The door was opened by the boy. The boy opened the door with a key. The boy: 施事格 The door: 客体格 The key: 工具格,格语法,基本规则 词汇部分 转换部分,基本规则,S-M+P P-V+C1+C2+Cn C-K+NP,基本规则,S-M+P 一个句子S可以改写成情态和命题两大部分 情态部分包括否定、时、式、体、以及其他被理解为全局情态成分的状语 命题牵涉到动词和名词短语、动词和内嵌小句之间的关系,基本规则,P-V+C1+C2+Cn

14、任何命题P都可改写成一个动词V和若干个格C。 动词是广义上的动词,包括:动词、形容词、甚至包括名词、副词和连词,基本规则,C-K+NP K为格标,是各格范畴在底层结构中的标志。,格表,施事格Agentive 工具格Instrumental 承受格Dative 使成格Factitive 方位格Locative 客体格Objective 收益格Benefactive 源点格Source 终点格Goal 伴随格Comitative,词汇部分,在词库中标明词汇的底层格的特征 Street +Locative Idea -Locative 标出动词的框架特征 Cry +A run +A Cry 和 ru

15、n 可以带有一个表示施事的NP 区分必选格和可选格,转换部分,和转换语法类似 移动 删除 插入 复写,格语法与汉语,有局限性 汉语不是动词中心 流水句、无动局、连动、紧缩等结构,无法用一个动词统率一个句子的模式来描述。,义素分析法,丹麦语言学家叶姆斯列夫 L. Hjelmslev 美国语言学家卡茨J. Katz和福多尔J. A. Fodor提出解释语义学,义素分析法,义素是意义的基本要素 义素是词的理性意义的区别特征 词的理性意义是一系列语义特征的总和,例1,男人:+人、+成年、+男性 女人:+人、+成年、-男性 男孩:+人、-成年、+男性 女孩:+人、-成年、-男性,例2,陆军:军队在陆地作

16、战f通常由组成步兵炮兵装甲兵工程兵各专业部队 海军:军队在海上作战f通常由组成水面舰艇潜艇海军航空兵海军陆战队各专业部队 同一类型的义素写在同一花括弧 f:适用范围 “各”是一个标志,它表示被标志的义素可以分解为若干同类的义素。,义素分析法,了解词与词搭配是在语义上受到什么样的限制 用于判断同义词、近义词之间的差别,蒙太古语法,Montague Grammar 语义研究的形式化问题 蒙太古认为自然语言研究必须是数学的一个分支 组成部分 句法 翻译 语义,MG理论模式,词库,有意义的词语,义类,内涵逻辑表达式,语义规则,特定模型中 的外延 或内涵所指,对应函数f,翻译规则,基本词语,语类,句法规

17、则,树形图,MG句法部分,语类 category e和t以及它们之间关系的一组集合 e: 表示个体词语(individual expression)或实体词语(entity expression) 不同于名词或者名词短语 e.g. chair不属于e语类,只有具体的某把椅子的词语才属于e语类 t: 表示具有真值的语言单位,真值词语(truth value expression)或陈述语句(declarative sentence),语类,如果A和B位语类标记,则A/B、A/B均为语类标记 所有语类都是从e和t中推出 A/B表示一个可以与B语类词语结合而产生A语类标记的语类 A/B和A/B表示属

18、于不同句法范畴而具有相同语义范畴的语类,语类一览表,句法规则,句子依照费雷格原理,通过短语有小到大的结合而逐渐产生 短语之间的结合通过句法规则来实现 典型的句法规则 Sn如果PA,PB,那么 Fm(, ) PC,且Fm(, ) =,基本规则,S1 对于任何A语类来说,BA(即A类基本词语) PA(即A类短语)S3 如果PCN,Pt,那么F3,n(,) PCN,且F3,n(,) = s .t. ,其中来自,并根据中第一个BCN的阳、阴、中性,用he、she、it或him、her、it来提换中的每一个hen或himn。 S2 如果PCN ,那么F0(), F1(),F2() PT,且F0() =e

19、very , F1()=the , F2()=不是a 就是an ,具体情况依中第一词和或搭配形式而定。,合取和析取规则,S11和S13处理有and或or连接的合取或析取短语 S11 如果, Pt ,那么F8(,),F9(,) Pt ,且F8(,) = and , F9(,) = or ,量化规则,S14至S16为量化规则 S14 PT, PT, 那么F10(, ) PT, 且: 如果不是hek形式短语(即不是传统意义上的人称代词),那么F10(, )就等于将中第一个hen或himn用代替,其后出现的hen或himn则根据中第一个BCN或BT的性用he, she, it或him, her, it

20、替换 如果=hek,则F10(, )等于将中所有的hen或himn用hek或himk来替换,时态及记号规则,S17为时态及记号规则,MG翻译部分,MG为表示句法和语义的同态性,通常将句子翻译成内涵逻辑表达式 每一条句法规则都有相对应的一条翻译规则,MG翻译部分,表示的内涵, 表示的外延 Pa= P(a)叫做括号等式 = 谓词变项P表示个体集合的属性 人名和代词在MG中的依法分别为: PP, PPhen,变换,变换指的是把主目代入含有算子指定的那个变项的表达式中,并消掉及变项。 xx(a)=a,函数应用规则,S4至S10将A/B语类的短语与B语类的短语结合而产生A语类的短语 S4 如果Pt/IV, PIV,那么F4(,) Pt,且F4(,)=,其中是将中的第一个动词替换成第三人称单数形式的结果。,MG语义部分,MG内涵逻辑有句法和语义两部分组成 句法部分主要确定内涵逻辑表达式义类问题 语义部分主要有语义规则组成,这些规则根据模型来确定内涵逻辑表达式中的所指问题。,MG内涵逻辑句法部分,内涵逻辑的句法主要确定内涵逻辑表达式的逻辑义类(logical type)问题 基本义类有两个:e和t e表示个体 t表示真值义类和语类是不同的概念,义类的递归性的定义,t 是一个义类; e是一个义类; 如果a和b是义类,那么

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论