人工智能与机器翻译期末复习题_第1页
人工智能与机器翻译期末复习题_第2页
人工智能与机器翻译期末复习题_第3页
人工智能与机器翻译期末复习题_第4页
人工智能与机器翻译期末复习题_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能与机器翻译期末复习题名词解释(5X3‘)15’兼类(P121):一个单词既可以作名词动词又可以作其他词类机器翻译:用计算机软件代替人做的书面翻译组合型歧义:一个字与前面的字成词,与后面的字成词,合起来也成词。交集型歧义(P117):一个字与前面的字成词,与后面的字也成词。人工智能:用计算机硬件、软件模拟人的行为,解决人类目前尚未认识清楚的问题。人工智能软件的三大技术:知识表示、知识推理、知识获取。语料库:单词、短语和句子组成的数据库。知识工程:包括人工智能软件技术的工程。(知识工程是以知识为基础的系统,就是通过智能软件而建立的专家系统)深度学习:一步一步在丰富起来的特征规律引导下,由浅入深完成推理的方法。语用分析:分析成语和习惯用语的方法。题解P36例2.1、2.2例2.1 设有下列语句:(1)高山比他父亲出名。(2)刘水是计算机系的一名学生,但他不喜欢编程序。(3)人人爱劳动。为了用谓词公式表示这些语句,应先定义谓词:    BIGGER(x,y):x比y出名    COMPUTER(x):x是计算机系的学生    LIKE(x,y):x喜欢y    LOVE(x,y):x爱y    M(x):x是人定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为:(1)BIGGER(高山,father(x)) (2)COMPUTER(刘水)∧∽LIKE(刘水,程序)(3)(∀x)(M(x) → LOVE(x,劳动))例2.2 设有下列语句:(1)自然数都是大于零的整数。(2)所有整数不是偶数就是奇数。(3)偶数除以2是整数。定义谓词如下:N(x):x是自然数I(x):x是整数E(x):x是偶数O(x):x是奇数GZ(x):x大于零另外,用函数S(x)表示x除以2。此时,上述三个句子可用谓词公式表示为:        (∀x)(N(x) →GZ(x)∧I(x))        (∀x)(I(x) →E(x)∨O(x))        (∀x)(E(x) →I(S(x)))论述(4X5‘)20’阐述深度、广度、代价驱动搜索方法。(P68)答:广度优先搜索法:对全部节点沿广度进行横向扫描,按各节点生成的先后次序,先生成、先检查、先扩展,沿广度遍历所有节点。深度优先搜索法:每一次扩展最晚生成的子节点,沿着最晚生成的子节点分支,逐级纵向深入发展。  代价驱动搜索法:依据初始节点到它们各自所付出的代价大小进行排序,代价小的节点放在前面扩展,周而复始重复上述操作,直到找到目标节点为止。智能软件的核心组成部分。答:数据库、控制程序、知识库或规则集。举例说明专业人工智能和广义人工智能的区别。广义:能够代替人类做任何事情功能的即可 专业:用计算机软件模拟人的行为以解决人类目前尚未认识清楚的问题阐述人工智能软件和常规软件的区别。答:普通软件只有控制集与数据库集;智能软件具有控制集与数据库集,还有知识库或者规则集。试述规则不一致的规则与原因(P77)答:(1)循环规则:由数个规则的前提和结论形成一个循环链,最终由末尾规则的结果子句推出起始规则的前提部分;(2)冲突规则:两个规则的前提条件等价,但一个或多个结果子句有矛盾或者前提子句有矛盾而结论部分完全等价;也有可能由多条规则链形成冲突规则集;(3)冗余规则:两个规则的前提条件等价,一个或多个子结果子句也等价;(4)从属规则:两个规则有相同的结果,但其中一个包含有多余的约束条件。简述三次人工智能的高潮及原因答:1956年,人工智能诞生;1981年,日本研制智能机,各个国家不甘落后;2017年,计算机软件战胜围棋冠军,人工智能备受瞩目。阐述类比搜索方法的基本思想。(P75)答:利用类比获得与新问题相似的过去问题的求解过程,作为启发信息来指导新问题的求解,这样可以缩小搜索范围,降低问题求解的复杂性。阐述机器学习的两种方式答:狭义:指人们通过系统设计,程序编制和人机交互,使机器获取知识。广义:指机器自动或半自动地获取知识。四、自然语言处理的概念1.试述歧义问题的种类。(P129)答:①词组的多义产生的歧义;②由计算机程序在自动分词阶段产生的歧义;③由词典大小产生的歧义;④由自然语言的二义性产生的歧义。2.人工智能、知识工程、专家系统的区别。答:专家系统:是人工智能特定领域技术;   知识工程:就是人工智能的软件技术;   人工智能:不仅是软件技术还有硬件技术。3.试述机器翻译的四种方法。(P88的四个小标题)答:①基于分析和转换的机器翻译方法。②基于中间语言的机器翻译方法。③基于统计的机器翻译方法。④基于实例的机器翻译方法。1.转换式的方法     特征:利用了语法语义关系2.中间语言的方法   特征:假想每种语言都能转换到中间语言3.统计的方法       特征:利用了数学统计原理       4.实例的方法       特征:利用了类比相似语句4.机器字典的用途。(P114)1>机器词典的好坏是更好的实现实用化机器翻译系统软件的障碍之一 2>机器词典是机器翻译的质量的关键,要达到机器翻译的全自动,高质量,就必须有一部信息丰富,易于使用的机器词典 3>电子词典(机器词典)不仅可以用于机器翻译,而且也可以用在自然语言理解,自然语言处理等诸多方面 机器翻译系统的词典又可以分为通用词典和专业词典两部分,这种划分便于维护和扩充.也可以把机器词典分的更细一点,如组俺们的缩略语词典,特殊字词典等,还可以把通用词典再细分为名词词典,动词词典,成语词典等5.举例说明语义分析的用途例:乒乓球拍买完了6.上下无关文法的定义答:一个句子意义本身每一个单词意义全部明确。(比如王明是好学生,意义明确,而他是好学生,他与上下文相关,意义就不明确。)五、算法描述1.产生式系统的基本算法(P59)答:E1:初始化综合数据库(DATA←初始事实库)E2:until DATA满足结束条件以前,do E3:begin E4:在规则集中,按冲突解决方法选出某一条可用于综合数据库的规则E5:执行当前选中的规则,把该规则执行后得到的结论送入综合数据库中(DATA←规则应用到DATA得到的结果)E6:end2.回溯方法(P67)YX0:选择一条新路径搜索 YX1:搜索若超出规定指标(无新路径,超时,超深度等)失败退出;否则搜索继续 YX2:搜索真的状态找不到可用规则,回溯到YX0 YX3:搜索的状态依某种原则(任意排列或按启发式准则)取有用规则 YX4:若规则用完未找到目标回溯YX0 YX5:取头条可用规则Ri YX6:删去头条规则减少搜索中规则集长度(注意这里不懂原则规则集) YX7:规则Ri作用于当前状态生成新状态 YX8:若找到目标成功退出;若生成的"新状态"已出现过回溯到YX0 YX9:记录新状态对新状态递归调用YX1~YX7六、分析题P117-P119(18题选8)1、交集型歧义切分字段是由词与词之间的交叉组合产生的。  (1) 名词+名词:例如, 在句子“用树形图形式加以描述”中, 歧义字段“图形式”是由名词“图”与名词“形式”之间的交叉组合产生的----“图形”十“形式”。事实上,“图形”是歧义词,它是歧义字段“图形式”在给定句子中错误地切分出来的片段,“形式”是非歧义词,它是歧义字段“图形式”在给定句子中,按正确的切分方式切分出来的片段。  (2) 动词十名词:例如,在句子“研究生命的本质”中,歧义字段“研究生命”是由动词“研究”与名词“生命”之间的交叉组合产生的----“研究生”(歧义词)十“生命”(非歧义词)。  (3) 形容词十名词:例如,在句子“白天鹅游过来了”中,歧义字段“白天鹅”是由形容词“白”与名词“天鹅”之间的交叉组合产生的——“白天”(歧义词)十“天鹅”(非歧义词)。  (4) 介词十名词:例如,在句子“让位移等于50厘米”中,歧义字段“让位移”是由介词“让”与名词“位移”之间的交叉组合产生的——“让位”(歧义词)十“位移”(非歧义词)。  (5) 连词十名词:例如,在短语“独立自主和平等互利的原则”中,歧义字段“和平等”是由连词“和”与名词“平等”的交叉组合产生的——“和平”(歧义词)十“平等”(非歧义词)。  (6) 副词十形容词:例如,在句子“这本小说的情节太平淡了”中,歧义字段“太平淡”是由副词“太”与形容词“平淡”的交叉组合产生的----“太平”(歧义词)十“平谈”(非歧义词)。  (7) 助词十形容词:例如,在短语“对这种现象的确切描述”中,歧义字段,“的确切”是由助词“的”与形容词“确切”的交叉组合产生的----“的确”(歧义词)+“确切”(非歧义同)。  (8)名词十连词:例如,在句子“社会需求和生产水平有矛盾”中,歧义字段“需求和”是由名词“需求”与连词“和”的交叉组合产生的----“需求”(非歧义词)十“求和”(歧义词)。  (9)动词十介词:例如,在句子“他们看中和日本人做生意的机会”中,歧义字段“看中和”是由动词“看中”与介词“和”的交叉组合产生的----“看中”(非歧义词)十“中和”(歧义词)。2、多义组合型歧义切分字段比较复杂,这种歧义切分字段是由词与词之间的串联组合产生的。  (1)量词十名词:例如,在句子“一阵风吹过来了”中,歧义切分字段“阵风”是由量词“阵”和名词“风”的串联组合产生的。  (2)介词十名词:例如,在句子“请把手抬高一点儿”中,歧义切分字段“把手”是由介词“把”和名词“手”的串联组合产生的。  (3)动词十名词:例如,在句子“他喜欢吃烤白薯,中,歧义切分字段“烤白薯,是由动词“烤”和名词“白薯”的串联组合产生的。  (4)名词十方位词:例如,在句子“他骑在马上”中,歧义切分字段“马上”是由名词“马”和方位词“上”的串联组合产生的。  (5)名词十动词:例1,在句子“语言学起来并不十分容易”中,歧义切分字段“语言学”是由名词“语言”和动词“学”的串联组合产生的。例如,在句子“学生会兴奋得手舞足蹈”中,歧义切分字段“学生会”是由名词“学生”和动词“会”的串联组合产生的。  例如, 在句子“乒乓球拍卖完了”中,歧义切分字段“乒乓球拍”是由名词“乒乓球”和动词“拍”的串联组合产生的。  例如,在句子“美国会采取措施提高工业竞争力”中,歧义切分字段“美国会”是由名词“美国”和动词“会”的串联组合产生的。  (6) 方位词十动词:例如,在句子“他在庄稼地里间麦苗”中,歧义切分字段“里间”是由方位词“里”和动词“间”的串联组合产生的。  (7) 副词十动词:例如,在句子“他将来北京探亲”中,歧义切分字段“将来”是由副词“将”和动词“来”的串联组合产生的。  (8) 助词十动词:例1,在句子“他学会了解S。        (1) N→NP                   (2) A  NP→NP        (3) DET  NP→DNP    (4) P  DNP→PP          (5) DNP  PP→DNP    (6) V  DNP→VP         (7) DNP  VP→S  下面用计算机程序(产生式模块)来分析一个汉语句子是否合法: "高新技术的高新价值产品涌现高新科技园". 算法执行过程: 经自动分词和算法E1,已得到: DET  N  P  DET  A  N  V  DET  

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论