人工智能-25. 机器翻译概述_第1页
人工智能-25. 机器翻译概述_第2页
人工智能-25. 机器翻译概述_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

25:机器翻译概述教师姓名授课名称人工智能及机器学习基础知识授课形式授课班级授课地点授课日期章节名称机器翻译概述教学目的掌握中间语言法基本原理掌握机器翻译的主要方法。重点难点重点:中间语言法基本原理。难点:机器翻译的主要方法。主要内容一、课程引入自然语言处理(NLP)通常是指用计算机对人类自然语言进行的有意义的分析与操作。本节我们主要介绍机器翻译。 课程内容机器翻译概述机器翻译(machinetranslation,MT),又称为自动翻译,是利用计算机把一种语言(源语言,sourcelanguage)翻译成另一种语言(目标语言,targetlanguage)的一门技术,一般指自然语言之间句子和全文的翻译。它是自然语言处理(NLP)的一个分支,与计算语言学(ComputationalLinguistics)、自然语言理解(NLU)之间存在着密不可分的关系。用一种机器让不同语种的人能够无障碍交流,一直是人类的梦想。随着互联网的日益普及,网上出现了以各种语言为载体的大量信息,语言障碍问题在新的时代又一次凸显出来,人们比以往任何时候都更迫切需要语言的自动翻译系统。但机器翻译是一个极为困难的研究课题,无论目前对它的需求多么迫切,全自动高质量的机器翻译系统仍将是人类一个遥远的梦。机器翻译的方法机器翻译方法包括三大类:基于规则的机器翻译方法,直接转换法、中间语言法;基于语料库的机器翻译方法,基于统计的方法、基于实例的方法;混合式机器翻译方法。20世纪90年代以前,机器翻译方法的主流一直是基于规则的方法,因此基于规则的方法也称为传统的机器翻译方法。不过,统计方法后来居上,目前已成主流方法,从学术研究的角度看,更是如此。主要翻译方法介绍直接翻译法:逐词进行翻译,又称逐词翻译法。这个方法的特点包括:无需对源语言文本进行分析;对翻译过程的认识过度简化,忽视了不同语言之间在词序、词汇、结构等方面的差异;翻译效果差,现已无人采用。(2)中间语言法中间语言法使用中间语言进行机器翻译。中间语言是一种中间表达,通常是一种句法—语义表达,中间语言独立于任何具体的自然语言。翻译过程为两个阶段:分析和生成。源文本经过深层分析得到源语言的中间语言表示,再由该中间表示生成目标语文本。不同系统采用不同的中间语言,有的是一种逻辑形式的语言,有的甚至采用类似自然语言的人工语言,如:荷兰政府支持的DLT计划就采用世界语Esperanto做中间语言。中间语言法在理论上非常经济,可有效减少翻译模块的数量。可把n(n-1)个直接翻译模块减少为2n个翻译模块。如图为中间语言法翻译模块的情况。很显然,中间语言方法的翻译模块的数量比较少,所以说他更

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论