基于规则的机器翻译系统_第1页
基于规则的机器翻译系统_第2页
基于规则的机器翻译系统_第3页
基于规则的机器翻译系统_第4页
基于规则的机器翻译系统_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器翻译原理之,基于规则的机器翻译系统(Rule-basedSystem),机器翻译(machinetranslation),机器翻译原理本质:是人类思维和语言活动的模拟;是探索如何借助计算机程序将文字或语言从一种自然语言翻译成另一种自然语言的技术。,机器翻译的翻译过程如图所示:,(输入)原语,分析,转换,生成,目的语(输出),机器翻译(machinetranslation),机器翻译主要有两套系统:一、基于规则的(Rule-basedSystem)二、基于语料库的(Corpus-basedSystem),基于规则的机器翻译系统,规则主要包括:1、词法2、句法3、短语规则4、转换生成语法,基于规则的机器翻译系统,大致可分为三种类型:1、直接翻译2、结构转换翻译3、中间语翻译,基于规则的机器翻译系统之直接翻译,是把原语中的单词或句子直接替换成相应的目的语的单词,必要时对词序进行适当的调整。这是机器翻译最初的构想。从目的语中寻找与原语词汇相对应的单词.但并不是电子词典的word-to-word形式,而是翻译句子中所有的词汇。到后期也加入了一些简单句法甚至语义规则,对替换后的词语进行重新排序,生成目的语文本。,其翻译模式如下图:,SL输入,形态分析,双语词典查询,语序调整,TL输出,在孩子的教育问题上,家庭教育与学校教育同等重要Familyeducationplayanequallyimportantroleinchildrenseducationasschooleducation.,由于原语与目的语在句子语法结构上千差万别,翻译出来的句子的可读性可想而知。但它是机器翻译的最实质性的一步,是机器翻译从梦想到现实的一次飞跃。,基于规则的机器翻译系统之转换系统,为了提高译文的可读性,人们更多的从句子的层面来分析处理原语与目的语的特征。于是在直接翻译系统之上,出现了机器翻译的转换系统。,基于规则的机器翻译系统之转换系统,通常包括:分析、转换和生成三部分其中从原语向目的语的转换是该系统的核心。这种方法被认为是模拟人类翻译活动最恰当的机制。,机器翻译的三个阶段,1957年,美国学者V.Yingve提出了翻译的三个阶段,即:1、用代码化的结构标志转换为目的语句子结构标志(分析阶段)2、把原语句子的结构标志转换为目的语句子的结构标志(转换阶段)3、有目的语句子结构都标志生成目的语句子(生成阶段),个人见解,SL表层结构,我,爱,你,SL深层分析,5,2,0,TL深层结构,TL表层结构,Five,Two,Zero,I,Love,You,分析,转换,生成,三阶段的新诠释,法国人B.Vouquois将三阶段诠释为六个步骤,分析,转换,生成,原句词法,原句句法,双语词法,双语句法,目的语句法,目的语词法,奈达对翻译过程的诠释,奈达根据乔姆斯基的“转换生成语法”做的诠释,SL表层结构,SL深层结构,转换,TL深层结构,TL表层结构,分析,生成,机器翻译中,从原语(SL)句子的表层结构到其深层结构需要经过词法、句法、语义等分析。性层的深层结构是一种树(syntaxtree)。它反映的事一个句子内部的语法结构,这种结构认为是人类抽象思维的逻辑表达式。不同的语言具有相同或相似的深层结构。就像是一座桥梁,把人类不同的语言连接恰来,使彼此可以翻译交流。,问题:这两种诠释有什么相似之处?,基于规则的机器翻译系统之中间语翻译,自然语言大多一个单词有多种意思,比如,中文的“方便”二字就有很多不同的意思,容易产生歧义。在机器翻译中,为了简化纷繁的表达结构,避免其含糊不清的语言现象,独立于各种自然语言,同时又能清晰准确地表达各种自然语言的人造计算机语言英语而生。这种人造计算机语言就是中间语(interlingua,IL),基于中间语的机器翻译原理就是不同语言之间建立一个通用的语义-句法表达式,如图所示:,SL,中间语表达式,TL,SL词典和语法库,SL词典,TL词典和语法库,合成,分析,个人见解,货币的本质是一种等价物,那意味着所有的物品都可以用货币去衡量,就相当于一种中间语,用货币比喻如图:1000RMB=一头牛100欧元=一个花瓶1000RMB=100欧元=1货币在这个比喻中,虽然不能把一头牛直接等价于一个花瓶,也不能直接把1000RMB直接等价于100欧元,但是它们都有相同的等价物1货币,这1货币就是它们之间的桥梁,它们可以互相交换。这就和中间语的功能是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论