机器翻译课件_第1页
机器翻译课件_第2页
机器翻译课件_第3页
机器翻译课件_第4页
机器翻译课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器翻译机器翻译机器翻译,也称为“计算机翻译”,就是利用计算机进行翻译,它表示把一种自然语言生成另一种自然语言的计算机系统;或者说,机器翻译就是利用计算机实现从一种自然语言文本,到另一种自然语言文本的翻译。机器翻译原理刘宓庆:人工翻译从解码到换码的过程第一阶段:理解第二阶段:表达SL信息系统SL概念系统TL概念系统TL信息系统

机器翻译原理分析转换生成机器翻译的四个主要阶段基于规则的机器翻译基于统计的机器翻译基于实例的机器翻译基于不同方法应用的机器翻译机器翻译的特征自动化:速度是人工翻译速度的5-6倍;不受工作时间限制。机械性:根据韩礼德系统功能语言学,语言一般表达概念意义、语篇意义和人际意义。机器翻译能较好的翻译源语文本的概念意义和语篇意义,再现人际意义差强人意。以句子为翻译单位:机器翻译以句子为基本的翻译单位。二度募仿:指机器翻译所完成的目的语文本既是源语文本的再现,也是双语对齐语料库所体现的双语词汇和语句对应关系的再现。语境制约有限:语境可分为语言语境、情境语境和文化语境。机器翻译只受制于词汇和语句层面的语言语境。人工翻译是机器翻译的基础;机器翻译可以协助解决人工翻译所遇到的困难。机器翻译的译后编辑和译文润色需要依靠人工翻译;机器翻译和人工翻译可以进行合理分工,承担不同层次或者不同性质的翻译任务。(机器翻译更适用于特定领域的程式化文本或信息化文本的翻译)机器翻译与人工翻译:相辅相成,相互促进机器翻译的成就、困境和未来

电子词典的技术日趋成熟;翻译机可以进行单句翻译,把英语句子和短语翻译成参考性极高的汉语句子和短语;语音识别的机器翻译也取得了阶段性的突破。但是,机器翻译的成功只是局部的、有限的、浅层次的,只是在机助人译、人助机译、受限语言、子语言方面取得了成功。机器翻译的成就、困境和未来翻译本身的复杂性:机器的工作原理建立在二值逻辑的基础上,即“非此即彼”,没有思维、判断和推理能力。自然语言的复杂性:歧义是自然语言中普遍存在的现象,MT面对的难题是词义消歧,多义识别机器自身的局限性机器翻译的成就、困境和未来语言学理论的发展大规模语料库的建成完善的文字处理的语言知识库的建立更有效的机器翻译方法的实现解开人类大脑认知机制的“黑箱”计算机技术的进步和人工智能的突破

全自动、高质量的机器翻译机器辅助翻译机器辅助翻译,即机器辅助人工译者进行翻译,亦称为计算机辅助翻译,是一种人机交互翻译。其工作原理是:用户利用已有的原文和译文,建立起一个或多个翻译记忆库、术语库,在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、短语、术语),给出参考译文,译者可以避免无谓的重复劳动,只需专注于新内容的翻译,从而提高效率和质量。机器辅助翻译与语料

在计算机辅助翻译技术中,对翻译质量产生深远影响的是基于翻译记忆的“平行语料库”建设,各种单语语料库和双语平行语料库相继建立。双语平行语料库是将原语文本及其译语文本进行检索并对照显示的语料库。双语对齐可在篇章级、段落级、句子级、子句级、短语级、词汇级等多种级别进行。机器辅助翻译的利与弊积累越多,翻译越快协同翻译,资源共享翻译术语的一致性审核与翻译同步,即时修改格式一致开放的语料库管理机制节约翻译成本,提高翻译质量有助于提高翻译教学和研究的质量机器辅助翻译的利与弊前期投入大相似度匹配不完善翻译记忆有限格式不统一个人主观能动性不能尽情发挥网络翻译以网络为操作和传输的平台而进行的翻译活动及其活动成果,具有开放性、互动性、快捷性、共时性和一定的局限性。AI时代译者技术应用能力信息技术应用能力翻译技术应用能力翻译管理技术的应用能力NLP里程碑式突破:首个媲美人类专业译者的机器翻译系统

微软昨天(2018年3月14日)宣布其研发的机器翻译系统首次在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破。这次微软的翻译系统是在数据集WMT-17的新闻数据集newstest2017上取得了上述成果。WMT是机器翻译领域的国际顶级评测比赛之一。WMT数据集也是机器翻译领域一个公认的主流数据集。其中,newstest2017新闻报道测试集由产业界和学术界的合作伙伴共同开发,包括来自新闻评论语料库的约332K个句子对,来自联合国平行语料库的15.8M个句子对,以及来自CWMT语料库的9M个句子对。

在这篇有24位作者的论文《机器翻译:中英新闻翻译方面达到与人类媲美的水平》(AchievingHumanParityonAutomaticChinesetoEnglishNewsTranslation)中,微软研究团队描述了他们为新闻汉英翻译任务在规模数据集上实现人类水平所作的努力。

微软亚洲研究院机器学习组将他们的最新研究成果——对偶学习(DualLearning)和推敲网络(DeliberationNetworks)应用在了此次取得突破的机器翻译系统中。其中,对偶学习利用的是人工智能任务的天然对称性。当我们把训练集中的一个中文句子翻译成英文之后,系统会将相应的英文结果再翻译回中文,并与原始的中文句子进行比对,进而从这个比对结果中学习有用的反馈信息,对机器翻译模型进行修正。

而推敲网络则类似于人们写文章时不断推敲、修改的过程。通过多轮翻译,不断地检查、完善翻译的结果,从而使翻译的质量得到大幅提升。“我们在深度学习和自然语言这两者中间找到了一个平衡点,我们想通过对机器翻译的研究,从自然语言的角度对机器学习做进一步的理解,找到一些直觉,再通过这个直觉反过来影响机器学习研究的路线,走出盲目尝试的状态。”微软亚洲研究院副院长、机器学习组负责人刘铁岩说。基于之前的研究积累,自然语言计算组在此次的系统模型中增加了另外两项新技术:联合训练(JointTraining)和一致性规范(AgreementRegularization),以提高翻译的准确性。联合训练可以理解为用迭代的方式去改进翻译系统,用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。一致性规范则让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。这次使用的技术,从对偶学习(DualLearning)、推敲网络(DeliberationNetwork)到一致性规范(AgreementRegularization),都属于神经机器翻译(NMT)方法。

AmongthetranslationtechnologiesusingArtificialIntelligence(AI)developedbyMicrosoft,itbecameclearthattheleveloftechnologytotranslateChineseintoEnglishhasreachedthelevelequivalenttothatofhumantranslators.Thisresultisconfirmedaftercheckingthecontentsbymultipleagenciesandexperts.

ResearchersbelongingtoMicrosoft‘slaboratoriesinChinaandtheUSconfirmedonMarch14,2018thattheChinese-to-Englishtranslationsystemtheydevelopedhastheaccuracyandqualitycomparabletohumanability.Weannouncedthatitwasdone.Translationdonebythissystemisoftenusedtoconfirmtranslationqualitynewstest2017.Wereceivedtheevaluationbyaseriesoftestscalled"ResearcherConference"heldintheautumnof2017"WMT17itwasannouncedin.

MicrosoftTranslationresultisaccurateandcomparabletothatofahumantranslator,anexternaltranslationevaluatorisappointedtocomparethecontentsoftranslationbyAIandtranslationpreparedseparatelybytwotranslators.IthasbeenconfirmedthattheaccuracyandtranslationqualityofAItranslationisatalevelcomparabletothatofhumanbeings.

AtMicrosoft,XuedongHuang,atechnicalfellowwholeadsresearchonspeech,naturallanguageandmachinetranslation,saidaboutthisachievement,"Ithasbeenourdreamtoachievethesamequalityashumansinmachinetranslation.Inevereventhoughtthatitcouldberealizedquickly,"hesaysthatitisamajormilestoneintranslatingthemostdifficultlinguisticprocessingtask.Mr.Huangalsosaid,"

Thepursuitofpursuingapurposeofremovinglanguagebarrierandachievingbettercommunicationiswonderful,itisafruitfulthing,"hesays,andexpectationforAItranslationtechnologytotakeawaylargebarriersIhavedeclared.Effortstoincreasethelevelofmachinetranslationtothesamelevelashumanbeingshasbeenongoingfordecades,anditsrealizationhasbeenthoughttobeahead.AlthoughthetechnicalleveloftranslatingChinesenewssentencesintoEnglishwasconfirmedthistime,ontheotherhand,therearealsosomeremainingissues.MingZhou,whoisamemberoftheresearchteam,saidthatwhileitisimpossibletohidetheexcitementoftheresultsthistime,therearestillplentyofmountainstobecleared,suchasrealtimenewstranslationtechnology.

Mr.ArulMenezes,co-founderandchiefofMicrosoft'smac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论