机器翻译和计算机辅助翻译.ppt_第1页
机器翻译和计算机辅助翻译.ppt_第2页
机器翻译和计算机辅助翻译.ppt_第3页
机器翻译和计算机辅助翻译.ppt_第4页
机器翻译和计算机辅助翻译.ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器翻译和计算机辅助翻译 MT CAT邵白杨刘洋刘娜邓雯马雪 机器翻译 机器翻译 MachineTranslation 又称为自动翻译 是利用计算机把一种自然源语言转变为另一种自然目标语言的过程 它是自然语言处理 NaturalLanguageProcessing 的一个分支 与计算语言学 ComputationalLinguistics 自然语言理解 NaturalLanguageUnderstanding 之间存在着密不可分的关系 一 机器翻译简史 机器翻译的研究历史可以追溯到20世纪四五十年代 学界一般将其划分为如下四个阶段 1 开创期 1946 1964 1954年 美国乔治敦大学 GeorgetownUniversity 在IBM公司协同下 用IBM 701计算机首次完成了英俄机器翻译试验 向公众和科学界展示了机器翻译的可行性 从而拉开了机器翻译研究的序幕 中国开始这项研究也并不晚 早在1956年 国家就把这项研究列入了全国科学工作发展规划 课题名称是 机器翻译 自然语言翻译规则的建设和自然语言的数学理论 1957年 中国科学院语言研究所与计算技术研究所合作开展俄汉机器翻译试验 翻译了9种不同类型的较为复杂的句子 从20世纪50年代开始到20世纪60年代前半期 机器翻译研究呈不断上升的趋势 2 受挫期 1964 1975 1964年 为了对机器翻译的研究进展作出评价 美国科学院成立了语言自动处理咨询委员会 AutomaticLanguageProcessingAdvisoryCommittee 简称ALPAC委员会 开始了为期两年的综合调查分析和测试 1966年11月 该委员会公布了一个题为 语言与机器 的报告 简称ALPAC报告 该报告全面否定了机器翻译的可行性 并建议停止对机器翻译项目的资金支持 这一报告的发表给了正在蓬勃发展的机器翻译当头一棒 机器翻译研究陷入了近乎停滞的僵局 无独有偶 在此期间 中国爆发了 十年文革 基本上这些研究也停滞了 机器翻译步入萧条期 3 恢复期 1975 1989 进入70年代后 随着科学技术的发展和各国科技情报交流的日趋频繁 国与国之间的语言障碍显得更为严重 传统的人工作业方式已经远远不能满足需求 迫切地需要计算机来从事翻译工作 4 新时期 1990 现在 随着Internet的普遍应用 世界经济一体化进程的加速以及国际社会交流的日渐频繁 传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求 人们对于机器翻译的需求空前增长 机器翻译迎来了一个新的发展机遇 国际性的关于机器翻译研究的会议频繁召开 中国也取得了前所未有的成就 相继推出了一系列机器翻译软件 例如 译星 雅信 通译 华建 等 机器翻译当前存在的两大突出问题 一 尚无法做到确认不同讲话人的等值语音 二 在处理语义的组成部分上 仍有问题 三机器翻译的推动作用 推动社会的进步人类想尽一切办法研制并完成了一个一个的机器翻译系统 开发了一个一个的翻译软件 推动了经济的发展 社会的进步 消除了世界人与人之间的语言障碍 沟通了整个世界 促进了交流 加快了全球化进程 提高翻译效率随着机器翻译研究水平不断提高 翻译领域也取得了前所未有的成就 在我们的翻译工作中 我们可以借助各种翻译系统或软件完成翻译任务 这样可以提高翻译的速度和准确度 提高了翻译工作的效率 促进其他领域发展机器翻译涉足数学 计算机科学 语言学 翻译学等多门学科领域 需要这些学科强劲的发展 丰厚的成果作基础 从而促进了这些领域的发展 四机器翻译的前景 1 用计算机分析语言将在处理语言材料方面带来重大变革2 计算机将使我们重新获得控制现有各种语言中所可利用的大量情报的能力3 机器翻译的研制成功 必将快速排除交流情报的障碍 计算机辅助翻译 计算机辅助翻译 Computeraidedtranslation CAT 类似于CAD 计算机辅助设计 能够帮助翻译者优质 高效 轻松地完成翻译工作 它不同于以往的机器翻译软件 不依赖于计算机的自动翻译 而是在人的参与下完成整个翻译过程 与人工翻译相比 质量相同或更好 翻译效率可提高一倍以上 CAT使得繁重的手工翻译流程自动化 并大幅度提高了翻译效率和翻译质量 计算机辅助翻译是一个广泛的和不精确的术语 涵盖了一系列的工具 从非常简单到更复杂的 主要功能 在翻译过程中 存在着大量重复或相似的句子和片段 采用人工笔译哪怕是最简单的句子 也需要书写一遍 CAT技术具有自动记忆和搜索机制 可以自动存储用户翻译的内容 当用户翻译某个句子时 系统自动搜索用户已经翻译过的句子 如果当前翻译的句子用户曾经翻译过 会自动给出以前的翻译结果 对于相似的句子 也会给出翻译参考和建议 CAT是一个具有自学习功能的软件 它会随着用户的使用 学习新的单词 语法和句型 为用户节省更多的时间 CAT还配有增强工具CAM ComputerAidedMatch 可将用户以前翻译过的资料转换为可以重复使用的记忆库 这样 用户就无需重复以前的劳动 从而提高翻译速度和准确性 核心技术 CAT技术的核心是翻译记忆技术 当翻译在不停地工作时 CAT则在后台忙于建立语言数据库 这就是所谓的翻译记忆 每当相同或相近的短语出现时 系统会自动提示用户使用记忆库中最接近的译法 用户可以根据自己的需要采用 舍弃或编辑重复出现的文本 辅助功能 对于CAT技术来说 另一个重要组成部分则是术语管理 广义的说 翻译中出现的任何词汇 如果有重复使用的必要 都可以作为术语进行保存 保存的术语集合则成为术语库 术语库也可以重复利用 不仅仅是在本次翻译 还可以在以后的项目或其他人的翻译工作中重复使用 不但提高工作效率 更重要的是解决翻译一致性问题 当前的翻译机构必须倚重翻译技术 越来越多的大中型翻译机构要求加盟的专职和兼职译员掌握诸如Trados Wordfast等主流的TM软件 计算机辅助翻译基本过程 词汇复用 系统提供大容量的专业词库 为用户节省查词典的时间 可自动进行词频记忆并按词频排序 用户只要点击鼠标或按快捷键即可完成句子翻译 句子复用 采用先进的翻译记忆 TM 技术 把用户翻译的原文句子和译文自动记忆到数据库中 翻译过程中 通过搜索引擎 自动查找记忆库 对需要翻译的内容进行快速分析 对比 保证相同的句子永远不要翻译第二遍 模糊匹配复用 一旦发现与记忆库中例句相同或相似的句子 将根据与原文的匹配情况 系统自动给出翻译建议 用户可选择自动匹配替换 直接得到翻译结果 避免重复性劳动 提高工作效率 片段复用 如果当前翻译的句子与记忆库中例句有相同的片段时 系统会给出提示 作为翻译时的参考 翻译项目管理 项目管理是多语翻译和多语软件本地化项目的关键因素 术语词库准备 在翻译开始之前 项目经理准备术语词库和例句库 由同一项目中的所有翻译者共享 术语词库准备可大大影响项目的成本 还可以统一用词和相同句的译法 材料接收和完成 翻译者收到项目经理所发来的需翻译的材料和术语词库 就可用翻译软件打开文件 进行翻译 翻译时 翻译者可使用翻译记忆和术语词库 并不断的把新的语言片断加入到翻译记忆中 也不断把新的术语词汇加入到词库中 翻译完成后 翻译者以目的语言代替源语言 建立一个与源语言文件布局完全一致的目的语言文件 再通过电子邮件的形式 发送给项目经理 随着全球经济的发展和各国之间交流的增多 对语言翻译的需求将会进一步增加 在这样的背景下 如何更加高效 高质的处理语言转换已经成为众多机构和公司共同关心的问题 计算机辅助翻译技术正是在这种背景下应运而生 它能够帮助翻译者优质 高效 轻松地完成翻译工作 前景 翻译产业化的重要途径就是翻译信息化 CAT技术的研究 就是为了适应现代计算机技术在语言转换 国际交流 本地化 国际化以及翻译领域中的发展和应用 但这一能够使学生面对市场 面对竞争

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论