



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语言技术研究 机器翻译与计算机辅助翻译比较分析 梁三云 扬州大学 外国语学院英语系 江苏扬州 225009 摘 要 机器翻译 MT Machine Translation 和计算机辅助翻译 CAT Computer Aided Transla2 tion 是两个既有联系又有本质区别的概念 本文首先回顾了机器翻译的历史 系统比较了机器翻译和 计算机辅助翻译在设计理念 应用范围以及翻译引擎三个方面各自的特点 得出了两者都有各自的优 势 在发展上不能厚此薄彼的结论 关键词 机器翻译 计算机辅助翻译 翻译记忆 中图分类号 H319 3文献标识码 A文章编号 100125795 2004 062004220004 MT or CAT That Is the Question L IAN G San2yun Foreign Languages College Yangzhou University Yangzhou Jiangsu 225009 China Abstract Machine Translation and Computer Aided Translation are two concepts interrelated with each other yet different in nature This paper reviewing the history of Machine Translation and systemati2 cally comparing the respective features of MT and CAT in the concept of design the scope of application and the translation engine concludes that both of them retain their own advantages and that we should not favor one more than the other in development Key words Machine Translation Computer Aided Translation Translation Memory 从古希腊时代起 人们就梦想着用机器翻译语言 可直到1903年 古图拉特 Couturat 和洛 Leau 在 通 用语言的历史 一书中才第一次提出了 机器翻译 德 文是ein mechanisches Uebersetzen 这个术语 而世界 上第一次真正意义的机器翻译试验是1954年美国乔 治敦大学在国际商用机器公司 IBM公司 的协同下 用IBM2701计算机 把几个简单的俄语句子翻译成英 语 没过多久 刚刚经历了萌芽期的机器翻译就遭当 头棒喝 1966年 美国科学院成立的语言自动处理咨 询委员会 Automatic Language Processing Advisory Committee 简称ALPAC委员会 调查了机器翻译的 研究情况 并发表黑皮书 语言与机器 翻译和语言学 中的计算机 简称ALPAC报告 对机器翻译采取否 定的态度 使得机器翻译出现了一片萧条 直到20世 纪70年代 机器翻译才出现了复苏的局面 到目前 虽然机器翻译历经了70多年的研究 机译的译文质量 确实还是不能令人满意 以至于近来有人说 MT 不 是machine translation的缩写 而是mad translation 疯 子的翻译 的缩写 Snell2Hornby也表达了她对机器 翻译的看法 毫无疑问 技术的产物 无论怎么复杂 都不能和人脑的创造能力相媲美 Snell2Hornby 1988 1995 66 机器翻译遭遇了难以克服的技术障碍 似乎走到了山穷水尽的地步 在这种情况下 采用翻 译记忆 translation memory 技术的计算机辅助翻译系 作者简介 梁三云 19662 男 硕士 讲师 研究方向 翻译理论研究与应用语言学 收稿日期 2004202209 24 第100期 2004年12月 外语电化教学 ETFL T No 100 Dec 2004 统 又称翻译工作站 workbench 应运而生了 翻译记 忆软件除了提供一般的翻译记忆功能以外 还可提供 文件格式的分解与合成 术语库管理 翻译项目管理 语料库加工与对齐等一系列辅助翻译工具 1 机器翻译 机器翻译 machine translation 又称机译 MT 是利用计算机把一种自然语言转变成另一种自然语言 的过程 用以完成这一过程的软件叫做机器翻译系 统 机器翻译所依赖的自动翻译技术包括语音翻译和 文字翻译 主要的关键技术有四个方面 单词分析 语 法分析 意义分析和文理分析 它的工作过程是 先把 语句分成各个单词 通过存放于机器数据库内的电子 字典查清词义 根据语法规则分析语句的意思 并把它 变换成概念构造 然后借助语言模型生成目标语言 其中 语言模型即是原语言和目标语言间的中间语言 各种语言通过它可译成另一种所需语言 如果配上双 向翻译软件 自动翻译系统就能翻译多种语言 机器翻译的实现技术原理主要有两大分支 基于 语法分析和基于语料库 1 所谓基于语法分析的技术就是对源语言语句 的词法 语义 语法和句法进行分析并进行判断和取 舍 然后重新进行排列组合 最后生成目标语言 这一 系列过程均是模仿人脑进行翻译的过程 尽管计算机 具有良好的存储记忆和执行功能 但它却缺少良好的 思维功能 而人类的翻译工作恰恰是一种极其复杂的 逻辑思维过程 要解决这一矛盾就必须将输入计算机 的语言公式化 规则化 规则设计的实质是寻找一种 规则描述语言 用于描述自然语言 使其能被计算机 处理 陈光火 1999 42 由于自然语言具有灵活性 复 杂性和开放性等特点 规则的建立和完善是很难的 因 此目前用该方法作出的翻译软件 其译文的可读性不太 理想 该方法在机器翻译研究的初期占主导地位 2 基于语料库技术的工作原理是利用统计学和 概率方法建立一个包含各种句型的双语对照语料库 在翻译时 从语料库中抽取与输入句子相类似的例句 然后模仿例句来实现源语言与目标语言的转换 采用 这种技术能够得到可读性和准确性较好的译文 但这 种方法的难点在于庞大语料库构筑及其有效运行机制 的建立 这种技术目前已越来越受到重视并已在很多 产品的开发中得到应用 IBM的统计机器翻译模型 就是IBM公司Peter Brown等研究者按照这种方法 以英法双语对照加拿大议会辩论记录为双语语料库 开发了一个英法机器翻译系统 从他们发表的文章来 看 实验的结果相当不错 已经超出了传统的基于规则 的翻译系统 刘群 2002 27 30 2 机器辅助翻译 翻译记忆 TM 翻译记忆 TM Translation Memory 是 译者运 用计算机程序部分参与翻译过程的一种翻译策略 Shuttleworth 第二种主要 用于翻译原文经过简化的材料 第三种类型则需要译 者介入翻译过程之中 在人机对话中完成翻译任务 第 四种批处理型又称 词典易于更新式批处理型 该 类型的系统工作时先输入全部原文 由机器查阅词典 然后一次性产生全部译文 柯平 1995 49 最后一 种类型则是用来翻译所有输入机器的材料 当前 全 文翻译软件中的通用类软件占据了市场的绝大多数 国内的有 通译2000 金山快译 net2001等 前者可 以进行全文自动翻译 批量翻译以及交互式翻译等功 能 后者则注重互联网的翻译系统 网页和电子邮件的 翻译 增加了计算机 经贸 电子等专业词库 3 2 应用范围不同 从机器翻译的角度来看 日常翻译的材料主要可 分为以下6类 柯平 1995 47 文学作品 非文 学出版物 网页及计算机相关材料 法律文件 情报资料 文摘 文学翻译是 传达作者的全部意 图 即包括经过他深思熟虑的 也包括他无意识的意 图 即作者对在读者思想感情上产生艺术作用的全部 意图 斯米尔诺夫 见 苏联文学百科全书 翻译 辞条 转引自 谭载喜 1988 文学 翻译过程不是一个 简单的语码转换过程 而是一个极其复杂的心理过程 是一个非线性的波浪式前进的动态思维过程 王金 铨 2002 471 即使对于专业翻译工作者来说 文学翻 译也不是件容易的事 更何况是对于没有任何认知能 力的机器 笔者曾让机器试译了下面两句 1 The plant has been in operation for several weeks 2 The operation of this drug lasted two hours 机器译文分别为 1 植物生效几个星期了 2 这 药的操作持续了二个小时 正确的译文分别为 1 工厂已开工几个星期了 2 这种药的药效持续了两个小时 这两个句子的文学意味还不是很浓 若是真的让 机器来翻译小说 诗歌 结果可想而知 文学翻译的出 路还是在于机器辅助翻译 由译者占据主导地位指导 机器的翻译行为 而机器只为译者提供翻译记忆 片断 匹配 术语统一的服务 非文学出版物的机器翻译一 直在进行 产品说明书 天气预报等一些基于专业语料 库的材料的翻译效果还是不错的 例如 蒙特利尔大 学研制的英法翻译系统进行天气预报的自动翻译 多 年来每天自动翻译1 5002 000份天气预报材料 具有 很强的实用性 由于计算机的不断更新换代 网络技 术的日新月异 世界上有70 以上的网站都是用英文 编写的 而只有12 13 的网站是由汉语编写而成 的 互联网以及与计算机相关材料的翻译很大一部分 依赖机器翻译 机器翻译在这方面发挥着机器辅助翻 译所不能比拟的作用 据新浪网报道 微软在机器翻 译领域取得了重大突破 它研制的机器翻译软件不仅 仅局限于单字或单词的翻译 而是准确地提供短语级 译文 它甚至可以对文本进行总结 给出摘要和近似 的翻译 从而使用户不需要阅读 翻译整篇文章便可以 了解大概内容 这对很多对英语不是很熟悉的人们来 说不啻于一个福音 法律文件对措辞和术语的准确性 有着极高的要求 而拥有庞大的专业法律语料库的机 器翻译软件也能勉强胜任此类翻译 不过 最好还是 44 梁三云 机器翻译与计算机辅助翻译比较分析 采用人机互动的方式才能最大限度地避免不必要的麻 烦 机器辅助翻译在这方面也有着很大的潜力 情报 使用机器进行翻译是由来已久 包括美国中央情报局 和原克格勃在内的许多机构和组织都正致力于人工智 能的开发 力求研制出功能先进 复杂的翻译软件 处 理各种敏感的情报资料 美国空军每年要用机器翻译 1700万字的情报资料 情报人员关心的是翻译的可读 性的问题 再粗糙的翻译对于他们来说都是很有价值 的材料 3 3 翻译引擎不同 机器翻译软件更注重综合功能 要保证翻译效果 因此对语法库 专业词库等的要求较高 但机器辅助 翻译软件是通过句库自动匹配实现的 并不需要语法 而需要大量的资源库 即语料库 这主要由翻译专业 人员在使用过程中进行添加 以满足自己的需要 上 文已经全面介绍了机器翻译实现技术原理的两大主要 分支 基于语法分析和基于语料库 下面着重介绍机 器辅助翻译的翻译引擎 一般来说 机器辅助翻译的翻译引擎包括四个方面 1 在翻译过程中 翻译记忆软件会自动记忆翻 译结果 当译者再次进行翻译时 翻译记忆会搜索记 忆库 就当前句子与库中存在的翻译单元进行对比和 匹配 挑出系统设定值范围之内的翻译单元 作为参考 译文 如果译者设定的匹配值为60 则软件会给出 匹配值高于或等于此值的参考译文 译者可以选择接 受该译文 也可以做一些修改 修改后的新译文会自动 存入记忆库 供以后使用 2 支持网络共享记忆库功能 当多个译者进行 同一个翻译项目时 他们可以通过局域网共享一个翻 译记忆库 以国产雅信CAT翻译系统为例 它的网络 版内设网络共享记忆库的功能 这就使得整个翻译工 作组能够高效率地协同翻译 成员遇到已有翻译结果 的单词 词组 句子或片断时不需要重新翻译 只要参 照组内成员的翻译结果即可 这样也使得同一篇作品 内部的术语得以最大化的统一 3 术语管理功能 术语管理是TM软件翻译引 擎的另一个重要特点 几乎每篇文档都有很多的专业 术语 尤其是在科技翻译文献当中 术语的前后一致 性是编辑校对时的一个重要方面 我们时常可以在一 些出版的译著中看到一些前后不一致的术语翻译 使 得读者在理解时出现了上下文的脱节 极大地影响了 翻译的质量 翻译记忆软件中有一个术语管理工具来 规范所有的专业术语 译者只需一次性建立一个或多 个标准术语列表 翻译时 翻译记忆软件会自动识别出 那些字词或结构是已定义的术语 并且给出相应的术 语译文 保证术语的统一 例如 在塔多思 TRADOS 系统中有一个叫MultiTerm术语存放的工具 在翻译 时 Workbench 工作站 会搜索MultiTerm的数据库 如果该术语存在 它的翻译就会显示在Workbench的 窗口中 4 多语种间双向互译功能 由于翻译记忆实现 的是原文和译文的比较和匹配 因此 翻译记忆软件支 持多语种之间的双向互译 以全球最著名的翻译记忆 软件德国塔多思 TRADOS 为例 该公司的产品基于 UNICODE 统一字符编码 支持60多种语言 其中包 括对汉语 日语 韩语 阿拉伯语等双字节和双向语种 的支持 以上机器辅助翻译软件 CAT 的特点都是机器翻 译 MT 的翻译引擎中所没有的 但是 这并不说明机 器翻译就一定不如机器辅助翻译 这两种软件都有其 发挥各自重要作用的功能和领域 4 结论 尽管机器翻译存在着这样或那样的问题 它的译 作有时候还不能实现 信 达 雅 中的第一个标准 但 是它的易用性为人们提供了极大的方便 它所拥有的 网页
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届重庆市大渡口区化学九上期末综合测试试题含解析
- 知情同意告知培训
- 2026届新疆伊犁州名校化学九上期中经典试题含解析
- 2026届福建省福州市台江区化学九年级第一学期期中质量检测试题含解析
- 2026届内蒙古鄂尔多斯附属学校化学九上期中调研模拟试题含解析
- 2025年炉外精炼工职业技能考试题库及答案(完整版)
- 2026届山东省德州七中学九上化学期中经典试题含解析
- 2026届吉林省长春市第一五三中学九年级化学第一学期期中考试试题含解析
- 夫妻个人债务合同范本8篇
- 类第号上海证券交易所证券投资咨询协议
- 机电一体化设计
- 新教材教科版五年级上册科学 第二单元 地球表面的变化 单元全套课时练
- 职业发展与就业创业指导ppt课件完整版
- 挠度计算模板表格(自动版)
- (中职中专)财经法规与会计职业道德课件完整版电子教案
- 宝钢集团生产安全事故案例汇编
- DB37T 5151-2019 园林绿化工程资料管理规程
- Q∕GDW 11612.43-2018 低压电力线高速载波通信互联互通技术规范 第4-3部分:应用层通信协议
- 贝多芬F大调浪漫曲—小提琴谱(带钢伴谱)
- 压力传感器(课堂PPT)
- (施工方案)场地三通一平施工方案
评论
0/150
提交评论