全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器翻译及其问题浅析摘要:由于信息技术高速发展,国际交流日益频繁,如何克服语言障碍已经成为国际社会共同面对的问题,而人工翻译的方式已经远远不能满足需求。利用机器翻译协助人们快速获取信息已成为必然趋势,但机器翻译仍存在一些影响译文可读性和准确性的问题。本文将简单介绍机器翻译并对常见问题进行浅析。关键词:机器翻译 问题 语法 应用一、引言机器翻译(Machine Tanslation,简称MT),又称自动翻译,是利用计算机来进行不用的自然语言之间的翻译,它是自然语言处理 (Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding) 之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科,也是信息时代语言应用的一个重要领域。二、机器翻译的简介(一)机器翻译简史人类在近代就萌发了机器翻译的梦想,但是真正把设想付诸现实还是因为计算机的诞生和计算机技术的发展。机器翻译的研究历史课追溯到20世纪四五十年代。1946年第一台现代电子计算机ENIAC诞生,同一年,美国科学家韦弗(W. Weaver)和英国工程师布斯(A. D. Booth) 在讨论电子计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。1949年,韦弗(W. Weaver)发表翻译备忘录,正式提出机器翻译的思想。经过六十年的曲折发展,到目前互联网的普遍应用,以及人们对翻译需求的迅猛增长,给机器翻译带来新的发展机遇。我国相继推出了一系列的机器翻译软件如“译星”、“雅信”、“通译”、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。(二)机器翻译的主要方法机器翻译的过程一般可简化为三个阶段:原文分析、原文译文转化和译文生成。表象上,机器翻译的核心问题是翻译的准确性;实质上,体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面,机器翻译系统可分为基于规则( Rule-Based )和基于语料库(Corpus-Based)两大类。基于规则( Rule-Based )就是由词典和语法规则库构成翻译知识库。尽管语言学家经过长期努力创建了含有成千上万条规则的规则库,覆盖了相当大范围的语言现象,但却难以应付现实世界中复杂多变的语言现象。基于语料库(Corpus-Based)则是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库。语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。基于语料库的方法使翻译质量有所提高,但建立一个完善的语料库需要投入巨大的人力和物力。不过在一个受限的领域内,该方法是非常有效的。三、机器翻译存在的问题众所周知,英汉两种语言之间的差异明显大大超过了西方各语言之间的任何差异,英汉机器翻译的难度也就可想而知。尽管与多年前相比,机译的速度和质量已明显提高,但与人工翻译相比,机译的译文还达不到百分之五十的准确率和可读性。除了机器翻译的译文比较生硬,机器味过浓,在翻译过程中存在一些影响译文的典型问题。下面就某些常见问题加以举例说明:(一)词义辨析错误英语中一词多义现象非常普遍,一个词在与不同的词语搭配时具有不同的词义。人工翻译会根据语境来选择,而机器翻译还达不到通过语境来判断语义,通常是根据该次的第一个词义来进行翻译,这就容易出现一些选词不当或错误的翻译结果。例如:Have you ever operated a computer?机译 你曾经运转过一种计算机吗?人译 你操作过计算机吗?(二)词类判断错误英语中有很多词是有多种词性的,如“do”和“have”等既可以用作实义动词,也可用作没有意义的助动词,但计算机往往会当成实义动词来译。特别是那些形式上与谓语动词相同,而实际上是作定语或状语的分词,也会当作动词来处理。例如:Telescopes are housed in large building called observatories.机译 望远镜是坐落在大建筑物调用天文台。人译 望远镜安置在高大的建筑物即天文台上。(三)冠词的取舍汉语中没有冠词,而英语中的冠词有时候相当于汉语中的指示代词“这”、“那”、“该”等,但并非所有的冠词都需要译出来。因而如何把握就成了机器翻译的难题,就会出现表达不当的情况:Welcome to the world of computer telecommunications.机译 欢迎您到该计算机的世界远程通信来。人译 欢迎来到计算机电信世界。(四)状语和定语的位置计算机目前还无法根据状语、定语等在句中的修饰关系,灵活准确地处理状语和定语等在汉语中恰当的位置,因而在机译中常常会有不符合汉语表达习惯的情况出现,如:Electrons revolve about the nucleus at tremendous speed.机译 电子围绕该核心以巨大的速度旋转。人译 电子绕原子核高速旋转。(五)所有格的判断英语中的名词所有格“s”的形式与系动词“is”的缩写“s”形式相同,所以机器在翻译时常常将两者混淆,如:What is the temperature at the suns center?机译 该温度在太阳是中心是什么?人译 太阳中心的温度是多少?以上所列只是某些简单句子通过机器翻译表现出来的,反映出了一些具体问题,但具有一定局限性。由于英语的语法现象较多,特别是在从句中,所以还有很多机器翻译容易出现的问题尚未列出,如介词短语和定语从句的辨析错误、丢失主句的主语、时态表达不正确等。四、正确使用机器翻译机器翻译的译文质量不应该用出版物的质量标准还衡量,其从某种程度只能够传达原文的内容,我们应降低对机器翻译的译文质量的接受值。通常从使用目的来看,法国机器翻译专家将其分为四种:(一)用于浏览的机器翻译(For the watcher,简称MT-W):用于愿意接受粗糙的译文,也不愿一无所获。(二)用于修改的机器翻译(For the reviser,简称MT-R):目的在与给客户提供草稿,以便用户修改。(三)用于翻译的机器翻译(For the translator,简称MT-T):机器翻译系统为翻译人员提供在线词典、参考译文的实例,帮助翻译人员进行翻译。(四)用于作者的机器翻译(For the author,简称MT-A):作者在翻译时,由机器翻译提供译文中可能产生的歧义,以便得到更好的译文。这四种类型实际上也反映了机器翻译发展的不同阶段,随着机器翻译技术的发展,机器翻译从开始只能翻译简单的句子,到现在翻译整篇的文章,从一小时翻译几千字,到现在几十万字,已有了巨大的发展和提供。机器翻译在处理专业性强、数量大的技术资料和论文等有相当的优势。我们应对其持肯定态度,相信其正确率和可读性会越来越高。机器翻译是科技发展的趋势,它提高了翻译的效率,满足了翻译需求,我们应积极正确地利用机器翻译,更好地服务工作和生活。参考文献1 冯梅. 英汉科技翻译. M. 哈尔滨:哈尔滨工业大学出版社,20002 冯志伟. 机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东白云学院《有机化学Ⅰ(上)》2024-2025学年第一学期期末试卷
- 汕尾职业技术学院《商业策划与项目管理》2024-2025学年第一学期期末试卷
- 上海电力大学《教育技术与应用能力训练》2024-2025学年第一学期期末试卷
- 高血压急症护理要点与药物治疗方案
- 心脏外科冠心病冠脉搭桥术后护理管理手册
- 泌尿系结石预防指南及管理策略
- 骨折急救处理方案
- 放射性碘治疗甲状腺癌监测方案
- 急诊科脑卒中监护措施
- 2025年检验类之临床医学检验技术(师)每日一练试卷B卷含答案
- 生产良率管理办法
- 消防员涉赌涉贷课件
- 旅行社安全生产工作会议记录
- 喂饭机器人设计
- 护士条例培训课件
- 2025年中国企业家健康绿皮书
- 水厂安全生产培训课件
- 确有专长针灸题库及答案
- 2025版《农机专业合作社事故隐患内部报告奖励制度》修订版
- 年产5万吨乙酸乙酯生产工艺毕业设计
- 化粪池平时管理制度
评论
0/150
提交评论