




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
对google语言工具机器翻译系统的测试分析陶莹谭晓平一、关于测试对象和测试方法的说明1我们主要是对google语言工具这一机器翻译系统的翻译效果和能力进行测试分析。选择google语言工具这一机器翻译系统作为测试分析的对象有两个原因。一是google语言工具是免费的,比较方便。二是因为我们觉得google作为用户众多的搜索引擎,它引入的这个机器翻译的语言工具应该是更多的人接触和了解机器翻译的途径,那么它的翻译效果和能力直接影响人们对它的认识和接受。2测试内容:汉英翻译。3具体的测试方法:我们认为,源语言与目标语言语义的不完全对应、不同的语序和句式、实现语法功能和语用功能的不同方式是机器翻译在句子翻译层面需要面对和处理的不同层次的难点。对语义判断和语法功能判断处理的测试可以在句式分析处理的测试过程中部分实现,因此我们以有汉语特殊语法特征句式的测试分析为第一层次(语义测试分析在这一阶段同时完成),以含有特殊语法和语用功能的句子为第二层次。二、测试实例分析之句式分析1兼语句式测试语句A:他邀请那个漂亮的女孩看电影。 He invites that attractive girl to watch the movie.测试语句B:你不能强迫别人都在你这里吃饭。 You cannot force the others all to eat in your here.分析:我们选择了两个句子进行测试,认为翻译效果较好。在这里机器翻译用不定式来处理兼语式,但我们认为这是通过对词语层面的用法分析就可以达到的,因为在汉语中可形成兼语句的动词在英语中接第二个动词时都要带不定式。用英语中的不定式来对应汉语中的兼语式是在词语本身(使令性动词)的语义要求在两种语言中的表现。在B句中还存在语序和词义的问题。在汉语句子中的副词“都”语义指向是“别人”,那么英语句子中“all”应移到“the others”前面,而机器翻译对此未做调整。“在你这里吃饭”译为“eat in your here”按英语习惯把介词短语放在了动词后面,但是“in your here”显然是词对词的硬译,不合语法。2连动句式测试语句A:他穿上衣服推开房门走了。 He put on clothes shoves open the house door walks.测试语句B:大家听到这个消息都很高兴。Everybody hears to this news very to be happy.分析:我们选择了两个句子进行测试,认为翻译效果不好。第一,汉语的连动句式的特殊之处就在于几个动词语可以直接连用,不需要连词连接或用逗号隔开。而在英语中这是不合语法的。从A句的测试来看机器翻译没有把这种差别考虑进去并表现出来。第二,从B句来看,当汉语的连动式的后一谓词语是形容词语时,机器翻译把它处理成不定式形式,但是翻译后的句子与源句的焦点不同(源句的焦点是“很高兴”,而译后变成了“hear”)。也就是说,还未进入深层的语义分析。我们还可以看到A句“推开”(译为“shove open”)和B句“听到”(译为“hear to”)的补语翻译存在较明显的错误,这点在带补语句的分析中详细分析。3存现句测试句式A组:台上坐着主席团。主席团坐在台上。On sits the presidium. President 团坐 on.测试句式B组:路那边开过来一辆公共汽车。班里走了两个同学。Side road that opens comes one bus.In the class walked two schoolmates.分析:我们选择了两组句子进行测试,认为翻译效果不好。英语对应存现句的是“There be”句型,方位短语一般做状语。从A组句子看,机器翻译没有对主语是方位短语的情况做出区别处理(实际应该有做出判断的可能),因此不能对汉语的存现句做出相应的句式转换。从B组句子看,表示“出现”和“消失”的存现句也存在同样的问题。A组第二句还存在三音节词的切分问题,机器翻译优先双音节词,所以对多音节词往往出现切分错误。B组第一句还存在补语判断的问题,它没有把“过来”判断为补语,而是翻译成动词。4非谓谓语句测试语句A组:他男朋友一米八。鲁迅浙江人。妹妹大眼睛。His boyfriend one meter eight.Lu Xun Zhejiang person. Younger sister big eye.测试语句B组:这个问题我们已经解决了。This question we already solved.分析:我们选择了两组句子进行测试,A组是名词性谓语句,B组是主谓谓语句,翻译效果都不理想。从A组来看,机器翻译对名词性谓语句的翻译效果不好的原因在于它没有把英语必须有的动词性谓语补充出来。从B组来看,汉语中主谓短语做谓语的句子的主语是作为整个句子的主题,在语义上应是动词的宾语。但是机器翻译不能对此做出判断,而直接进行词对词的翻译。这同样是缺乏对原句的深层语义分析。5把字句测试语句:他把钥匙丢了。他丢了一把钥匙。He lost the key. He threw one key.分析:经过测试,我们认为把字句翻译得较好。我们认为像“把”这种比较容易标注的汉语特殊句式标志,机器翻译系统都能做比较好的处理。第二句我们测试作为量词的“把”,机器能够判断数词后面的“把”是量词,并按英语语法略掉汉语的量词(或者是基于实例的翻译系统,很容易得到“一把”这种数量关系实例)。对第二句的“丢”字可以有“丢失”和“抛出”两种解释,这里给出的是在此种语境下不常选择的“抛出”义。6被字句测试语句:她的秘密被发现了。她的秘密被人发现了。Her secret was discovered. Her secret was discovered by the person.分析:和把字句一样,被字句也翻译得较好。原因相同。两句的时态都被翻译成过去式,我们认为在此机器翻译中“了”被标注了过去式的时态信息。第二个句子我们把对于英语来说一般省略掉的无须指出的施事“人”加入,但是翻译结果没有省略掉。目的语的深层语义分析也不够,或者说无法实现。7多层定语句测试语句A:她穿着妈妈昨天买的那条漂亮的黄裙子。She puts on that attractive yellow skirt which mother yesterday bought.测试语句B:你上星期从图书馆借的那三本关于健身的畅销书还了么?You last week that three which borrowed from the library about the healthy body bestseller also?分析:从A句看,机器翻译注意了把汉语中的多层定语中的小句对应到英语中的定语从句,并以动词后面的“的”作为标志。但在翻译成的定语从句中,语序存在问题。它按照词对词的翻译,而未按照英文的惯用表达方式。B句考察的是主语的多层定语,翻译结果不理想。存在这样几个问题:第一,“还”(hun)的谓语身份没有判定出来,主要是因为把“还”当成副词的“还”(hi)。第二,仍是以动词后的“的”为标志把小句对应为定语从句,但是定语从句的先行词定位错误。第三,把“健身”这个词翻译成了两个词,可能它的词库中没有这个词。8带补语句测试语句A组:他切开了那个大西瓜。他把西瓜切成一片一片的。He cut open that big watermelon. He slivers the watermelon everywhere everywhere.测试语句B组:他高兴得跳起来。她激动得哭了。He is happy jumps.She was excited cries.测试语句C组:他生于1980年。海南省位于中国最南部。He had been born in 1980. Hainan Province locates China most south.分析:我们对三组不同形式的带补语句进行了测试,认为带补语句对机器翻译是个大难点,翻译效果不好。因为补语是汉语独有的成分,而且非常灵活,不易进行判断和处理。A组是单个动词+补语的形式,对于没有补语成分的英语来说,大部分情况这种补语是无须译出的,但难点在于对补语的判断,如A组的两个句子中的“切开”“切成”,对机器翻译来说是很难判断出这是单个动词+补语的组合,在翻译中的处理方式,一是把它当成两个动词(如把“切开”译为“cut open”),一是把它处理为一个动词(如把“切成”译为“sliver”)。B组是有补语标志“得”的句子,翻译得仍不好。这两个句子的补语都是谓词性的,在英语中大致可以对应为“sothat”固定格式,但机器翻译直接把它们并列为两个谓语成分。C组是含有表示时空概念的补语成分的句子,句子翻译得比较正确。我们认为这应该是基于对“于”这个标志分析较好(或者说是基于实例的机器翻译很容易得到“生于”和“位于”这样的翻译实例)。9、歧义切分和同形异义测试语句A:中国家用电器市场竞争激烈。父母亲自送我上学。The Chinese domestic electric appliances market competition is intense. The parents personally deliver me go to school.测试语句B:你今天吃早点了吗?明天你早点儿来。You have today eaten earlier?Tomorrow you earlier will come.他们聊得很投机。他靠投机发了财。They chat very congenially. He depended on congenially sends the wealth.分析:下面再补充两个有关语义的测试,一是歧义切分,二是同形异义词。A组是对两个交集型歧义的句子的测试。结果这两个句子都切分正确,因为在这两个例子中都是几个双音节词连用,这对于机器翻译来说是最优先的。A组中第二个句子中“送”字的翻译有误。我们发现,对单音节词特别是义项丰富的单音节动词翻译错误率较高,它往往选择最常见义来翻译。B组是对两个同形异义词“早点”“投机”在不同句子中机器翻译对义项选择的测试。测试结果表明,机器翻译对同形异义词的处理与对多义词的处理类似,都是选择翻译这个词的高频义项。如在测试句中把“早点”都译为“earlier”,把“投机”都译为“congenially”。二、翻译实例分析之功能分析1用“是”表示强调的句子测试语句:是你告诉他这个事情的吗?我是昨天回北京的。Is you tells him this matter? I was yesterday return Beijing.分析:这是两个用“是”来形成强调的句子,但是机器翻译没有对“是”只是强调标志的情况作区别分析。所以都把“是”译成了“be”,而且都完全是词对词的翻译。2表示否定的句子测试语句:我今天晚上不吃饭了。我今天晚上没有吃饭。I today evening do not eat.I today evening do not have eating.分析:在汉语中“不”和“没有”分别表示主观上和客观上的否定。机器翻译没有表现出这种区别。另外,“今天晚上”翻译成“today evening”,而这本来在英语中可用一个词来对应。“没有吃饭”翻译成“do not”“have”“eating”,可见都是词对词的翻译。3“了”特殊语用功能测试语句A组:我在北京住了三年。我在北京住了三年了。I lived three years in Beijing. I lived three years in Beijing.测试语句B组:都大姑娘了。今天星期五了。All girl of marrying age. Today Friday.分析:“了”是汉语中语法和语用功能非常活跃的虚词。我们对 “了”含有深层语用意义的句子进行测试,机器翻译基本不能对此做出判断。A组中对两个句子的翻译结果完全一样,没有体现出因为第二个“了”而带来的语义上的差别。我们推测,在机器翻译中会把“了”作为过去时态的标记,但是对“了”进一步的语法功能(比如,第二个句子中第二个“了”有表示“到目前为止”的意思)没有做出标记。B组的两个句子中的“了”有表示让步的语法意义,对这样深层而不易标识判断的语法意义,机器翻译无能为力。对于“了”的处理,往往是不译了事。四、总结1词义问题大多情况能够对应出准确的词义,但对多义词和同形异义词的翻译,系统会选择高频词义,这样就会出现错译。这种情况在词义活跃的单音节词翻译上尤为突出。实词的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮店火锅营销方案模板
- 《民间借贷合同范本:教育培训融资与合同签订》
- 离婚协议电子档起草与子女抚养及赡养费合同
- 离婚协议补充:夫妻共同债务分担及还款期限调整协议
- 甲乙丙三方新能源项目股权转让及绿色能源合作协议
- 离婚后共同创业公司股权分割及权益转让协议
- 离职补偿协议范本(含知识产权保护条款)
- 离婚协议中财产分割及子女监护权协议告知单
- 咨询管理or运营方案
- 高端商务区商铺租赁合同与品牌形象维护协议
- 抗凝剂皮下注射技术临床实践指南2024版
- 依法治校视角下高校后勤管理法律风险的识别与化解策略
- 2025年法学专业基础课程试题及答案
- 腰椎管狭窄症病例讨论
- 部编版语文(2024)二年级上册第一单元综合素养测评A卷(含答案)
- 工程质量事故案例课件
- 多囊卵巢综合症及护理方法
- 2025年城市更新与历史文化街区保护相结合的社区治理模式研究报告
- DB1311T 091-2025 旧水泥混凝土路面多锤头碎石化施工技术规范
- 前臂骨折护理查房
- 经济数学微积分 杨慧卿 第4版 教案 第1-3章 函数、极限与连续;一元函数微积分;一元函数积分学
评论
0/150
提交评论