google汉英翻译试用_第1页
google汉英翻译试用_第2页
google汉英翻译试用_第3页
google汉英翻译试用_第4页
google汉英翻译试用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对 google 语言工具机器翻译系统的测试分析 陶莹 谭晓平 一、关于测试对象和测试方法的说明 1我们主要是对 google 语言工具这一机器翻译系统的翻译效果和能力进行测试分析。 选择 google 语言工具这一机器翻译系统作为测试分析的对象有两个原因。一是 google 语言 工具是免费的,比较方便。二是因为我们觉得 google 作为用户众多的搜索引擎,它引入的 这个机器翻译的语言工具应该是更多的人接触和了解机器翻译的途径,那么它的翻译效果 和能力直接影响人们对它的认识和接受。 2测试内容:汉英翻译。 3具体的测试方法:我们认为,源语言与目标语言语义的不完全对应、不同的语序和 句式、实现语法功能和语用功能的不同方式是机器翻译在句子翻译层面需要面对和处理的 不同层次的难点。对语义判断和语法功能判断处理的测试可以在句式分析处理的测试过程 中部分实现,因此我们以有汉语特殊语法特征句式的测试分析为第一层次(语义测试分析 在这一阶段同时完成) ,以含有特殊语法和语用功能的句子为第二层次。 二、测试实例分析之句式分析 1兼语句式 测试语句 A:他邀请那个漂亮的女孩看电影。 He invites that attractive girl to watch the movie. 测试语句 B:你不能强迫别人都在你这里吃饭。 You cannot force the others all to eat in your here. 分析:我们选择了两个句子进行测试,认为翻译效果较好。在这里机器翻译用不定式 来处理兼语式,但我们认为这是通过对词语层面的用法分析就可以达到的,因为在汉语中 可形成兼语句的动词在英语中接第二个动词时都要带不定式。用英语中的不定式来对应汉 语中的兼语式是在词语本身(使令性动词)的语义要求在两种语言中的表现。 在 B 句中还存在语序和词义的问题。在汉语句子中的副词“都”语义指向是“别人” , 那么英语句子中“all”应移到 “the others”前面,而机器翻译对此未做调整。 “在你这里吃 饭”译为“eat in your here”按英语习惯把介词短语放在了动词后面,但是 “in your here” 显然是词对词的硬译,不合语法。 2连动句式 测试语句 A:他穿上衣服推开房门走了。 He put on clothes shoves open the house door walks. 测试语句 B:大家听到这个消息都很高兴。 Everybody hears to this news very to be happy. 分析:我们选择了两个句子进行测试,认为翻译效果不好。第一,汉语的连动句式的 特殊之处就在于几个动词语可以直接连用,不需要连词连接或用逗号隔开。而在英语中这 是不合语法的。从 A 句的测试来看机器翻译没有把这种差别考虑进去并表现出来。第二, 从 B 句来看,当汉语的连动式的后一谓词语是形容词语时,机器翻译把它处理成不定式形 式,但是翻译后的句子与源句的焦点不同(源句的焦点是“很高兴” ,而译后变成了 “hear”) 。也就是说,还未进入深层的语义分析。 我们还可以看到 A 句“推开 ”(译为“shove open”)和 B 句“听到” (译为“hear to” ) 的补语翻译存在较明显的错误,这点在带补语句的分析中详细分析。 3存现句 测试句式 A 组:台上坐着主席团。 主席团坐在台上。 On sits the presidium. President 团坐 on. 测试句式 B 组:路那边开过来一辆公共汽车。 班里走了两个同学。 Side road that opens comes one bus. In the class walked two schoolmates. 分析:我们选择了两组句子进行测试,认为翻译效果不好。英语对应存现句的是 “There be”句型,方位短语一般做状语。从 A 组句子看,机器翻译没有对主语是方位短 语的情况做出区别处理(实际应该有做出判断的可能) ,因此不能对汉语的存现句做出相应 的句式转换。从 B 组句子看,表示 “出现”和“消失”的存现句也存在同样的问题。 A 组第二句还存在三音节词的切分问题,机器翻译优先双音节词,所以对多音节词往 往出现切分错误。 B 组第一句还存在补语判断的问题,它没有把“ 过来”判断为补语,而是翻译成动词。 4非谓谓语句 测试语句 A 组:他男朋友一米八。 鲁迅浙江人。 妹妹大眼睛。 His boyfriend one meter eight. Lu Xun Zhejiang person. Younger sister big eye. 测试语句 B 组:这个问题我们已经解决了。 This question we already solved. 分析:我们选择了两组句子进行测试,A 组是名词性谓语句,B 组是主谓谓语句,翻 译效果都不理想。从 A 组来看,机器翻译对名词性谓语句的翻译效果不好的原因在于它没 有把英语必须有的动词性谓语补充出来。从 B 组来看,汉语中主谓短语做谓语的句子的主 语是作为整个句子的主题,在语义上应是动词的宾语。但是机器翻译不能对此做出判断, 而直接进行词对词的翻译。这同样是缺乏对原句的深层语义分析。 5把字句 测试语句:他把钥匙丢了。 他丢了一把钥匙。 He lost the key. He threw one key. 分析:经过测试,我们认为把字句翻译得较好。我们认为像“把”这种比较容易标注 的汉语特殊句式标志,机器翻译系统都能做比较好的处理。 第二句我们测试作为量词的“把” ,机器能够判断数词后面的“把”是量词,并按英语 语法略掉汉语的量词(或者是基于实例的翻译系统,很容易得到“一把”这种数量关系实 例) 。 对第二句的“丢”字可以有“丢失”和“抛出”两种解释,这里给出的是在此种语境 下不常选择的“抛出”义。 6被字句 测试语句:她的秘密被发现了。 她的秘密被人发现了。 Her secret was discovered. Her secret was discovered by the person. 分析:和把字句一样,被字句也翻译得较好。原因相同。 两句的时态都被翻译成过去式,我们认为在此机器翻译中“了”被标注了过去式的时 态信息。 第二个句子我们把对于英语来说一般省略掉的无须指出的施事“人”加入,但是翻译 结果没有省略掉。目的语的深层语义分析也不够,或者说无法实现。 7多层定语句 测试语句 A:她穿着妈妈昨天买的那条漂亮的黄裙子。 She puts on that attractive yellow skirt which mother yesterday bought. 测试语句 B:你上星期从图书馆借的那三本关于健身的畅销书还了么? You last week that three which borrowed from the library about the healthy body bestseller also? 分析:从 A 句看,机器翻译注意了把汉语中的多层定语中的小句对应到英语中的定语 从句,并以动词后面的“的”作为标志。但在翻译成的定语从句中,语序存在问题。它按 照词对词的翻译,而未按照英文的惯用表达方式。B 句考察的是主语的多层定语,翻译结 果不理想。存在这样几个问题:第一, “还” (hun)的谓语身份没有判定出来,主要是因 为把“还”当成副词的“还” (hi) 。第二,仍是以动词后的“的”为标志把小句对应为定 语从句,但是定语从句的先行词定位错误。第三,把“健身”这个词翻译成了两个词,可 能它的词库中没有这个词。 8带补语句 测试语句 A 组:他切开了那个大西瓜。 他把西瓜切成一片一片的。 He cut open that big watermelon. He slivers the watermelon everywhere everywhere. 测试语句 B 组:他高兴得跳起来。 她激动得哭了。 He is happy jumps. She was excited cries. 测试语句 C 组:他生于 1980 年。 海南省位于中国最南部。 He had been born in 1980. Hainan Province locates China most south. 分析:我们对三组不同形式的带补语句进行了测试,认为带补语句对机器翻译是个大 难点,翻译效果不好。因为补语是汉语独有的成分,而且非常灵活,不易进行判断和处理。 A 组是单个动词+ 补语的形式,对于没有补语成分的英语来说,大部分情况这种补语是无须 译出的,但难点在于对补语的判断,如 A 组的两个句子中的 “切开” “切成” ,对机器翻译 来说是很难判断出这是单个动词+补语的组合,在翻译中的处理方式,一是把它当成两个 动词(如把“切开”译为“cut open”) ,一是把它处理为一个动词(如把“切成”译为 “sliver”) 。B 组是有补语标志 “得”的句子,翻译得仍不好。这两个句子的补语都是谓词 性的,在英语中大致可以对应为“sothat”固定格式,但机器翻译直接把它们并列为两个 谓语成分。C 组是含有表示时空概念的补语成分的句子,句子翻译得比较正确。我们认为 这应该是基于对“于”这个标志分析较好(或者说是基于实例的机器翻译很容易得到“生 于”和“位于”这样的翻译实例) 。 9、歧义切分和同形异义 测试语句 A:中国家用电器市场竞争激烈。 父母亲自送我上学。 The Chinese domestic electric appliances market competition is intense. The parents personally deliver me go to school. 测试语句 B:你今天吃早点了吗? 明天你早点儿来。 You have today eaten earlier? Tomorrow you earlier will come. 他们聊得很投机。 他靠投机发了财。 They chat very congenially. He depended on congenially sends the wealth. 分析:下面再补充两个有关语义的测试,一是歧义切分,二是同形异义词。A 组是对 两个交集型歧义的句子的测试。结果这两个句子都切分正确,因为在这两个例子中都是几 个双音节词连用,这对于机器翻译来说是最优先的。A 组中第二个句子中“送”字的翻译 有误。我们发现,对单音节词特别是义项丰富的单音节动词翻译错误率较高,它往往选择 最常见义来翻译。 B 组是对两个同形异义词“早点 ”“投机”在不同句子中机器翻译对义项选择的测试。 测试结果表明,机器翻译对同形异义词的处理与对多义词的处理类似,都是选择翻译这个 词的高频义项。如在测试句中把“早点”都译为“earlier ”,把“投机”都译为 “congenially”。 二、翻译实例分析之功能分析 1用“是”表示强调的句子 测试语句:是你告诉他这个事情的吗? 我是昨天回北京的。 Is you tells him this matter? I was yesterday return Beijing. 分析:这是两个用“是”来形成强调的句子,但是机器翻译没有对“是”只是强调标 志的情况作区别分析。所以都把“是”译成了“be” ,而且都完全是词对词的翻译。 2表示否定的句子 测试语句:我今天晚上不吃饭了。 我今天晚上没有吃饭。 I today evening do not eat. I today evening do not have eating. 分析:在汉语中“不”和“没有”分别表示主观上和客观上的否定。机器翻译没有表 现出这种区别。另外, “今天晚上”翻译成“today evening”,而这本来在英语中可用一个 词来对应。 “没有吃饭”翻译成“do not ”“have”“eating”,可见都是词对词的翻译。 3 “了”特殊语用功能 测试语句 A 组:我在北京住了三年。 我在北京住了三年了。 I lived three years in Beijing. I lived three years in Beijing. 测试语句 B 组:都大姑娘了。 今天星期五了。 All girl of marrying age. Today Friday. 分析:“了”是汉语中语法和语用功能非常活跃的虚词。我们对 “了”含有深层语用 意义的句子进行测试,机器翻译基本不能对此做出判断。A 组中对两个句子的翻译结果完 全一样,没有体现出因为第二个“了”而带来的语义上的差别。我们推测,在机器翻译中 会把“了”作为过去时态的标记,但是对“了”进一步的语法功能(比如,第二个句子中 第二个“了”有表示“到目前为止”的意思)没有做出标记。B 组的两个句子中的“了” 有表示让步的语法意义,对这样深层而不易标识判断的语法意义,机器翻译无能为力。对 于“了”的处理,往往是不译了事。 四、总结 1词义问题 大多情况能够对应出准确的词义,但对多义词和同形异义词的翻译,系统会选择高频 词义,这样就会出现错译。这种情况在词义活跃的单音节词翻译上尤为突出。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论