厦门大学第四届机器翻译研讨会评测系统描述.ppt_第1页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第2页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第3页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第4页
厦门大学第四届机器翻译研讨会评测系统描述.ppt_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

厦门大学第四届机器翻译研讨会评测系统描述,陈毅东 史晓东 周昌乐 ydchen, mandel, 厦门大学信息科学与技术学院智能科学与技术系 2008年11月 北京,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,概述,厦门大学参加了 汉英新闻领域机器翻译(开放) 汉英新闻领域系统融合 英汉新闻领域机器翻译(受限) 英汉科技领域机器翻译(受限) 使用的模型 汉英机器翻译:短语,短语+规则 英汉机器翻译:短语+规则、规则,使用的融合方法和系统融合评测中使用的相同,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,机器翻译系统概要(1),统计翻译系统 短语模型 对数线性模型 融合特征:短语翻译概率(正向/反向)、词汇化短语翻译概率(正向/反向)、语言模型、长度惩罚因子、短语惩罚因子 单调解码,动态规划方法 汉英机器翻译评测中,我们的短语翻译系统则结合了基于组块的词语调序模型,机器翻译系统概要(2),规则翻译系统 基本模块: 词法分析句法分析词义消歧译文生成 采用依存文法描述英语和汉语,文法由程序来描述 词典条目大约10万 结合了部分TM技术 没有专门针对这次评测进行调整,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,系统融合方法概要(1),早在1994年就有研究者研究多引擎翻译系统。 多引擎系统的研究可以粗略地分成两类: 简单地在各系统的输出中选出一个最佳的结果。 从各系统的输出中各选取最佳片段并构成新的结果。 由于融合粒度更细,第二类方法常常可以获得更好的融合效果。 第二类系统融合技术需要解决的两个问题: 必须从候选翻译中抽取出与原文相对应的翻译片段。 必须在这些可用的翻译片段中筛选并组合成新的翻译结果。,系统融合方法概要(2),参考文献 Chen Yu, Andreas Eisele, Christian Federmann, Eva Hasler, Michael Jellinghaus, and Silke Theison. 2007. Multi-Engine Machine Translaiton with an Open-Source Decoder for Statistical Machine Translaiton. In: Proceedings of the Second Workshop on Statistical Machine Translation, Prague, 193-196.,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,评测数据与结果(1),使用的外部工具 GIZA+工具包对双语语料进行词对齐,训练模式是15H53545 使用SRI语言模型工具包来训练语言模型 使用CRF+工具包来训练组块分析器(汉英测评中)。,评测数据与结果(2),汉英新闻机器翻译评测 数据 结果,评测数据与结果(3),汉英新闻系统融合评测 根据诸系统在ssmt2007测试集上的成绩仅挑选了前4名的系统参与融合 采用的数据情况同汉英新闻机器翻译评测 结果 constrast系统使用和汉英新闻机器翻译评测相同的参数,primary系统则将长度惩罚因子参数增加到原来的两倍。,英汉新闻机器翻译评测 数据情况 结果,评测数据与结果(5),英汉科技机器翻译评测 数据情况 结果 xmu-constrast-memt2系统仅使用科技语料,提纲,概述 机器翻译系统概要 系统融合方法概要 测评数据与结果 小结,小结,本次评测我们参加的系统在技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论