汉英机器翻译中时体态处理.pdf_第1页
汉英机器翻译中时体态处理.pdf_第2页
汉英机器翻译中时体态处理.pdf_第3页
汉英机器翻译中时体态处理.pdf_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

汉英机器翻译中时体态处理 程节华 戴新宇 陈家骏 王启祥程节华 戴新宇 陈家骏 王启祥 南京大学计算机软件新技术国家重点实验室 南京大学计算机科学与技术系 南京 210093 摘要摘要 作为机器翻译系统 我们必须处理目标语中句子的时态和体态 本文介绍了汉语中句 子的时体态形式 给出了汉语中时态 体态抽取分析算法 归纳出汉英机器翻译时时体态转 换规则 介绍了时体态处理系统流程 关键词关键词 机器翻译 汉语 英语 时体态抽取 时体态转换 中图分类号 中图分类号 TP391 0 前言前言 句子的时态提供了说话的时间和句子中所阐述的事件二者之间的时间关系 无论是自然 语言理解和自然语言生成 还是机器翻译中都少不了时态方面的分析 然而在汉语和英语中 其表示时态的方法是不同的 英语中 句子的时态是通过动词的形态变化来表示的 而汉语 中没有动词的形态变化 也没有明显的时态标记 其时间表达是隐性的 其时态只能由副词 助词 时间短语 上下文信息等来表示 严格地说 汉语传统意义上的时态概念比较模糊 运用自然语言逻辑方法对汉语时间语 义特征进行研究 本文针对汉语提出时态 tense 和体态 aspect 的概念 分析汉语句子 中表达的时体态 并将其转换成英语中相应的时体态 完成汉英句子的翻译 本文首先介绍汉语句子时体态形式 然后给出汉语时态 体态分析抽取算法 最后介绍 汉英时态转换策略 1 汉语中句子时和态抽取分析算法汉语中句子时和态抽取分析算法 汉语句子的时态 体态比较复杂 各家分类标准不一 而英语只有 16 种时态 一般过 去时 一般现在时 一般将来时 现在完成时 过去完成时 将来完成时 现在进行时 将 来进行时 过去进行时 过去将来完成时 现在完成进行时 将来完成进行时 过去完成进 行时 过去将来时 过去将来进行时 过去将来完成进行时 根据汉语的特点和汉英时体态 转换的方便 本文将汉语的体态分为以下几种 实现态 一般态 进行态 经历态和将行态 汉语中表示时间的概念形式有 过去时 现在时 将来时 由于汉语中没有动词的形式变化 所以其时体态形式只能通过一些特定的词以及上下文信息来表示 其中包括副词 助词以及 时间短语等 下面分别介绍汉语中时和体的抽取算法 1 1 体态形式抽取分析算法 体态形式抽取分析算法 为了叙述方便 根据汉语的句式 副词 V 助词 宾语 按照以下方法进行匹配 i if 句式为 V 了 or 已经 V 了 or V 补语且补 语为 完 好 掉 成 then 句子的语态为 实现态 else ii if 句式为 V 过 or 曾经 V 过 then 句子的语态为 经历态 else iii if 句式为 1 V 着 2 V adv 且 adv 为 一直 不断 不停 3 在 动词性词语 4 介词结构 在 动词性词语 5 动词性词语 呢 6 动词 带 个 的否定状语 7 从 处所宾语 动词 来 宾语 8 向 处所宾语 动词 来 去 9 边 边 10 名词性词语 动词 在 处所词语 then 句子的语态为 进行态 else iv if 句式为 将要 V or 要 V then 句子的语态为 将行态 else v if 句式为 已经 在 V 了 呢 then 为 完成 进行态 else vi 句子的语态为 一般态 1 2 时间信息抽取分析算法时间信息抽取分析算法 汉语的动词没有严格意义的形式变化 只能用分析性手段来表示在某一段时间内的存 在或延续 具体来说 时间词语 副词 语境 和部分结构都可以单独或结合起来在句中表 示动作发生或状态存在的时间 句中的时间概念可以按以下算法抽取 1 if 含有时间状语为 今天 现在 本周 今年 时 下 目前 or 含有副词为 在 正 正在 天天 经常 常常 每天 or 含有助词 呢 or 结构为 正 呢 then 句子的时间标记为 现在 2 if 有时间状语为 昨天 前天 上周 去年 当年 早先 战前 小 时侯 文革时期 19 世纪 or 含有副词为 曾 曾经 已经 刚 刚刚 刚才 or 结构为 自从 打 以来 是 的 then 句子的时间标记为 过去 3 if 有时间状语为 明天 后天 明年 后年 下周 下学期 一世纪 or 含有副词为 将 将要 快 快要 or 结构为 快要 了 就要 了 会 的 then 句子的时间标记为 将来 4 if 句子的谓语是形容词或状态助词 then 句子的时间标记为 现在 5 if 句子的谓语动词为行为动词 且主语是第一人称单数 then 句子的时间标记为 现在 6 其余情况句子的时间标记为 过去 7 当句中时间词语与语气助词 频度副词同时出现时 时间词语有较高的优先级 时体态的抽取算法中表达时体态的时间短语 副词 助词等等用特征集表示 可以扩充 2 汉英机器翻译中时态转换规则汉英机器翻译中时态转换规则 在汉英机器翻译中 当汉语的时态 体态信息获取后 将其转换成对应的英语句子的 时标记 体标记 生成正确目标句 时态转换时 按以下规则进行 设 Tc s 汉语句子的时间信息 Te s 为英语句子的时间标记 Ac s 为汉语句子的语态信 息 Ae s 为英语句子的语态标记 规则一 Te s Tc s 其中 Tc s 可以为 过去 现在 将来 规则二 若 Ac s 实现态 则 Ae s 完成态 或 Ae s 一般态 且当句中含有过去时间词语时 Ae s 一般态 否则 Ae s 完成态 规则三 若 Ac s 经历态 则 Ae s 完成态 或 Ae s 一般态 当句中含有过去时间词语时 Ae s 一般态 否则 Ae s 完成态 规则四 若 Ac s 将行态 则 Ae s Null 规则五 若 Ac s 进行态 则 Ae s Ac s 规则六 若 Ac s 完成 进行态 则 Ae s Ac s 3 系统流程 对汉英机器翻译中时态处理 在词法分析阶段抽取出句子的时体态信息 在译文生成阶 段进行汉英时体态的转换 我们采用规则驱动的方法 的方法 具体流程如下 4 结束语 本文结合汉语时态表示的特殊性 归纳了汉语时体态的一般表现形式 给出的汉英机器 翻译中句子时态转换的一种方法 该方法目前能解决汉语中简单陈述句的转换问题 存在一 定的误转率 由于汉语是一门 重意合 轻形式 的语言 汉语的时体态不仅与其特征集有 关 而且与具体动词的语意有关如 1 他去了上海 2 他完成了作业 源语输入 句子切分 词法分析 译句生成 译文输出 规则库 句法分析 时体态抽取 时体态转换 对于上面两例由于 完成 与 去 分别表示连续与终止性动作 因此其译句为 1 he went to shanghai 2 he has finished homework 所以今后的改进工作主要集中在以下两个方面 1 在时体态抽取时 对特征集进行扩充 加入对语意与语境方面的分析 2 进行复合句的时态转换研究 参考文献参考文献 1 Ren Rong Hsu and His Jian lee The Analysis of Tense and Aspect in Chinese Sentences for translating Mechanically to English 1990 International Conference on computer Processing of Chinese and Oriental Languages P21 26 2 Guo Wen Yang A Systemic Description of the Restricted Recursive Aspect System in standard Chinese International Conference On Machine Translation Department of Computer Sciences and Technology Nanjing University 210093 Nanjing Abstract For a machine translation system we have to process the tense and aspect of the sentences in target languages In this paper we analyze the tense and aspect of sentences in Chinese Then we give a algorithm to extract the temporal and aspect s information in Chinese sentences

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论