统计机器翻译的调序方法和模型.pdf_第1页
统计机器翻译的调序方法和模型.pdf_第2页
统计机器翻译的调序方法和模型.pdf_第3页
统计机器翻译的调序方法和模型.pdf_第4页
统计机器翻译的调序方法和模型.pdf_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计机器翻译的调序方法和模型 闫英杰 易绵竹 李峰 2009年10月17日 内容提要 一 自然语言的语序 二 人工翻译与机器翻译的认知 三 机器翻译的调序问题 四 调序方法和模型的发展 五 一些难点问题 六 结论 一 自然语言的语序问题 语序 也叫 词序 即语言中词语组合的先后次序 汉语的词序基本上比较固定 从古到今没有太大的变化 其基本次序为 定语 主语 状语 谓语 补语 定语 宾语 语序的意义 某种语言的词序规律正是在从文本的语义表达式向该语言 的现实文本转化过程中词形式的铺排规则 词形式的线性 化 一般要经过语义表达式 深层句法表达式 表层句法 表达式 深层词法表达式等三种操作程序 才能实现 语序是重要的语方表达手段 语法作用 决定句子的语义模式 交际目的 词序变化反映交际 修辞作用 灵活的排序 二 人工翻译与机器翻译的认知 理解人工翻译的过程 对机器翻译的认知 人工翻译与机器翻译的对比 理解人工翻译的过程 人工翻译的过程 源语言的切分转换 目标语言的调整生成 人工翻译中的语序 自然语言的语句顺序在一定程序上临摹了人的 认知过程 感知和语言都决定于生理构造 人 类具有同样的生理构造 不同语言的词序排列 理应遵从相同的认知心理依据 对机器翻译的认知 翻译的基本任务 源语言分析 词法 句法 语义 转换 基于不同层次 词序 结构 语义的调整词序 结构 语义的调整 译词的选择 目标语言生成 词形变化 增加或删除词语 对机器翻译的认知 续 机器翻译的基本策略 直译 从原文句子的表层 词 词组或短语 出发 直接转换 成译文 辅以必要的词序调整 转换 分析源语言后 得到一个基于源语言的中间表示 然后 将这个中间表示转换成基于目标语言的中间表示 再从 基于目标语言的中间表示生成目标语言 中间语 对源语言进行分析 得到一个独立于源语言和目标语言 的 基于概念的中间表示 然后从这个中间表示生成目 标语言 中间语言 源语言目标语言 分析生成 词汇转换 句法转换 语义转换 词法 句法 语义 词法 句法 语义 对机器翻译的认知 续 人工翻译与机器翻译的对比 翻译采用的策略不同 人工翻译是直译 意译 主要基于对语义的理解 机器翻译的策略多样化 但目前主要的研究都 是基于词法 句法 翻译过程的实质相同 对源语言或目标语言的分解和生成必不可少 语义单元的对应转换和语句顺序的相应调整必 不可少 三 机器翻译的调序问题 切分转换 源语言 源语言核心句 目标语言译文 语序调整 目标语言分句 一般的翻译调序过程 机器翻译的调序问题 续 调序的时机 转换之前处理与之后处理 调序的对象 对源语言的调序与对目标语言的调序 调序的范围 词汇 短语 句子 不受限的调序是个NP难题 四 调序方法和模型的发展 简单词语的局部调序 基于短语和语块的调序 基于形式化句法的调序 简单词语的局部调序 多种实现方法 线性移位模型 扁平调序模型 词汇化的短语调序模型 基于短语转换规则的调序模型 不足之处 没有句法结构和语义分析的指导 转换很难很好地进 行 特别是对句法 语义结构相差很大的语言 译词选择和词序调整工作可用的信息太少 基于短语和语块的调序 语块标记 识别句子中某些结构相对简单的独立成分 语 块分析使句法分析的任务在某种程度上得到简 化 同时也利于句法分析技术在大规模真实文 本处理系统中迅速得到应用 分层短语模型 结合了短语模型和同步上下文无关文法 以目标语言的句法结构来调整源语言短语和语 块 将源语言转换成符合目标语言句法的句子 基于短语和语块的调序 续 优点 便于实现长距离的短语对的调序 不足之处 对分层短语模型的规则提取没有任何句法信息 的约束 使其抽取的语法规模往往十分庞大 基于形式化句法的调序 两类方法 固定模板方法 概率模型方法 不同实现 语言学知识的句法分类 基于概率统计的句法分类 不足之处 句法分析的程度 句序调整的范围 五 一些难点问题 调序方法的普适性问题 认知语言学理论的研究 调序方法的评测问题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论