面向专利文献机器翻译系统定制.ppt_第1页
面向专利文献机器翻译系统定制.ppt_第2页
面向专利文献机器翻译系统定制.ppt_第3页
面向专利文献机器翻译系统定制.ppt_第4页
面向专利文献机器翻译系统定制.ppt_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面向专利文献的机器翻译系统定制,Siriussoft Corp.,目录,公司简介 技术竞争力 韩国专利文献的特点 定制过程 改良需求,2008-11-04,公司简介,Siriussoft 目前拥有韩译英、英译韩、韩译日以及日译韩的机器翻译技术。 公司计划扩展机器翻译所涵盖语种,如汉译韩、德译英、法译英以及俄译英。,3,现行经营模式 产品 : 集成有机器翻译引擎的 在线专利检索系统 韩国专利 (K2E-PAT) EP, US, JP, PCT 专利 (E2K) 平台: KIPRIS 网站 (eng.kipris.or.kr) PIE 网站 () 目标客户: 终端用户 一千四百万 KIRRIS 用户 研究人员、信息专家 个人发明者、专利律师等 价格 : $ 30 /篇 (K2E) 篇幅不限,公司简介,终端用户,研究人员,个人发明者,专利律师,信息专家,公司简介,历史与成就,2019-09-19,5,机器翻译:计算语言学的分支学科,研究如何运用计算机软件将文本或语音从一种自然语言翻译为另一种自然语言 。 语素处理技术 句法处理技术 语义处理技术 语境处理技术 句子生成技术,技术竞争力,源语句,语素分析器,句法分析器,词典,知识库,语境处理,语法库,生成器,目标语句,分析,语法,技术竞争力,专利领域专用MT系统 词典和语法的涵盖范围限制在专利领域文章, 使输出译文具有高准确度。 K2E 专利机器翻译系统 K2J 专利机器翻译系统 E2K 专利机器翻译系统 J2K 专利机器翻译系统 MT 方法 K - E 引擎 : 以“基于模板”为主的机器翻译 K J 引擎 : 基于规则的机器翻译 将来会用到混合方法,目标文本,基于规则,基于模板,基于统计,词法分析,源文本,混合机器翻译系统,技术竞争力,专利技术 (ETRI) 多语言翻译设备中用于识别多语言短语的系统(KR0261273) 基于概念的跨国语言翻译系统的自动语法修正方法(KR0204068 ) 对大量机器翻译请求的快速响应 翻译记忆 例) Opposition to Utility Model Registration 例) The due date of submission of the amendment for the present application is not allowed until the above due date. 对同一个机器翻译请求进行分布式计算 负载平衡技术 多样与便捷的 API 网络翻译, 批量翻译, 电子文件翻译等,语序差异 英语是SVO语言,而韩语是SOV语言 格标记 英语中不存在格标记 没有对应于“, ”的英文词 冠词 韩语中不存在冠词 通常不被翻译成特定的词,韩国专利文献的特点, ,He ate the cookies,S O V,S V O,韩国专利文献的特点,间隔单位不同 英语 词与语素相对应 不需要改变间隔单位 韩语 词(eojeol)与语素不同 需要改变间隔单位 * Eojeol是人性化的间隔单位 主语 韩语语句中,主语可以省略 英语语句的主语不能被对应到一个韩语词汇,韩国专利文献的特点,专利文献 极长又复杂的句子 韩语专利文献中,句子由平均14.5个Eojeol组成 韩语新闻文章中,句子由平均12.3个Eojeol组成 独特的句型 摘要 例) 本发明涉及 发明内容详述 例)根据现有技术 如图N所示 附图简要说明 例) 图n是用于说明的视图 有益效果 例) 本发明的有益效果在于 权利要求 例)如权利要求n所述的,进一步包括,11,定制过程,半自动词典创建过程 通过包含在专利文献中的括号提取韩英语对 双语专利标题语料库 双语专利标题,12,(TFT : Thine Film Transistor),(patterning),(etching),(deposition),定制过程,手动词典创建过程 日常处理 机器翻译过程中未得到翻译的词汇被自动报告给翻译人员 年度处理 术语从一年中的韩语专利文献中抽取 新术语自动识别 新术语人工翻译 加入到字典,13,定制过程,名字翻译过程 包含在PCT等同专利、申请代码、公司网站及罗马字体书写规则中的英文名,14,定制过程,语句模板创建过程 手工创建专利特有语句模板 例1) 源文本: KR 模板 : NP1 匹配模板: NP1 that be:v achieved by the present invention 目标文本: The system that is achieved by the present invention is developed. 例2) 源文本: KR 模板: NP1 NP2 VP1 匹配模板: NP1TopicVP1 compared to NP2 目标文本: The Invention improved performance compared to the prior art.,15,定制过程,消除词语歧义 DB建设: IPC的统计信息 例) 韩语词“” 可以被翻译成 电子领域中的“磁极” 医药领域中的“刺激”,16,改良需求,源语句自身的错误 间隔错误 例) (synchronization plan) + (east evaporation plan) +

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论