版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、面向专利文献的机器翻译系面向专利文献的机器翻译系统定制统定制Siriussoft Corp.目录公司简介技术竞争力韩国专利文献的特点定制过程改良需求2008-11-04公司简介 Siriussoft 目前拥有韩译英、英译韩、韩译日以及日译韩的机器翻译技术。 公司计划扩展机器翻译所涵盖语种,如汉译韩、德译英、法译英以及俄译英。3现行经营模式现行经营模式 产品 : 集成有机器翻译引擎的 在线专利检索系统 韩国专利 (K2E-PAT) EP, US, JP, PCT 专利 (E2K)平台: KIPRIS 网站 (eng.kipris.or.kr) PIE 网站 ()目标客户: 终端用户 一千四百万
2、KIRRIS 用户 研究人员、信息专家 个人发明者、专利律师等价格 : $ 30 /篇 (K2E) 篇幅不限公司简介终端用户终端用户研究人员研究人员个人发明者个人发明者专利律师专利律师信息专家信息专家公司简介 历史与成就1/14/20222008.09 E2K 机器翻译引擎嵌入KIPO内部专利检索系统2008.07 在KIPRIS 网站开通E2K & J2K 服务2007.11 开通 PIE.COM 服务: 2007.04 为三边专利局开通K2E机器翻译系统2006.12 J2K机器翻译引擎并入KIPO 内部专利检索系统2006.10 KIPRIS系统开通 K2E-PAT服务2005.
3、11 开通 K-PION (韩国专利信息在线网络系统) 2004.12 获得ETRI机器翻译技术转让5机器翻译:计算语言学的分支学科,研究如何运用计算机软件将文本或语音从一种自然语言翻译为另一种自然语言 。语素处理技术句法处理技术语义处理技术语境处理技术句子生成技术技术竞争力源语句语素分析器 句法分析器 词典知识库语境处理语法库生成器目标语句分析语法技术竞争力 专利领域专用MT系统词典和语法的涵盖范围限制在专利领域文章,使输出译文具有高准确度。 K2E 专利机器翻译系统 K2J 专利机器翻译系统 E2K 专利机器翻译系统 J2K 专利机器翻译系统 MT 方法 K - E 引擎 : 以“基于模板
4、”为主的机器翻译 K J 引擎 : 基于规则的机器翻译将来会用到混合方法目标文本基于规则基于模板基于统计词法分析源文本混合机器翻译系统混合机器翻译系统技术竞争力 专利技术 (ETRI)多语言翻译设备中用于识别多语言短语的系统(KR0261273) 基于概念的跨国语言翻译系统的自动语法修正方法(KR0204068 ) 对大量机器翻译请求的快速响应翻译记忆例) Opposition to Utility Model Registration例) The due date of submission of the amendment for the present application is no
5、t allowed until the above due date.对同一个机器翻译请求进行分布式计算 负载平衡技术 多样与便捷的 API网络翻译, 批量翻译, 电子文件翻译等 语序差异英语是SVO语言,而韩语是SOV语言 格标记英语中不存在格标记没有对应于“, ”的英文词 冠词韩语中不存在冠词通常不被翻译成特定的词韩国专利文献的特点 HeHe ateate thethe cookcookiesiesS O VS O VS V OS V O韩国专利文献的特点 间隔单位不同英语 词与语素相对应 不需要改变间隔单位韩语 词(eojeol)与语素不同 需要改变间隔单位 * Eojeol是人性化的间
6、隔单位 主语韩语语句中,主语可以省略英语语句的主语不能被对应到一个韩语词汇韩国专利文献的特点 专利文献极长又复杂的句子 韩语专利文献中,句子由平均14.5个Eojeol组成 韩语新闻文章中,句子由平均12.3个Eojeol组成独特的句型 摘要例) 本发明涉及 发明内容详述例)根据现有技术 如图N所示 附图简要说明例) 图n是用于说明的视图 有益效果例) 本发明的有益效果在于 权利要求例)如权利要求n所述的,进一步包括 11定制过程 半自动词典创建过程通过包含在专利文献中的括号提取韩英语对双语专利标题语料库双语专利标题12(TFT : Thine Film Transistor)(TFT : T
7、hine Film Transistor)(patterning)(patterning)(etching)(etching)(deposition)(deposition)定制过程 手动词典创建过程日常处理 机器翻译过程中未得到翻译的词汇被自动报告给翻译人员 年度处理 术语从一年中的韩语专利文献中抽取 新术语自动识别 新术语人工翻译 加入到字典13定制过程 名字翻译过程 包含在PCT等同专利、申请代码、公司网站及罗马字体书写规则中的英文名 14定制过程 语句模板创建过程手工创建专利特有语句模板例1) 源文本: KR 模板 : NP1 匹配模板: NP1 that be:v achieved
8、by the present invention 目标文本: The system that is achieved by the present invention is developed.例2) 源文本: KR 模板: NP1 NP2 VP1 匹配模板: NP1TopicVP1 compared to NP2 目标文本: The Invention improved performance compared to the prior art.15定制过程 消除词语歧义DB建设: IPC的统计信息例) 韩语词“” 可以被翻译成 电子领域中的“磁极” 医药领域中的“刺激” 16改良需求 源语句自身的错误 间隔错误 例) (synchronization plan) + (east evapor
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 62541-23:2025 EN-FR OPC unified architecture - Part 23: Common ReferenceTypes
- 【正版授权】 IEC 61300-1:2022/AMD2:2025 EN-FR Amendment 2 - Fibre optic interconnecting devices and passive components - Basic test and measurement procedures - Part 1: General and guida
- 2025年高职(药学)药品调剂技术综合测试题及答案
- 第六单元 组合图形的面积(复习课件)-(北师大版)
- 蓝商务大气年终工作述职报告工作总结年终总结
- 蓝金商务风活动策划
- 工程用电安全培训题课件
- 制药厂安全培训感想课件
- 《C语言程序设计:从计算思维到项目驱动(微课视频版)》第4章 函数 习题答案
- 2026年特殊药品及国家专门管理药品培训试题
- 2026年湖南电气职业技术学院单招综合素质考试题库含答案详解
- 2025年天津市普通高中学业水平等级性考试思想政治试卷(含答案)
- 2025年昆明市呈贡区城市投资集团有限公司及下属子公司第二批招聘(11人)备考核心题库及答案解析
- 2025年度护士个人工作总结与展望
- 医院副院长年度工作述职报告范文
- 工地给水管预埋施工方案
- 住宅项目施工质量自检与审查方案
- 地理试卷(26-138B)+答案河北省邢台市卓越联盟2025-2026学年第一学期高二12月期中考试(12.4-12.5)
- GB 17675-2025汽车转向系基本要求
- 2025年粮油质量检验员知识竞赛考试题库500题(含答案)
- 会计师事务所员工绩效考核制度规定
评论
0/150
提交评论