汉英机器翻译中的知识库系统建设_第1页
汉英机器翻译中的知识库系统建设_第2页
汉英机器翻译中的知识库系统建设_第3页
汉英机器翻译中的知识库系统建设_第4页
汉英机器翻译中的知识库系统建设_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

汉英机器翻译中的知识库系统建设刘化冰国家知识产权局知识产权出版社liuhuabing@http://2008.11我们的梦想

真正的“傻瓜式”专利检索,跨越一切语言障碍专利信息技术的新发展

机器翻译亚洲语言欧洲语言跨语言检索语义检索专利信息技术在中国的新发展汉英专利机器翻译系统于2008年开通。基于词典的中国专利跨语言检索已经实现,用户可以使用英文关键词检索中国专利全文。专利语义检索的原型系统已经出现。

知识产权出版社汉英机器翻译面临的问题不断提高翻译质量RBMT

or

SBMT

or

??原文分析的优化可信度评价

面对未来挑战,知识库建设是未来发展的重要基础。机器翻译中的知识库建设海量双语语料库术语库&双语词典

翻译模板库翻译记忆术语抽取统计机器翻译科技术语翻译原文分析可信度评估基于特定语法规则的翻译海量双语语料库目标超过四千万的句对齐语料库资源大约40万件同族专利专利名称,文摘非专利名称,文摘数据标准XML格式构建双语语料库的工作流程语料采集数据加工语料库组织管理原始数据格式、噪音处理数据清理、标注自动对齐对齐检查加工完成数据双语语料库索引术语库&双语词典库现有词典的问题词汇量有限,特别是短语缺少相关性因子目标从专利文献中提取更多的科技术语和短语(现档和过档)方法新词发现相关性分析翻译等价物挖掘新词发现和相关性分析文本输入(原始文献,双语语料库)分词引擎A分词引擎B分词引擎C按照最大长度提取术语和词组频度统计同义词分析相关度分析现有词典过滤增加领域信息新词挖掘人工检查术语库翻译等价物挖掘

术语库翻译等价物挖掘人工检查和翻译网上检索从语料库抽取自动构词吸引attractvt.可被吸引的attractableadj.

保存preservevt.可保存的preservableadj.调整v.n.装置n.调整装置ving+nAdjustingDevice

<TM>无线通信网</TM>上提供实时<TM>分组话音</TM>和<TM>数据服务</TM>的方法和装置METHODANDAPPARATUSFORPROVIDINGREAL-TIME<TM>PACKETIZEDVOICE</TM>AND<TM>DATASERVICES</TM>OVERA<TM>WIRELESSCOMMUNICATIONNETWORK</TM>ExistingDictionary无线通信网wirelesscommunicationnetwork数据服务dataserviceCandidate分组话音packetizedvoice声码器GoogleVoIP语音编码器-Voip

技术应用-IXPUB技术博客-PoweredbyX-Space声码器(vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接收端,用来导出...

根据合同,该公司帮助翻译国家安全局所截获的情报中的一些信息。CNKIvocoder(187)sounder(3)speechvocoder(6)Iciba

【计】vocoder

【化】vocoder翻译模板库一种A,由B和C组成,其特征在于AkindofA,composedofBandC,characterizedinthat/characterizedby一种A,包括/包括有B和C,其中:AkindofA,including/comprisingBandC,wherein:一种A,其具有一带B的C,AkindofA,havingaCwithB一种A,包括一用于V+N的B,AkindofA,includingaBusedforV-ingtheN.根据权利要求X所述的A,其特征在于,AasstatedinClaimX,characterizedinthat/characterizedby根据权利要求X的A,其特征在于所述B为一+ADJ+的+C,AaccordingtotheClaimX,characterizedinthatBistheCthat……如前述权利要求中任一项所述的A,其特征在于, Astatedinanyaforesaidclaim,characterizedby,应该理解,下面的描述只是本发明的原理的示范,不应该被认为是缩小了遵循的权利要求。因此本发明目的是在于覆盖落入本发明的权利要求以及它们的等价内容的范围内的修改和变化。因此,本发明旨在覆盖在所附权利要求等的范围内提供的本发明的修改和变化。以下本发明优选实施例的描述实质上仅为示例作用,并不用于限制本发明及其应用或使用。本公开不应限于因此,本公开不应限于采用的光学元件类型。本发明不受到将微观结构_30_制作在透明材料中的特殊的结构或方法的限制,而且也不受到将这些结构最初制作在主基体或次基体中的特殊过程所限制。因此,本发明的精神和范围应广义理解且仅由附属权利要求而不是由前面的说明书限定。因此,本发明打算仅受限至由后附权利要求书及可应用规程的规则和原理所要求的程度。因此本发明的实施方案和实例只是说明性的而不是限制性的,本发明的范围由下面的权利要求给出而不是前面的描述给出,在权利要求的范围之内的所有变化都属于本发明。在权利要求的范围之内的所有变化都属于本发明。机器翻译流程中的知识库系统PatentInputMorphologyAnalysisPart-of-speechTaggingPre-processingPhraseAnalysisSyntaxAnalysisGrammarAnalysisConversionSyntaxAnalysisStructureSelectionTerminologySelectionFormatconversionOutputRule&TemplateBaseDictionary1IPC-drivenDictionary……………Dictionary2Dictionary3Dictionary4ParallelCorpusTMSBMTRBMT自动可信度评估匹配率模板匹配语料库匹配原文分析缺失片段歧义分析译文分析句法和语法分析知识库在专利检索中的应用跨语言检索相关性匹配语义检索概念挖掘相关性分析照明设备=lightingelementRelatedconcept照明设备、照明装置、照明仪器……lightingelement;lightingdevice;lightingequipment;lightingset……机器翻译:自然语言处理;词法;语言模型;目标语言;语言规则;机器翻译系统;源语言;对句;译文;词法;自然语言;语言现象;汉语文本;语言同义;语料库;语料库数据computationallinguistics;naturallanguage;websearch;dataengineering;firstinternationalworkshop

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论