CN113228030A 多语言文本生成系统和方法 (华为技术有限公司)_第1页
CN113228030A 多语言文本生成系统和方法 (华为技术有限公司)_第2页
CN113228030A 多语言文本生成系统和方法 (华为技术有限公司)_第3页
CN113228030A 多语言文本生成系统和方法 (华为技术有限公司)_第4页
CN113228030A 多语言文本生成系统和方法 (华为技术有限公司)_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PCT/CN2019/108028201WO2020/063710EN2020.04.2神经机器翻译器,用于学习所述至少两种语个损失函数分别指示所述编码器和所述解码器能够基于所述编码表示翻译3.根据权利要求1或2所述的计算系统,其特征所述判别器产生置信度得分,以确定所述编码表示是由所述损失函数指示所述判别器能够确定所述编码表示是由所述6.一种用于训练计算系统以同时生成至少两种语言的平行语句的方法,其特征在于,学习所述至少两种语言的共享潜在空间,所述8.根据权利要求6或7所述的方法,其特征在于,所使用编码器生成所述至少两种语言的语句的编码表示使用解码器对所述编码表示进行解码以生成所述至少两种语言中任3至少一个损失函数分别指示所述编码器和所述解码器能够基于所述编码表示翻译和重建所述判别器产生置信度得分,以确定所述编码表示是由述损失函数指示所述判别器能够确定所述编码表示是由所述4言文本生成系统和方法”(SystemandMethodsforMultilingualTextGeneration)的在机器翻译领域具有实用性的数据结构以新颖和创造性的方式用于附加和/或替代用途,两种语言中任一种语言的语句;以及生成对抗网络(generativeadversarialnetwork,5述编码器接收语句的编码表示;所述判别器针对生成的和潜在的表示的来源(无论根据真数,所述损失函数指示所述判别器能够确定所述生成的编码表示和接收的编码表示的来器实现用于同时生成第一语言和第二语言的语句的机器学习算法(machinelearning于翻译神经网络的训练后的MLA,所述翻译神经网络可用于共享对包括映射向量的多维空6所述潜在空间进行采样以获得所述输出代码;以及针对所述至少一种语言中的每种语言,[0030]图1为本发明一些非限制性实施例中所设想的用于生成文本的系统的组件的框7[0031]图2A至图2E为本发明一些非限制性实施例中包括文本生成器的系统的示例的框[0036]图7为本发明一些非限制性实施例中所设想的用于生成文本的系统的组件的框[0037]图8为本发明一些非限制性实施例中所设想的训练用于生成文本的系统的方法的[0038]图9为根据至少一个示例性实现方式的计算设备的组件的框图,可以在所述计算设备上执行本发明一些非限制性实施例中所设想的生成文本构将第一语言(例如,英语)的单词序列等源对象映射到第二语言的单词序列等目标对象。(例如,语句)转换为相应的可变长度输出序列的模型更为灵活。由于递归神经网络[0042]最近,Lample等人在其2017年出版物“仅使用单语语语料库的无监督机器翻译” (UnsupervisedMachineTranslationUsingMonolingualCorporaOnly)(以下简称“Lample”)中描述了可用于执行双向翻译的模型的Lample公开了一种方法,该方法从两种不同语言的单语语语料库中提取语句,并使用这些8[0045]神经文本生成(neuraltextgeneration,NTG)技术和神经机器翻译(neural术可能尚未考虑如何调整共享潜在空间以促进其在其他用途应用(例如文本生成)中的使含词序列的语句),而不是例如要求从分别对应于两种不同语言的两个单独的潜在空间中9[0048]现在参考图1,描绘了根据本发明的至少一个非限制性实施例的示出了一种计算用适当的解码器解码成两种语言中的任一种语言的相应语句。系统100在本文中也可以统神经文本生成器110可以使用至少一个神经网络来实现,并且可以进行训练以准确地生成[0051]根据至少一个实施例,神经文本生成器110包括生成对抗网络(generative个神经网络在零和游戏框架中相互竞争运行。更具体地,将参考图4以示例方式进一步描享潜在空间120采样编码表示时,所述采样的编码表示能够同时解码为多种语言中的每种进行训练以构建和迭代改进共享潜在空间120的模型,并且这样做需要访问共享潜在空间本生成器110不仅可以读取共享潜在空间120,还可以例如在训练阶段修改共享潜在空间在训练的神经文本生成器(在图2中描述为110'的训练生成器)生成表示共享潜在空间120[0056]在神经文本生成器110包括GAN的至少一个实施例中,当神经文本生成器110的生述判别器模块和所述生成器模块之间的目标函数(例如,上述损失函数)进行响应性评估,是源自生成器模块还是共享潜在空间。生成器将学会如何生成共享空间中(或接近于共享[0057]在使用中,训练后的生成器模块然后可以生成与共享潜在空间120中包括的编码[0059]关于神经文本生成器100的使用中的应用,图2A至图2E是示出在本发明的一些非[0060]对于以下应用,用于训练神经文本生成器100以产生训练后的神经文本生成器成以第一语言L1和第二语言L2两者表达特定概念(例如,具有相同含义的语句)的等效文[0062]响应于随机化模块210提供的随机输入,文本100'以向文本生成器100'提供输入,文本生成器100'可使用该输入对共享潜在空间120进2E描绘了一个示例性实现方式,其中文本生成器100'用于为多种语言的图像添加说明文本生成器100'的神经文本生成器100(图1)可以使用该输入来对共享潜在空间120进行采样图像解码器250可以包括卷积神经网络。图像解码器250生成图像252的编码表示并且将所110基于图像解码器250提供的编码表示对共享潜在空间120进行采样。在对共享潜在空间[0070]图3是示出本发明的一些非限制性实施例中所设想的用于生成文本的系统的组件作为示例的过程中生成共享潜在空间120的模型。现在将结合示例性实施例更详细地描述[0072]图4还示出了图3系统的示例性实现方式中的组件,笼统地表示为翻译器/生成器语言L1和第二语言L2的文本进行编码以导出共享潜在空间120。可以认为自编码器是“共是第一和第二语言L1、L2。神经机器翻译器310的共享自编码器包括编码器430和解码器流形上的对应点,并且可以计算两点之间的距离(例如,使用一些已知的距离或相似性测[0076]再次参考图4,编码器430接收第一语言L1的输入语句x以及第二语言L2的输入语码器430将语句x和y编码为映射到共享潜在空间120的中间的低级别的编码表示或“代码”y。解码器440可操作以随后解码这些低级别的编码表示以生成语句重构(x_tilde,y_于具有相同的含义,这些语句在共享潜在空间120中的向量表示根据某种距离度量应该彼中未显式示出)对从平行语句编码的向量中的一个进行采样,并猜测向量是从第一语言L1和第二语言L2中的哪个语言编码的。通过基于来自判别器的反馈对判别器和编码器430进[0087]4.将语句逐字输入编码器(并标识要编码的语言),以获得每个单词的末尾[0096]再次参考图4,神经文本生成器110可以访问由神经机器翻译器310的自编码器形[0097]在至少一个实施例中,神经文本生成器110独立于神经机器翻译器310进行述判别器420可能无法将源自所述共享潜在空间120的代码识别为从所述共享潜在空间120中采样的和/或可能无法将代码识别为已由生成器410生成的代码,尽管可以使用一些其验证集的性能停止改善或恶化时等)。生成器410和判别器420通过训练学习以对抗的方式[0098]图5还示出了图3的系统的一个示例性实现方式中的组件,通常表示为翻译器/生y生成第一语言L1(x_tilde)的语句重建,而解码器440b可用于解码由编码器430b编码的代y[0101]图6是示出本发明的一些非限制性实施例中所设想的生成文本的方法的流程图,个组件或另一计算系统或设备的一个或多个组件执行。方法600或其一个或多个动作可以[0103]方法600的后续动作针对神经文本生成器110的训练,所述神经文本生成器110可判别器420对映射在共享潜在空间120中的第一语言L1的语[0109]反复地重复在612至630处描绘的动作,直到由生成器模块学习的共享潜在空间[0110]图7还示出了图3的系统的另一示例性实现方式中的组件,笼统地表示为翻译器/神经机器翻译器310和神经文本生成器110之间协作互动,相互训练(在本文中通常可以称别器模块710。如先前结合图5讨论的,生成器410用于从先验分布N生成样本z的编码表示器410生成的新的数据实例cgen中识别出来自共享潜在空间120的数据分布的编码表示cL1、[0116]图8是示出本发明的一些非限制性实施例中所设想的训练用于生成文本的系统的多个动作可以体现在存储在非瞬时性计算机可读介质等计算机可读介质中的计算机可执[0117]方法800包括共同训练生成文本的系统(例如图7的系统700)的动作。至少在本实[0121]在818处,生成器(例如图7中的410)从先验分布N生成归一化随机输入z的编码表gengen文本的方法的至少一些动作。特定装置实施可利用所有所示的组件或所述组件的一子集,[0126]计算系统900包括至少一个处理单元902。处理单元902可包括中央处理器的处理核代替传统的CPU。例如,可以在CPU914之外或替代CPU914提供图形处理单元态随机存取存储器(dynamicrandomaccessmemory,DRAM)、同步DRAM(synchronous以是包括内存总线或内存控制器、外设总线和/或视频总线在内的任意类型的几种总线架[0129]视频适配器910和I/O接口912可提供接口以将外部输入和输出设备耦合到处理单[0130]处理单元902还可以包括一个或多个网络接口906,网络接口906可以包括有线链[0132]虽然本文中描述的实施例主要涉及两种语言的文本之间的翻译和生成(即,双语[0133]虽然本文所述的实施例采用了包括神经网络的文本生成器,但是在变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论