CN111241815B 文本增量方法、装置及终端设备 (平安科技(深圳)有限公司)_第1页
CN111241815B 文本增量方法、装置及终端设备 (平安科技(深圳)有限公司)_第2页
CN111241815B 文本增量方法、装置及终端设备 (平安科技(深圳)有限公司)_第3页
CN111241815B 文本增量方法、装置及终端设备 (平安科技(深圳)有限公司)_第4页
CN111241815B 文本增量方法、装置及终端设备 (平安科技(深圳)有限公司)_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

道福安社区益田路5033号平安金融中2将所述特征矩阵输入与所述文本主题对应的变分自编码器,获得所针对每个类别的语料,基于所述基础变分自编码器进行再训通过预设的BERT模型对所述待增量文本进行特征提取,获得所述通过预设的BERT模型将所述待增量文本转换为N×768维的特征矩阵,预设将所述特征矩阵输入与所述文本主题对应的变分自编码器的编码器,将所述采样编码输入到变分自编码器的解码器中生成所述待增量文提取模块,用于对所述待增量文本进行特征提取,获得所述待增量文本对3增量模块,用于将所述特征矩阵输入与所述文本主题对针对每个类别的语料,基于所述基础变分自编码器进行再训通过预设的BERT模型对所述待增量文本进行特征提取,获得所述9.一种终端设备,包括存储器、处理器以及存储在456话、会话启动协议(SessionInitiationProtocol,SIP)电话、无线本地环路(Wireless下一代通信系统,例如,5G网络中的移动终端或者未来演进的公共陆地移动网络(Public[0037]以所述终端设备为手机为例。图1示出的是与本申请实施例提供的手机的部分结7括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(LowNoise上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystemofMobilecommunication,GSM)、通用分组无线服务(GeneralPacketRadioService,GPRS)、码分多址(CodeDivisionMultipleAccess,CDMA)、宽带码分多址[0040]存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120[0042]显示单元140可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元140可包括显示面板141,可选的,可以采用液晶显示器(LiquidCrystal面板131与显示面板141集成而实现手机的输8或者将音频数据输出至存储器120以便进[0045]WiFi属于短距离无线传输技术,手机通过WiFi模块170可以帮助用户收发电子邮过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的[0053]图2示出了本申请实施例提供的一种文本增量方法的实现流程图。所述文本增量的手机100中。所述文本增量方法包括步骤S201至步骤S204,各个步骤的具体实现原理如9文本自动按照步骤S202至步骤S204的过程进行[0063]词向量模型包括但不限于word2vec(wordtovector),ELMo,和BERT[0067]示例性地,通过预设的BERT模型将所述待增量文本转换为N预设的所述BERT模型包括24层编码层,也就是说采用的是BERTLarge模型,该模型中[0070]另一示例性地,采用包括12层编码层的BERT模型,即BERTBase模型,该模型中[0071]作为本申请另一非限制性示例,如图3所示,步骤S202包括步骤S2021至步骤差卷积神经网络模型(ResNet)等。其中,深度卷积神经网络模型包括但不限于AlexNet,当终端设备将训练好的模型存储好,或者其他终端设备将训练好的模型推送至终端设备用来识别大规模文档集(documentcollection)或语料库(corpus)中潜分,但是描述上的前后之分和标号的大小之分都不代表具体限制了步骤的先后时序关系。采样获得一个采样编码,之后将这个采样编码输入到解码器的生成器中生成增量文本数[0098]作为本申请一非限制性示例,使用一个较为简单的循环神经网络(Recurrent正态分布中采样得到的采样编码向量在解码器的RNN的每一个时间步进行输入,这样每一个时间步的输出在接入一个全连接层和softmax函数后生成每个词在该位置出现的概率,成文本时实现确定性,因而通过BERT模型和VAE结合的双重作用避免了生成文本时的随机语料集中的语料训练一个基础VAE;然后,在对语料集中的语料进行文本主题分类的基础[0104]可以理解的是,在上述两个非限制性示例中,为了提高VAE文本增量结果的准确[0105]本申请实施例通过先提取待增量文本的特征矩阵,并确定待增量文本的文本主的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限[0107]对应于上文实施例所述的文本的增量方法,图5示出了本申请实施例提供的文本[0126]将所述采样编码输入到变分自编码器的解码器中生成所述待增量文本的增量文有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步[0132]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用计算机存储器、只读存储器(Read-OnlyMemo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论