CN114064894B 文本处理方法、装置、电子设备及存储介质 (中国平安人寿保险股份有限公司)_第1页
CN114064894B 文本处理方法、装置、电子设备及存储介质 (中国平安人寿保险股份有限公司)_第2页
CN114064894B 文本处理方法、装置、电子设备及存储介质 (中国平安人寿保险股份有限公司)_第3页
CN114064894B 文本处理方法、装置、电子设备及存储介质 (中国平安人寿保险股份有限公司)_第4页
CN114064894B 文本处理方法、装置、电子设备及存储介质 (中国平安人寿保险股份有限公司)_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文本数据进行编码处理,得到文本隐性特征向类模型和文本类别标签对目标文本向量进行标2通过预设的文本分类模型和文本类别标签对所述目标文通过预设的文本聚类模型和文本聚类标签对所述目标文本向基于预先训练的文本处理模型的编码模块将所述目标文本数据映射到预设的向量空根据自下而上的编码顺序和编码维度,对目标文本特征进行初根据预设的权重比例,对多个特征维度的文本隐向量进行加权按照固定的间隔采集文本隐性特征向量的灰度数值,对采集到的灰度值基于所述文本处理模型的解码模块对所述中间文本向量进行解根据预设的编码顺序和编码维度,对所述目标文本特征进行编3根据预设的分类函数和文本类别标签对目标文本向量进行标签分根据预设的聚类算法和文本聚类标签对所述目标文本向量进行聚文本处理模块,用于通过预设的文本分类模型和文本类别基于预先训练的文本处理模型的编码模块将所述目标文本数据映射到预设的向量空根据自下而上的编码顺序和编码维度,对目标文本特征进行初根据预设的权重比例,对多个特征维度的文本隐向量进行加权按照固定的间隔采集文本隐性特征向量的灰度数值,对采集到的灰度值基于所述文本处理模型的解码模块对所述中间文本向量进行解上并可在所述处理器上运行的计算机程序以及用于实现所述处理器和所述存储器之间的45够捕获到待处理文本与类别标签间的关系,但是忽略了类别标签与类别标签之间的关系,[0010]通过预设的文本分类模型和文本类别标签对所述目标文本向量进行标签分类处67技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,8控制,全局是因为均值的控制。变分自编码器的损失函数由重构项(最后层)和正则项(隐9出推断。举个高斯混合模型的例子,GMM中隐变量指的是每个observation对应的高斯的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐,或者找到相似的用户聚类算法,它们基于不同的理论或技术,比如图论,模糊集理论,神经网络以及核技术待处理文本和类别标签的关系来进行分类/聚类,这种方法虽然能够捕获到待处理文本与[0088]在一些实施例的步骤S101[0089]请参阅图2,在一些实施例中,步骤S102可以包括但不限于包括步骤S201至步骤可以基于bi-LSTM算法构建序列分类器,在基于bi-LSTM算法的模型中,输入单词wi和字符嵌入,通过左到右的长短记忆和右向左的长短时记忆,使得在输出被连接的位置生成单一的输出层。序列分类器通过这一输出层可以将输入的文本实体特征直接传递到softmax分[0113]请参阅图3,在一些实施例中,步骤S103可以包括但不限于包括步骤S301至步骤方式相较于传统技术中的将高维度的文本信息映射到低维的隐变量层z的方法,能够有效[0120]请参阅图4,在一些实施例中,步骤S104可以包括但不限于包括步骤S401至步骤积法内插法对已采样点进行内插处理,得到目标文本数据在不同维度上的多个分布[Y1,[0130]需要说明的是,该文本分类模型可以为textCNN模型。该文本分类模型包括而将特征向量输入至输出层,通过输出层中的预设函数即可对目标特征向量进行分类操该方式能够对标签文本向量进行过滤,剔除掉相关性较低或者词性不符合需求的文本词[0133]请参阅图6,在一些实施例,步骤S502还可以包括但不限于包括步骤S601至步骤[0141]通过上述步骤S101至步骤S105,能够根据文[0142]请参阅图7,在另一些实施例,步骤S103可以包括但不限于包括步骤S701至步骤[0148]最后,执行步骤S703,根据不同变量层的维度为3,可以通过对每一隐变量层进行均匀采样来得到每一特征维度代表的含[0154]步骤S801,根据预设的聚类算法和文本聚类标签对目标[0158]通过上述步骤S101至步骤S105,能够通[0160]请参阅图9,本申请实施例还提供一种文本处理装置,可以实现上述文本处理方[0165]文本处理模块905,用于通过预设的文本分类模型和文本类别标签对目标文本向储器上并可在处理器上运行的计算机程序以及用于实现处理器和存储器之间的连接通信[0178]本领域技术人员可以理解的是,图1-8中示出的技术方案并不构成对本申请实施可以根据实际的需要选择其中的部分或者全部模块来实现本说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论