CN110851596A 文本分类方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第1页
CN110851596A 文本分类方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第2页
CN110851596A 文本分类方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第3页
CN110851596A 文本分类方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第4页
CN110851596A 文本分类方法、装置及计算机可读存储介质 (平安科技(深圳)有限公司)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

道福安社区益田路5033号平安金融中到带有标签的文本向量和不带有标签的文本向神经网络模型对所述不带有标签的文本向量进机森林模型对所述带有标签的文本向量和带有2根据所述字向量特征,利用卷积神经网络模型对所述不带有标签的文本向量进行训利用随机森林模型对所述带有标签的文本向量和带有虚拟标签的文本向量进行多标所述将所述带有标签的文本向量输入BERT模将所述带有标签的文本向量对应的所述词性向量输入至B根据所述带有标签的文本向量的词矩阵得到所述带有标签4.如权利要求1至3中任意一项所述的文本分将所述不带有标签的文本向量输入所述卷积神经网络模型的卷积层对所述卷积神经利用袋装算法的有放回抽样,从所述带有标采用所述决策树模型作为基分类器,利用预先设定的分裂规则3根据所述字向量特征,利用卷积神经网络模型对所述不带有标签的文本向量进行训利用随机森林模型对所述带有标签的文本向量和带有虚拟标签的文本向量进行多标对所述原始文本数据进行分词操作得到第二文本数据;对所述将所述带有标签的文本向量输入BERT模将所述带有标签的文本向量对应的所述词性向量输入至B根据所述带有标签的文本向量的词矩阵得到所述带有标签将所述不带有标签的文本向量输入所述卷积神经网络模型的卷积层对所述卷积神经4[0009]利用随机森林模型对所述带有标签的文本向量和带有虚拟标签的文本向量进行去停用词操作得到第三文本数据;对所述第三文本数据进行去重操作得到第四文本数据;[0014]将所述带有标签的文本向量对应的所述词性向量输入至BERT模型中进行数据处[0015]根据所述带有标签的文本向量的词矩阵得到所述带有标签的文本向量的字向量[0017]将所述不带有标签的文本向量输入所述卷积神经网络模型的卷积层对所述卷积5[0027]利用随机森林模型对所述带有标签的文本向量和带有虚拟标签的文本向量进行去停用词操作得到第三文本数据;对所述第三文本数据进行去重操作得到第四文本数据;[0032]将所述带有标签的文本向量对应的所述词性向量输入至BERT模型中进行数据处[0033]根据所述带有标签的文本向量的词矩阵得到所述带有标签的文本向量的字向量[0035]将所述不带有标签的文本向量输入所述卷积神经网络模型的卷积层对所述卷积6[0054]具体地,本发明较佳实施例对所述原始文本数据进行分词操作得到第二文本数78 9[0080]本发明中所述BERT模型是BidirectionalEncoderRepresentationsfromTransformers(双向编码翻译器表示模型),由双向Transformer(翻译器)组成的一个特征LanguageModel和NextSentencePrediction是BERT模型中的两[0084]将所述初始词向量与所述词性向量相加,得到所述带有标签的文本向量的词向[0085]将使用所述词向量表示的带有标签的文本向量输入至Transformer模型中进行数抽样算法,从所述带有标签的文本向量和带有虚拟标签的文本向量中抽取多个样本子集,络得到的文本向量标签的特征作为决策树的子节点,其下节点为各自再次提取到的特征,标签分类的文本向量)其每个子节点(标签)的得分情况,若该标签得分超过本发明所设置单元也包括外部存储设备。存储器11不仅可以用于存储安装于文本分类装置1的应用软件[0103]处理器12在一些实施例中可以是一中央处理器(CentralProcessingUnit,称为显示屏或显示单元,用于显示在文本分类装置1中处理的信息以及用于显示可视化的[0107]图2仅示出了具有组件11-14以及文本分类程序01的文本分类装置1,本领域技术[0111]具体地,本发明较佳实施例对所述原始文本数据进行分词操作得到第二文本数本的特征语义网络图,统计文本的词频和文本频率,然后对所述词频和文本频率进行加权计算和特征抽取得到所述标签。[0135]本发明中BERT模型是BidirectionalEncoderRepresentationsfromTransformers(双向编码翻译器表示模型),由双向Transformer(翻译器)组成的一个特征LanguageModel和NextSentencePrediction是BERT模型中的两[0139]将所述初始词向量与所述词性向量相加,得到所述带有标签的文本向量的词向[0140]将使用所述词向量表示的带有标签的文本向量输入至Transformer模型中进行数抽样算法,从所述带有标签的文本向量和带有虚拟标签的文本向量中抽取多个样本子集,络得到的文本向量标签的特征作为决策树的子节点,其下节点为各自再次提取到的特征,标签分类的文本向量)其每个子节点(标签)的得分情况,若该标签得分超过本发明所设置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论