CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）

上传人：1*** IP属地：山西上传时间：2026-05-14 格式：DOCX 页数：59 大小：1.84MB 积分：10.8 举报 版权申诉

CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）_第2页

CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）_第3页

CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）_第4页

CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）_第5页

已阅读5页，还剩54页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

体数据的图像特征，获取多媒体数据的文本特合特征；基于数据分类模型对图像特征进行预预测标签的第二概率值；对预测标签p的第一概率值与预测标签p的第二概率值进行融合，直至2根据所述图像数据获取所述多媒体数据的图像特征，根据所述文基于数据分类模型对所述图像特征进行预测，得到对象标签，获取对所述预测标签p的第一概率值与所述预测标签p的第二概率值基于图像获取周期从所述至少两个视频帧图像中获取所查找所述多媒体数据相关联的第一文本内容，若查找若未查找到所述第一文本内容，则获取所述图像数据在所获取所述图像特征对应的第一权重矩阵及所述文本特将所述至少两个预测标签中，具有最大的第三概率值的预测标签确定为目标预测标对所述目标预测标签及所述对象标签进行拼接，得到媒体数据标签，若所述媒体数据类别与所述媒体数据获取标签相匹配，则将所3述目标用户；若所述媒体数据类别与所述媒体数据获取标签不匹配，则获取所述媒体数据类别所属的标签集群，若所述标签集群若所述标签集群为第二标签集群，则删除所述多媒体数据；所述获取样本多媒体数据中的样本图像数据和样本文本数据，获根据所述样本图像数据获取所述样本多媒体数据的样本图像特基于初始数据分类模型对所述样本图像特征进行预测，得到样本对象标签所关联的至少两个样本预测标签及每个样本预测标签对应的第一样本概率主观情感类型；所述至少两个样本预测标签的数量根据标签库中主观情感类别的数量确对所述样本预测标签j的第一样本概率值与所述样本预测标签j的第二样本概率值进根据所述样本标签及所述模型输出标签所组成的损失函数，对所所述根据所述样本标签及所述模型输出标签所组成的损失函数，根据所述参考样本标签与所述样本对象标签生成所将所述参考样本预测标签与所述样本对象标签进行拼接，生成目标述目标样本标签与所述模型输出标签生成所述根据所述第一损失函数及所述第二损失函数对所述初始数据分类模型进行45样本对象标签所关联的至少两个样本预测标签及每个样本预测标签对应的第一样本概率[0013]对该样本预测标签j的第一样本概率值与该样本预测标签j的第二样本概率值进6行融合，得到该预测标签p的第三概率值，直至得到该每个预测标签分别对应的第三概率媒体数据类别。据的至少两个视频帧图像；基于图像获取周期从该至少两个视频帧图像中获取该图像数7[0025]样本数据获取模块，用于获取样本多媒体数据中的样本图像数据和样本文本数计算机设备执行本申请实施例一方面中的各8过使用图像特征对应的对象标签辅助融合特征对应的预测标签来判断多媒体数据的类别，可以避免由于文本特征与多媒体数据的类别差异太大(例如多媒体数据的标题较夸张与视得到融合特征对应的预测标签的情况下，再使用图像特征对应的对象标签进行再次判断。9于文本特征与多媒体数据的类别差异太大，实现更准确及全面的反映多媒体数据的类别，取周期从至少两个视频帧图像中获取图像数据；查找多媒体数据相关联的第一文本内容，作为图像数据。具体的，计算机设备从多媒体数据中获取得到的视频帧图像可以如301所取多个图像特征和每个图像特征关联的文本特征的方法可参考获取该一个图像数据的方[0062]具体实现中，计算机设备可以通过图像特征提取网络对得到图像特征。图像特征提取网络可以包括但不限于卷积神经网络(ConvolutionalNeuralNetworks，CNN)、超分辨率测试序列(VisualGeome本特征提取网络可以是指双向编码器模型(BidirectionalEncoderRepresentations征进行特征融合，得到融合特征的方式例如可以为对图像特征及文本特征进行特征融合，本特征均能准确反映多媒体数据的类别信息时，则第一权重矩阵可以等于第二权重矩阵。权运算得到的图像加权特征A1*B1为2关联的至少两个预测标签是指通过数据分类模型对图像特征进行预测得到的标签，或者，预测标签p的第一概率值与预测标签p的第二概率值进行融合，得到预测标签p的第三概率的第一概率值与预测标签p的第二概率值进行融合可以是指将预测标签p的第一概率值与对应的第一概率值为0.5，密集对应的第二概率值为0.35，则预测标签p的第三概率值为集”确定为目标预测标签，则对目标预测标签及对象标签进行拼接后得到媒体数据标签为分类模型中的第一图像分类器、第二图像分类器和融合分类器进行训练的过程可参考图5过使用图像特征对应的对象标签辅助融合特征对应的预测标签来判断多媒体数据的类别，可以避免由于文本特征与多媒体数据的类别差异太大(例如多媒体数据的标题较夸张与视得到融合特征对应的预测标签的情况下，再使用图像特征对应的对象标签进行再次判断。高对多媒体数据分类的准确性，在使用数据分类模型对图像特征和文本特征进行预测之前，可以使用大量样本图像特征和融合特征对数据分类模型进行训练并调整数据分类模样本文本数据的方法可参考步骤S101中获取多媒体数据中的图像数据和文本数据的方法，据获取样本多媒体数据的样本文本特征，将样本图像特征及样本文本特征进行特征融合，像特征和样本文本特征进行特征融合得到样本融合特征的方法可参考步骤S102中获取多样本对象标签所关联的至少两个样本预测标签及每个样本预测标签对应的第一样本概率[0087]具体的，计算机设备可以通过初始数据分类模型对样本上述过程，可以获取到每个样本预测标签分别对应的第一样本概率值及第二样本概率值，预测标签j对应第一样本概率值和第二样本概率值。样本预测标签的数量及类型与预测标初始图像分类器用于对样本图像特征进行预测得到样本对象标签所关联的至少两个样本预测标签及每个样本预测标签分别对应的第一样本概率值，即得到样本图像特征为惊悚、[0091]计算机设备在获取样本预测标签j的第一样本概率值与样本预测标签j的第二样预测标签j的第二样本概率值进行融合可以是指将样本预测标签j的第一样本概率值与第模型输出标签是指至少两个样本预测标签中第三概率值最大的样本预测标签和样本对象数据分类模型可以更准确的对图像特征和融合特征进行预测，从而提高数据分类的准确[0110]本发明实施例中，步骤S301～S304的具体实现方式可参考步骤S101～S104的描[0113]具体的，目标用户的媒体数据获取标签可以是多媒体数也可以是计算机设备根据该多媒体数据的获取请求从媒体库中为目标用户匹配的媒体数标用户可以通过目标用户所在的用户终端向计算机设备发送针对多媒体数据的获取请求，方式确定该多媒体数据的媒体数据类别，以及获取每个用户所关联的媒体数据获取标签，第二标签集群包括不属于第一标签集群的标签，例如第二标签集群可以如上述的负面标据进行哪种类型的操作，由于第二标签集群是指多媒体数据的内容容易让用户处于压抑、媒体数据类别。[0134]若未查找到该第一文本内容，则获取该图像数据在该视频数据中对应的语音数[0136]该权重获取单元721，用于获取该图像特征对应的第一权重矩阵及该文本特征对标用户；媒体数据所在的应用程序的首页中显示该多过使用图像特征对应的对象标签辅助融合特征对应的预测标签来判断多媒体数据的类别，可以避免由于文本特征与多媒体数据的类别差异太大(例如多媒体数据的标题较夸张与视得到融合特征对应的预测标签的情况下，再使用图像特征对应的对象标签进行再次判断。[0155]样本标签确定模块83，用于基于初始数据分类模型对该[0159]该第一训练单元851，用于根据该参考样本标签与该样本对象标签生成该第一损[0161]该模型生成单元853，用于根据该第一损失函数及该第二损失函数对该初始数据数据分类模型可以更准确的对图像特征和融合特征进行预测，从而提高数据分类的准确运行能够执行如图3、5、6中所示的相应方法所涉及的各步骤的计算机程序(包括程序代过使用图像特征对应的对象标签辅助融合特征对应的预测标签来判断多媒体数据的类别，可以避免由于文本特征与多媒体数据的类别差异太大(例如多媒体数据的标题较夸张与视得到融合特征对应的预测标签的情况下，再使用图像特征对应的对象标签进行再次判断。通过计算机程序来指令相关的硬件来完成，该的程序可存储于计算机可读取存储介质中，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）

文档简介

温馨提示

最新文档

评论

CN113392236B 一种数据分类方法、计算机设备及可读存储介质 （腾讯科技（深圳）有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN113392236B 一种数据分类方法、计算机设备及可读存储介质（腾讯科技（深圳）有限公司）