CN119377415B 一种中文不良言论检测方法及系统 (北京科技大学)_第1页
CN119377415B 一种中文不良言论检测方法及系统 (北京科技大学)_第2页
CN119377415B 一种中文不良言论检测方法及系统 (北京科技大学)_第3页
CN119377415B 一种中文不良言论检测方法及系统 (北京科技大学)_第4页
CN119377415B 一种中文不良言论检测方法及系统 (北京科技大学)_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本发明提供一种中文不良言论检测方法及2S7:将所述中文不良言论数据集输入至训练后的中文S501:基于所述中文不良言论数据集,通过所述S5022:将所述第一特征表示和所述第二特征表示作为所述中文不良言论数据集中同S503:将所述正样本对输入至所述R_Drop正则化模;;3;S508:利用梯度下降优化算法调整所述中文不良对所述初始推文数据集进行包括数据清洗和格式化S303:选择多个中文预训练模型,其中,所述中文预训练模型包括BERT_Base模型、S305:将所述第二数据集输入至微调后的各个中文;S5012:对所述中文不良言论数据集进行包括分词、4;;s一Dropout掩码,iw表示第二Dropout掩码。;其中,Ruai表示第一分类概率分布,Rumss表示第二分类概率第一通道和第二通道分类器的权重矩阵,b1和b2分别表示第一通道和第二通道分类器的偏;8.根据权利要求1所述的中文不良言论检测方法,其特征在于,所述KL散度损失具体;5;存储器,所述存储器上存储有计算机可读指令,所述计算机67被处理器执行时实现如第一方面的中文不良[0026]图3为本发明实施例提供的一种中文不良言论检测系统的结构示意图。下面结合[0031]参考说明书附图1,示出了本发明实施例提供的一种中文不良言论检测方法的流[0032]参考说明书附图2,示出了本发明实施例提供的一种中文不良言论检测模型的结8误判。[0049]具体地,进行包括数据清洗和格式化的预处理具体包括去除推文中的非中文内9[0056]S303:选择多个中文预训练模型,其中,中文预训练模型包括BERT_Base模型、[0069]具体地,BERT单元负责从文本中提取上下文特征,以提[0088]S5022:将第一特征表示和第二特征表示作为中文不良言论数据集中同一个句子表示第一通道和第二通道分类器的权重矩阵,b1和b2分别表示第一通道和第二通道分类器数据集中参与损失计算的输入句子数量,P(y)表[0119]本发明对同一句子执行两次BERT编码,每次编码均利用Dropout随机性生成不同[0122]参考说明书附图3,示出了本发明提供的一种中文不良言论检测系统的结构示意[0126]本发明提供的中文不良言论检测系统20能够执行上述的unit,CPU该处理器还可以是其他通用处理器、数字信号处理器(digitalsignal可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read_速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(randomaccess算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行计算机指令或计算机程序时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以为通可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个处理器执行时实现如方法实施例的中文不良言[0142]本发明提供的一种计算机可读存储介质可以实现上述方法实施例的中文不良言

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论