CN115688801B 一种文本对抗样本生成方法、设备及介质 (重庆邮电大学)_第1页
CN115688801B 一种文本对抗样本生成方法、设备及介质 (重庆邮电大学)_第2页
CN115688801B 一种文本对抗样本生成方法、设备及介质 (重庆邮电大学)_第3页
CN115688801B 一种文本对抗样本生成方法、设备及介质 (重庆邮电大学)_第4页
CN115688801B 一种文本对抗样本生成方法、设备及介质 (重庆邮电大学)_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

阵对文本数据集进行预处理后的文本进行计算采用贪心算法从替换候选词中选取替换词对关符合当前语境上下文的多种替换策略和改进现存在的文本对抗样本质量不足和效率太低的问2基于文本分类模型和雅可比矩阵对文本进行计算,得到文本中词语的贡使用替换成功的案例构建替换语料库,将所述关键词与所述若所述关键词与所述替换语料库的案例匹配,采用替换语料库中若所述关键词与所述替换语料库的案例不匹配,则采用预换候选词,采用贪心算法从替换候选词中选取替换词对关键词进行替换并生成对抗样本;A、计算使用替换候选词替换前文本的置信值以及使用替换候选词替换后文本的置信D、使用余弦相似度计算扰动文本S9与未替换之前的文本S采用文本数据集对文本分类模型和预训练模型进行训练,使文本分类在预训练模型中引入掩码语言任务,基于完形填空的特性用[MASK]标记进行掩码还包括在关键词的左侧插入[MASK]标记或在关键词的右侧插入3算扰动文本S,与未替换文本S之间的语义相,,,7.一种电子设备,包括存储器、处理器及行时实现如权利要求1至6任一项所述的一种文本对抗样4[0001]本发明涉及人工智能信息安全技术领域,具体涉及一种文本对抗样本生成方法、处理(NaturalLanguageProcessing,NLP)等领域取得巨大成功,人工智能正在走向人类[0003]常用对抗攻击方法根据是否了解模型的具体信息划分为:白盒攻击和黑盒攻击。模型进行预训练生成符合当前语境上下文的多种替换策略对关键词进行替换并生成对抗样本从而解决了现有文本白盒攻击中存在的对抗样本质量不足和效率5语作为关键词并进行替换有助于提升对抗样[0023]A、计算使用替换候选词替换前文本的置信值以及使用替换候选词替换后文本的6值之下,则重复步骤A直至扰动文本S9的语义相似性在阈值之上或所有替换候选词使用完[0027]在一种可选实施例中,使用余弦相似度计算扰动文本S9与未替换文本S之间的语[0035]使用NLTK工具对原始文本数据的每个句子进行分词操作,得到句子的词语集合S7别所对应的置信度;言可以减小整个攻击系统的开销提升了生成对抗8BERT在NLP各个领域都取得了突破性的性能提升,而BERT使用海量文本进行无监督的训练中,包含两个方法,一个是掩码语言模型MLM,另一个是下句预测(NextSentencePrediction,NSP)判断一个句子的是否是该句子在段落中的计算原始文本的置信度,其中“government”的置信度最高则将其作为关键词,若练。型把[MASK]当成一个正常Token处理,然后通过预测掩码位置的词进行无监督语义特征的见附图2。[0068]相较现有技术而言,本实施例中生成的候选词符合上下文的语境。比如“The“captain”,将任意一个替换候选词替换“government”都符合上下文语境,比如“The9[0071]A、计算使用替换候选词替换前文本的置信值以及使用替换候选词替换后文本的值之下,则重复步骤A直至扰动文本S9的语义相似性在阈值之上或所有替换候选词使用完使用余弦相似度保持其语义相似性在设定的阈值之后都未使分类模型产生不同的标签,则选择能最大限度地包括相对于处理器21远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。[0084]本发明实施例3还提供一种计算机可读存储介质,所述计算机可执行指令在由计算机处理器执行时用于实现如实施例1所提供的一种文指令不限于实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论