CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）

上传人：1*** IP属地：山西上传时间：2026-04-22 格式：DOCX 页数：24 大小：394.88KB 积分：10.2 举报 版权申诉

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）_第2页

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）_第3页

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）_第4页

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）_第5页

已阅读5页，还剩19页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

一种基于强化学习的人脸识别联邦学习系本发明公开了一种基于强化学习的人脸识解决了现有联邦学习后门攻击存在的适应性不且可以进一步提升联邦学习系统对后门攻击的2其中，基础信息包括的信息对象包括人脸识别联邦学习系统的奖励函数R用于对给定的状态st和动作at步骤4，将步骤3得到的后门攻击模型置于目标联邦系统2.如权利要求1所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，其3.如权利要求1或2所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，人脸识别模型的基础信息包括用于实现人脸识别的网4.如权利要求1或2所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，;3表示防御策略，Aggr()表示聚合服务器采用的聚合函数，L()表示损失函数，下标i用于标识正常客户端，下标j用于标识恶意客户端，xi表示正常客户端i的输入数据，yi表示正常客户端i的标签，表示恶意客户端j的输入数据，yj表示恶意客户端j的标签，w表示客户端当前接受的从聚合服务器传递过来的全局模型参数，5.如权利要求1或2所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，;化学习虚拟环境中模拟的联邦学习回合数，ye(0,1)表示未来奖励的贴现因子，E[]表6.如权利要求1或2所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，7.如权利要求6所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，其表示预置的权重，poi_ACC表示后门攻击任务精度。8.如权利要求7所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，其后门攻击任务精度poi_ACC通过后门攻击成功率表示，通过恶意客户端当前获取的9.如权利要求8所述的一种基于强化学习的人脸识别联邦学习系统后门攻击方法，其;其中，N表示干净数据集中参与测试的样本数，Ncorrect表示参与测试的所有干净样本中分类正确的数量；表示中毒数据集中参与测试的样本数，N'correct表示参与测试4;;rf表示智能体i在第t轮的奖励值。5[0003]联邦学习近年来受到了相当大的关注，并且正在成为一而有必要通过对后门攻击方式研究以提升攻击效率和成功率，同时降低被检测到的风险；备以及持久性差的不足而导致联邦学习后门攻击防御领6[0008]一种基于强化学习的人脸识别联邦学习系统后门攻击方法，该方法包括以下步[0015]状态转移函数P的表征形式为：S×A→P(S)，其由正常客户端和恶意客户端的数[0016]奖励函数R用于对给定的状态st和动作lt设置对应的奖励；[0019]步骤4，将步骤3得到的后门攻击模型置于目标联邦系统7的损失函数F'()是正常客户端和恶意客户端聚合后共同作用的结果，h()表示防御策客户端，下标j用于标识恶意客户端，表示正常客户端i的输入数据，yi表示的标签，表示恶意客户端j的输入数据，yj表示恶意客户端j的标签，w表示客户端当前所有的后门损失函数的函数值之和得到优化目标函数值，优化目标是使得T回合内总后门客户端当前获取的全局模型参数在中毒数据集上j()表示参与当前后门攻击任务的所有智能8于微调后的后门攻击模型在目标联邦学习系统中的攻击结果部署目标联邦学习系统的后联邦学习系统对后门攻击的防御能力，以及丰富联邦学习系统的后门防御能力的评估方实施例所提方法主要将后门攻击问题表述为马尔可夫决意设备的本地数据和通用知识构建MDP的模拟器，即攻击下真实联邦学习环境的“虚拟模9残差网络（ResNet）和VGG（VeryGoodGraphics）等模型架构，本发明实施例中，以基于ResNet_50模型的人脸识别模型为例。模型参数则是指人脸识别任务中所使用的人脸识别（batchsize模型拟合部分包含2个参数，拟合度α和β,这两个模型与干净模型的拟合程度。值得注意的是，本实施例中设置的6个参数均被定义为_1到1中的虚拟联邦学习环境也是采用了类似的定义。Gym库是OpenAI推出的强化学习实验环境[0055]奖励函数R用于对给定的状态st和动作lt设置对应的奖励；[0057]训练的结果是希望得到一个知道在何种观测条件下应当采用何种控制动作以获[0058]步骤S4，将步骤S3得到的后门攻击模型置于目标联邦系统的真实环境中进行测的损失函数F'()是正常客户端和恶意客户端聚合后共同作用的结果，h()表示防御策参数的客户端之间的欧氏距离dy表示客户端i、j的模型参数和的欧式距离；随后计算每个客户端与其他客户端的距离和其[0067]L=N'($,y,y')y'表示中毒数据集的标签，j为人脸识别模型输出的预测结果，y为对应的j()表示参与当前后门攻击任务的所有智能[0078]本发明实施例本例提供了一个采用多智能体强化方法IRAT（IndividualReward略和团队策略，二者同时进行学习更新，并且引入类似于PPO（ProximalPolicy[0083]biBi+cvologno,(aiIS)(ri+yvo,(s')-vo,(s))i的策[0086]biBi+vlog[0090]其中，Luiscrepancy表示一致性约束，表示基于个体奖励的策略，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）

文档简介

温馨提示

最新文档

评论

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法 （电子科技大学）

文档简介

温馨提示

最新文档

评论

相关文档

CN119445337A 一种基于强化学习的人脸识别联邦学习系统后门攻击方法（电子科技大学）