CN119358708B 基于扩散模型的自适应双边蒸馏个性化联邦学习方法 (齐鲁工业大学(山东省科学院))_第1页
CN119358708B 基于扩散模型的自适应双边蒸馏个性化联邦学习方法 (齐鲁工业大学(山东省科学院))_第2页
CN119358708B 基于扩散模型的自适应双边蒸馏个性化联邦学习方法 (齐鲁工业大学(山东省科学院))_第3页
CN119358708B 基于扩散模型的自适应双边蒸馏个性化联邦学习方法 (齐鲁工业大学(山东省科学院))_第4页
CN119358708B 基于扩散模型的自适应双边蒸馏个性化联邦学习方法 (齐鲁工业大学(山东省科学院))_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于扩散模型的自适应双边蒸馏个性化联本发明属于联邦学习的技术领域,更具体联邦学习方法。所述方法通过设计一种指导机弥补了局部_全局相互蒸馏过程中可能丢失的全化能力的平衡,适用于非独立同分布non_IID数2S2、客户端接收服务器传来的全局模型,客户端利S4、服务器根据客户端的本地数据量将收到的聚合完成后,服务器使用余弦相似度来计算各个本地的表示将和归一化为单位向量;;S5、利用相似度来对接收到的本地的局部生成3S6、服务器利用全局生成器生成的全局伪数据对(5)(6)处理后的学生模型的概率分布,代表教师模型在全局伪数据上的输出logits,S7、服务器将优化后的全局模型重新广播发送2.根据权利要求1所述的基于扩散模型的自适应双边蒸馏个性化联邦学习方法,其特将本地数据分别送入到本地的局部模型和全局模型进行训练,在过程使用交叉熵损43.根据权利要求1所述的基于扩散模型的自适应双边蒸馏个性化联邦学习方法,其特根据本地的局部模型和全局模型在数据集上预测的准确性来控制在相互蒸馏的过程中,使用了KL散度来控制本地的局部模型预4.根据权利要求1所述的基于扩散模型的自适应双边蒸馏个性化联邦学习方法,其特(14)po(x--1lx,c)=N(x--1;u(xpt,c),z(x,t,c))(15)xr-1~po(xr-1]x,c)(16)xr-1~po(xr-1]x,c)代表从条件概率分布中采样得到时间状态t_1时刻的样本56在共享全局知识的同时,针对每个用户的特定数据分布和任务需求优化本地模型的性能。[0004]现有的大多数个性化联邦学习方法往往只关注模型个性化和泛化能力中的某一性化知识和全局知识的学习,但全局模型在利用本地数据训练时可能遗忘部分全局知识,[0006]中国专利文献CN117035057A公开一种基于模型和数据蒸馏的个性化联邦学习方7下载多个全局编码器模型,更新客户端中的多个本地共享编码器模型参数,下载全局[0007]有鉴于此,本发明设计一种基于扩散模型的自适应双边蒸馏个性化联邦学习方引入条件扩散模型生成高质量的伪数据,并利用这些伪数据对聚合后的全局模型进行微8[0024]根据本地的局部模型和全局模型在数据集上预测的准确性来控制相互蒸馏的强原始数据逐步变为纯噪声;[0034]po(x--1lx,c)=N(xe-1;uo(xpt,c),z(x,t,c))(6)9[0035]xr-1~po(xr-1]x,c)(7)xr-1~po(xr-1]x,c)代表从条件概率分布中采样得到时间状态t_1时刻的样本过最小化模型预测的噪声EO和真实添加的噪声之间的距离,从而使逆向生成过程更加准客户端j的本地数据量,|D|代表所有客户端的数据总量,代表第i轮的客户端j[0047]在式(10)中,Cos(wi,w)是计算本地的全局模型和聚合后全局模型的初步相似度,代表第i轮的客户端k的全局模型参数向量,wi代表第i轮聚合后的全局模型参数向[0055]首先利用全局生成器gi生成全局伪数据D:,然后选择前m轮的全局模型进行加权过平滑处理后的学生模型的概率分布,代表教师模型在全局伪数据上的输出r2用于抵消概率分布平滑带来的梯度缩放;的梯度;[0076]图3是本发明实施例1中在CIFAR10数据下本发明的个性化联邦学习算法与其他联[0077]图4是本发明实施例1中在CIFAR100数据下本发明的个性化联邦学习算法与其他[0080]参图1和图2,本实施例提供基于扩散模型的自适应双边蒸馏个性化联邦学习方[0094]根据本地的局部模型和全局模型在数据集上预测的准确性来控制相互蒸馏的强[0099]所述客户端利用本地数据和类别向量来训练本地条件扩散模型得到本地的局部原始数据逐步变为纯噪声;[0104]po(x--1lx,c)=N(xe-1;uo(xpt,c),z(x,t,c))(6)[0105]xr-1~po(xr-1]x,c)(7)xr-1~po(xr-1]x,c)代表从条件概率分布中采样得到时间状态t_1时刻的样本过最小化模型预测的噪声EO和真实添加的噪声之间的距离,从而使逆向生成过程更加准客户端j的本地数据量,|D|代表所有客户端的数据总量,代表第i轮的客户端j[0117]在式(10)中,Cos(wi,w)是计算本地的全局模型和聚合后全局模型的初步相似度,代表第i轮的客户端k的全局模型参数向量,wi代表第i轮聚合后的全局模型参数向cxtw)进行标[0125]首先利用全局生成器gi生成全局伪数据D:,然后选择前m轮的全局模型进行加权过平滑处理后的学生模型的概率分布,代表教师模型在全局伪数据上的输出r2用于抵消概率分布平滑带来的梯度缩放;|DX|表示其拥有的数据集的数量。全局数集合。该发明本地的主要目标是同时获取一个本地模型w和一个全局模型w8,其优化目标[0146]本发明提供

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论