2025神经网络与深度学习深度生成模型_第1页
2025神经网络与深度学习深度生成模型_第2页
2025神经网络与深度学习深度生成模型_第3页
2025神经网络与深度学习深度生成模型_第4页
2025神经网络与深度学习深度生成模型_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深度生成模型

DeepGenerativeModels《神经网络与深度学习》2025参考《神经网络与深度学习》-深度生成模型一些例子来自于李宏毅《IntroductionofGenerativeAdversarialNetwork(GAN)》生成模型

GenerativeModels机器学习的两种范式生成模型:一系列用于随机生成可观测数据的模型生成模型包含两个步骤:密度估计采样生成数据的另一种思路深度生成模型深度生成模型就是利用神经网络构建生成模型。变分自编码器(VariationalAutoencoder,VAE)[KingmaandWelling,2013,Rezendeetal.,2014]生成对抗网络(GenerativeAdversarialNetwork,GAN)[Goodfellowetal.,2014]变分自编码器

VariationalAutoencoder,VAE含隐变量的概率图模型生成数据x的过程可以分为两步进行:根据隐变量的先验分布p(z;θ)采样得到样本z;根据条件分布p(x|z;θ)采样得到x。概率生成模型EM算法回顾给定一个样本x,其对数边际似然logp(x|θ)可以分解为EstepMstep变分自编码器的模型结构可以分为两个部分:寻找后验分布p(z|x;θ)的变分近似q(z|x;ϕ∗);变分推断:用简单的分布q去近似复杂的分p(z|x;θ)在已知q(z|x;ϕ∗)的情况下,估计更好的分布p(x|z;θ)。变分自编码器(VAE)用神经网络来替代变分自编码器推断网络推断网络目标生成网络先验分布p(z|θ)一般假设隐变量z的先验分布为各向同性的标准高斯分布N(z|0,I)条件概率分布p(x|z,θ)假设p(x|z,θ)服从对角化协方差的高斯分布目标模型汇总再参数化再参数化分布q(z|x,ϕ)依赖于参数ϕ再参数化(reparameterization)是实现通过随机变量实现反向传播的一种重要手段

变分自编码器的训练过程变分自编码器学习到的隐变量流形生成对抗网络

GenerativeAdversarialNetwork(GAN)显式密度模型和隐式密度模型显式密度模型显示地构建出样本的密度函数p(x|θ),并通过最大似然估计来求解参数;变分自编码器、深度信念网络隐式密度模型不显示地估计出数据分布的密度函数但能生成符合数据分布pdata(x)的样本无法用最大似然估计生成网络生成网络从隐空间(latentspace)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。如何学习生成网络?生成网络示例生成网络

生成网络

生成网络

生成网络

Eachdimensionofinputvectorrepresentssomecharacteristics.LongerhairbluehairOpenmouth判别网络判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。判别网络判别网络判别网络判别网络1.01.00.1?MinMaxGame对抗训练生成网络要尽可能地欺骗判别网络。判别网络将生成网络生成的样本与真实样本中尽可能区分出来。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。生成网络v3生成网络v2对抗过程生成网络(student)判别网络(teacher)生成网络v1判别网络v1判别网络v2NoeyesNomouthMinMaxGame判别网络生成网络MinimaxGame训练过程AnimeFaceGeneration100updates1000updatesAnimeFaceGeneration2000updates5000updatesAnimeFaceGeneration10,000updates50,000updates一个具体的模型:DCGANs判别网络是一个传统的深度卷积网络,但使用了带步长的卷积来实现下采样操作,不用最大汇聚(pooling)操作。生成网络使用一个特殊的深度卷积网络来实现使用微步卷积来生成64×63大小的图像。DCGANs模型分析数据分布

Intheend……realgenerated模型分析

不稳定性:生成网络的梯度消失

使用JS散度来训练生成对抗网络的一个问题是当两个分布没有重叠时,它们之间的JS散度恒等于常数log2。对生成网络来说,目标函数关于参数的梯度为0。模型坍塌:生成网络的“错误”目标生成网络的目标函数其中后两项和生成网络无关,因此前向和逆向KL散度

前向KL散度逆向KL散度前向和逆向KL散度改进弱化判别器使用更好的损失函数realgeneratedstrongweakLeastSquareGAN(LSGAN)Replacesigmoidwithlinear(replaceclassificationwithregression)1(Real)0(Fake)判别网络scalar判别网络scalarTheydon’tmove.01realgeneratedf-GAN

f-GAN目标函数f-divergencesWassersteinGANWasserstein距离

Wasserstein距离

Kantorovich-

Rubinstein对偶定理Lipschitz连续函数WassersteinGAN梯度问题DCGANWGANbatchnormalizationconstantnumberoffiltersateverylayerDCGANG:CNN,D:CNNG:CNN(nonormalization),D:CNN(nonormalization)LSGANOriginalWGANImprovedWGANG:CNN(tanh),D:CNN(tanh)DCGANLSGANOriginalWGANImprovedWGANG:MLP,D:CNNG:CNN(badstructure),D:CNNG:101layer,D:101layerGAN的扩展条件生成根据条件针对性的生成数据生成网络“Girlwithredhairandredeyes”“Girlwithyellowribbon”生成网络

Inaspecificrange条件生成Givencondition:CaptionGenerationChat-botGivencondition:“Hello”“Ayounggirlisdancing.”“Hello.Nicetoseeyou.”ConditionalGANInfoGAN判别网络分类器scalarGenerator=zZ'cxcPredictthecodecthatgeneratesx“Auto-encoder”Parametersharing(onlythelastlayerisdifferent)encoderdecoder/abs/1606.03657/abs/1606.03657AC-GANBiGANEncoderDecoderDiscriminatorImagexcodezImagexcodezImagexcodezfromencoderordecoder?(real)(generated)(frompriordistribution)JeffDonahue,

PhilippKrähenbühl,

TrevorDarrell,“AdversarialFeatureLearning”,

ICLR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论