计算机视觉应用开发课件:VGG-19_第1页
计算机视觉应用开发课件:VGG-19_第2页
计算机视觉应用开发课件:VGG-19_第3页
计算机视觉应用开发课件:VGG-19_第4页
计算机视觉应用开发课件:VGG-19_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

VGG-19VGG-19的由来01任务结构解析02任务学习目标了解VGG-19的由来掌握VGG-19的网络结构1VGG-19的由来1VGG-19的由来2014年,牛津大学计算机视觉组(VisualGeometryGroup)和GoogleDeepMind公司的研究员一起提出了一种新的深度卷积神经网络:VGGNet,并取得了ILSVRC2014比赛分类项目的第二名。VGGNet的主要贡献是使用很小的卷积核(3×3)构建各种深度的卷积神经网络结构,并对这些网络结构进行了评估,最终证明在16-19层的网络深度能够取得较好的识别精度。这也就是常用来提取图像特征的VGG-16和VGG-19。2结构解析2结构解析VGG-19整体由五个卷积块和3个全连接层组成,每个卷积块由不同层数的卷积层构成。其中第一,二个卷积块分别有两个卷积层,第三,四,五个卷积块分别有四个卷积层。那VGG-19中的19是怎么来的?这里的19只算了卷积层(16层)和全连接层(3层)的数量,没有包括池化层。VGG-19的输入为224×224×3的图像,并且对图像做了均值处理,在每个像素中减去在训练集上计算的RGB均值。2结构解析VGG-19中使用的都是3×3的卷积核,来代替比较大的卷积核,并且使用了连续多个卷积层。使用小的卷积核的问题是,其感受野必然变小,但使用连续的卷积核,可以增大感受野。卷积的固定步长为1,并在图像的边缘填充1个像素,这样卷积后保持图像的分辨率不变;连续的卷积层(卷积块)后会接着一个池化层,做最大池化,步长为2;最后一层卷积层之后,接着的是3个全连接层,前两个每个都有4096个通道,第三是输出层输出1000个分类。2结构解析2结构解析VGG-19优势:VGG-19的结构很是简洁,整个网络都使用了一样大小的卷积核尺寸(3×3)和最大池化尺寸(2×2)。几个小滤波器(3×3)卷积层的组合比一个大滤波器(5×5或7×7)卷积层好,验证了经过不断加深网络结构能够提高性能。VGG-19缺点:VGG-19耗费更多计算资源,而且使用了更多的参数,致使更多的内存占用(140M)。其中绝大多数的参数都是来自于第一个全连接层。VGG-19但是有3个全连接层。注:不少pretrained的方法就是使用VGG的model(主要是16和19),VGG相对其余的方法,参数空间很大,最终的model有500多m,AlexNet只有200m,GoogLeNet更少,因此train一个V

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论