版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、;.1卷积神经网络卷积神经网络;.2目录 1.概述 2.核心思想 3.文字识别系统LeNet-5 4.优点;.31.概述 卷积神经网络是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点。 它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。 该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。;.4 在CNN中,图像的一小部分(局部感受区域)作为层级结构的最低层的输入,信息再依次传输到不同的层,每层通过一个数字滤波器去获得观测数据的最显著的特征。 这个方法能够获取对平移、
2、缩放和旋转不变的观测数据的显著特征,因为图像的局部感受区域允许神经元或者处理单元可以访问到最基础的特征,例如定向边缘或者角点。;.52.核心思想卷积神经网络通过以下特性来保证图像对位移、缩放、扭曲的鲁棒性:局部感受野权值共享时间/空间亚采样;.6局部感受野BP神经网络全连接卷积神经网络卷积神经网络 局部连接局部连接;.7全连接网络。如果我们有全连接网络。如果我们有1000 x1000像素的图像,像素的图像,有有1百万个隐层神经元,每个隐层神经元都连接图像百万个隐层神经元,每个隐层神经元都连接图像的每一个像素点,就有的每一个像素点,就有1000 x1000 x1000000=1012个连接,也就
3、是个连接,也就是1012个权值参数。个权值参数。局部连接网络,每一个节点与上层节点同位置附件局部连接网络,每一个节点与上层节点同位置附件10 x10的窗口相连接,则的窗口相连接,则1百万个隐层神经元就只有百万个隐层神经元就只有100w乘以乘以100,即,即108个参数。其权值连接个数比原个参数。其权值连接个数比原来减少了四个数量级。来减少了四个数量级。;.8权值共享 隐含层的每一个神经元都连接10 x10个图像区域,也就是说每一个神经元存在10 x10=100个连接权值参数。 如果设定每个神经元这100个参数是相同的,也就是说每个神经元用的是同一个卷积核去卷积图像,参数个数与神经元个数无关。
4、无论隐层的神经元个数有多少,两层间的连接只有100个参数 隐层的参数个数和隐层的神经元个数无关,只和滤波器的大小和滤波器种类的多少有关。;.9;.10Feature Map 假如一种滤波器,也就是一种卷积核就是提出图像的一种特征。 提取不同的特征,需要多个滤波器。每种滤波器的参数不一样,表示它提出输入图像的不同特征。这样每种滤波器去卷积图像就得到对图像的不同特征的放映,我们称之为Feature Map。 100种卷积核就有100个Feature Map。这100个Feature Map就组成了一层神经元。 每层参数个数=100种卷积核x每种卷积核共享100个参数=100 x100=10K,也就
5、是1万个参数。;.11隐层神经元个数 隐层的神经元个数和原图像,也就是输入的大小(神经元个数)、滤波器的大小和滤波器在图像中的滑动步长都有关。 例如,图像是1000 x1000像素,而滤波器大小是10 x10,假设滤波器没有重叠,也就是步长为10,这样隐层的神经元个数就是(1000 x1000 )/ (10 x10)=100 x100个神经元了。 注意:这只是一种滤波器,也就是一个Feature Map的神经元个数如果100个Feature Map就是100倍了。 由此可见,图像越大,神经元个数和需要训练的权值参数个数的差距就越大;.12网络结构 卷积神经网络含多层; 每层含多个二维Featu
6、re Map; 每个Feature Map含多个神经元。;.13 C层为特征提取层,每个神经元的输入与前一层的局部感受野相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来; S层是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等。 卷积神经网络中的每一个特征提取层(C-层)都紧跟着一个用来求局部平均与二次提取的计算层(S-层)。;.143.文字识别系统LeNet-5;.15;.16 1. 输入图像是32x32的大小,局部滑动窗的大小是5x5的,由于不考虑对图像的边界进行拓展,则滑动窗将有28x28个不同的位
7、置,也就是C1层的大小是28x28。 C1层是一个卷积层(通过卷积运算,可以使原信号特征增强,并且降低噪音),由6个特征图Feature Map构成。特征图中每个神经元与输入中5*5的邻域相连。;.17 C1有156个可训练参数(每个滤波器5*5=25个unit参数和一个bias参数,一共6个滤波器,共(5*5+1)*6=156个参数),共156*(28*28)=122,304个连接。;.18C1层:输入图片大小:32*32卷积窗大小:5*5卷积窗种类: 6输出特征图数量:6输出特征图大小:28*28(32-5+1)神经元数量:4707 (28*28)*6)连接数:12304 (5*5+1)*
8、6*(28*28)可训练参数:156 (5*5+1)*6;.19 2. S2层是一个下采样层,利用图像局部相关性的原理,对图像进行子抽样,可以减少数据处理量同时保留有用信息。 S2层每个单元的4个输入相加,乘以一个可训练参数,再加上一个可训练偏置,结果通过sigmoid函数计算。;.20 简单的说,由4个点下采样为1个点,也就是4个数的加权平均。因此S2中每个特征图的大小是C1中特征图大小的1/4(行和列各1/2),因此有6个14*14的特征图。 S2层有(1+1)*6=12个可训练参数,有(2*2+1)*14*14*6=5880个连接。;.21S2层:输入图片大小:(28*28)*6卷积窗大
9、小:2*2卷积窗种类:6输出下采样图数量:6输出下采样图大小:(14*14)*6神经元数量:1176(14*14)*6连接数:5880(4+1)*(14*14)*6可训练参数:12(6*2);.22卷积和子采样过程卷积和子采样过程;.23 卷积过程包括:用一个可训练的滤波器fx去卷积一个输入的图像(第一阶段是输入的图像,后面的阶段就是卷积特征map了),然后加一个偏置bx ,得到卷积层Cx 。;.24;.25 子采样过程包括:每邻域四个像素求和变为一个像素,然后通过标量子采样过程包括:每邻域四个像素求和变为一个像素,然后通过标量Wx+1加权,再增加偏置加权,再增加偏置bx+1 ,然后通过,然后
10、通过一个一个sigmoid激活函数,产生一个大概缩小四倍的特征映射图激活函数,产生一个大概缩小四倍的特征映射图Sx+1 。;.26 从一个平面到下一个平面的映射可以看作是作卷积运算,S-层可看作是模糊滤波器,起到二次特征提取的作用。 隐层与隐层之间空间分辨率递减,而每层所含的平面数递增,这样可用于检测更多的特征信息。;.27 3. C3层也是一个卷积层,它同样通过5x5的卷积核去卷积层S2,然后得到的特征map就只有10 x10个神经元,但是它有16种不同的卷积核,所以就存在16个特征map了。 注意:C3中的每个特征map是连接到S2中的所有6个或者几个特征map的,表示本层的特征map是上
11、一层提取到的特征map的不同组合;.28C3层:输入图片大小:(14*14)*6卷积窗大小:5*5卷积窗种类:16输出特征图数量:16输出特征图大小:10*10(14-5+1)神经元数量:1600 (10*10)*16)连接数:151600 (部分连接)可训练参数:1516 ;.29简单的说,例如对于简单的说,例如对于C3层第层第0张特征图,其每一个节点与张特征图,其每一个节点与S2层的第层的第0张特征图,第张特征图,第1张特征图,第张特征图,第2张特张特征图,总共征图,总共3个个5x5个节点相连接。后面依次类推,个节点相连接。后面依次类推,C3层每一张特征映射图的权值是相同的。层每一张特征映
12、射图的权值是相同的。;.30 前6个feature map与S2层相连的3个feature map相连接,后面6个feature map与S2层相连的4个feature map相连接,后面3个feature map与S2层部分不相连的4个feature map相连接,最后一个与S2层的所有feature map相连。 卷积核大小依然为5*5,所以总共有6*(3*5*5+1)+6*(4*5*5+1)+3*(4*5*5+1)+1*(6*5*5+1)=1516个参数。而图像大小为10*10,所以共有151600个连接。;.31 4. S4层是一个下采样层,由16个5*5大小的特征图构成。特征图中的每
13、个单元与C3中相应特征图的2*2邻域相连接,跟C1和S2之间的连接一样。 S4层有32个可训练参数(每个特征图1个因子和一个偏置)和16*5*5(2*2+1)=2000个连接。;.32S4层:输入图片大小:(10*10)*16卷积窗大小:2*2卷积窗种类:16输出下采样图数量:16输出下采样图大小:(5*5)*16神经元数量:400(5*5)*16连接数:2000(4+1)*(5*5)*16可训练参数:32(16*2);.33 5.C5是卷积层,总共120个feature map,每个feature map与S4层所有的feature map相连接,卷积核大小是5*5,而S4层的feature
14、 map的大小也是5*5,这构成了S4和C5之间的全连接,所以C5的feature map就变成了1个点,共计有120(25*16+1)=48120个参数。;.34C5层:输入图片大小:(5*5)*16卷积窗大小:5*5卷积窗种类:120输出特征图数量:120输出特征图大小:1*1(5-5+1)神经元数量:120 (1*120)连接数:48120 16*25+1*1*120(全连接)可训练参数:48120 16*25+1*1*120;.35 6. F6层有84个单元(之所以选这个数字的原因来自于输出层的设计),与C5层全相连。有84*(120+1)=10164个可训练参数。 如同经典神经网络,
15、F6层计算输入向量和权重向量之间的点积,再加上一个偏置。然后将其传递给sigmoid函数产生单元i的一个状态。;.36F6层:输入图片大小:(1*1)*120卷积窗大小:1*1卷积窗种类:84输出特征图数量:84输出特征图大小:1神经元数量:84 连接数:10164 120*84(全连接)可训练参数:10164 120*84;.37OUTPUT层:输入图片大小:1*84输出特征图数量:1*10;.384.卷积神经网路的优点 (1)识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显式的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。;.39 (2)卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。;.40 (3)它可以直接处理灰度图片,能够直接用于处理基于图像的分类。 流的分类方式几乎都是基于统计特征的,这就意味着在进行分辨前必须提取某些特征。然而,显式的特征提取并不容易,在一些应用问题中也并非总是可靠的。卷
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 核心素养导向教学
- 《GB-T 28200-2011钢制储物柜(架)技术要求及试验方法》专题研究报告
- GBT 19290.7-2021发展中的电子设备构体机械结构模数序列 第2-5部分:分规范 25 mm设备构体的接口协调尺寸 各种设备用机柜接口尺寸专题研究报告
- 《宠物鉴赏》课件-宠物鸟的简介
- 2026年安徽省马鞍山市单招职业倾向性测试题库及参考答案详解一套
- 心血管留图资料
- 云数据库运维服务合同
- 智能电表调试技师(初级)考试试卷及答案
- 种子包装设计行业种子包装设计师(蔬菜)岗位招聘考试试卷及答案
- (2025)全国劳动保障知识竞赛题库与参考答案
- 2025年烟花爆竹经营单位安全管理人员考试试题及答案
- 2025天津大学管理岗位集中招聘15人参考笔试试题及答案解析
- 2025广东广州黄埔区第二次招聘社区专职工作人员50人考试笔试备考题库及答案解析
- 2025年云南省人民检察院聘用制书记员招聘(22人)考试笔试参考题库及答案解析
- 旋挖钻机地基承载力验算2017.7
- xx乡镇卫生院重症精神病管理流程图
- 2023年印江县人民医院紧缺医学专业人才招聘考试历年高频考点试题含答案解析
- 安徽绿沃循环能源科技有限公司12000t-a锂离子电池高值资源化回收利用项目(重新报批)环境影响报告书
- 《汽车电器故障问题研究4600字(论文)》
- 公路工程标准施工招标文件第八章-工程量清单计量规则(2018年版最终稿)
- DB44-T 2197-2019配电房运维服务规范-(高清现行)
评论
0/150
提交评论