




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第python神经网络Densenet模型复现详解目录什么是DensenetDensenet1、Densenet的整体结构2、DenseBlock3、TransitionLayer网络实现代码
什么是Densenet
据说Densenet比Resnet还要厉害,我决定好好学一下。
ResNet模型的出现使得深度学习神经网络可以变得更深,进而实现了更高的准确度。
ResNet模型的核心是通过建立前面层与后面层之间的短路连接(shortcuts),这有助于训练过程中梯度的反向传播,从而能训练出更深的CNN网络。
DenseNet模型,它的基本思路与ResNet一致,也是建立前面层与后面层的短路连接,不同的是,但是它建立的是前面所有层与后面层的密集连接。
DenseNet还有一个特点是实现了特征重用。
这些特点让DenseNet在参数和计算成本更少的情形下实现比ResNet更优的性能。
DenseNet示意图如下:
代码下载
Densenet
1、Densenet的整体结构
如图所示Densenet由DenseBlock和中间的间隔模块TransitionLayer组成。
1、DenseBlock:DenseBlock指的就是DenseNet特有的模块,如下图所示,前面所有层与后面层的具有密集连接,在同一个DenseBlock当中,特征层的高宽不会发生改变,但是通道数会发生改变。
2、TransitionLayer:TransitionLayer是将不同DenseBlock之间进行连接的模块,主要功能是整合上一个DenseBlock获得的特征,并且缩小上一个DenseBlock的宽高,在TransitionLayer中,一般会使用一个步长为2的AveragePooling2D缩小特征层的宽高。
2、DenseBlock
DenseBlock的实现示意图如图所示:
以前获得的特征会在保留后不断的堆叠起来。
以一个简单例子来表现一下具体的DenseBlock的流程:
假设输入特征层为X0。
1、对x0进行一次1x1卷积调整通道数到4*32后,再利用3x3卷积获得一个32通道的特征层,此时会获得一个shape为(h,w,32)的特征层x1。
2、将获得的x1和初始的x0堆叠,获得一个新的特征层,这个特征层会同时保留初始x0的特征也会保留经过卷积处理后的特征。
3、反复经过步骤1、2的处理,原始的特征会一直得到保留,经过卷积处理后的特征也会得到保留。当网络程度不断加深,就可以实现前面所有层与后面层的具有密集连接。
实现代码为:
defdense_block(x,blocks,name):
foriinrange(blocks):
x=conv_block(x,32,name=name+'_block'+str(i+1))
returnx
defconv_block(x,growth_rate,name):
bn_axis=3
x1=layers.BatchNormalization(axis=bn_axis,
epsilon=1.001e-5,
name=name+'_0_bn')(x)
x1=layers.Activation('relu',name=name+'_0_relu')(x1)
x1=layers.Conv2D(4*growth_rate,1,
use_bias=False,
name=name+'_1_conv')(x1)
x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_1_bn')(x1)
x1=layers.Activation('relu',name=name+'_1_relu')(x1)
x1=layers.Conv2D(growth_rate,3,
padding='same',
use_bias=False,
name=name+'_2_conv')(x1)
x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])
returnx
3、TransitionLayer
TransitionLayer将不同DenseBlock之间进行连接的模块,主要功能是整合上一个DenseBlock获得的特征,并且缩小上一个DenseBlock的宽高,在TransitionLayer中,一般会使用一个步长为2的AveragePooling2D缩小特征层的宽高。
实现代码为:
deftransition_block(x,reduction,name):
bn_axis=3
x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_bn')(x)
x=layers.Activation('relu',name=name+'_relu')(x)
x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,
use_bias=False,
name=name+'_conv')(x)
x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)
returnx
网络实现代码
fromkeras.preprocessingimportimage
fromkeras.modelsimportModel
fromkerasimportlayers
fromkeras.applicationsimportimagenet_utils
fromkeras.applications.imagenet_utilsimportdecode_predictions
fromkeras.utils.data_utilsimportget_file
fromkerasimportbackend
importnumpyasnp
BASE_WEIGTHS_PATH=(
'/keras-team/keras-applications/'
'releases/download/densenet/')
DENSENET121_WEIGHT_PATH=(
BASE_WEIGTHS_PATH+
'densenet121_weights_tf_dim_ordering_tf_kernels.h5')
DENSENET169_WEIGHT_PATH=(
BASE_WEIGTHS_PATH+
'densenet169_weights_tf_dim_ordering_tf_kernels.h5')
DENSENET201_WEIGHT_PATH=(
BASE_WEIGTHS_PATH+
'densenet201_weights_tf_dim_ordering_tf_kernels.h5')
defdense_block(x,blocks,name):
foriinrange(blocks):
x=conv_block(x,32,name=name+'_block'+str(i+1))
returnx
defconv_block(x,growth_rate,name):
bn_axis=3
x1=layers.BatchNormalization(axis=bn_axis,
epsilon=1.001e-5,
name=name+'_0_bn')(x)
x1=layers.Activation('relu',name=name+'_0_relu')(x1)
x1=layers.Conv2D(4*growth_rate,1,
use_bias=False,
name=name+'_1_conv')(x1)
x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_1_bn')(x1)
x1=layers.Activation('relu',name=name+'_1_relu')(x1)
x1=layers.Conv2D(growth_rate,3,
padding='same',
use_bias=False,
name=name+'_2_conv')(x1)
x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])
returnx
deftransition_block(x,reduction,name):
bn_axis=3
x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_bn')(x)
x=layers.Activation('relu',name=name+'_relu')(x)
x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,
use_bias=False,
name=name+'_conv')(x)
x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)
returnx
defDenseNet(blocks,
input_shape=None,
classes=1000,
**kwargs):
img_input=layers.Input(shape=input_shape)
bn_axis=3
#224,224,3-112,112,64
x=layers.ZeroPadding2D(padding=((3,3),(3,3)))(img_input)
x=layers.Conv2D(64,7,strides=2,use_bias=False,name='conv1/conv')(x)
x=layers.BatchNormalization(
axis=bn_axis,epsilon=1.001e-5,name='conv1/bn')(x)
x=layers.Activation('relu',name='conv1/relu')(x)
#112,112,64-56,56,64
x=layers.ZeroPadding2D(padding=((1,1),(1,1)))(x)
x=layers.MaxPooling2D(3,strides=2,name='pool1')(x)
#56,56,64-56,56,64+32*block[0]
#Densenet12156,56,64-56,56,64+32*6==56,56,256
x=dense_block(x,blocks[0],name='conv2')
#56,56,64+32*block[0]-28,28,32+16*block[0]
#Densenet12156,56,256-28,28,32+16*6==28,28,128
x=transition_block(x,0.5,name='pool2')
#28,28,32+16*block[0]-28,28,32+16*block[0]+32*block[1]
#Densenet12128,28,128-28,28,128+32*12==28,28,512
x=dense_block(x,blocks[1],name='conv3')
#Densenet12128,28,512-14,14,256
x=transition_block(x,0.5,name='pool3')
#Densenet12114,14,256-14,14,256+32*block[2]==14,14,1024
x=dense_block(x,blocks[2],name='conv4')
#Densenet12114,14,1024-7,7,512
x=transition_block(x,0.5,name='pool4')
#Densenet1217,7,512-7,7,256+32*block[3]==7,7,1024
x=dense_block(x,blocks[3],name='conv5')
x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,name='bn')(x)
x=layers.Activation('relu',name='relu')(x)
x=layers.GlobalAveragePooling2D(name='avg_pool')(x)
x=layers.Dense(classes,activation='softmax',name='fc1000')(x)
inputs=img_input
ifblocks==[6,12,24,16]:
model=Model(inputs,x,name='densenet121')
elifblocks==[6,12,32,32]:
model=Model(inputs,x,name='densenet169')
elifblocks==[6,12,48,32]:
model=Model(inputs,x,name='densenet201')
else:
model=Model(inputs,x,name='densenet')
returnmodel
defDenseNet121(input_shape=[224,224,3],
classes=1000,
**kwargs):
returnDenseNet([6,12,24,16],
input_shape,classes,
**kwargs)
defDenseNet169(input_shape=[224,224,3],
classes=1000,
**kwargs):
returnDenseNet([6,12,32,32],
input_shape,classes,
**kwargs)
defDenseNet201(input_shape=[224,224,3],
classes=1000,
**kwargs):
returnDenseNet([6,12,48,32],
input_shape,classes,
**kwargs)
defpreprocess_input(x):
x/=255.
mean=[0.485,0.456,0.406]
std=[0.229,0.224,0.225]
x[...,0]-=mean[0]
x[...,1]-=mean[1]
x[...,2]-=mean[2]
ifstdisnotNone:
x[...,0]/=std[0]
x[...,1]/=std[1]
x[...,2]/=std[2]
returnx
if__name__=='__main__':
#model=DenseNet121()
#weights_path=get_file(
#'densenet121_weights_tf_dim_ordering_tf_kernels.h5',
#DENSENET121_WEIGHT_PATH,
#cache_subdir='models',
#file_hash='9d60b8095a5708f2dcce2bca79d332c7')
model=DenseNet169()
weights_path=get_file
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中医按摩养生师承合同
- 拆除工程合同履行及施工许可证办理承包合同范本
- 茶叶电商平台入驻与营销合作合同
- 吞咽治疗护理
- 房产代持协议书(婚姻财产分割版)
- 和人有关的课件
- 撤资协议书标准模板
- 车贷抵押担保业务专属合同模板
- 城市出租车经营权承包合作协议范本
- 高端汽车定制生产与售后服务协议
- 小区燃气管道施工方案施工方法
- 糖尿病合并尿路感染
- 教学能力比赛学情分析图(源图可编辑)
- 幼儿园2024-2025学年保教工作计划
- 燕舞集团招聘试题
- 2024年新苏教版五年级下册科学全册精编知识点(附附问答题)
- 肠管脱出的应急救援原则、方法
- 《解密分层教学》读书心得体会(读书心得体会30篇)
- 服务档案管理制度
- 2024年新一轮科技革命的开启
- 村委消防安全网格化管理工作制度范文
评论
0/150
提交评论