python神经网络Densenet模型复现详解_第1页
python神经网络Densenet模型复现详解_第2页
python神经网络Densenet模型复现详解_第3页
python神经网络Densenet模型复现详解_第4页
python神经网络Densenet模型复现详解_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第python神经网络Densenet模型复现详解目录什么是DensenetDensenet1、Densenet的整体结构2、DenseBlock3、TransitionLayer网络实现代码

什么是Densenet

据说Densenet比Resnet还要厉害,我决定好好学一下。

ResNet模型的出现使得深度学习神经网络可以变得更深,进而实现了更高的准确度。

ResNet模型的核心是通过建立前面层与后面层之间的短路连接(shortcuts),这有助于训练过程中梯度的反向传播,从而能训练出更深的CNN网络。

DenseNet模型,它的基本思路与ResNet一致,也是建立前面层与后面层的短路连接,不同的是,但是它建立的是前面所有层与后面层的密集连接。

DenseNet还有一个特点是实现了特征重用。

这些特点让DenseNet在参数和计算成本更少的情形下实现比ResNet更优的性能。

DenseNet示意图如下:

代码下载

Densenet

1、Densenet的整体结构

如图所示Densenet由DenseBlock和中间的间隔模块TransitionLayer组成。

1、DenseBlock:DenseBlock指的就是DenseNet特有的模块,如下图所示,前面所有层与后面层的具有密集连接,在同一个DenseBlock当中,特征层的高宽不会发生改变,但是通道数会发生改变。

2、TransitionLayer:TransitionLayer是将不同DenseBlock之间进行连接的模块,主要功能是整合上一个DenseBlock获得的特征,并且缩小上一个DenseBlock的宽高,在TransitionLayer中,一般会使用一个步长为2的AveragePooling2D缩小特征层的宽高。

2、DenseBlock

DenseBlock的实现示意图如图所示:

以前获得的特征会在保留后不断的堆叠起来。

以一个简单例子来表现一下具体的DenseBlock的流程:

假设输入特征层为X0。

1、对x0进行一次1x1卷积调整通道数到4*32后,再利用3x3卷积获得一个32通道的特征层,此时会获得一个shape为(h,w,32)的特征层x1。

2、将获得的x1和初始的x0堆叠,获得一个新的特征层,这个特征层会同时保留初始x0的特征也会保留经过卷积处理后的特征。

3、反复经过步骤1、2的处理,原始的特征会一直得到保留,经过卷积处理后的特征也会得到保留。当网络程度不断加深,就可以实现前面所有层与后面层的具有密集连接。

实现代码为:

defdense_block(x,blocks,name):

foriinrange(blocks):

x=conv_block(x,32,name=name+'_block'+str(i+1))

returnx

defconv_block(x,growth_rate,name):

bn_axis=3

x1=layers.BatchNormalization(axis=bn_axis,

epsilon=1.001e-5,

name=name+'_0_bn')(x)

x1=layers.Activation('relu',name=name+'_0_relu')(x1)

x1=layers.Conv2D(4*growth_rate,1,

use_bias=False,

name=name+'_1_conv')(x1)

x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_1_bn')(x1)

x1=layers.Activation('relu',name=name+'_1_relu')(x1)

x1=layers.Conv2D(growth_rate,3,

padding='same',

use_bias=False,

name=name+'_2_conv')(x1)

x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])

returnx

3、TransitionLayer

TransitionLayer将不同DenseBlock之间进行连接的模块,主要功能是整合上一个DenseBlock获得的特征,并且缩小上一个DenseBlock的宽高,在TransitionLayer中,一般会使用一个步长为2的AveragePooling2D缩小特征层的宽高。

实现代码为:

deftransition_block(x,reduction,name):

bn_axis=3

x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_bn')(x)

x=layers.Activation('relu',name=name+'_relu')(x)

x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,

use_bias=False,

name=name+'_conv')(x)

x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)

returnx

网络实现代码

fromkeras.preprocessingimportimage

fromkeras.modelsimportModel

fromkerasimportlayers

fromkeras.applicationsimportimagenet_utils

fromkeras.applications.imagenet_utilsimportdecode_predictions

fromkeras.utils.data_utilsimportget_file

fromkerasimportbackend

importnumpyasnp

BASE_WEIGTHS_PATH=(

'/keras-team/keras-applications/'

'releases/download/densenet/')

DENSENET121_WEIGHT_PATH=(

BASE_WEIGTHS_PATH+

'densenet121_weights_tf_dim_ordering_tf_kernels.h5')

DENSENET169_WEIGHT_PATH=(

BASE_WEIGTHS_PATH+

'densenet169_weights_tf_dim_ordering_tf_kernels.h5')

DENSENET201_WEIGHT_PATH=(

BASE_WEIGTHS_PATH+

'densenet201_weights_tf_dim_ordering_tf_kernels.h5')

defdense_block(x,blocks,name):

foriinrange(blocks):

x=conv_block(x,32,name=name+'_block'+str(i+1))

returnx

defconv_block(x,growth_rate,name):

bn_axis=3

x1=layers.BatchNormalization(axis=bn_axis,

epsilon=1.001e-5,

name=name+'_0_bn')(x)

x1=layers.Activation('relu',name=name+'_0_relu')(x1)

x1=layers.Conv2D(4*growth_rate,1,

use_bias=False,

name=name+'_1_conv')(x1)

x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_1_bn')(x1)

x1=layers.Activation('relu',name=name+'_1_relu')(x1)

x1=layers.Conv2D(growth_rate,3,

padding='same',

use_bias=False,

name=name+'_2_conv')(x1)

x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])

returnx

deftransition_block(x,reduction,name):

bn_axis=3

x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_bn')(x)

x=layers.Activation('relu',name=name+'_relu')(x)

x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,

use_bias=False,

name=name+'_conv')(x)

x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)

returnx

defDenseNet(blocks,

input_shape=None,

classes=1000,

**kwargs):

img_input=layers.Input(shape=input_shape)

bn_axis=3

#224,224,3-112,112,64

x=layers.ZeroPadding2D(padding=((3,3),(3,3)))(img_input)

x=layers.Conv2D(64,7,strides=2,use_bias=False,name='conv1/conv')(x)

x=layers.BatchNormalization(

axis=bn_axis,epsilon=1.001e-5,name='conv1/bn')(x)

x=layers.Activation('relu',name='conv1/relu')(x)

#112,112,64-56,56,64

x=layers.ZeroPadding2D(padding=((1,1),(1,1)))(x)

x=layers.MaxPooling2D(3,strides=2,name='pool1')(x)

#56,56,64-56,56,64+32*block[0]

#Densenet12156,56,64-56,56,64+32*6==56,56,256

x=dense_block(x,blocks[0],name='conv2')

#56,56,64+32*block[0]-28,28,32+16*block[0]

#Densenet12156,56,256-28,28,32+16*6==28,28,128

x=transition_block(x,0.5,name='pool2')

#28,28,32+16*block[0]-28,28,32+16*block[0]+32*block[1]

#Densenet12128,28,128-28,28,128+32*12==28,28,512

x=dense_block(x,blocks[1],name='conv3')

#Densenet12128,28,512-14,14,256

x=transition_block(x,0.5,name='pool3')

#Densenet12114,14,256-14,14,256+32*block[2]==14,14,1024

x=dense_block(x,blocks[2],name='conv4')

#Densenet12114,14,1024-7,7,512

x=transition_block(x,0.5,name='pool4')

#Densenet1217,7,512-7,7,256+32*block[3]==7,7,1024

x=dense_block(x,blocks[3],name='conv5')

x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,name='bn')(x)

x=layers.Activation('relu',name='relu')(x)

x=layers.GlobalAveragePooling2D(name='avg_pool')(x)

x=layers.Dense(classes,activation='softmax',name='fc1000')(x)

inputs=img_input

ifblocks==[6,12,24,16]:

model=Model(inputs,x,name='densenet121')

elifblocks==[6,12,32,32]:

model=Model(inputs,x,name='densenet169')

elifblocks==[6,12,48,32]:

model=Model(inputs,x,name='densenet201')

else:

model=Model(inputs,x,name='densenet')

returnmodel

defDenseNet121(input_shape=[224,224,3],

classes=1000,

**kwargs):

returnDenseNet([6,12,24,16],

input_shape,classes,

**kwargs)

defDenseNet169(input_shape=[224,224,3],

classes=1000,

**kwargs):

returnDenseNet([6,12,32,32],

input_shape,classes,

**kwargs)

defDenseNet201(input_shape=[224,224,3],

classes=1000,

**kwargs):

returnDenseNet([6,12,48,32],

input_shape,classes,

**kwargs)

defpreprocess_input(x):

x/=255.

mean=[0.485,0.456,0.406]

std=[0.229,0.224,0.225]

x[...,0]-=mean[0]

x[...,1]-=mean[1]

x[...,2]-=mean[2]

ifstdisnotNone:

x[...,0]/=std[0]

x[...,1]/=std[1]

x[...,2]/=std[2]

returnx

if__name__=='__main__':

#model=DenseNet121()

#weights_path=get_file(

#'densenet121_weights_tf_dim_ordering_tf_kernels.h5',

#DENSENET121_WEIGHT_PATH,

#cache_subdir='models',

#file_hash='9d60b8095a5708f2dcce2bca79d332c7')

model=DenseNet169()

weights_path=get_file

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论