第三章 深度学习_第1页
第三章 深度学习_第2页
第三章 深度学习_第3页
第三章 深度学习_第4页
第三章 深度学习_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医/学/人/工/智/能

深度学习目录CONTENTS深度学习概述PART01PART02神经网络基础PART03深度学习在医药领域的实际应用深度学习概述三起两落:神经网络发展简史01感知器的诞生与局限1958年,感知机作为首个神经网络模型诞生,能够自动学习权重,但受限于异或问题,无法处理复杂非线性数据,导致研究陷入低谷。02反向传播的突破1986年,反向传播算法的提出解决了多层神经网络训练难题,为模型向深度化发展奠定了基础,推动了神经网络的复兴。03深度学习概念的确立2006年,Hinton提出深度信念网络与无监督逐层预训练,有效解决了深层网络优化难题,标志着深度学习概念正式确立。04深度学习在医学影像中的应用2012年,AlexNet在ImageNet竞赛夺冠,推动医学影像识别进入实用阶段,如X光肺炎检测准确率大幅提升。深度学习的定义与特点深度学习是机器学习的分支,基于深层神经网络架构,通过多层非线性变换自动学习数据分布式特征表示,无需人工设计特征规则。深度学习的定义1.多层神经网络结构2.自动特征提取3.强大的表示学习能力4.依赖大量数据和计算资源深度学习的特点图3-1

特征表征学习神经网络基础01神经网络的结构神经网络由输入层、隐藏层和输出层构成。输入层接收原始数据,隐藏层通过非线性变换提取特征,输出层根据任务类型输出预测结果。02神经元的工作原理神经元通过加权求和、激活函数引入非线性,将输入信号转换为输出信号。常用的激活函数包括ReLU、Sigmoid、Tanh和Softmax。03神经网络的训练过程训练过程包括前向传播、损失函数计算、反向传播和权重更新,通过调整权重和偏置使网络输出接近真实值。卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种包含卷积计算的前馈神经网络,特别适用于处理具有网格结构的数据,如图3-5。CNN通过卷积层、池化层和全连接层的组合,能够自动提取图像的局部特征,并逐步构建出高级特征表示。卷积神经网络CNN图3-5卷积神经网络卷积神经网络CNN01卷积层的作用卷积层通过卷积核在输入数据上滑动,提取局部特征,如边缘、纹理等,适用于医学影像中病变特征的提取。02池化层的作用池化层通过最大池化或平均池化操作,减少特征图的尺寸,保留重要特征,降低计算量和过拟合风险。03全连接层的作用全连接层将卷积层和池化层提取到的特征进行整合,用于最终的分类或回归任务,输出每个类别的概率。1.卷积层

卷积层的核心操作是卷积。卷积层包含多个卷积核(或滤波器),每个卷积核(例如:3×3或5×5的权重矩阵)在输入数据上滑动(卷积),并计算卷积核与输入数据的点积(加权求和),生成特征图(FeatureMap)。每个卷积核生成一个特征图,特征图的大小取决于卷积核的大小、步长(Stride)和填充(Padding)。卷积神经网络CNN对于多通道输入(如彩色图像的RGB三个通道),每个卷积核会对所有输入通道进行卷积操作,然后将结果相加得到一个特征图,因此输入数据的维度一般有三个:(长,宽,通道)。图3-6

卷积操作CNN的结构通常由以下几个关键部分组成:卷积神经网络CNN2.激活函数

在卷积层之后,通常使用ReLU激活函数引入非线性特性。ReLU函数将所有负值置为0,保留正值,有助于缓解梯度消失问题,过滤无关噪声(如X光片的设备伪影),突出关键特征。也可以使用其他激活函数,如Tanh或Sigmoid,但在CNN中ReLU是最常用的。3.池化层

池池化层的主要作用是对特征图进行降维,减少数据量和计算量,同时能够降低过拟合的风险,保留重要特征。它通过在特征图上滑动一个窗口(称为池化窗口),并对窗口内的元素进行聚合操作来实现降维。常见的池化操作包括最大池化(MaxPooling)和平均池化(AveragePooling)。图3-7

最大池化图3-8

平均池化CNN的结构通常由以下几个关键部分组成:CNN的结构通常由以下几个关键部分组成:卷积神经网络CNN4.全连接层

全连接层是CNN的最后一部分,它将卷积层和池化层提取到的特征进行整合,用于进行最终的分类或回归任务。全连接层中的每个神经元与前一层的所有神经元相连,通过学习权重矩阵和偏置项来实现特征的组合和分类。在全连接层中,输入是一个一维向量,通常是将前面层输出的多通道特征图进行展平(Flatten)操作得到的。CNN的工作原理:卷积神经网络CNN输入数据

输入数据通常是图像,其维度为(高度,宽度,通道数)。例如,对于RGB图像,通道数为3。卷积层

卷积层通过卷积核在输入数据上滑动,计算卷积核与输入数据的点积,生成特征图。每个卷积核生成一个特征图,多个卷积核生成多个特征图,形成新的特征图集合。激活函数

在卷积层之后,应用ReLU激活函数,将所有负值置为0,保留正值。池化层

池化层通过最大池化或平均池化操作,减少特征图的尺寸,保留重要特征。重复卷积和池化

通常会有多层卷积和池化操作,每一层的卷积核数量逐渐增加,特征图的尺寸逐渐减小。展平操作

在经过多层卷积和池化后,特征图被展平为一维向量。全连接层

全连接层的每个神经元与前一层的所有神经元相连,用于学习特征之间的复杂关系。最后一层是输出层,输出每个类别的概率。经典CNN演进:从LeNet到ResNetLeNet与AlexNetLeNet是最早的CNN之一,用于手写数字识别;AlexNet在2012年ImageNet竞赛中取得突破性成果,推动了CNN的发展。VGGNet与ResNetVGGNet结构简单,使用多个小卷积核和池化层;ResNet通过引入跳跃连接解决了深层网络训练中的梯度消失问题。循环神经网络(RNN)及其变体RNN的基本单元是循环单元。它接收两个输入:当前时间步的输入(xt)和上一时间步的隐藏状态(ht−1)。隐藏状态可以看作是网络的记忆,它将上一时间步的信息传递到当前时间步。在每个时间步,循环单元会根据输入和隐藏状态计算新的隐藏状态(ht),并可能产生一个输出(yt)。隐藏状态的更新公式一般可以表示为:其中,Wx和Wh分别是输入权重矩阵和隐藏状态权重矩阵,b是偏置项,f是非线性激活函数,如tanh或ReLU。1.RNNLSTM是为了克服RNN在处理长序列数据时容易出现的梯度消失问题而设计的。它通过引入门控机制来控制信息的流动,使得网络能够更好地学习到长距离的依赖关系。LSTM有三个主要的门:遗忘门、输入门和输出门。遗忘门决定哪些信息需要被丢弃,输入门决定哪些新信息需要被写入,输出门决定哪些信息需要被输出。这使得LSTM网络在信息流通过网络时可以选择性地保留或丢弃信息,从而能够学习长期依赖关系。循环神经网络(RNN)及其变体2.长短期记忆网络(LSTM)GRUs的核心思想是使用门控机制来选择性地更新在每个时间步的隐藏状态,使它们能够记住重要的信息,同时丢弃无关的细节。GRU有两个门:更新门和重置门。更新门决定了新隐藏状态中保留旧隐藏状态信息的程度,重置门决定了新隐藏状态中忽略旧隐藏状态信息的程度。循环神经网络(RNN)及其变体3.门控循环单元(GRU)双向循环神经网络(BRNN)是传统RNN的扩展,旨在处理正向和反向的数据,使得网络在预测时能够利用过去的和未来的上下文。Bi-RNN包含两个RNN,一个用于处理正向序列(从左到右),另一个用于处理反向序列(从右到左)。每个时间步的输出由正向RNN的隐藏状态和反向RNN的隐藏状态拼接而成。循环神经网络(RNN)及其变体4.双向循环神经网络(Bi-RNN)自注意力机制旨在衡量序列中不同位置之间的相关性,从而让模型能够关注到序列中与当前位置相关的其他位置的信息。例如,在处理一句话时,通过自注意力机制,模型可以确定每个词与其他词之间的关联程度,进而更好地理解句子的语义。具体来说,对于输入序列中的每个位置i,会生成三个向量:查询向量(queryvector,Qi)、键向量(keyvector,Ki)和值向量(valuevector,Vi)。查询向量和键向量用于计算注意力分数,值向量用于生成最终的输出。注意力分数的计算公式为:循环神经网络(RNN)及其变体5.Transformer其中,j表示序列中的另一个位置,*表示向量的点积。通过将注意力分数进行softmax操作,可以得到注意力权重(attentionweight),即:循环神经网络(RNN)及其变体5.Transformer其中,n是序列的长度。然后,将注意力权重与对应的值向量相乘并求和,得到位置i的输出:医学图像处理1CNN在医学图像分类中应用广泛,例如对X光、CT、MRI等医学影像进行分析,以辅助医生诊断疾病。通过训练CNN模型识别图像中的病变特征,能够实现对疾病的自动检测和分类。例如,在肺部CT图像中检测肺炎、肺结节等病变,CNN可以学习到病变区域的纹理、形状等特征,从而实现准确的分类。深度学习在医药领域的实际应用医学文本处理2利用RNN及其变体可以对患者的连续生命体征数据(如心电图、血压、血氧饱和度等)进行实时监测和预测。例如,通过分析患者一段时间内的心电图序列数据,LSTM可以帮助预测心律失常等异常情况的发生,提前发出预警信号,以便医护人员及时采取措施深度学习在医药领域的实际应用药物研发3在药物分子设计和筛选过程中,理解药物分子在生物体内的动态行为(如与靶点的结合过程、在体内的代谢过程等)非常重要。Bi-RNN可以用于处理药物分子的动态模拟数据,分析其在不同时间和环境下的状态变化,帮助研究人员优化药物分子的结构,提高药物的疗效和安全性。药物临床试验会产生大量的患者生理指标、症状变化等时间序列数据。RNN及其变体可以对这些数据进行建模,分析药物的治疗效果和不良反

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论