人工智能基础及应用课件 模块一-任务三-《深度学习》_第1页
人工智能基础及应用课件 模块一-任务三-《深度学习》_第2页
人工智能基础及应用课件 模块一-任务三-《深度学习》_第3页
人工智能基础及应用课件 模块一-任务三-《深度学习》_第4页
人工智能基础及应用课件 模块一-任务三-《深度学习》_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

了解人工智能发展的关键技术深度学习Part1Part2Part3深度学习与机器学习的关系常见深度学习算法深度学习的应用场景

Contents目录深度学习与机器学习的关系深度学习是机器学习的一个重要分支,特指基于深层神经网络模型的机器学习方法,如下图所示。它是在统计机器学习与人工神经网络基础上,结合当代大数据与大算力发展而来。其概念源于神经网络研究,例如,包含多个隐藏层的多层感知器就是一种深度学习结构。深度学习最核心的技术特点是自动提取特征,所获得的深度特征相比人工设计的特征,具有更强且更稳健的表示能力。因此,深度学习的本质是特征表征学习,其模型基础——深度神经网络,本质上是一系列非线性变换的嵌套。常见的深度学习算法包括:受限玻尔兹曼机(RestrictedBoltzmannMachine,RBM),DeepBeliefNetworks(DBN),卷积神经网络(ConvolutionalNeuralNetwork,CNN),Transformer自注意力机制等。深度学习常见深度学习算法——受限玻尔兹曼机受限玻尔兹曼机(RBM)是一种可学习数据概率分布的随机生成神经网络,结构示意图如下图(左)所示,作为玻尔兹曼机(BM)的改进变体,如下图(右)所示,其核心创新在于引入了结构限制:RBM规定同一层内神经元不相连,仅允许可见层与隐藏层之间跨层连接,从而将BM全连接网络“所有人交头接耳”般的混乱计算,转变为“仅限与对面交流”的有序高效结构。RBM由可见层和隐藏层构成,可见层负责接收输入数据(如图像像素),隐藏层则通过学习提取其中的抽象特征(如“横线”“圆圈”);通过反复调整层间连接权重,RBM既能实现特征学习,也可借助隐藏层激活反向生成与原始数据相似的新样本,广泛应用于特征提取、数据生成等任务。玻尔兹曼机的运行示意图受限玻尔兹曼机受限玻尔兹曼机常见深度学习算法——卷积神经网络卷积神经网络是一种专为处理图像等网格结构数据而设计的深度学习模型,其结构如下图所示。CNN通过卷积层提取局部特征、池化层压缩信息,最终由全连接层完成分类或回归任务,广泛应用于图像识别与目标检测等领域。其核心思想是通过多层结构对输入数据进行局部特征提取与层级表示,实现从低级特征到高级语义的逐层抽象。CNN的学习方式类似于人类的认知过程:如同人类通过识别鸟喙、狗爪等局部特征来区分不同动物,CNN也通过逐层学习从边缘、纹理到整体形状的特征,最终实现精确的图像识别与分析。卷积神经网络构成卷积神经网络举例眼睛喙脚尾巴这是一只鸟识别常见深度学习算法——卷积神经网络输入层是卷积神经网络的起点,负责接收原始图像数据。以一张224×224像素的彩色图像为例,其输入维度为224×224×3,这三个维度分别对应图像的高度、宽度和颜色通道数(红、绿、蓝)。每个通道都是一个二维矩阵,矩阵中的元素值代表对应像素的强度。卷积层卷积层通过卷积操作提取图像的局部特征,其核心组件是卷积核(或称滤波器)。卷积核在输入图像上滑动,与局部区域进行逐元素相乘并求和,生成特征图(FeatureMap)。例如,使用3×3卷积核处理224×224×3的输入图像,可得到222×222×1的特征图。卷积核的权重通过训练自动学习,不同卷积核能够提取边缘、纹理等不同特征,输出的特征图包含宽度、高度和深度三个维度,具体输出形式如右图所示。卷积神经网络构成输入层卷积层常见深度学习算法——卷积神经网络激活函数层通过引入非线性变换,使神经网络能够学习复杂模式。最常用的ReLU函数定义为f(x)=max(0,x),它将特征图中的负值置零而保留正值。例如,卷积层输出的特征图经ReLU处理后,负值被抑制,重要特征得到增强,这一过程如右图(上)所示。这种非线性变换显著提升了模型对复杂图像特征的表达能力。池化层通过降采样减少特征图尺寸,在保留关键特征的同时降低计算复杂度。以2×2最大池化为例:它在特征图上滑动采样窗口,提取窗口内最大值作为输出。若输入特征图尺寸为222×222×1,经池化后将降为111×111×1(纵深不变)。这一操作使模型对平移、缩放等变化具有更强鲁棒性,其工作原理如右图(下)所示。激活函数原理及处理示例池化原理及处理示例激活函数池化层常见深度学习算法——卷积神经网络全连接层位于网络末端,将前面层级提取的特征展平为一维向量后进行最终分类或回归。该层每个神经元均与前一层的全部输出相连,其输出节点数通常与任务类别数一致(如对4类动物分类则设置4个神经元)。每个神经元的输出值代表对应类别的预测概率,结构示意如下图所示。像素展开、神经元全连接、结果输出全连接层常见深度学习算法——Transformer自注意力机制谷歌于2017年提出的Transformer是一种基于自注意力机制的神经网络架构,它取代了传统的RNN和CNN,能够并行处理序列数据。其核心是多头自注意力机制,结合编码器-解码器结构,有效捕捉长距离依赖关系。通过位置编码保留序列顺序信息,该模型显著提升了机器翻译等任务的性能,已成为BERT、GPT等预训练模型的基础架构,并扩展至多模态领域。自注意力机制是Transformer的核心组件,使模型在处理序列中每个元素时能够关注序列中的所有其他元素,捕捉全局依赖关系。以中文句子“我喜欢学习人工智能”为例,当处理“欢”字时,机制会同时考虑“我”“喜”“学”等字的关联;在英文句子“Itisananimal!”中,处理代词“It”时会特别关注“animal”这一指代对象。这种机制模拟了人类阅读时理解上下文关联的认知过程,确保不遗漏重要信息,为模型的优异表现奠定基础。谷歌于2017发表《AttentionIsAllYouNeed》Transformer自注意力机制常见深度学习算法——Transformer自注意力机制Transformer采用编码器-解码器(Encoder-Decoder)架构,如右图所示。编码器(Encoder)由多个结构相同但参数独立的编码层堆叠而成,每个编码层包含自注意力层(Self-Attention)和前馈神经网络(Position-wiseFeedForwardNetwork,FFN)两个核心子层。自注意力层使编码器在处理每个词时能整合整个输入序列的信息,其输出经前馈网络进一步转换。解码器(Decoder)在保持这两层的基础上,新增了编码器-解码器注意力层,使其在生成每个输出时能聚焦于编码器输出的相关部分。这种分工明确的架构使编码器专注于理解输入序列(如深度解析原文语义),解码器负责生成输出序列(如逐词产生译文),二者协同完成机器翻译等序列到序列任务。由于未使用循环或卷积结构,模型通过位置编码保留序列顺序:为每个词生成包含绝对位置信息的独特向量,与词嵌入相加后形成同时承载语义和位置信息的输入表示,有效支撑了对序列结构的理解。编码器-解码器架构Encoder-Decoder深度学习的应用场景制造业通过深度学习实现从“人工主导”到“人机协同”的转型。在生产环节,基于卷积神经网络的视觉检测系统可实时识别汽车焊接点的熔深偏差、焊瘤等缺陷,显著提升质检效率;同时,利用循环神经网络对电机振动、轴承温度等时序数据进行建模,实现关键部件的预测性维护,大幅减少停机时间。在供应链管理中,自然语言处理技术能自动解析合同与订单文本,提取产品型号、交期等关键信息,驱动仓储系统智能调度,提升整体响应速度。应用场景123智慧交通聚焦“安全保障”与“效率提升”。在自动驾驶领域,CNN负责识别交通信号、车道线及障碍物,LSTM网络则通过分析车辆速度、加速度等时序数据预测周边车辆轨迹,共同为决策系统提供实时环境感知。在交通管理方面,基于目标检测算法的视频系统可实时统计路口行人及机动车流量,动态调整红绿灯配时,有效缓解高峰拥堵,此类自适

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论