《人工智能通识》课件 第五章 深度学习_第1页
《人工智能通识》课件 第五章 深度学习_第2页
《人工智能通识》课件 第五章 深度学习_第3页
《人工智能通识》课件 第五章 深度学习_第4页
《人工智能通识》课件 第五章 深度学习_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章:深度学习目录CONTENTS01深度学习概述02神经网络基础03深度学习类型04深度学习应用深度学习概述015.1.1深度学习定义与起源深度学习定义深度学习(deeplearning)是机器学习(machinelearning)的一个重要分支,它基于人工神经网络(artificialneuralnetworks,ANN)的架构和原理,通过构建多层(深层)神经网络结构,自动从大量数据中学习数据的特征表示和复杂模式。与传统的机器学习方法相比,深度学习的核心优势在于能够自动提取数据的层次化特征,而无须人工设计复杂的特征工程。5.1.1深度学习定义与起源深度学习起源于20世纪40-50年代对人脑神经元的模拟研究。1943年,McCulloch和Pitts提出首个形式化神经元模型;1958年,Rosenblatt提出感知机,可实现简单线性分类,奠定神经网络基础。发展瓶颈与反向传播突破(20世纪70-80年代)受算力与数据限制,神经网络在70-80年代陷入停滞。1986年,Hinton等人提出反向传播算法,有效训练多层网络,推动神经网络重回发展轨道。深度学习的爆发与时代里程碑(21世纪至今)2012年AlexNet在ImageNet把错误率从26%降到15%,证明深度卷积在大规模视觉任务中的威力,标志深度学习进入主流研究与产业落地阶段。此后,深度学习在图像识别、自然语言处理、语音识别、自动驾驶等多个领域取得了令人瞩目的成就,成为人工智能领域最热门的研究方向之一。深度学习定义深度学习的早期萌芽(20世纪40-50年代)5.1.2深度学习五大核心特点自动特征提取告别繁琐的人工特征工程自动从原始信号中逐层抽象,构建从边缘到语义的特征表示,大幅节省专家人力并提升泛化能力。强大的模型拟合能力捕捉复杂的非线性关系深层网络赋予极强表达力,通过多层非线性变换挖掘数据本质规律,在图像语音等高维任务中表现卓越。高效利用大规模数据数据驱动的性能飞跃数据越多特征越全面,配合数据增强可有效防止过拟合,将大数据优势转化为实实在在的模型精度优势。5.1.2深度学习五大核心特点计算资源高效利用:硬件与框架赋能•专用芯片(GPU/TPU):并行计算将训练从数周缩短至数小时•分布式计算:突破单节点瓶颈,提升整体吞吐量•核心价值:加速复杂模型落地,推动AI技术快速迭代模型可扩展性:灵活适配多样化任务•架构调整:增减层数/神经元,轻松适配任务复杂度变化•迁移学习:复用预训练模型,大幅降低新任务训练成本•核心价值:具备极强通用性,广泛覆盖图像/NLP/自动驾驶等领域神经网络基础025.2.1神经元模型与激活函数1.接收输入获取外部或其他神经元的信号源(x₁,x₂,...,xₙ)。2.加权求和每个信号源乘以一个权重(ω₁,ω₂,...,ωₙ),代表其重要性,然后将所有加权后的信号相加,再加上一个偏置值θ。3.激活处理将加权和的结果输入到一个激活函数中,引入非线性因素,决定神经元是否应该被“激活”。4.产生输出激活函数处理后,产生最终的输出信号y,该信号可以作为下一层神经元的输入。y=∑(xi·wi)+θxi:输入信号|wi:权重|θ:偏置值核心定义模仿生物神经元的计算单元,通过加权、求和、激活等操作将多输入转化为单输出。5.2.2神经元模型与激活函数核心逻辑:模拟人脑分层处理构建多层次信息处理系统,数据逐层传递与转换,从原始输入到最终输出层层递进。输入层(InputLayer)|信息入口,接收原始特征数据隐藏层(HiddenLayer)|核心处理,提取复杂特征模式输出层(OutputLayer)|结果生成,输出预测或分类结果•神经元:基本计算单元•权重参数:网络学习核心•激活函数:引入非线性5.2.3神经网络的学习过程01前向传播(ForwardPropagation)输入数据逐层运算,生成预测结果,构建基础输出02计算损失(CalculateLoss)对比预测值与真实标签,量化误差,评估模型表现03反向传播(BackwardPropagation)反向计算参数梯度,定位误差来源,指导参数修正04参数更新(UpdateParameters)基于梯度调整权重与偏置,迭代优化模型,减小误差神经网络的学习过程通常是基于监督学习的,其目标是通过训练数据调整网络参数,使网络的输出尽可能接近真实标签。5.2.4神经网络的优化方法核心目标:效率与性能的双重提升通过优化策略加速模型收敛,提升最终表现,增强泛化能力。优化算法:参数更新引擎梯度下降(BGD/SGD)|动量优化加速|Adam自适应调整正则化技术:防止过拟合L1/L2参数约束|Dropout随机丢弃|提升模型鲁棒性初始化方法:训练的起点随机初始化打破对称|Xavier/He初始化保持信号稳定图示:梯度下降沿损失曲面寻找最小值的优化路径💡关键洞察:合适的优化组合是训练成功的关键。好的初始化配合自适应算法,能让模型在更少Epoch内达到更高精度。梯度下降是所有优化策略的底层逻辑深度学习类型035.3深度学习类型核心定义:机器学习分支,通过构建深层神经网络自动学习数据的多层次抽象特征。▌按学习方式分类监督学习:利用标签数据(CNN/RNN)无监督学习:发现未标记数据模式(GAN)半监督学习:结合少量标签与大量无标签强化学习:通过奖励机制优化策略▌主流模型架构FNNCNNRNNGANGNNTransformer从感知到认知的进化DeepLearning:EvolutionofAI5.3.1卷积神经网络(CNN)核心原理:特征提取与降维通过卷积层提取边缘、纹理等局部特征,再通过池化层降低特征维度,模拟人眼视觉机制。关键特点:高效识别的奥秘•局部连接:卷积核聚焦图像局部区域•参数共享:大幅减少模型参数量,防止过拟合主要应用:多领域视觉赋能•分类与检测:手写数字识别、人脸识别、自动驾驶•图像分割:医学影像病灶定位、卫星地图分析图示:卷积神经网络(CNN)层级结构示意图技术价值CNN是深度学习在计算机视觉领域取得突破的基石技术。5.3.2循环神经网络(RNN)循环神经网络(RNN)核心原理:循环神经网络(RNN),如图5-6所示,通过记忆之前的输入,将其输出传递给下一步的输入,使得模型可以处理序列数据。RNN的每个时间步都依赖前一个时间步的输出,形成一种链式结构。主要痛点:存在梯度消失,难以捕捉长距离依赖关系RNN存在梯度消失和梯度爆炸问题,使得它在处理长序列时性能不佳,这为后来的LSTM和GRU带来了改进空间。图示:RNN循环展开结构5.3.3长短时记忆网络(LSTM)核心原理:门控机制引入遗忘门、输入门、输出门,像阀门一样精确控制信息的流动与保留。解决痛点:突破遗忘有效解决RNN的梯度消失问题,既能记住长期重要信息,又能主动遗忘无关细节。直观类比:故事阅读如同阅读长篇故事,大脑会选择性记住关键情节(输入/输出),忘记琐碎描写(遗忘)。LSTM单元核心结构示意“赋予神经网络长时记忆的能力”长序列数据处理的首选算法之一5.3.4自编码器(Autoencoder)核心结构:编码与解码•编码器:将高维输入压缩为低维潜在特征•解码器:从低维特征中还原重建原始输入学习目标:最小化重构误差通过不断优化,让输出尽可能接近输入,从而捕捉数据的本质特征。主要应用场景数据降维可视化|关键特征提取|图像/数据去噪自编码器网络结构示意图5.3.5生成对抗网络(GAN)核心架构:博弈的双生网络生成器负责“造假”生成假数据,判别器负责“打假”识别真伪,两者构成对抗核心。训练机制:对抗式螺旋进化如同猫鼠游戏,双方在持续博弈中迭代升级,最终生成器产出以假乱真的高保真数据。核心应用:多元场景落地覆盖虚拟人脸/艺术创作(图像生成)、照片转油画(风格迁移)及小样本数据增强等领域。图示:GAN标准工作流——展示了从随机噪声输入,经生成器(G)生成数据,再由判别器(D)辨别真伪并反馈的完整闭环。核心价值:突破传统模型瓶颈,释放AI无限创造力5.3.6Transformer核心机制:自注意力的颠覆彻底抛弃RNN循环结构,完全依赖自注意力机制(Self-Attention)处理序列数据,重构网络逻辑。工作原理:全局关联计算计算每个元素与序列中所有元素的关联度,直接捕捉长距离依赖,打破循环模型的时序限制。关键优势:高效且精准•并行计算:训练速度呈指数级提升,适合大规模训练

•长程捕捉:无视位置距离,轻松建模全局上下文关系主要应用:多领域赋能经典架构:Encoder-Decoder双端结构

由多头注意力层与前馈神经网络堆叠而成5.3.7图神经网络(GNN)核心处理对象专注处理非欧几里得的图结构数据,广泛适用于社交网络关系、化学分子结构及知识图谱构建等场景。消息传递机制节点通过聚合邻居节点的特征信息更新自身状态,层层传递后使每个节点具备“全局感知”能力。•社交:用户行为预测与社区发现•推荐:基于图结构的精准物品推荐GNN节点消息传递与聚合示意图中展示了节点如何聚合局部邻居信息更新自身特征深度学习应用045.4.1深度学习应用计算机视觉:从“看见”到“看懂”●核心任务:实现了图像分类、目标检测、图像分割三大核心任务的革命性突破。●关键技术:以卷积神经网络(CNN)为基础,涌现出如ResNet、YOLO等先进模型。●典型应用:在安防监控、自动驾驶、医学影像分析等领域得到广泛应用。NLP:从“理解”到“生成”●核心任务:攻克了文本分类、机器翻译、文本生成等复杂语言任务。●关键技术:基于Transformer架构的BERT、GPT等预训练模型。●典型应用:广泛应用于智能客服、机器翻译、内容创作等场景。5.4.1深度学习应用医疗健康应用场景:通过医学影像分析辅助医生精准诊断疾病(如肿瘤检测);利用电子健康记录预测疾病风险;加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论