深度学习与大模型课件第2章人工神经网络与深度学习基础

上传人：h*** IP属地：山东上传时间：2026-03-09 格式：PPTX 页数：38 大小：2.29MB 积分：15 举报 版权申诉

已阅读5页，还剩33页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人工神经网络与深度学习基础——从理论原理到实战应用1.神经网络的基本概念2.前向传播与反向传播3.激活函数及其选择4.深度学习与传统机器学习的对比5.深度学习的应用场景6.实战：

多层感知机实现MNIST分类7.本章小结与思考练习8.答疑环节1神经网络的基本概念神经网络起源与定义Input

layerHidden

layers

Output

layer灵感来源受哺乳动物中央神经系统启发的机器学习模型核心构成人工神经元与可学习连接权重深度学习关系复杂神经网络的学习即深度学习生物神经元

提出背景

Frank

Rosenblatt

(1957年)

核心组件

输入信号(X₁

、X₂)

神经元、权重、阈值(θ)感知机结构示意图感知机的结构与原理异或问题（XOR）示例单层感知机无法找到一条直线将不同类别点分开能力边界仅处理线性可分问题（如

“与”、“或”、“非”运算）典型瓶颈无法解决“异或”

问题（非线性可分）问题本质线性模型无法拟合

非线性决策边界感知机的局限性

多层感知机结构示意图引入隐藏层

添加1个及以上隐藏层，增强模型表达能力多层感知机(MLP)的结构

核心改进

三

层

架

构

输入层接收原始数据隐藏层

信息深度加工输出层

输出结果案例：“异或”问题的解决通过隐藏层构建非线性决策边界，解决单层感知机无法处

理的非线性问题关键突破非线性激活函数+多层结构，实现复杂特征提取核心流程多层感知机的工作原理加权求和

激活函数处理

逐层传递实现“异或”的多层感知机对比维度感知机多层感知机结构单层网络多层网络(含隐藏层)学习能力线性可分问题非线性问题训练算法感知机学习规则反向传播应用场景简单分类复杂模式识别局限性无法解决XOR问题训练复杂度高核心差异隐藏层增强表

达能力∑非线性激活解

决复杂问题反向传播优化

网络参数感知机与多层感知机对比2前向传播与反向传播

定义

数据从输入层到输出层的单向计算与存储过程

依赖结构前馈神经网络(无环、层间全连接)核心步骤

输入层接收数据

隐藏层逐层计算传递前向传播的定义与流程前馈神经网络结构示意图输出层产生结果前向传播的数学表达符号定义

关键公式

网络层数

输入层→

隐藏层

隐藏层间

隐藏层→输出层输入数

权重

偏进行线性变激活处和据通过

矩阵

置换

，再通过函数理上一层输当前层

，重复线性变换和

出作为输入

激活函数处理最后隐藏层输最终变

得到网络预测出经

换

结果

∑

数学基础链式法则(梯度反向传递)三

反向传播定义通过损失函数梯度反向调整权重，最小化误差梯度下降类比从山顶沿最陡坡度下山

关键参数：学习率(η)反向传播的核心思想与梯度下降梯度下降过程示意图

过大：震荡不收敛

过小：收敛慢效率

低

←

反向计算误差输出层误差→

隐藏层误差(逐层传递)

反向传播的步骤反向传播示意图3213激活函数的选择关键结论无激活函数的神经网络等价于线性回归模型控制输出范围稳定训练概率区间[0,1]引入非线性突破线性模型限制

拟合复杂关系激活函数的核心作用促进梯度传播缓解梯度消失缓解梯度爆炸

Activation

FunctionsReLU函数图像

特性输出范围：[0,+∞]数学表达式ReLU(x)=max(0,X)常见激活函数——

ReLU∑

优点

计算简单

缓解梯度消失

稀疏激活

缺点

死亡Re

LU问题

非零中心化Sigmoid输出范围(0,1)优点概率表示直观常见激活函数——Sigmoid与Tanh缺点×

梯度消失

×计算复杂缺点

仍有梯度消失问题Tanh

输出范围:（-1,1）Sigmoid函数输出范围（0,1）常用于二分类输出层Tanh函数输出范围（-1,1），

以0为中心，适合隐藏层优点

零中心化利于优化

按任务类型选择

分类任务稀疏数据避免梯度消失概率输出输出层

Sigmoid（二分类）

Softmax（

多分类）激活函数选择策略隐藏层ReLU（首选）隐藏层ReLU/Tanh

特殊场景适配输出层无激活

回归任务

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

深度学习与大模型课件第2章人工神经网络与深度学习基础

文档简介

温馨提示

最新文档

评论

深度学习与大模型 课件 第2章 人工神经网络与深度学习基础

文档简介

温馨提示

最新文档

评论

相关文档

深度学习与大模型课件第2章人工神经网络与深度学习基础