版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
梯度下降及神经网络反向传播目录梯度下降算法反向传播正反向传播总结神经网络梯度下降算法对比常用梯度下降算法选型建议常用梯度下降算法关键对比维度PART.1梯度下降算法梯度下降算法神经网络通过前向传播计算预测值(ŷ),再通过损失函数衡量预测值
ŷ
与真实值y的差距。我们的终极目标是找到一组最优的网络参数(权重w和偏置b),使得这个损失在所有训练数据上尽可能小。想一想参数空间巨大,如何高效地找到那组使损失函数最小的参数?梯度下降算法梯度下降算法
负梯度方向是函数下降最快的方向,我们可以从某个点开始,沿着向下方向一路前行,期望最终可以找到目标函数的极小值点,这就是梯度下降法的核心思想。通过迭代调整参数来最小化目标函数的优化方法。其核心是计算目标函数对各参数的偏导数(梯度向量),沿负梯度方向更新参数值,逐步逼近函数极小值点,因此也被称为最速下降法。在微积分里面,对多元函数参数求偏导数,把求的各参数的偏导数以向量的形式表达出来,就是梯度,如图所示。梯度下降算法导数=
你脚下那一刻的爬坡速度几何意义=你脚下那一点山坡的陡峭程度函数
→
整座山坡的轮廓
某一点
→
你脚下的位置
导数
→
你此时此地的瞬时爬坡速度
切线斜率
→
你脚下那一小块地有多陡梯度下降算法
梯度下降推导——一元函数导数一元函数导数:一个函数在某一点的导数描述了这个函数在这一点附近的变化率。几何意义:函数在某一点的导数就是该函数所代表的曲线在这一点上的切线斜率。梯度下降推导—二元函数导数二元函数z=f(x,y)通常指偏导数或偏微分。偏导数表示函数沿某一坐标轴方向的变化率,其他变量固定。定义梯度下降推导—二元函数导数
定义:二元函数z=f(x,y)通常指偏导数或偏微分。
偏导数表示函数沿某一坐标轴方向的变化率,其他变量固定。PART.2反向传播反向传播让网络从错误中学习网络中数百万的参数(权重和偏置),每一个该向哪个方向、调整多少,才能最有效地降低这个误差?”需要什么反向传播就是这个关键的解码器它利用链式法则,将总误差从输出层开始,沿着网络结构层层‘回溯’,精确计算出每一个参数对总误差的(梯度),为梯度下降提供明确的优化方向。反向传播
反向传播
通过正向传播得到损失函数的值之后,我们再进行反向传播。从后向前,逐层求损失函数对每层神经元参数的偏导数,迭代更新所有参数。反向传播
y=0.8反向传播
y=0.8参数更新的步长幅度反向传播
反向传播
反向传播
第二轮正向传播
PART.3正反向传播总结正反向传播总结
PART.4神经网络梯度下降算法对比神经网络梯度下降算法对比
PART.5常用梯度下降算法关键对比维度常用梯度下降算法关键对比维度1.收敛速度:Adam>RMSprop≈Momentum>Adagrad>SGD2.内存消耗:Adam>Adagrad>RMSprop>Momentum>SGD3.参数敏感性:SGD<Adam<RMSprop<Momentum<Adagrad4.适用数据特征:稀疏数据:Adagrad密集数据:Adam/RMSprop小批量数据:SGD/Momentum关键对比维度PART.6常用梯度下降算法选型建议常用梯度下降算法选型建议默认首选:Adam(适合大多数深度学习任务)资源受限场景:SGD+Momentum
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年上半年四川广安市岳池县“小平故里英才计划”引进急需紧缺专业人才6人考试备考题库及答案解析
- 2026江苏镇江市扬中市卫健委所属事业单位招聘编外人员33人考试模拟试题及答案解析
- 2026江西新余市社会保障卡一卡通中心招聘见习生2人笔试备考题库及答案解析
- 2026江西赣州大余县博物馆见习生招聘2人笔试模拟试题及答案解析
- 2026陕西西安莲湖区枣园社区卫生服务中心招聘笔试参考题库及答案解析
- 2026四川遂宁兴业投资集团有限公司项目合同制用工招聘11人考试备考题库及答案解析
- 2026中国南水北调集团水网水务投资有限公司所属单位春季招聘12人(第一批)笔试模拟试题及答案解析
- 2026中工国际工程股份有限公司春季校园招聘考试参考题库及答案解析
- 2026四川泸州江阳区华阳街道社区卫生服务中心就业见习岗位招聘6人笔试模拟试题及答案解析
- 2026四川达州大竹县国有资产事务服务中心县属国有企业招聘工作人员28人笔试备考题库及答案解析
- 《无人机载荷与行业应用》 课件全套 第1-6章 无人机任务载荷系统概述- 未来展望与挑战
- 《公共管理学》第六章 公共政策PPT
- 2022年河北雄安新区容西片区综合执法辅助人员招聘考试真题
- 周围血管与淋巴管疾病第九版课件
- 付款计划及承诺协议书
- 王君《我的叔叔于勒》课堂教学实录
- CTQ品质管控计划表格教学课件
- 沙库巴曲缬沙坦钠说明书(诺欣妥)说明书2017
- GB/T 42449-2023系统与软件工程功能规模测量IFPUG方法
- 卓越绩效管理模式的解读课件
- 疫苗及其制备技术课件
评论
0/150
提交评论