版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、梯度下降法,阿育王 2017.6.13,1,2,1. 引言,梯度下降(GD)是最小化风险函数、损失函数的一种常用方法。 在应用机器学习算法时,通常采用梯度下降法来对采用的算法进行训练。,2,2020/6/23,梯度下降法包含三种不同形式: 批量梯度下降BGD(Batch Gradient Descent ) 随机梯度下降SGD(Stochastic Gradient Descent ) 小批量梯度下降法MBGD (Mini-Batch Gradient Descent ) 下文将以线性回归算法为例来对三种梯度下降法进行比较,3,2020/6/23,2. 先导知识,一元线性回归(拟合曲线) 假设
2、这里存在m=6组数据(x, y),4,2020/6/23,从图上可以看出,大致数据的大致走势是可以用线性模型y=kx+b来表示的,为此我们建立一维线性回归模型。 假设一维线性模型表达式如下:,5,2020/6/23,其中: h(x)是假设函数,即要拟合的函数 为待求解参数,即要迭代求解的值, 求解出来了那最终要拟合的函数h(x)就确定了。 n表示输入特征数,为方便计算,所有的样本都加入了x0=1这个特征,所以维数为n+1维。,6,2020/6/23,对应的损失/误差函数,即估计值与真实值之间的差距,这里用2-范数表示为: 其中: m是训练集的样本个数 1/2是为了后面求导计算方便,7,2020
3、/6/23,一个二维参数( 0 , 1 )组对应能量函数(描述整个系统的优化程度,随着网络的变化而减小,最终网络稳定时能量达到最小)的可视化图,8,2020/6/23,3. 批量梯度下降法BGD,更新算法的目的:误差函数尽可能小,即求解参数使误差函数尽可能小。 主要思想: 首先,随机初始化参数; 然后,不断反复的更新参数使得误差函数减小,直到满足要求时停止。,9,2020/6/23,梯度下降算法,利用初始化的参数并且反复更新参数: 代表学习率,表示每次向着函数J最陡峭的方向迈步的大小(步长?),10,2020/6/23,(1)将J()对求偏导,得到每个对应的的梯度 当m=1时,即只有一个样本数
4、据(x, y),J对第j个参数j的偏导数是:,11,2020/6/23,对所有m个样本数据,上述损失函数的偏导(累和)为:,12,2020/6/23,(2)由于是要最小化风险函数,所以按每个参数的梯度负方向,来更新每个j(j=0, 1, 2, , n),13,2020/6/23,上例中,利用BGD求得,14,2020/6/23,由更新公式可知,批量梯度下降得到的是一个全局最优解,每一次的参数更新都用到了所有的训练数据,如果训练数据非常多的话,执行效率较低。 批量梯度下降法的收敛图(迭代的次数相对较少):,15,2020/6/23,4. 随机梯度下降法SGD,由于批梯度下降每更新一个参数的时候,
5、要用到所有样本,所以训练速度会随着样本数量的增加而变得非常缓慢。 随机梯度下降正是为了解决这个办法而提出的。它是利用单个样本的损失函数对求偏导得到对应的梯度,来更新。,16,2020/6/23,上例中,利用SGD求得,17,2020/6/23,随机梯度下降是通过每个样本来迭代更新一次,如果样本量很大的情况(例如几十万),那么可能只用其中几万条或者几千条的样本,就已经将参数迭代到最优解。 对比上面的批量梯度下降,迭代一次需要用到十几万训练样本,一次迭代不可能最优,如果迭代10次的话就需要遍历训练样本10次。 SGD的问题是噪音较BGD要多,使得SGD并不是每次迭代都向着整体最优化方向。,18,2020/6/23,随机梯度下降收敛图(SGD迭代的次数较多,在解空间的搜索过程看起来很盲目。但是大体上是往着最优值方向移动。),19,2020/6/23,5. 小批量梯度下降法MBGD,为综合解决BGD的训练速度慢,以及SGD的准确性低的问题,提出MB
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年ACOG妇产科临床处理指南妊娠恶心呕吐(完整版)
- 九年级化学第四单元测试题及答案
- 2026广东省选调生招录1715人参考笔试题库附答案解析
- 安全预防方案执行承诺函范文3篇
- 冬季穿线施工方案(3篇)
- 山地测量施工方案(3篇)
- 公司发型活动策划方案(3篇)
- 生态墙面施工方案(3篇)
- 施工方案绘图教程(3篇)
- 蔬菜礼盒活动策划方案(3篇)
- 2026年江西农业工程职业学院单招职业适应性测试题库有答案解析
- 工地应急处置方案范本
- 2026春《初中物理•必刷题》8下(RJ)狂K重点
- 采石场组织架构、部门岗位职能设置及全套企业管理制度汇编
- 路灯维修维护实施方案
- 2025-2026学年北京市顺义区初二(上期)期末考试地理试卷(含答案)
- (2025年)外架工入场考试题附答案
- 2026年湖南中医药高等专科学校单招职业技能测试必刷测试卷含答案
- 2025年小学法制教育
- 工行人力资源序列题库
- 神奇的记忆力课件
评论
0/150
提交评论