




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在线学习算法分享在线学习算法分享XX2016.Outline 传统方法 批量(Batch)算法 在线算法 稀疏性的考量 非光滑凸优化算法:FOBOS、AOGD、RDA、FTRL介绍传统方法 最小化的目标函数(无约束优化),soft regularization formulation: 另一种等价约束优化描述,convex constraint formulation:Outline 传统方法 批量(Batch)算法 在线算法 稀疏性的考量 非光滑凸优化算法:FOBOS、AOGD、RDA、FTRL介绍 无约束优化表示 全局梯度下降: 牛顿法、LBFGS等方法 不等式约束凸优化问题 投影梯度下降
2、(约束优化表示下),gt是subgradient批量算法批量算法 传统不等式约束的凸优化方法:内点法(转化为规则化的无约束优 批量算法的优缺点 优点 精度高 局限性 受限于被训练数据的规模 无法有效处理数据流,做在线训练Outline 传统方法 批量(Batch)算法 在线算法 稀疏性的考量 非光滑凸优化算法:FOBOS、AOGD、RDA、FTRL介绍在线算法 在线梯度下降(OGD) 随机梯度下降(SGD),在凸集上做投影混合正则化项:在线算法 梯度下降方法 精度比较好 局限性 很难产生真正稀疏的解,即便加入L1正则化项 对于不可微点的迭代会存在一些问题(the iterates of the
3、 subgradient method are very rarely at the points of non-differentiability)Outline 传统方法 批量(Batch)算法 在线算法 稀疏性的考量 非光滑凸优化算法:FOBOS、AOGD、RDA、FTRL介绍稀疏性的考量1. 简单加入L1范数 a+b两个float数很难绝对等于零,无法产生真正稀疏的特征权重2. 那就设定一个阈值,做截断来保证稀疏,可以结合L1范数简单截断方法,每online训练K个数据截断一次稀疏性的考量 Truncated gradient (09年的工作)3. Black-box wrapper
4、approaches: 黑盒的方法去除一些特征,然后重新训练的看被消去的特征是否有效。 需要在数据集上对算法跑多次,不太实用Outline 传统方法 批量(Batch)算法 在线算法 稀疏性的考量 非光滑凸优化算法:FOBOS、AOGD、RDA、FTRL介绍非光滑全局优化算法 迭代公式非光滑全局优化算法 . 迭代方程 第一项:梯度或累积梯度; 第二项:L1正则化项; 第三项:限定x不要离已迭代过的解太远(proximal),或者离0太远(central),也是low regret的需求 regret定义FOBOSForward-Backward Splitting method (google
5、和伯克利09年的工作)可以看作truncated gradient的一种特殊形式基本思想:跟projected subgradient方法类似,不过将每一个数据的迭代过程,分解成一个经验损失梯度下降迭代和一个优化问题AOGD 迭代公式 再看一下OGD OGD迭代公式的等价优化问题的含义: 每次新的结果不要太远离之前的结果 每一步还是要向正确的方向前进(梯度or子梯度方向)AOGDRDA Regularized dual averaging(微软10年的工作) 非梯度下降的范畴,属于更加通用的一个primal-dual algorithmic schema的一个应用 克服了SGD类方法所欠缺的e
6、xploiting problem structure,especially for problems with explicit regularization。 能够更好地在精度和稀疏性之间做trade-offFTRL (Follow-the-regularized-Leader) 基本思想OGD不够稀疏FOBOS能产生更加好的稀疏特征梯度下降类方法,精度比较好RDA可以在精度与稀疏性之间做更好的平衡稀疏性更加出色FTRL综合OGD的精度和RDA的稀疏性最关键的不同点是累积L1惩罚项的处理方式FTRL (Follow-the-regularized-Leader) 迭代公式 再看一下OGD
7、OGD迭代公式的等价优化问题的含义: 每次新的结果不要太远离之前的结果 每一步还是要向正确的方向前进(梯度or子梯度方向) 这种迭代方式够简单,但不够好,解不稀疏。FTRL (Follow-the-regularized-Leader) Mirror decent 利用了上面的直观特性,但是用arbitrary Bregman divergence代替二范数项,并更进一步,对历史点的bregman项叠加起来: Composite-objective mirror descent (COMID) 每一轮将正则化项加入到目标函数中(例如1范数)FTRL (Follow-the-regularize
8、d-Leader) FTRL-Proximal算法把OGD的迭代方式变成一个优化问题。 第一项:梯度或累积梯度;第二项:L1正则化项;第三项:限定x不要离已迭代过的解太远(proximal),或者离0太远(central),也是low regret的需求FTRL (Follow-the-regularized-Leader) FTRL (改进与实际应用H. Brendan McMahan, google) 10年理论性paper,但未显式地支持正则化项迭代;论文证明regret bound以及引入通用的正则化项;揭示OGD、FOBOS、RDA等算法与FTRL关系; FTRL,可以看作RDA和FOB
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考英语-构词法(讲练)(解析)
- 数字智慧方案食品安全追溯方案
- 2024年高速型数控铣床或数控仿形铣床投资申请报告代可行性研究报告
- 供电防护员练习试题(三)
- 职业资格-交通工程真题库-5
- 职业资格-房地产经纪综合能力真题库-10
- 明确方向2025年财务管理考试试题及答案
- 单招高频试题及答案
- 高考数学试题及答案
- 可行性研究报告含义
- 中国铁路青藏集团有限公司招聘普通高校真题2024
- 抗生素临床疗效评价-全面剖析
- 2025年角膜接触镜考试题及答案
- 西部计划面试试题及答案
- 中级宏观经济学知到课后答案智慧树章节测试答案2025年春浙江大学
- 江苏开放大学2025年春大学英语B【2】
- 2025年江苏省安全员-B证考试题库及答案
- 【数学】图形的轴对称 问题解决策略:转化课件+2024-2025学年北师大版数学七年级下册
- 铁路运输安全风险防范-洞察分析
- 三年级 语文 下册《火烧云》课件 (第1课时)
- 2025年临床医师定期考核必考复习题库及答案(1080题)
评论
0/150
提交评论