版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 面试中出现有关xgboost总结 介绍xgboost是gb算法的高效实现,xgboost中的基学习器除了可以是cart(gbtree)也可以是线性分类器(gblinear)。与gbdt不同之处xgboost在目标函数中显示的加上了正则化项,基学习为cart时,正则化项与树的叶子节点的数量t和叶子节点的值有关。gb中使用loss function对f(x)的一阶导数计算出伪残差用于学习生成fm(x),xgboost不仅使用到了一阶导数,还使用二阶导数。gb中使用loss function对f(x)的一阶导数计算出伪残差用于学习生成fm(x),xgboost不仅使用到了一阶导数,还使用二阶导数上
2、面提到cart回归树中寻找最佳分割点的衡量标准是最小化均方差,xgboost寻找分割点的标准是最大化,lamda,gama与正则化项相关 上面提到cart回归树中寻找最佳分割点的衡量标准是最小化均方差,xgboost寻找分割点的标准是最大化,lamda,gama与正则化项相关支持并行化,这是xgboost的闪光点,虽然树与树之间是串行关系,但是同层级节点可并行。具体的对于某个节点,节点内选择最佳分裂点,候选分裂点计算增益用多线程并行。训练速度快。xgboost算法的步骤和gb基本相同,都是首先初始化为一个常数,gb是根据一阶导数ri,xgboost是根据一阶导数gi和二阶导数hi,迭代生成基学
3、习器,相加更新学习器。优化内容xgboost与gdbt除了上述三点的不同,xgboost在实现时还做了许多优化:在寻找最佳分割点时,考虑传统的枚举每个特征的所有可能分割点的贪心法效率太低,xgboost实现了一种近似的算法。大致的思想是根据百分位法列举几个可能成为分割点的候选者,然后从候选者中根据上面求分割点的公式计算找出最佳的分割点。xgboost考虑了训练数据为稀疏值的情况,可以为缺失值或者指定的值指定分支的默认方向,这能大大提升算法的效率,paper提到50倍。特征列排序后以块的形式存储在内存中,在迭代中可以重复使用;虽然boosting算法迭代必须串行,但是在处理每个特征列时可以做到并行。按照特征列方式存储能优化寻找最佳的分割点,但是当以行计算梯度数据时会导致内存的不连续访问,严重时会导致cache miss,降低算法效率。paper中提到,可先将数据收集到线程内部的buffer,然后再计算,提高算法的效率。xgboost 还考虑了当数据量比较
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 避险情绪升温债券收益率下行多空交织下把握结构性机会
- 第三节 印度教学设计初中地理仁爱科普版七年级下册-仁爱科普版2012
- 第三课 触摸创新-用材料改变观念教学设计高中美术人美版2019选择性必修1 绘画-人美版2019
- 三绕组变压器与小功率电源变压器教学设计中职专业课-变压器与电动机-电气设备运行与控制-装备制造大类
- 综合布线施工人员培训方案
- 洗煤厂劳动保护措施方案
- 隧道施工质量控制方案
- 第八节 家庭电路教学设计-2025-2026学年高中物理必修第三册沪科版(2020·上海专用)
- 主治医师单元测试重点难点试题及答案
- 中国移动冲刺试题中等及答案
- 天然气维修安全常识培训课件
- 2026科大讯飞校招面试题及答案
- 2026年南阳科技职业学院单招综合素质考试题库带答案详解
- 职场课课件教学课件
- 2025深圳南山半程马拉松竞赛组织方案
- 2026年二级建造师之二建机电工程实务考试题库500道及一套参考答案
- 防水工程施工流程
- 2025年黑龙江省哈尔滨市中考数学真题含解析
- 2025版《煤矿安全规程》解读
- 农村人居环境整治问题及对策
- 核心素养导向下的小学数学单元作业设计策略研究
评论
0/150
提交评论