版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、阿里天池大数据竞赛实战:RF&GBRT 完成过程1、Xlab GBRT上手微信公众号ID: datadw 进入领取资料。1.1、训练特征表准备训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2.Label 见下图:1.2 、建立特征稀疏表,为训练做准备特征稀疏表可直接在Xlab由原始特征表转换得到,截图如下:进入普通表转稀疏矩阵界面后,在选择列里填上: user_id对应的列号(表默认从0列开始),brand_id对应的列号,以及想要使用的众多特征对应的列号(不需要填写标签对应的列号!);然后在输出表里
2、填上转换成的稀疏矩阵:gbrt_offline_section_one_24_1;如下图1.3 、GBRT训练 利用训练的特征表gbrt_offline_section_one_24,进行GBRT训练,如下图所以进入配置界面,勾选训练的标签,稀疏矩阵名处输入刚才转好的稀疏矩阵gbrt_offline_section_one_24_1,模型输出表处填写模型输出表名,参数配置处根据效果进行配置(最开始默认就可以的)。如下图所示:配置好只好就可以进行训练了,等待训练好之后等到GBRT预测模型:gbrt_offline_section_one_25;1.4、GBRT预测特征表准备训练的特征表gbrt_
3、offline_section_two_11格式与训练特征表格式一样,为:user_id, brand_id, feature1, feature2.Label 见下图:1.5、建立预测稀疏矩阵表特征稀疏表可直接在Xlab由原始特征表转换得到,方法和原来一样,直接截图如下:需要注意的是,选择列必须和训练时候一样!1.6、GBRT预测利用转好的预测稀疏矩阵表gbrt_offline_section_two_11_1进行预测,如下图所示进入界面如下:model 处填写刚才训练好的GBRT模型表:gbrt_offline_section_one_25;输出表名处填写预测结果输出表gbrt_offli
4、ne_section_two_13,然后进行预测,如下图所示:1.7、GBRT碎碎念GBRT预测好之后,得到的结果为与原始预测表gbrt_offline_section_two_11一一对应的单列值y_var(搞不懂为什么不提供类似RF那样预测结果追加user_id,brand_id 列),如下图:所以,还得进行追加ID列,进行zxs_gbrt_offline_section_two_13_1和zxs_gbrt_offline_section_two_11_1两张表的合并,得到类似user_id,brand_id,y_val的表,取阈值进行推荐就可以了,下图为xlab里提供的脚本,追加ID列代
5、码。另外:附上脚本实现的代码,方便测试:2、Xlab RF上手2.1、训练特征表准备训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2.Label (和GBRT时候是一样的),见下图所示: 2.2、RF训练利用训练的特征表gbrt_offline_section_one_24,进行RF训练,如下图所以 进入配置界面,在Features 框里勾选训练特征以及该特征连续与否,在Class框里目标处选择标签列,模型输出表处填写输出模型表名:gbrt_offline_section_one_25;进一步,点击参数配置选项卡,进入参数配置界面,进行参数配置,我们主要配置了树的棵树,配置好后,进行训练,如下图所示: 训练结束,得到RF模型表gbrt_offline_section_one_25。2.3、RF预测利用预测特征表gbrt_offline_section_two_11进行RF预测,如下图所示: 进入配置界面:在结果附加列中添加user_id ,brand_id 列,勾选目标列2分类,主分类为1,这样预测结果表中就会给出预测为1 的概率值,输出信息处填写预测输出表,进行预测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年心理咨询师之心理咨询师二级技能考试题库【真题汇编】
- 2026年浙江越秀外国语学院单招(计算机)测试备考题库附答案
- 2025年南昌市湾里管理局招聘社区工作者(专职网格员)笔试(公共基础知识)综合能力测试题附答案
- 2026深国创中心校园招聘备考题库附答案
- 2026年一级注册建筑师之建筑经济、施工与设计业务管理考试题库300道附答案(考试直接用)
- 2025重庆长寿区晏家街道办事处公益岗招聘5人(公共基础知识)综合能力测试题附答案
- 2026年贵州建设职业技术学院单招(计算机)考试备考题库附答案
- 2026年郴州思科职业学院单招(计算机)考试备考题库附答案
- 2026年保安员从业资格证及保安岗位职责题库及一套参考答案
- 2026保安员(初级)考试题模拟考试题库必考题
- 施工方案与安全保障措施
- 工程维保及售后服务方案
- 医院科室主任的工作总结
- 附表:医疗美容主诊医师申请表
- GB/Z 20833.5-2023旋转电机绕组绝缘第5部分:重复冲击电压下局部放电起始电压的离线测量
- 毕节市织金县化起镇污水处理工程环评报告
- 黑布林英语阅读初一年级16《柳林风声》译文和答案
- 河流动力学-同济大学中国大学mooc课后章节答案期末考试题库2023年
- 一年级上册美术测试题
- 常用兽药配伍禁忌一览表
- 2023年一级建造师机电工程管理与实务考试笔记
评论
0/150
提交评论