全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
题目在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这个商品子集上的行为数据,往往还需要利用更丰富的用户行为数据。定义如下的符号:U用户集合I商品全集P商品子集,PID用户对商品全集的行为数据集合那么我们的目标是利用D来构造U中用户对P中商品的推荐模型。数据说明数据包含两个部分。第一部分是用户在商品全集上的移动端行为数据(D),表名为mobile_recommend_train_user,包含如下字段:字段字段说明提取说明user_id用户标识抽样&字段脱敏item_id商品标识字段脱敏behavior_type用户对商品的行为类型包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4。user_geohash用户位置的空间标识,可以为空由经纬度通过保密的算法生成item_category商品分类标识字段脱敏time行为时间精确到小时级别第二个部分是商品子集(P),表名为mobile_recommend_train_item,包含如下字段:字段字段说明提取说明item_id商品标识抽样&字段脱敏item_ geohash商品位置的空间标识,可以为空由经纬度通过保密的算法生成item_category商品分类标识字段脱敏训练数据包含了抽样出来的一定量用户在一个月时间(11.1812.17)之内的移动端行为数据(D),评分数据是这些用户在这个一个月之后的一天(12.18)对商品子集(P)的购买数据。使用训练数据建立推荐模型,并输出用户在接下来一天对商品子集购买行为的预测结果。评分数据格式具体计算公式如下:完成用户对商品子集的购买预测之后,需要将结果放入指定格式的数据表中,要求结果表名为:mobile_recommendation_predict,第一列user_id和第二列item_id两列,要求去除重复。见数据文件里相应csv文件。评估方式:采用经典的精确度(precision)、召回率(recall)和F1值作为评估指标。具体计算公式如下:其中PredictionSet为算法预测的购买数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 育婴员-模拟练习题及答案
- 临床诊断学核心知识点总结
- 项目五:老年服务礼仪基础认知
- (辅导班)2026年新高三数学暑假讲义(基础班)第02讲 函数的性质:单调性与奇偶性(原卷版)
- 医学26年:心血管防控多文化融合进展解读 心内科查房
- 【2026】年品牌推广专员(某大型国企)面试题题库解析
- 26年银发护理记录造假禁忌课件
- 2026届河南百师联盟高三下学期5月模拟联考历史试题
- 教育基础及其方法 4
- 中级经济师考试中级工商管理试题及答案解析
- 《消防产品监督检查》课件
- 六年级下册辩论四项辩论材料
- ACT的正常值及临床意义
- 上海市建筑施工风险管控与隐患排查实施导则
- YDT 4409.3-2023云原生能力成熟度模型 第3部分:架构安全
- DB34∕T 2396-2015 高速公路桥梁伸缩缝维修与更换技术规程
- GB/T 15568-2024通用型片状模塑料(SMC)
- 《JJG196-2006-常用玻璃量器检定规程》
- 员工雇佣合同
- 5.1.4 识读识读预焙阳极铝电解槽的结构图
- (高清版)DZT 0426-2023 固体矿产地质调查规范(1:50000)
评论
0/150
提交评论