




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
6-1认识个性化推荐模块❻个性化推荐:主动满足你的需求目录CONTENTS个性化推荐的思路01推荐算法分类02推荐效果评估03一.个性化推荐的思路1.基于的事实认知人们更喜欢那些与自己喜欢的东西相似的物品、倾向于与和自己趣味相投的人有相似的爱好,或者不同的客户群体有固定的购物习惯等。个性化推荐的实现过程:一.个性化推荐的思路2.推荐系统的两个特性特征主动化个性化推荐系统应用领域二.推荐算法分类1.协同过滤推荐算法基本思想:给用户推荐和他兴趣相似的用户感兴趣的物品。当需要为用户A推荐时,首先找到和A兴趣相似的用户集合(用U表示),然后把集合U中所有用户感兴趣而A没有听说过(未进行过操作)的物品推荐给A。1.基于用户的协同过滤推荐算法:算法步骤:1.计算用户之间的相似度,选取最相似的N个用户构成用户集合。2.找到集合中用户喜欢但目标用户没有用过的物品,将其推荐给目标用户。二.推荐算法分类1.协同过滤推荐算法皮尔逊相关系数:P余弦向量相似度:相似度计算:二.推荐算法分类1.协同过滤推荐算法基于用户协同过滤推荐示例:二.推荐算法分类1.协同过滤推荐算法2.基于物品的协同过滤推荐算法:基本思想:给用户推荐与他们以前喜欢的物品相似的物品。这里所说的相似并非从物品的角度出发,而是基于一种假设:喜欢物品A的用户大多也喜欢物品B,代表着物品A和物品B相似。算法步骤:1.计算物品之间的相似度。2.针对目标用户u,找到和用户感兴趣的物品最相似的物品集合,然后根据其感兴趣程度由高到低确定N个物品并推荐给用户u。二.推荐算法分类1.协同过滤推荐算法2.基于物品的协同过滤推荐算法:物品相似度计算用户u对可能感兴趣的物品j的兴趣度二.推荐算法分类1.协同过滤推荐算法2.基于物品的协同过滤推荐算法:基于物品的协同过滤推荐示例二.推荐算法分类2.
基于内容推荐算法基本思想:向用户推荐与其感兴趣的内容相似的物品,如用户喜欢励志类电影,那么系统会直接他推荐《阿甘正传》这部电影。这个过程综合考虑了用户兴趣和电影内容,因此不需要提供用户的历史行为数据,这能够很好地解决新用户的“冷启动”问题。算法步骤:1.为每个物品(Item)构建一个物品的特征。2.为每个用户(User)构建一个用户的喜好特征。3.计算用户喜好特征与物品特征的相似度,向用户推荐相似度最高的物品。二.推荐算法分类3.关联规则推荐算法基本原理:基于物品之间的关联性,通过对用户的购买记录进行规则挖掘,发现不同用户群体之间共同的购买习惯,从而实现用户群体的兴趣建模和物品推荐。概念:项集而项集是指总项集中所有不同项目分别组合形成的集合,如{牛奶}、{牛奶,面包}、{牛奶,尿不湿,啤酒}等。项目数为k的项集称为k-项集,因此,上述项集分别是1-项集、2-项集、3-项集。二.推荐算法分类3.关联规则推荐算法关联规则3个统计量二.推荐算法分类3.关联规则推荐算法关联规则3个统计量关联规则的提取即找出所有支持度大于等于最小支持度,且置信度大于等于最小置信度以及提升度靠前(大于1)的关联规则。像{牛奶}→{面包}这样的关联规则称为强关联规则,因为它们同时具有高支持度和高置信度。二.推荐算法分类3.关联规则推荐算法Apriori算法简介算法步骤:1.通过迭代计算所有事务中的频繁项集,即支持度不低于用户设定的阈值的项集。2.利用频繁项集构造出满足用户最小置信度的关联规则。二.推荐算法分类3.关联规则推荐算法Apriori算法应用示例求最小支持度是50%,最小置信度是50%的关联规则二.推荐算法分类3.关联规则推荐算法Apriori算法应用示例使用Apriori算法求解关联规则的过程:三.推荐效果评估1.评估方法实验步骤:1.构建测试数据集,并按照比例将数据集分为训练集和测试集。2.在训练集上建立算法模型,对用户及其兴趣建模。3.按照预先定义的评估指标在测试集上进行预测推荐,评估推荐效果。三.推荐效果评估1.评估方法三.推荐效果评估1.评估指标①评分预测方法T表示测试集,包含用户u和物品i,rui是用户u对物品i的实际评分,而是推荐系统给出的预测评分,m是测试集的样本总数。三.推荐效果评估1.评估指标②TopN推荐方法其中U是所有被推荐的用户的集合,是为用户u推荐的N个物品的列表,是用户u在测试集上喜欢的物品集合。三.推荐效果评估1.评估指标②TopN推荐方法精确率和召回率都用于评估推荐系统效果,最理想的情况是精确率和召回率都比较高。人工智能基础与应用Thankyouverymuch!6-2项目1—推荐你喜爱的电影模块❻个性化推荐:主动满足你的需求目录CONTENTS提出问题01预备知识03解决方案02任务1—合并电影基本信息和评分记录04任务3—给某个用户推荐前m部电影06任务2—找到与某用户最相似的n个用户05一.提出问题问题描述随着人们生活节奏的加快,在工作之余上网看电影不失为一种放松身心的方式。面对网站里琳琅满目的电影,用户自己有时也不知如何去选择。那么,是否可以利用前文所介绍的推荐算法帮助用户做出选择,让用户体验到智能化的生活方式呢答案是肯定的。二.解决方案1.方案思路基于用户的协同过滤推荐电影解决问题基本思想:首先要了解该用户的兴趣爱好,即他看过哪些电影、对哪些电影的评价较高等,以此来确定他的电影偏好;其次,要找出与当前用户具有相似电影爱好的用户群体,看他们已经看过哪些电影,然后从这些电影中筛选出当前用户没有看过的电影;最后按评分从高到低的顺序将电影推荐给用户,以达到主动满足用户看电影的需求的目的。电影偏好相似群体最爱电影筛选排序推荐topN二.解决方案2.具体方案三.预备知识1.MovieLens数据集将数据集解压后,可以看到4个主要的CSV文件,它们分别是links.csv、movies.csv、ratings.csv和tags.csv三.预备知识2.按主键合并数据点X与点Y之间的欧氏距离等于各特征值之差的平方和的平方根为啥合并?于用户与电影的数据非常多,为了便于管理,将这些数据分别存储在不同的文件中。但在推荐过程中,要直观了解一部电影的关联信息,如用户评价过哪几部电影、它的名称是什么等,就需要使用关键字将关联信息合并在一张表中。三.预备知识2.按主键合并数据合并后的结果四.任务1——合并电影基本信息和评分记录1.读取文件数据四.任务1——合并电影基本信息和评分记录2.合并数据五.任务2——找到与某个用户最相似的n个用户1.统计各用户已评价的电影和评分用户1评分的部分数据五.任务2——找到与某个用户最相似的n个用户2.计算两个用户之间的相似度五.任务2——找到与某个用户最相似的n个用户3.找到与某用户最相似的前n个用户与用户1最相似的10个用户的相似度六.任务3——给某个用户推荐前m部电影1.找出最相似的用户看过的但该用户没有看过的m部电影六.任务3——给某个用户推荐前m部电影2.向指定用户推荐前m部电影推荐给用户2的前8部电影六.任务3——给某个用户推荐前m部电影3.课后思考人工智能基础与应用Thankyouverymuch!6-3项目2—推荐你要一起购买的商品模块❻个性化推荐:主动满足你的需求目录CONTENTS提出问题01预备知识03解决方案02任务1—将CSV文件数据转换为事务型数据04任务3—提取有用的销售关联规则06任务2—找出购物清单中频繁购买的商品05一.提出问题问题描述当顾客走进一家实体卖场或进入一个在线商店时,商家会如何向他推荐商品呢?或者作为一个卖场的管理者,该如何根据顾客已购买的商品类型向他兜售关联的商品呢?假设卖场想举办一个商品促销活动,如何知道哪些捆绑商品是顾客喜欢的?进一步思考,为方便顾客购买,提升顾客的消费体验,该如何对卖场的商品摆放布局进行调整呢二.解决方案2.解决方案(1)数据整理表6-6中1表示某商品出现在某次购物清单中,0表示没有出现,这样就形成了一个可反映所有种类商品在购物清单中是否出现的矩阵。二.解决方案2.解决方案(2)具体方案数据合并整理为事务型数据找频繁被购商品项筛选有用的购物模式推荐购物模式三.预备知识1.事务型数据转换事务型数据三.预备知识1.事务型数据代码实现三.预备知识2.frequent_patterns模块的主要函数【引例6-3】按最小支持度为0.5、最小置信度为0.6来计算表6-7所示购物清单中的频繁项集和关联规则。三.预备知识2.frequent_patterns模块的主要函数(1)找支持度>=0.5的频繁项集实现代码运行结果三.预备知识2.frequent_patterns模块的主要函数(2)找出步骤1中频繁项集隐含的关联规则运行结果四.任务1——将CSV文件数据转换为事务型数据1.将文件数据保存到列表中列表中的数据(部分)四.任务1——将CSV文件数据转换为事务型数据2.对列表数据进行事务编码处理部分数据五.任务2——找出购物清单中频繁被购买的商品1.确定合理的最小支持度结论:一种商品每天被购买的次数为0.02609×9835÷30≈8.6次,说明以这个频次被购买的商品是值得去发现其中可能隐藏的一些规则的,所以尝试设定最小支持度为0.02。五.任务2——找出购物清单中频繁被购买的商品2.找出频繁项集(1)利用Apriori找出所有的频繁项集运行结果五.任务2——找出购物清单中频繁被购买的商品2.找出频繁项集(2)找出频繁2-项集运行结果:六.任务3——提取有用的销售关联规则1.挖掘出一些关联规则已经找出了一些频繁2-项集,但两种商品一起出现的可能性有多大?它们之间是否存在一些购买模式或者关联规则呢?前11项六.任务3——提取有用的销售关联规则2.关联规则分析和评估在买黄油的顾客中,有一半的人同时购买了全脂牛奶提升度均大于1,说明这些关联规则所涉及的两种商品是有关联,前一种商品的销售是会影响后一种商品的销售的。六.任务3——提取有用的销售关联规则2.关联规则分析和评估这些关联规则中,哪些关联规则是有用的?哪些关联规则的商业价值不大?哪些关联规则其实就是一类事实的重现?六.任务3——提取有用的销售关联规则2.关联规则分析和评估五.任务3——为3类客户
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安徽安全员考试模拟考试题及答案
- 2025年健身项目经理专业素质评定考试试题及答案解析
- 2025年健身房管理师职业水平评定试题及答案解析
- 2025年建筑玻璃幕墙工程师职业资格考试试题及答案解析
- 2025年安全生产安全检查标准试题及答案
- 2025年摄影师招聘面试技巧与模拟题答案
- 2025年暑期消防安全知识测试题库
- 机电知识培训目的课件
- 2025年工地安全员高处作业规范及答案
- 2025年收费站安全生产法规模拟题
- 一年级新生报名登记表
- 《体育游戏》课程标准
- 制程能力管理办法实用文档
- GB/T 451.3-2002纸和纸板厚度的测定
- GB/T 1303.2-2009电气用热固性树脂工业硬质层压板第2部分:试验方法
- 子痫前期子痫课件
- 部编版《县委书记的榜样-焦裕禄》课件1
- 基础教育改革与发展中的热点问题课件
- 汽车保养基础知识优秀课件
- 青少年运动员 运动损伤的预防 课件
- 2022年十部经典的三级片电影
评论
0/150
提交评论