版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能技术与应用6.推荐系统课程概况—基本情况PART01推荐系统推荐系统概述推荐系统实现隐含语义模型推荐系统概述推荐系统:推荐系统:推荐系统概述推荐系统:推荐系统概述协同过滤:如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?如何确定一个用户是不是和你有相似的品位?如何将邻居们的喜好组织成一个排序的目录?推荐系统-协同过滤协同过滤:实现步骤收集用户偏好找到相似的用户或物品计算推荐推荐系统-协同过滤协同过滤:实现步骤推荐系统-协同过滤协同过滤:相似度计算推荐系统-协同过滤协同过滤:相似度计算欧几里德距离(EuclideanDistance)皮尔逊相关系数(PearsonCorrelationCoefficient)
Cosine相似度(CosineSimilarity)推荐系统-协同过滤协同过滤:相似度计算皮尔逊相关系数(PearsonCorrelationCoefficient)协方差皮尔逊相关系数Pearson相关系数是用协方差除以两个变量的标准差得到的推荐系统-协同过滤协同过滤:皮尔逊相关系数推荐系统-协同过滤协同过滤:皮尔逊相关系数邻居的选择
固定数量的邻居
基于相似度门槛的邻居推荐系统-协同过滤基于用户的协同过滤:推荐系统-协同过滤基于用户的协同过滤:基于用户的协同过滤要解决的问题已知用户评分矩阵MatrixR(一般都是非常稀疏的)
推断矩阵中空格emptycells处的值推荐系统-协同过滤基于用户的协同过滤:基于用户协同过滤UserCF缺点
对于一个新用户,很难找到邻居用户。对于一个物品,所有最近的邻居都在其上没有多少打分注意事项
相似度计算最好使用皮尔逊相似度
考虑共同打分物品的数目,如乘上min(n,N)/Nn:共同打分数N:指定阈值
对打分进行归一化处理
设置一个相似度阈值推荐系统-协同过滤基于用户的协同过滤:基于用户协同过滤UserCF为啥不流行1.稀疏问题2.数百万的用户计算,这量?3.人是善变的注意事项
推荐系统-协同过滤基于物品的协同过滤:
推荐系统-协同过滤基于物品的协同过滤:基于物品的协同过滤优势!计算性能高,通常用户数量远大于物品数量可预先计算保留,物品并不善变
推荐系统-协同过滤基于物品的协同过滤:
推荐系统-协同过滤r_51=(0.41*2+0.59*3)/(0.41+0.59)=2.6基于物品的协同过滤:用户冷启动问题引导用户把自己的一些属性表达出来利用现有的开放数据平台根据用户注册属性推荐排行榜单物品冷启动问题文本分析、主题模型打标签、推荐排行榜单推荐系统-协同过滤基于物品的协同过滤:推荐系统-协同过滤基于物品的协同过滤:推荐系统-协同过滤基于用户的推荐实时新闻突然情况基于物品的推荐图书电子商务电影隐语义模型:隐语义模型从数据出发,进行个性化推荐用户和物品之间有着隐含的联系(有一个隐含方程)隐含因子让计算机能理解就好将用户和物品通过中介隐含因子联系起来隐语义模型:隐语义模型分解用户和隐藏因子之间的关系电影和隐藏因子之间的关系(F*M)T*(N*M)=(F*M)组合隐语义模型:隐语义模型梯度下降方向:隐语义模型:隐语义模型隐语义模型目标函数隐语义模型负样本选择:隐语义模型负样本采样:对每个用户,要保证正负样本的平衡(数目相似)选取那些很热门,而用户却没有行为的物品对于用户—物品集K{(u,i)}其中如果(u,i)是正样本,则有=1,负样本则=0隐语义模型:隐语义模型特征的重要程度隐语义模型:重新计算USV的结果得到A2来比较下A2和A的差异,看起来差异是有的,但是并不大,所以我们可以近似来代替隐语义模型隐语义模型:
将U的第一列当成x值,第二列当做y值,即U的每一行用一个二维向量表示,同理V的每一行也用一个二维向量表示。
从图中可以看到,S5和S6特别相似,Ben和Fred也特别相似隐语义模型隐语义模型:寻找相似用户寻找相似用户:依然用实例来说明:假设,现在有个名字叫Bob的新用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年网络安全初级认证考试题集
- 2026年分析检验员面试常见问题及解答
- 临床治疗面神经炎中成药物适应症、禁忌症及用法
- 2026年针灸推拿理论知识
- 2026年会计初级职称笔试仿真题解析
- 2026年销售员业绩考核方案
- 2026年趣味医学知识问答
- 2026年消防工程师考试仿真题及答案
- 2026年中国乳品评鉴师认证考试模拟试卷精
- 2026年采购经理岗位笔试题库
- 《道路勘测设计》 课件 4-1道路横断面组成
- 2023年10月中国互联网发展基金会招考2名工作人员笔试历年难易错点考题荟萃附带答案详解
- 孕期营养与体重管理
- 2023年重庆市中考化学试卷(A卷及解析)
- 2021-2022学年广东省广州市增城区八年级(下)期末物理试卷(附答案详解)
- 苏东坡谪居黄州的养生观念,中医养生论文
- 基因功能研究技术之基因敲除及基因编辑技术-课件
- 示波器的原理和使用课件
- 人教版九年级数学上册:配方法解一元二次方程课件
- 云计算数据中心管理运维
- (完整版)220kV+SF6断路器结构及动作原理培训课件
评论
0/150
提交评论