




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
智能推荐系统 超群 comfuchaoqun 推荐系统 介绍 http en wikipedia org wiki Recommender system关键字 recommendersystem collaborativefiltering 关联规则 协同过滤 SVD KNN Amazon 豆瓣 新浪音乐 推荐系统常用算法 关联规则SlopeoneSVD 关联规则 沃尔玛的啤酒和尿布 关联规则 支持度 置信度 算法 Apriori算法 FP growth算法示例 Python Orange SlopeOne SlopeOne SimperCouldBeBetter 2005年由DanielLemire提出http www daniel SlopeOne参考资料 http en wikipedia org wiki Slope One SVD 相似性度量方法 基于项目评分预测的协同过滤推荐算法 邓爱林 朱扬勇 施伯乐 问题 如果大量的数据miss怎么办 很不幸 这个很常见 netflixprize数据缺失99 新浪音乐更糟糕 由于长尾效应 新浪音乐数据缺失率99 5 SVD R U S V Rm n Um r Sr r Vr n SVD性质 Rm n Um r Sr r Vr nRk Um k Sk k Vk n其中Um k是Um r的前k列 Sk k是Sr r的前k行和前k列 Vk n是Vr n的前k行Rk Rm n假如原矩阵是10万 100万的一个矩阵 原矩阵有1000亿个数据 如果采用奇异值分解保存为三个矩阵 取k 100 只需要总共10万 100 100 100 100 100万 1亿1千零1万 数据规模是原来的千分之一多点很多时候Rm n有很多不准确的数值在里面 比如缺失值 缩小到Rk的同时误差也缩小了数学证明查阅 SVD用在图片压缩 原图 K 10 K 20 WhySVD 以音乐为例 每一部音乐都是由一些元素构成 比如民谣 摇滚 轻缓 激昂 抒情等等 音乐在这些元素围度上的侧重各不相同 每一首音乐都可以用一段向量来表示 同样的 每一个用户欣赏音乐的时候 对民谣 摇滚 轻缓 激昂 抒情等元素围度的侧重也不相同 每一个用户也可以用一段向量来表示 最后 用户向量 音乐向量 用户对此音乐的打分 基于SVD推荐系统 以音乐为例 获得用户对音乐的打分数据矩阵R 假设有m个用户 n首歌曲 对原始数据作一些预处理 对矩阵R进行SVD分解 选择合适的K值 获得U S V三个矩阵 获得S矩阵的平方根sqrt S U sqrt S 作为用户矩阵 sqrt S V T作为歌曲矩阵 a 预测用户i对歌曲j的打分 pi j 用户i向量 音乐j向量 b 最近邻 knn 示例 转自 哪两个用户品味最接近 哪两部电视剧最相关 SVD结果值 空间分布图 构建开源SVD推荐系统 SVD计算matlabLAPCKL BLAS Fortran语言numpy scipy Python封装SVDLIBC Meschach C语言http en wikipedia org wiki Singular value decomposition KNN matlabFLANN 完备方案 DIVISI MAGICDIVISI usr bin envpython coding utf etimport data divisi SparseLabeledTensor ndim 2 readsomeratingintodata data user id song id 4svd result data svd k 128 获得指定用户感兴趣的100首歌曲 predict features svd result user id top items 100 获得指定歌曲最相关的100首其他歌曲 feature similarity svd result song id top items 100 获得指定用户音乐品味最接
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食品药品与服装产业概览
- 软件开发技术选型
- 围术期脓毒性休克治疗
- 信息技术未来发展趋势
- 去医院拔牙流程
- 文化活动介绍
- 研究生第一次开组会中文文献汇报
- 精准高效守护新生
- 社团特色活动介绍
- 热泵原理与技术
- 2025年医师定期考核法律法规试题及答案
- 学堂在线 大学计算机基础 章节测试答案
- 县域共配仓农村物流配送成本控制报告
- 二级实验室生物安全管理手册
- 2024-2025学年北京市西城区人教版五年级下册期末测试数学试卷(含答案)
- 全国“安康杯”职工安全健康意识与应急技能知识竞赛试卷附答案
- 2025年taca试题及答案
- 皮肤科说课课件
- 中国古代教育的发展历程
- 骨科术后并发肺栓塞的急救与护理
- 助理工程师考试试题以及答案
评论
0/150
提交评论