版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
矩阵分解技术应用到推荐系统第一页,编辑于星期六:二十三点二十二分。第1页,共25页。CataloguePaperBackgroundIntroductionRecommenderSystemsStrategiesMatrixFactorizationMethodsABasicMatrixFactorizationModelLearningAlgorithmAddingBiasesAddingInputSourcesTemporalDynamicsInputWithVaryingConfidenceLevelsNetflixPrizeCompetitionConclusionFriday,May12,20232第二页,编辑于星期六:二十三点二十二分。第2页,共25页。1、PaperBackgroundFriday,May12,202331.YehudaKoren,YahooResearch2.RobertBellandChrisVolinsky,AT&TLabs-Research3.PaperpublishedbytheIEEEComputerSocietyinAugust20094.AuthorwonthegrandNetflixPrizeCompetitioninSeptember2009第三页,编辑于星期六:二十三点二十二分。第3页,共25页。2、IntroductionModernconsumersareinundatedwithchoices.MoreretailorhavebecomeinterestedinRS,whichanalyzepatternsofuserinterestinproductstopridepersonalizedrecommendationsthatsuitauser'staste.NetflixandAhavemadeRSasalientpartoftheirwebsites.Particularlyuserfulforentainmentproductssuchasmovies,music,andTVshows.第四页,编辑于星期六:二十三点二十二分。第4页,共25页。3、RecommenderSystemStrategiesContentFilteringCollaborativeFiltering
1.Neighborhoodmethods
user-oriented
item-oriented
2.LatentFatorModelFriday,May12,20235第五页,编辑于星期六:二十三点二十二分。第5页,共25页。3.1、ContentsFilteringCreateaproeachuserorproducttocharacterizeitsnature.Needtogatherexternalinformation.AknownsuccessfulrealizationofcontentfilteringistheMusicGenomeProject,whichisusedfortheInternetradioserviceP.Friday,May12,20236第六页,编辑于星期六:二十三点二十二分。第6页,共25页。3.2、CollaborativeFilteringAnalyzerelationshipsbetweenusersandinterdep-enciesamongproductstoidentifynewuser-itemas-Socitions.Disadvantages:coldstartTwoprimaryareas:neighborhoodmethodsuser-orienteditem-orientedLatentfactormodelsFriday,May12,20237第七页,编辑于星期六:二十三点二十二分。第7页,共25页。3.2.1、NeighborhoodmethodsCenteredoncomputingtherelationshipsbetweenitemsor
users.Theitem-orientedapproachevaluatesa
user’spreferenceforanitembasedonratingsof“neighboring”itemsbythesameuser.Theuser-orientedapproachidentifieslike-mindeduserswhocancomplementeachother’sratings.Friday,May12,20238第八页,编辑于星期六:二十三点二十二分。第8页,共25页。Example:第九页,编辑于星期六:二十三点二十二分。第9页,共25页。3.2.2、LatentFactorModelsFindfeaturesthatdescribethecharacteristicsofratedobjects.Itemcharacteristicsanduserpreferencesaredescribedwithnumericalfactorvalues.Assumption:Ratingscanbeinferredfromamodelputtogetherfromasmallernumberofparameters.Friday,May12,202310第十页,编辑于星期六:二十三点二十二分。第10页,共25页。4、MatrixFactorizationMethodsCharacterizebothitemsandusersbyvectorsoffactorsinferredfromitemratingpatterns.RSrelyondifferenttypesofinputdata.Strength:incorporationofadditionalinformation,implicitfeedback.Implicitfeedback:purchasehistory,browsinghistory,searchpatterns,mousemovementandsoon.Friday,May12,202311第十一页,编辑于星期六:二十三点二十二分。第11页,共25页。5、ABasicMatrixFactorizationModelDotproductcapturestheuser’sestimatedinterestintheitem:(1)Here,theelementsofmeasuretheextenttowhichtheitempossessesthosefactors,theelementsofmeasuretheextentofinteresttheuserhasinitemsthatarehighonthecorrespondingfactors.Challenge:Howtocomputeamappingofitemsandusersfactorvectors?Approaches:SingularValueDecompositionn(SVD)
Friday,May12,202312第十二页,编辑于星期六:二十三点二十二分。第12页,共25页。5.1、SingularValueDecompositionRequirefactoringtheuser-itemratingmatrixConventionalSVDisundefinedforincompleteImputationtofillinmissingvaluesIncreasestheamountofdataModelingdirectlytheobservedratingsWeneedtoapproachthatcansimplyignoremissingvalue
第十三页,编辑于星期六:二十三点二十二分。第13页,共25页。5.1、SingularValueDecompositionMeasures:aregularizedmodel(2)Here,isthesetofthe(u,i)pairsforwhichisknown(thetrainingset);theconstantcontrolstheextentofregularization,determinedbycross-validation.第十四页,编辑于星期六:二十三点二十二分。第14页,共25页。6、LearningAlgorithmsTwomethodstominizingEquation(2)
StochasticGradientDescent
AlteringLeastSquaresFriday,May12,202315第十五页,编辑于星期六:二十三点二十二分。第15页,共25页。6.1、StochasticGradientDescentLoopthroughallratingsinthetrainingsetForeachgiventraingcase,thesystempredictsandcomputestheassociatedpredictionerrorBymagnitudeproportionaltointheoppositedirectionofthegradient
第十六页,编辑于星期六:二十三点二十二分。第16页,共25页。6.2、AlternatingLeastSquaresALSteachniquesrotatebetweenfixingtheandfixingtheALSisfavorableinatleasttwocases:AllowsmassiveparallelizationCenteredonimplicitdata
第十七页,编辑于星期六:二十三点二十二分。第17页,共25页。7、AddingBiasesAfirst-orderapproximationofthebiasinvolvedinratingisasfollows:(3)Here,istheoverallaverage;theparameters,indicatetheobserveddeviationsofuseranditemi.Includingbiasparametersintheprediction:(4)Optimize:(5)Friday,May12,202318第十八页,编辑于星期六:二十三点二十二分。第18页,共25页。8、AddingInputSourcesProblem:coldstartSolution:incorporateadditionalsourcesofinformationabouttheusers.Twoinformation:itemattributes,userattributesItemattribute:NormalizingthesumUserattribute:Optimaion:(6)
第十九页,编辑于星期六:二十三点二十二分。第19页,共25页。9、TemporalDynamicsRatingmaybeaffectedbytemporaleffectsPopularityofanitemmaychangeUser'sidentityandpreferencesmaychangeModelingtemporalaffectscanimporveaccuracysignificantlyRatingpredictionsasafunctionoftime:
(7)Friday,May12,202320第二十页,编辑于星期六:二十三点二十二分。第20页,共25页。10、InputwithVaringConfidencelevelsInseveralsetups,notallobservedratingsdeservethesameweightorconfidence.Plan:ConfidenceinobservingisdenotedasCostfounction:
(8)Friday,May12,202321第二十一页,编辑于星期六:二十三点二十二分。第21页,共25页。11、Netflixprizecomp
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 跨境电商海外仓仓储合同协议2025年全球版
- 2025 小学六年级语文上册阅读策略提取关键信息训练课件
- 2025年办公用品定制设计合同协议
- 2025年白内障术后出院指导合同协议
- 酒店住宿服务合同协议2025年
- 构件棱角破损质量通病防治方案
- 深度解析(2026)《GBT 39341-2020宇航用高速传输连接器通 用规范》(2026年)深度解析
- 物业消防面试题目及答案
- 深度解析(2026)《GBT 39231-2020无水氯化铈》(2026年)深度解析
- 2026年七年级历史上册期末考试试卷附答案(四)
- 某温室工程施工资料
- 外墙铝板维修合同协议
- 2025年湖南铁道职业技术学院单招职业技能测试题库带答案
- 2023冷库地面工程技术规程
- 小学一年级加减法口算100道A4直接打印
- 教育学开题报告模板
- 化学品(氩气+二氧化碳混合气)安全技术使用说明书
- 2024版七年级下册美术模拟试卷
- 大学生创业设计指导 课件 项目一 路演敲开创业之门
- 羊寄生虫综合防控技术规范
- 2023-2024学年人教部编版统编版九年级上学期历史期末模拟试卷(含答案解析)
评论
0/150
提交评论