个性化检索中的相似用户群的获取与更新

上传人：w*** IP属地：浙江上传时间：2023-04-05 格式：DOC 页数：60 大小：2.09MB 积分：15 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

[40]中介绍的方法，利用KMeans聚类对当前用户数据进行扩充。5.2.1节介绍选择对当前用户进行扩充的用户集时，需要用相似度与阈值α进行对比，如果大于阈值则使用此用户进行扩充。图5-3是对α训练的结果，其中横坐标是α的值，纵坐标是Min(CDet)Norm值越小系统性能越好。图5-3对扩充用户集阈值α的训练Figure5-3Trainingofthresholdαofexpansionuserset从图中可以看出，随着α的提高，系统性能先提高后降低，当α取0.5时系统性能最好，为0.2447。主要原因是：当α取值较小时，会将很多不相似用户拿来对当前用户数据进行扩充，导致扩充后的结果包含较多噪声，因此系统效果较差；而当α取值较大时，大于阈值的用户较少，对当前用户图5-4训练集上UCRM与baseline结果Figure5-4Resultsintrainingcorpus图5-5测试集上UCRM与baseline结果Figure5-5Resultsintestingcorpus的扩充幅度也较少，不能很好解决数据稀疏问题。图5-4是在训练集上UCRM系统与baseline系统的比较图。当相似用户阈值λ取0.184961时UCRM系统的性能达到最好，(CDet)Norm的最小值为0.2447。从图中可以看到，UCRM系统比baseline的效果有了很大提高，而且UCRM的DET曲线大部分在baseline的左下方，说明在相似用户阈值λ取大部分值的情况下，UCRM的效果都要好于baseline。主要原因是UCRM利用相关领域的用户群对当前用户的兴趣进行扩充，不仅解决了用户数据稀疏问题，而且由于群体兴趣的稳定性，还防止了对单个用户兴趣判定的偏差。图5-5是在测试集上UCRM与baseline的结果比较，其中UCRM比baseline的效果提高了7.12%。从图中可以看出，虽然UCRM在测试集上仍比baseline效果要好，但是UCRM在测试集上的效果要比其在训练集上的效果差很多。原因是：在训练集上对扩充用户集的阈值α进行了充分训练，因此选择的对当前用户进行扩充的相似用户比较准确，数据扩充效果较好；但是在测试集上无法对α进行训练，因此α的值仍取0.5，利用这个阈值在测试集上选择扩充用户，如果α偏小，则会选择很多不相关用户对当前用户数据进行扩充，引入了很多噪声，而如果α值偏大，则选择的扩充用户较少，无法很好的解决数据稀疏问题。本章小结本章首先分析了相似用户群建立的几个较好方法的优缺点，然后结合这些方法的优点，提出了基于相关性模型的相似用户群建立的方法，利用相似query段落内的相似用户对当前用户的查看网页数据进行扩充。最后，对相似用户群的实验结果进行了介绍，并对实验结果进行了相似的分析，分析了UCRM方法取得较好效果的原因，以及存在的一些问题。结论本文针对个性化中的重要子课题相似用户群的建立与更新展开研究。相似用户群的建立与更新的主要任务是，在一定的兴趣领域中，通过对用户的检索和浏览历史分析，找到与每个用户兴趣相似的其它用户。相似用户群建立的研究可以应用到个性化检索和推荐中，通过用户所在的用户群的兴趣挖掘单个用户兴趣，并对用户潜在的兴趣进行预测，挖掘用户潜在的新兴趣。国内外已经有很多研究机构对个性化检索和相似用户群建立展开研究，但是，由于缺乏合理的任务划分和标准评测集，此任务的研究也因此受到了很大的限制。因此，在本文的研究中，我们将个性化检索划分为用户新兴趣发现、用户兴趣跟踪、相似用户群的建立以及个性化检索四个子任务。同时利用语料标注辅助系统，收集了标注者在天网100G语料上进行的检索行为以及标注的正确答案，建立起了标准评测集。在评测中，利用错检率、漏检率和系统性能损耗代价对系统进行评测。因此将相似用户群从个性化检索中分离出来，作为一个独立的子任务进行研究。在相似用户群的研究中，数据稀疏问题是限制系统性能的一个重要问题。因此本文借鉴话题跟踪中用于数据扩充的相关性模型，提出了基于相关性模型的相似用户群建立算法，简称UCRM。文中首先针对相关性模型缺点，提出了基于向量空间的相关性模型，简称VRM，并将其应用到相似用户群的建立中。在研究中，我们将用户的query按照检索对象进行划分，在每个query段落内建立一个相似用户群。相似query段落内的相似用户查看历史被用来扩充当前query段落内的用户，扩充采用VRM模型，由query段落的相似度和用户的相似度决定扩充的数据的权重。最后，在系统的语料集上，将UCRM方法与基于聚类数据扩充的相似用户群方法进行比较。结果显示，UCRM方法比baseline系统的效果在训练集上显著高于baseline系统，说明UCRM方法不仅较好的解决了数据稀疏问题，而且利用用户群的兴趣挖掘单个用户兴趣，可以防止单个用户兴趣判定的偏差。但是UCRM在测试集上的性能比在训练集上下降了很多。原因是，在训练集上训练的扩充用户选择阈值α，在测试集上不合适，此阈值过大或过小会导致数据稀疏不能完全解决或扩充数据不准确。因此，如何在当前语料中动态划定扩充用户选择的阈值，将是后续研究的一个重要方面。参考文献曾春，邢春晓，周立柱.个性化服务技术综述.软件学报.2021，13(10)：1952~1961赵继海.论数字图书馆个性化定制服务.中国图书馆学报.2021，(03)：63~65黄晓斌.基于协同过滤的数字图书馆推荐系统研究.大学图书馆学报.2021，(01)：53~57白丽君.基于内容和协作的信息过滤方法研究.情报学报.2021，(03)：304~308J.S.Breese,D.Heckerman,andC.Kadie.EmpiricalanalysisofPredictiveAlgorithmsforCollaborativeFiltering.Proceedingsofthe14thConferenceonUncertaintyinArtificialIntelligence,2021:43~52.A.KohrsandB.Merialdo.ClusteringforCollaborativeFilteringApplications.ProceedingsofCIMCA'99,2021.IOSPress,2021:419~424L.H.UngarandD.P.Foster.ClusteringMethodsforCollaborativeFiltering.ProceedingsofWorkshoponRecommendationSystemsatthe15thNationalConferenceonArtificialIntelligence,MenloPark,CA,2021.AAAIPress,2021:175~190T.HofmannandJ.Puzicha,LatentClassModelsforCollaborativeFiltering.Proceedingsofthe16thInternationalJointConferenceonArtificialIntelligence,2021.SanFrancisco,MorganKaufmannPublishers,2021:688~693M.DeshpandeandG.Karypis.Item-basedtop-nrecommendation.ACMTransactionsonInformationSystems.2021,22(1):143~177B.Sarwar,G.Karypis,J.Konstan,andJ.Riedl.Item-basedcollaborativefilteringrecommendationalgorithms.Proceedingsofthe10thWWWConference,HongKong,2021.NewYork,ACMPress,2021:285~290J.L.Herlocker,J.A.Konstan,A.Borchers,andJ.Riedl.Analgorithmicframeworkforperformingcollaborativefiltering.Proceedingsof22ndSIGIRConference,California,2021.NewYork,ACMPress,2021:230~237R.Jin,J.Y.Chai,andL.Si.Anautomaticweightingschemeforcollaborativefiltering.Proceedingsof27thSIGIRConferenceonResearchandDevelopmentinInformationRetrieval,Sheffield,2021.NewYork,ACMPress,2021:337~344JunWang,ArjenP.deVries,MarcelJ.T.Reinders.UnifyingUser-basedandItem-basedCollaborativeFilteringApproachesbySimilarityFusion.Proceedingsofthe29thSIGIRConferenceonResearchanddevelopmentininformationRetrieval,Washington,2021.NewYork,ACMPress,2021:501~508陈健，印鉴.基于影响集的协作过滤推荐算法.软件学报.2021，(07)：1685~1694Baeza-Yates.现代信息检索.王知津.机械工业出版社.2021：20~22P.Resnick,N.Iacovou,M.Suchak,P.Bergstrom,andJ.Riedl.Grouplens:Anopenarchitectureforcollaborativefilteringofnetnews.ProceedingsofACMConferenceonComputerSupportedCooperativeWork,1994:175~186JonathanL.Herlocker.EvaluatingCollaborativeFilteringRecommenderSystems.ACMTransactionsonInformationSystem.2021,22(01):5~53MichaelP.O’Mahony,NeilJ.Hurley,GuenoleC.M.Silvestre.Utility-basedneighborhoodformationforefficientandrobustcollaborativefiltering.Proceedingsofthe5thACMconferenceonElectronicCommerce,NewYork,2021.NewYork,ACMPress,2021:260~261Linden,G.,Smith,B.,York,J.,2021,“ARecommendations:Item-to-ItemCollaborativeFiltering”,inIEEEInternetComputing,20217(1):76~81ZanHuang,HsinchunChen,DanielZeng.ApplyingAssociativeRetrievalTechniquestoAlleviatetheSparsityProbleminCollaborativeFiltering.ACMTransactionsonInformationSystem.2021,22(01):116~142K.Goldberg,T.Roeder,D.Gupta,andC.Perkins.Eigentaste:AConstantTimeCollaborativeFilteringAlgorithm.InformationRetrieval.2021,4(2):133~151D.Fisher,K.Hildrum,J.Hong,M.Newman,M.Thomas,andR,Vuduc.SWAMI:aFrameworkforCollaborativeFilteringAlgorithmDevelopmentandEvaluation.Proceedingsofthe23rdSIGIRConferenceonResearechandDevelopmentinInformationRetrieval,Athens,2021.NewYork,ACMPress,2021:366~368B.M.Sarwar,G.Karypis,J.A.Konstan,andJ.Riedl.ApplicationofDimensionalityReductioninRecommenderSystems:aCaseStudy.InACMWebKDDWorkshop,2021:42~53C.Zeng,C.-X.Xing,L.-Z.Zhou.SimilarityMeasureandInstanceSelectionforCollaborativeFiltering.Proceedingsof12thInternationalWorldWideWebconference,Budapest,2021.NewYork,ACMPress,2021:652~658Z.Huang,H.Chen,D.Zeng.ApplyingAssociativeRetrievalTechniquestoAlleviatetheSparsityProbleminCollaborativeFiltering.ACMTransactionsonInformationSystems,2021,22(1):116~142M.Balabanovic,Y.Shoham.Fab:Content-based,CollaborativeRecommendation.CommunicationoftheACM.2021,40(3):66~72M.Claypool,A.Gokhale,T.Miranda,P.Murnikov,D.Netes,andM.Sartin.CombiningContent-BasedandCollaborativeFiltersinanOnlineNewspaper.InProceedingsofACMSIGIRWorkshoponRecommender,2021:210~217A.Popescul,L.H.Ungar,D.M.Pennock,andS.Lawrence.ProbabilisticModelsforUnifiedCollaborativeandContent-basedRecommendationinSparse-dataEnvironments.Proceedingsofthe17thConferenceonUncertaintyinArtificialIntelligence,2021.SanFrancisco,MorganKaufmannPublisher,2021:437~444GLinden,BSmith,JYork.Amazonrecommendationsitem-to-itemcollaborativefiltering.InternetComupting.2021,7(01):76~80ASDas,MDatar,AGarg.GoogleNewsPersonalization:ScalableOnlineCollaborativeFiltering.Proceedingsofthe16thinternationalconferenceonWorldWideWeb,Alberta,2021.NewYork,ACMPress,2021:271~280Seung-TaekPark,DavidM.Pennock.ApplyingCollaborativeFilteringTechniquestoMovieSearchforBetterRankingandBrowsing.Proceedingsofthe13thSIGKDDConferenceonKnowledgediscoveryanddatamining,SanJose,2021.NewYork,ACMPress,2021:550~559/speech/tests/tdt/tdt2021/evalplan.htmXuehuaShen,BinTan,ChengXiangZhai.ImplicitUserModelingforPersonalizedSearch.Proceedingsofthe14thACMinternationalconferenceonInformationandknowledgemanagement,Bremen,2021.NewYork,ACMPress,2021:824~831MartiA.Hearst.Multi-ParagraphSegmentationofExpositoryText.Proceedingsofthe32ndannualmeetingonAssociationforComputationalLinguistics,LasCruces,1994.Morristown,AssociationforComputationalLinguistics,1994:9~16VLavrenko,JAllan,EDeGuzman.RelevanceModelsforTopicDetectionandTracking.ProceedingsoftheHumanLanguageTechnologyConference,SanDiego,2021.MorganKaufmannPublisher,2021:104~110.洪宇，张宇，刘挺.话题检测与跟踪的评测及研究综述.中文信息学报.2021，14(06)：71~87XLi,WBCroft.Noveltydetectionbasedonsentencelevelpatterns.Proceedingsofthe14thACMinternationalconferenceonInformationandknowledgemanagement,Bremen,2021.NewYork,ACMPress,2021:744~751GPCFung,JXYuandPSYu.ParameterFreeBurstyEventsDetectioninTextStreams.Proceedingsofthe31stinternationalconferenceonVerylargedatabases,Trondheim,2021.VLDBEndowment2021:181~192YimingYang,TomPierce,JamieCarbonell,AstudyonRetrospectiveandOn-LineEventdetection,CanegieMellonUniversity,Intheproceedingsofthe21thSIGIR,2021.NewYork,ACMPress,2021:28~36Gui-RongXue,ChenxiLin,PQiangYang.ScalableCollaborativeFilteringUsingCluster-basedSmoothing.Proceedingsorthe28thSIGIRconferenceonResearchanddevelopmentininformationretrieval,Salvador,2021.NewYork,ACMPress,2021:114~121RichardO.Duda.模式分类.李宏东.机械工业出版社.2021：423~426HaoMa,PIrwinKing,MichaelR.Lyu.EffectiveMissingDataPredictionforCollaborativeFiltering.Proceedingsofthe30thSIGIRconferenceonResearchanddevelopmentofinformationRetrieval,Amsterdam,2021.NewYork,ACMPress,2021:39~46ShlomoBerkovsky,TsviKuflik,PFrancescoRicci.DistributedCollaborativeFilteringwithDomainSpecialization.Proceedingsofthe2021ACMconferenceonRecommendersystem,Minneapolis,2021.NewYork,ACMPress,2021:33~40注意！copy前一定要备份！以后再做修改时，要修改备份文档。

咖啡店创业计划书第一部分：背景在中国，人们越来越爱喝咖啡。随之而来的咖啡文化充满生活的每个时刻。无论在家里、还是在办公室或各种社交场合，人们都在品着咖啡。咖啡逐渐与时尚、现代生活联系在一齐。遍布各地的咖啡屋成为人们交谈、听音乐、休息的好地方，咖啡丰富着我们的生活，也缩短了你我之间的距离，咖啡逐渐发展为一种文化。随着咖啡这一有着悠久历史饮品的广为人知，咖啡正在被越来越多的中国人所理解。第二部分：项目介绍第三部分：创业优势目前大学校园的这片市场还是空白，竞争压力小。而且前期投资也不是很高，此刻国家鼓励大学生毕业后自主创业，有一系列的优惠政策以及贷款支持。再者大学生往往对未来充满期望，他们有着年轻的血液、蓬勃的朝气，以及初生牛犊不怕虎的精神，而这些都是一个创业者就应具备的素质。大学生在学校里学到了很多理论性的东西，有着较高层次的技术优势，现代大学生有创新精神，有对传统观念和传统行业挑战的信心和欲望，而这种创新精神也往往造就了大学生创业的动力源泉，成为成功创业的精神基础。大学生创业的最大好处在于能提高自己的潜力、增长经验，以及学以致用;最大的诱人之处是透过成功创业，能够实现自己的理想，证明自己的价值。第四部分：预算1、咖啡店店面费用咖啡店店面是租赁建筑物。与建筑物业主经过协商，以合同形式达成房屋租赁协议。协议资料包括房屋地址、面积、结构、使用年限、租赁费用、支付费用方法等。租赁的优点是投资少、回收期限短。预算10-15平米店面，启动费用大约在9-12万元。2、装修设计费用咖啡店的满座率、桌面的周转率以及气候、节日等因素对收益影响较大。咖啡馆的消费却相对较高，主要针对的也是学生人群，咖啡店布局、格调及采用何种材料和咖啡店效果图、平面图、施工图的设计费用，大约6000元左右3、装修、装饰费用具体费用包括以下几种。(1)外墙装饰费用。包括招牌、墙面、装饰费用。(2)店内装修费用。包括天花板、油漆、装饰费用，木工、等费用。(3)其他装修材料的费用。玻璃、地板、灯具、人工费用也应计算在内。整体预算按标准装修费用为360元/平米，装修费用共360*15=5400元。4、设备设施购买费用具体设备主要有以下种类。(1)沙发、桌、椅、货架。共计2250元(2)音响系统。共计450(3)吧台所用的烹饪设备、储存设备、洗涤设备、加工保温设备。共计600(4)产品制造使用所需的吧台、咖啡杯、冲茶器、各种小碟等。共计300净水机，采用美的品牌，这种净水器每一天能生产12l纯净水，每一天销售咖啡及其他饮料100至200杯，价格大约在人民币1200元上下。咖啡机，咖啡机选取的是电控半自动咖啡机，咖啡机的报价此刻就应在人民币350元左右，加上另外的附件也不会超过1200元。磨豆机，价格在330―480元之间。冰砂机，价格大约是400元一台，有点要说明的是，最好是买两台，不然夏天也许会不够用。制冰机，从制冰量上来说，一般是要留有富余。款制冰机每一天的制冰量是12kg。价格稍高550元，质量较好，所以能够用很多年，这么算来也是比较合算的。5、首次备货费用包括购买常用物品及低值易耗品，吧台用各种咖啡豆、奶、茶、水果、冰淇淋等的费用。大约1000元6、开业费用开业费用主要包括以下几种。(1)营业执照办理费、登记费、保险费;预计3000元(2)营销广告费用;预计450元7、周转金开业初期，咖啡店要准备必须量的流动资金，主要用于咖啡店开业初期的正常运营。预计2000元共计： 120000+6000+5400+2250+450+600+300+1200+1200+480+400+550+1000+3000+450+2000=145280元第五部分：发展计划1、营业额计划那里的营业额是指咖啡店日常营业收入的多少。在拟定营业额目标时，必须要依据目前市场的状况，再思考到咖啡店的经营方向以及当前的物价情形，予以综合衡量。按照目前流动人口以及人们对咖啡的喜好预计每一天的营业额为400-800，根据淡旺季的不同可能上下浮动2、采购计划依据拟订的商品计划，实际展开采购作业时，为使采购资金得到有效运用以及商品构成达成平衡，务必针对设定的商品资料排定采购计划。透过营业额计划、商品计划与采购计划的确立，我们不难了解，一家咖啡店为了营业目标的达成，同时有效地完成商品构成与灵活地运用采购资金，各项基本的计划是不可或缺的。当一家咖啡店设定了营业计划、商品计划及采购计划之后，即可依照设定的采购金额进行商品的采购。经过进货手续检验、标价之后，即可写在菜单上。之后务必思考的事情，就是如何有效地将这些商品销售出去。3、人员计划为了到达设定的经营目标，经营者务必对人员的任用与工作的分派有一个明确的计划。有效利用人力资源，开展人员培训，都是我们务必思考的。4、经费计划经营经费的分派是管理的重点工作。通常能够将咖啡店经营经费分为人事类费用(薪资、伙食费、奖金等)、设备类费用(修缮费、折旧、租金等)、维持类费用(水电费、消耗品费、事务费、杂费等)和营业类费用(广告宣传费、包装费、营业税等)。还能够依其性质划分成固定费用与变动费用。我们要针对过去的实际业绩设定可能增加的经费幅度。5、财务计划财务计划中的损益计划最能反映全店的经营成果。咖啡店经

人人文库> 全部分类> 应用文书 > 项目管理

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

个性化检索中的相似用户群的获取与更新

文档简介

温馨提示

最新文档

评论

个性化检索中的相似用户群的获取与更新

文档简介

温馨提示

最新文档

评论

相关文档