基于用户反馈的个性化检索技术研究_第1页
基于用户反馈的个性化检索技术研究_第2页
基于用户反馈的个性化检索技术研究_第3页
基于用户反馈的个性化检索技术研究_第4页
基于用户反馈的个性化检索技术研究_第5页
已阅读5页,还剩104页未读 继续免费阅读

基于用户反馈的个性化检索技术研究.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文题目基基于用户反馈的个性化检索技术研究姓名学号1院系信息科学技术学院专业计算机系统结构研究方向网络与分布式系统导师姓名教授二零零七年五月版权声明任何收存和保管本论文各种版本的单位和个人,未经本论文作者同意,不得将本论文转借他人,亦不得随意复制、抄录、拍照或以任何方式传播。否则,引起有碍作者著作权之问题,将可能承担法律责任。摘要随着互联网的飞速发展,搜索引擎日渐成为人们必不可少的一项工具。然而一方面由于搜索引擎的用户大多是普通用户,很难将自己复杂的检索目的组织成搜索引擎所需要的简单的查询词表示;因此为用户提供更多的交互式接口,提供G2563发式检索G6175G8585G4613G7186得G10317G2047G18337要。G2490一方面G3324通用搜索引擎G1025,G5415不同的用户G17767G1849同一个检索词G7114,搜索引擎将不G1582G2318G2010的G17832G3250同G7691的检索G13479G7536。然而G4466G17353G16789G7138,用户的检索目的是多种多G7691的。G2375G1363是同G7691的检索词,不同用户所G7411G5465的检索G13479G7536G1075是各不G11468同的。此G7114需要一G1135更G2164G17160G17829用户的G6175G8585G7481G6925G2476G17837种检索方式,G1363得用户能G3827得G2052G11507G8503自己G1863G5527的G1461G5699。G17837G1075G4613是G256个G5627G2282检索G257所G16809G3282G16311G1927的问题。个G5627G2282检索G13007G13491是G6363G18039G1135G19036G4557不同用户G13984G7235G17832G3250不同检索G13479G7536的G1461G5699检索G13007G13491。G3324G17837G1135G13007G13491G1025,文G7735的G11468G1863G5627是G3534于不同用户的G13984G7235和G1864G17271而单G10432G16757G12651的。而用户的G1864G17271和G13984G7235通G5132是通G17819G7186式或G19556式的用户G2465G20316G7481G14731得。通G17819G4557G3534于用户G2465G20316的个G5627G2282检索G6228G7427的G9157G1849G11752G12362和G6518G16764,本文得G2052G1114G3926G991G11752G12362成G7536和G13479论G7261一种G7092G20047人工G5190G20056的、用于G15925G18339搜索引擎G6502G5219G13479G7536G17148G18339的方法和G6363G7643QRG708QUALITYOFARANKEDLISTG709。G16825G6363G7643能G3827用于G15925G18339一个文G7735G6502G5219G13479G7536的G17148G18339;G3324G4466G19481的检索G17819G12255G1025,G16825G6363G7643不需人工G5190G20056G2375可G16757G12651得G2052,而以G5460的G6363G7643G18129需要有人工G7643G8892的G13479G7536G19610G6177可G16757G12651。G4466G20576G13479G7536表G7138G1114QRG6363G7643G994DCGG1552成G8503G8616,G1075G4613是G16840QRG6363G7643G11842G4466G2465G7156G1114一个G6502G5219G13479G7536的G11507G4466G17148G18339。2一种G3534于QRG6363G7643的个G5627G2282G18337G6502G5219G12651法。G3324有G1114QRG6363G7643的G3534G11796G990,G4613可以通G17819G5415G2081G6502G5219G13479G7536的G17148G18339G7481G15925G18339用户不同G2465G20316文G7735的G11468G1863G5242G20652G1314,G17837G8503是QRG2164权G6502G5219G12651法的G5617G5831。通G17819G17837种方法,G11468G1863G5242G17751G20652的G2465G20316文G7735将G4557G18337G6502G5219G17819G12255起着更G18337要的作用,G1186而有G6940的G6925进G1114个G5627G2282G6502G5219的G13479G7536G17148G18339。3一种利用G2010类辅助的摘要G8616G17751G12651法SCCG708SA1A0A2A2A3A4A5A6A7A2A8A9A0A10A6A1A11A12A5A13A8A10A10A0A14A0A15A8A4A0A6A1G709。摘要G8616G17751G12651法是个G5627G2282G18337G6502G5219G12651法G17819G12255G1025必不可少的一个子模块。SCCG12651法的主要G5617G5831是根据搜索引擎G17832G3250摘要的G10317点,利用G2010类G6228G7427G7481扩展短摘要的G1461G5699,以G6925进摘要G8616G17751G12651法。G16825方法有G6940的克服G1114摘要文本短,内容少,G7092法直接G8616G17751的G10317点;G1186而G6925进G1114摘要G8616G17751的G13479G7536,进而提G20652G1114G6502G5219G12651法的G17148G18339。最终的G4466G20576G13479G7536G20576G16789G1114G16825方法的有G6940G5627。4一种G7092损的G3534于聚类的层次KNNG2010类G12651法。KNNG12651法是一种经典的G2010类G12651法,然而其G3324处理大规模训练文G7735G7114G6940率G990存G3324缺陷。本文利用层次聚类G12651法G4557训练文G7735进行有G6940的组织,G4466现G1114G3324提G20652G2010类G6940率的同G7114,G2010类G17148G18339不G991降。5G3324G9157G1849G11752G12362并G6518G16764G1114训练数据G19610G4557G2010类G13479G7536的影响之后,本文提出G1114一种稳定的G2010类评测G6363G7643NEWMACROF1。G16825评测G6363G7643具有G3926G991优点G726G708AG709G3324不同的训练数据G19610G990,NEWMACROF1表现G17751稳定;G708BG709G1363用新的评测G6363G7643,不同的G11752G12362工作G3324不同训练数据G19610G990的G5627能可以直接进行G8616G17751;G708CG709G3324给定一个G2010类器G3324某个训练数据G19610G990的NEWMACROF1G1552G7114,可以推导得G2052G16825G2010类器G3324G2490一个训练数据G19610G990的G2010类G13479G7536G708G2375G11507G4466的G2010类精G5242、召G3250率以及F1G1552G709。6一个个G5627G2282检索G13007G13491原型PTIANWANGG708PERSONALIZEDTIANWANGG709。它是一种G3534于G7186式用户G2465G20316的个G5627G2282检索G13007G13491,G16825G13007G13491通G17819一个客户端G7481完成用户G1461G5699的搜G19610以及检索G13479G7536的G18337G6502G5219工作。用G17837种方式可以G4557不同的用户产生不同的G6502G5219G6940G7536,满足用户不同的检索目的,G1186而达G2052个G5627G2282检索的目的。关键词G726搜索引擎,G1461G5699检索,个G5627G2282,G11468G1863G2465G20316,G2010类ONPERSONALIZEDRETRIEVALTECHNOLOGYBASEDONRELEVANCEFEEDBACKGONGBIHONGCOMPUTERSYSTEMARCHITECTUREDIRECTORBYPROFLIXIAOMINGABSTRACTWHILECURRENTWEBSEARCHTOOLSDOAGOODJOBINRETRIEVINGRESULTSTOSATISFYCERTAINPEOPLESNEEDSFORAGIVENQUERY,THEYDONOTDOAVERYGOODJOBINDISCERNINGINDIVIDUALSSEARCHGOALSITISANOPPORTUNITYTOACHIEVESIGNIFICANTIMPROVEMENTBYPURSUINGSEARCHALGORITHMSTHATRETURNPERSONALIZEDRESULTSINSTEADOFTREATINGALLUSERSASTHESAMEINTHISPAPER,RELEVANCEFEEDBACKTECHNIQUEISUSEDTOPERFORMTHERERANKINGBYUSINGTHEFEEDBACKFROMDIFFERENTINDIVIDUALSTHEMAINCONTRIBUTIONSINCLUDE1ANEWMEASURECALLEDQUALITYOFARANKEDLISTQRISDEVELOPEDTOEVALUATETHEQUALITYOFASEARCHRESULTTHISMEASUREQRCANBECALCULATEDFROMTHREEFEATURESOFARANKEDRESULTWITHOUTMANUALLABELWHILEPREVIOUSMEASURESCANNOTEXPERIMENTSSHOWTHATQRISINDIRECTPROPORTIONTOTHEDCGMEASUREWHICHMEANSQRCANBEUSEDTOEVALUATETHEQUALITYOFARESULTLIST2THEQUALITYOFCURRENTRANKEDRESULTISUSEDTOPREDICTTHERELEVANCEOFDIFFERENTFEEDBACKSANDPERFORMTHERERANKING,THATISTHEQRWEIGHTEDRERANKINGALGORITHMINTHISWAY,GOODFEEDBACKDOCUMENTPLAYSANIMPORTANTROLEINTHEPROCESSOFRERANKINGEXPERIMENTSSHOWTHATTHENEWRERANKINGALGORITHMQRLINEAROUTPERFORMSTHEOTHERTWOBASELINEALGORITHMSTHENEWALGORITHMISEFFECTIVEFORRERANKINGESPECIALLYWHENTHENUMBEROFFEEDBACKISLARGE3ANALGORITHM,SCCSNIPPETCOMPARISONBYCLASSIFICATION,WASDEVELOPEDTOIMPROVETHESNIPPETCOMPARISONASNIPPETISASHORTDOCUMENTINWHICHMOSTKEYWORDSOCCURONLYONCE,WHICHMAKESCONVENTIONALDOCUMENTCOMPARISONMETHODSINEFFECTIVE,SUCHASTHETFIDFANDCOSINETHEALGORITHMISTOEXPANDTHEINFORMATIONOFSHORTSNIPPETSBYCLASSIFICATIONTECHNIQUEANDTHENIMPROVETHESNIPPETCOMPARISONEXPERIMENTALRESULTSSHOWTHATTHEDCGBENCHMARKOFRETRIEVALRESULTSINCREASESWITHTHEIMPROVEDSNIPPETCOMPARISONMETHODBEINGUSED4ANALGORITHMLHKNNLOSSLESSHIERARCHICALKNNISPROPOSEDINTHISPAPERTHEALGORITHMUSESAHIERARCHICALCLUSTERINGALGORITHMTOPREPROCESSTHELARGETRAININGDATASETANDGETAHIERARCHICALTREEOFTRAININGDATACLUSTERWITHTHISWELLORGANIZEDHIERARCHICALTREE,LHKNNCANDOPRUNINGINCLASSIFICATIONPROCESSACCORDINGTOTHEPRUNINGRULETOGETGOODEFFICIENCYWITHOUTAFFECTINGTHEQUALITYEXPERIMENTSSHOWTHATTHEALGORITHMIMPROVESTHEEFFICIENCYOFCLASSIFICATIONBY50PERCENTANDGETSNEARLYTHESAMECLASSIFICATIONACCURACYASTHENONHIERARCHYKNNDOES5ANEWEVALUATIONMETHODOFSTATISTICALCATEGORIZATIONALGORITHMCALLEDNEWMACROF1ISPROPOSEDACCORDINGTOTHEANALYSISOFTHEEFFECTSOFTHETRAININGDATASETONTHECLASSIFICATIONRESULTTHENEWMEASUREREMAINSSTABLEONDIFFERENTDATASETSGIVENTHEPERFORMANCEOFANALGORITHMONONECOLLECTION,THEPERFORMANCESUCHASPRECISIONONOTHERCOLLECTIONSCOULDBEESTIMATEDWITHTHEHELPOFTHENEWMEASURE6APERSONALIZEDRETRIEVALSYSTEMPROTOTYPEPTIANWANGPERSONALIZEDTIANWANGISDEVELOPEDTODEMONSTRATEONEOFTHEAPPLICATIONSOFTHETECHNIQUEPRESENTEDINTHISPAPERTHESYSTEMISACLIENTSIDEAPPLICATIONWHICHUSESTHEEXPLICITRELEVANCEFEEDBACKTOPERFORMRERANKINGFORDIFFERENTINDIVIDUALSKEYWORDSSEARCHENGINE,INFORMATIONRETRIEVAL,PERSONALIZED,RELEVANCEFEEDBACK,CLASSIFICATION目录第1章引言111G11752G12362工作的G13984G7235和意义112用户G2465G20316G6228G7427的线装概述2121G3926何G14731得用户G2465G20316G1461G56994122G3926何G1363用用户G2465G20316G1461G56999123G3926何评价G2465G20316G6228G74271413本文的主要工作18131本文的主要G11752G12362内容18132本文的创新之处2014本文的组织G13479构21第2章对重排序算法的研究2221介绍2222G11468G1863工作2423G4557一个G6502G5219G13479G7536G17148G18339的评估25231G15925G18339一个G6502G5219G17148G18339的现有G6363G764325232三个G10317征以及QRG6363G764326233G1863于新G6363G7643QR的G4466G205763024利用QRG6363G7643G6925进的G18337G6502G5219G12651法及G4466G20576G13479G75363425本章小G1347936第3章利用分类改进的摘要比较算法3731引言3732利用G2010类G6228G7427G6925进的摘要G8616G17751G12651法37321引言37322G11468G1863工作39323摘要G8616G17751G12651法40324G4466G20576设置和G4466G20576G13479G753644325小G134794733G4557G2010类G12651法G6940率的G6925进47331引言47332G11468G1863工作49333LHKNNG3534于聚类的G7092损层次KNNG2010类G12651法49334G4466G20576G13479G7536和G12651法G2010析53335小G134795534本章小G1347955第4章对中文分类评测方法的研究5741引言5742G11468G1863G11752G123625943三个因素60431因素1训练G19610G1025的文G7735G8616例60432因素2G726类半径62433因素3G726类间距6444新评测G6363G7643以及G4466G2057666441新评测G6363G764366442G4466G205761同一个G2010类器G3324不同数据G19610G990的表现67443G4466G20576212个不同G2010类器G33242个不同数据G19610G990的表现68444新评测G6363G7643的优点6945本章小G1347970第5章一个应用实例及应用前景7251个G5627G2282检索G6228G7427应用现状7252一个应用G4466例PTIANWANGG7267453其他应用场G7235及G4466例76531客户端VS服务器76532G19556G2465G20316VSG7186式用户G2465G2031677533通用搜索引擎VS个G5627G2282搜索引擎78534G11468G1863工作及G13007G134917854本章小G1347979第6章总结和展望8161本文的总G134798162进一步的G11752G12362工作83参考文献85博士期间录用和提交的论文93博士期间的主要科研项目与所获奖励94致谢96图示G328211模拟评测18G328221G13479G7536G5219列的G10317征29G328222查询G7691例31G328223估G16757G11468G1863文G7735个数32G328224G10317征2G726半径33G328225G10317征3G726可能的G11468G1863文G7735G8616例33G328226QRG6363G7643G994DCGG1552的G1863G1300734G328227G18337G6502G5219G12651法流G1225534G328228QR线G5627G6502G5219G12651法36G328231摘要G4466例A39G328232摘要G4466例B39G328233摘要G4466例C39G328234天网搜索引擎G17832G3250摘要41G328235G1025文网页G2010类器的工作流G1225543G328236摘要G8616G17751G12651法G4466G20576G13479G753646G328237DCGG994G1863G13007G328247G328238一个G2465例50G328239判定规则G16840G713851G3282310G4466例G726二维空间54G32824112个不同G2010类器G33242个不同数据G19610G990的宏平均精G524259G328242文G7735G8616例G4557G2010类G13479G7536的影响62G328243因素2G726类半径的含义63G328244类半径G4557G2010类G13479G7536的影响64G328245因素3G726类间距的含义65G328246类间距G4557G2010类G13479G7536的影响65G328247同一个G2010类器G3324不同的数据G19610G990的G5627能表现68G328251个G5627G2282检索G13007G1349173G328252G3534于用户G2465G20316的个G5627G2282检索原型PTIANWANG75G328253PTIANWANG的G1363用G17819G1225576G328254OUTRIDEG13007G13491G16840G713878表格表11G726各种用户行为的G2010类6表31G7691本G19610G1025类G2047及G4466例数G18339的G2010布情况42表32G1025文网页G2010类器43表33查询G19610合G16840G713845表34层次KNNG12651法G6940率54表35LHKNNG12651法G6940率54表41G1461G5699检索G13007G13491的评价G7643准57表42评测G6363G7643G3324不同数据G19610G990的数G1552方差67表43CCT2002数据G1961068表44CCT2006数据G1961069表4512个不同的G2010类器G33242个数据G19610G990G5627能评价69表51个G5627G2282检索G13007G13491的划G201073A161A17A18A19A20第1章引言11研究工作的背景和意义随着WEB规模的迅速增长和内容的不断丰富,用户越发的需要搜索引擎G17837一G1461G5699服务G5430式以G5122助用户G5567速、准G11842的G3324G1461G5699的G9035G8927G1025G6226G2052自己需要的内容。一个典型的G1363用场G7235是G726用户将自己的检索目的组织成G14521G5190个查询词作为G17767G1849G17877给搜索引擎;搜索引擎根据查询词进行检索,将检索G13479G7536G17832G3250给用户;用户G8995G16284G17837G1135G13479G7536并点G1999查G11487自己G5831要的G13479G7536页面。然而一个G12373出的问题是G726一个查询G13479G7536G19610G1025G5460G5460G2265含G1114成G2327G990G987G2454差不G21796、内容各G5334的G13479G7536。G17837G1135G13479G7536有G1135是G12538合用户检索目的的,G1306是大G18108G2010G18129是不G11468G1863文G7735,G1075G4613是G16840查询G13479G7536G19610的精G5242G1314。G1186TRECG2394G5192的评测G13479G7536G1025G1075G16840G7138G1114通用搜索引擎的G17837一问题,而G256查询词的内容含G12958G257是导G14280G17837种情况的主要原因之一。由于检索目的不G7138G11842或是G4557检索G10627G3671的不G10099G5725SPINK,GRIESDORFETAL1998G12573因素,G16780多G1119G4466表G7138用户G7092法将自己的检索意G3282组织成G20652G17148G18339的查询词。经G20576丰富的用户,能G3827构G17908出G256G3921G257的查询词;所G16871G256G3921G257的查询词是G6363查询G1025G2265含大G18339G2318G2010G5242G20652的词G708G2375G3324少G18339文G7735G1025大G18339出现的词G709。G1306是大多数用户并不能G9177G7982的G6563述他的需G8726,最终得G2052的检索G13479G7536G1075G5460G5460难以G1208人满意。因此搜索引擎需要一G1135G20081G3818的G6228G7427G7481辅助G6378G6508用户的查询意G3282,G6925进检索G13479G7536。G2490一方面,G3324通用搜索引擎G1025,G5415不同的用户G17767G1849同一个检索词G7114,搜索引擎将不G1582G2318G2010的G17832G3250同G7691的检索G13479G7536。然而G4466G17353G16789G7138,用户的检索目的是多种多G7691的。G2375G1363是同G7691的检索词,不同用户所G7411G5465的检索G13479G7536G1075是各不G11468同的。此G7114需要一G1135更G2164G17160G17829用户的G6175G8585G7481G6925G2476G17837种检索方式,G1363得用户能G3827得G2052G11507G8503自己G1863G5527的G1461G5699。G17837G1075G4613是G256个G5627G2282检索G257所G16809G3282G16311G1927的问题。G11468G1863G2465G20316G6228G7427G708RELEVANCEFEEDBACKG709是G3324个G5627G2282检索方面最G18337要的方法之一G708传G13491的G11468G1863G2465G20316G6228G7427主要是用于查询扩展,然而G17829G1135G5192G11468G1863G2465G20316G6228G7427G5062经G5203G8879的应用G3324G1114各种个G5627G2282检索G13007G13491G1025。G17837一点将G1262G3324后面的章G14422G1025G16840G7138G709。经典的G1461G5699检索模型通G5132由4个要素组成,JIDQRFQD,其G1025G726G7081G709D是G4557一个大文G7735G19610合的G17935G17765表示;G7082G709Q是G4557用户G1461G5699需G8726的G17935G17765表示;G7083G709F为模型的G13984G7235G6563述;A211A22A23A24A25G7084G709RQI,DJ是一个G6502G5219G12651法。G4557任意一个用户G1461G5699需G8726QQIG708G2375用户检索词G709,G16825G12651法G16757G12651得G2052G8611个文G7735DDJ的G11468G1863G5242权G1552SALTONANDMJMCGILL1983。而G11468G1863G2465G20316G6228G7427最主要的作用是提供一个新的G6502G5219G12651法,RJIDDQR,G3324增G2164G1114一个G5062G11705G7477G1226RDG708RD为用户的G2465G20316G1461G5699G19610合G709的情况G991,G18337新G16757G12651G4557于查询QQI,文G7735DDJ的G11468G1863G5242权G1552;G1186而G6925G2476原G7481的G6502G5219G13479G7536,进而G6925进检索G17148G18339。需要G8892意的是,G4557于RKDD,DKG6563述的可以是用户的G8503G2465G20316G1461G5699G708G2375DK为用户的G11468G1863文G7735G709;DKG1075可以是G17139G2465G20316G1461G5699G708G2375DK为用户的不G11468G1863文G7735G709。G3324一个G11468G1863G2465G20316G13007G13491G1025,G4466G19481的G6817作流G12255G3926G991G726用户G4557检索出的文G7735G7186式或G19556式的进行G11468G1863G5627判定,G13007G13491根据G17837G1135判定生成新的查询,G4557检索G13479G7536进行G18337G6502G5219。G17837一G17819G12255可以不断的G17857G1207进行,直G2052用户G6226G2052满意的G11468G1863文G7735G19610合。G16780多G4466G20576G13479G7536G18129G16789G7138G1114G17837一方法能G3827有G6940的G6925进查询G13479G7536的G17148G18339,G17837种G6925进主要得G11422于查询扩展以及G4557查询词权G18337的G18337新G16757G12651。根据所G16772录的用户G2465G20316G2394G2502长短,G11468G1863G2465G20316G6228G7427可以G2010为长G7411及短G7411G1016种G726长G7411G708LONGTERMG709G11468G1863G2465G20316G2375长G7411G16772录用户的行为,G5326G12447并维G6264用户模型G708USEMODELG709,根据用户模型G4557用户的行为进行G20056测;短G7411G708SHORTTERMG709G11468G1863G2465G20316G2494处理一个G1262G16817G708SESSIONG709内的用户行为G708通G5132G6363一次G1461G5699检索查询G1025G4557查询G13479G7536G19610的优G2282G709,因此G1075G4613不G9053及用户长G7411G2394G2502以及用户模型的G2476G17813维G6264。本文G1025主要G16764论的是短G7411用户G2465G20316所G1363用的各种G11468G1863G6228G7427。G11468G1863G2465G20316G11468G4557于其他查询处理方法而言,具有G3926G991优点G726G7081G709用户G2494需G4557文G7735G1582出G11468G1863G5627判断,而不需要G1114G16311查询处理的G6228G7427G13466G14422;G7082G709用户G2465G20316G6228G7427将G6984个检索G17819G12255G2010G2118成3个用户容G7143理G16311的G18108G2010G726提交查询,进行G11468G1863G5627判断,G4557查询G13479G7536的G18337G6502G5219;G7083G709它提供G1114一种可G6523制的方法G7481G12373出某G1135查询词或是G2078G5381某G1135查询词。由此可G16277,G11468G1863G2465G20316G6228G7427是理G16311用户检索意G3282、G4466现个G5627G2282G6502G5219、G6925进搜索引擎G6502G5219G13479G7536,提G20652用户G4557搜索引擎G13479G7536满意G5242的G18337要工具。因此本文将G4557G3534于用户G2465G20316的个G5627G2282检索G6228G7427G17837一具有G18337要理论意义和G5203G19432应用G2081G7235的G16850题进行G11752G12362和G6518索。G312用户反馈技术的现状概述A261A27A28A29A30传G13491的用户G11468G1863G2465G20316G6228G7427主要G2265G63362个方面的G11752G12362内容G726查询扩展G708TERMEXPANSIONG709以及权G1552G16855G6984G708TERMREWEIGHTINGG709。随着G6228G7427的进步,G11468G1863G2465G20316的G11752G12362内容G17892渐发生G1114G2476G2282。目G2081的G11468G1863G2465G20316G6228G7427主要可以划G2010为以G9913个方面的G11752G12362工作G726G3926何G14731得用户G2465G20316G1461G5699G708G2375G990文所提G2052的RDG709;G3926何G1363用用户G2465G20316G1461G5699G7481G6925进检索G13007G13491的G17148G18339G708G2375G3926何构G17908新的G6502G5219G12651法,RJIDDQRG709;G3926何评价用户G2465G20316G6228G7427。G3926何G14731得用户G2465G20316G1461G5699G731G3324传G13491G11468G1863G2465G20316G6228G7427G1025,主要是通G17819用户G7186式的G4557文G7735进行G11468G1863G5627G7643G16772G7481G14731得。要G8726用户G7186式的G11468G1863G2465G20316G1262导G14280用户不G3582G17139G14667,G17837G1075是传G13491的G11468G1863G2465G20316G6228G7427不能G5203G8879应用的最大G19492制。目G2081,有G16780多新的G2465G20316G14731得方法,G19556G2465G20316G708IMPLICITFEEDBACKG709和G1278G2465G20316G708PSEUDOFEEDBACKG709是其G1025最G12373出的G1016种G6228G7427。G19556G2465G20316G6228G7427是G6363G1186用户的行为G708例G3926点G1999、G8995G16284、G6183G2372G12573G12573G709NICHOLSANDDM1997CLAYPOOL,LEETAL2001HIJIKATA2004G1025,通G17819种种数据G6378G6508G6228G7427G7481发现用户G19556含的G1864G17271及G10245G3921,并将G17837G1135G19556含的G1461G5699作为G2465G20316G1461G5699G7481辅助检索。G1278G2465G20316G6228G7427KURLAND,LEEETAL2005是G6363将检索G13479G7536G1025的G14521G5190个文G7735G1563设为G256G11468G1863文G7735G257作为G2465G20316G1461G5699G7481辅助检索。G3926何G1363用用户G2465G20316G1461G5699G7481G6925进检索G13007G13491的G17148G18339G731根据所G1363用的G1461G5699检索模型的不同,可以将G4557G17837一问题的G11752G12362G2010成三个方G2533。G17837三个G1461G5699检索模型为G726G2533G18339空间模型、概率模型和G16833言模型。不论G1363用G2750一种G1461G5699检索模型,其G1025G5527G5617G5831G18129是G4625可能的将查询G17160G17829用户的检索G1864G17271G2375用户的G2465G20316G1461G5699。G3926何评价用户G2465G20316G6228G7427G731G17837G18336G9053及G2052评价所G1363用的数据G19610、评价G6363G7643、评测方式以及评测G10627G3671的构G5326。不同的评测G10627G3671G1262G5114G7481不同的评测G13479G7536。本小G14422的主要G17141G10498是G4557G11468G1863G2465G20316G20058G3507G5415G2081的G11752G12362进展,G1582G1114G1852面的介绍;同G7114将用户G2465G20316问题划G2010成3个G3534本的G6228G7427问题G708G3926何G14731得G2465G20316G1461G5699、G3926何G1363用G2465G20316G1461G5699以及G3926何评价G2465G20316G6228G7427G709;并G4557目G2081G178373个G3534本问题的G5132用G16311G1927方法以及G11752G12362进展进行G1114介绍。以G2081G1075G7378经有G17819一G1135G13520述G5627的工作,例G3926KELLYANDTEEVAN2003RUTHVENANDLALMAS2003BAEZAYATESANDRIBEIRONETO2004。G1306是其G1025BAEZAYATESANDRIBEIRONETO2004G2494是G4557G11468G1863G2465G20316G6228G7427G1582G1114很简G11065的G16840G7138;RUTHVENANDLALMAS2003的工作完成的G8616G17751G7101,G17963G9443G1114一G1135G18337要的G18108G2010G708G8616G3926G19556G2465G20316以及G16833言模型G709,而G17837G1016个G18108G2010G18129是目G2081G11752G12362工作G17751G19610G1025的方面。文G10498KELLYANDTEEVAN2003G2494是G4557G19556G2465G20316G1025的主要文章G1582G1114G16840G7138,主要内容是G1403G18337于介绍G3926何G2474得G2465G20316,G1863于A311A32A33A34A35G5627能评价以及G3926何G1363用G2465G20316G1461G5699以G6925进检索G13007G13491的G17148G18339并G8821有G1582出很G3921的G16840G7138。本文的以G991G18108G2010是G17837G7691组织的G726G12544121G14422G16840G7138G1114G3926何G14731得用户G2465G20316G1461G5699,介绍G1114G5415G2081主要的3种用户G2465G20316G1461G5699G2474得G6175G8585以及G4557应的典型G13007G13491及优缺点。G12544122G14422G16840G7138G1114G3926何G1363用用户G2465G20316G1461G5699G7481G6925进检索G13007G13491的G6502G5219G17148G18339,同G7114介绍G1114G33243种模型G991各种不同的G2465G20316G12651法。G12544123G14422G16840G7138G1114G3926何评价用户G2465G20316G6228G7427。121如何获得用户反馈信息G14731得用户G2465G20316G1461G5699主要有3种G6175G8585G726G7186式用户G2465G20316G708EXPLICITFEEDBACKG709;G19556式用户G2465G20316G708IMPLICITFEEDBACKG709以及G1278G2465G20316G708PSEUDOFEEDBACKG709。G7186式用户G2465G20316是一种经典的方法;G16780多G11752G12362人G2604G17836G3324G13783G15397G3926何G1186用户的交互行为G1025G19556式的发现G1461G5699作为用户G2465G20316,G1075G4613是G19556G2465G20316;G1278G2465G20316的G5617G5831是G1186G17832G3250G13479G7536G1025G17885G6333一G1135文G7735作为用户G2465G20316。显式用户反馈G7101G7411的用户G2465G20316G6228G7427主要是用于文本G1461G5699检索G20058G3507,G5415G7114主要是G18331用G7186式用户G2465G20316G7481G14731G2474用户的G2465G20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论