已阅读5页,还剩118页未读, 继续免费阅读
(计算机科学与技术专业论文)个性化推荐和搜索中若干关键问题的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
j , 工学博士学位论文 个性化推荐和搜索中若干 关键问题的研究 博士研究生:张磊 导师:陈俊亮 学位级别:工学博士 学科专业:计算机科学与技术 所在单位:网络与交换技术国家重点实验室( 北京邮电大学) 论文提交日期:2 0 0 9 年1 0 月2 6 日 学位授予单位:北京邮电大学 肿i i ii ii i i l li ii i i i i ii ii 17 6 0 4 9 5 ad i s s e r t a t i o nf o rt h ed e g r e eo fd o c t o ro f p h i l o s o p h y r e s e a r c ho nt h ek e yi s s u e so f p e r s o n a l i z e dr e c o m m e n d a t i o na n ds e a r c h c a n d i d a t e :z h a n gl e i a d v i s o r :c h e nj u n l i a n g a c a d e m i cd e g r e ea p p l i e df o r :d o c t o ro f p h i l o s o p h y m a j o r :c o m p u t e rs c i e n c ea n dt e c h n o l o g y d a t eo fs u b m i s s i o n :2 0 0 9 1 0 一2 6 u n i v e r s i t y :b e i j i n gu n i v o fp o s t sa n d t e l e c o m m u n i c a t i o n s 声明 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料羞有不实之处,本人承担一切关责任。 本人签名:撒盥 日期: a ! 笃。p ! 羔互一一 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研 究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学 校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段 保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文 注释:本学位论 本人签名: 导师签名: 用本授权书。 日期: 2 塑一o 丛 日期: 皇纽z 9 :垄 “?i : 一 1 弦j,譬咱 矗 北京邮电人学博 :学位论文摘要 摘要 针对用户自身在实际需求,偏好特点和行为方式等方面的不同,个性化信息服 务致力于满足用户个体的差异化信息需求。较传统的通用服务,个性化服务因为能 够更好地表征、迎合用户的个性化偏好而受到了普遍的认可,个性化的相关技术也 成为近年来一个新型的热门研究课题,受到了学术界和商业机构的广泛重视。本文 围绕个性化技术中最为核心的两项,个性化推荐和个性化搜索中的若干关键问题进 行研究、讨论,论文的主要工作包括以下内容: 1 研究、探讨了协同推荐问题,在遵循基本协同的基础上,我们希望探寻、 讨论新的有效推荐的研究思路。以此为基本出发点,本文提出了一种基于自低至高 两个层面的多个b p 神经网络进行项目评价预测的方法( t w o l e v e lm u l t i p l e n e u r a l n e t w o r k s b a s e dc o l l a b o r a t i v e f i l t e r i n g r e c o m m e n d a t i o n a l g o r i t h m ,简记为 t m n n c f g a ) 。两层面的多个b p 神经网络协同工作,高层面b p 网反向误差传播 直至低层面多a n n 进行网络权值修正,以此为基础借助用户评价等特征前向给 出项目推荐预测。美国评测集m o v i e l e n s 上的实验评测验证了t m n n c f r a 算法 的可行性和有效性。 2 协作过滤推荐算法具有“冷启动 问题。“冷启动”问题的根源在于评价信 息过于有限,推荐系统难以准确挖掘出用户偏好。本文提出了借助用户的模糊反馈 信息改善冷启动推荐性能的基本研究思路( 具体涉及2 个算法) 。对于项目推荐中棘 手的冷启动问题可以从用户模糊反馈信息挖掘的角度展丌研究,相对于完全地基于 有限的项目评价本身的相似度测量改进等传统方法,这是一个相对比较新的研究基 点,对于解决冷启动问题具有重要的意义。我们采用两个独立的算法研究、探讨了 模糊反馈数据对于冷启动推荐的意义。其中,算法1 采用后向传播的神经网络方法 直接就模糊反馈数据本身进行学习,从“相对优劣”中挖掘用户对项目属性等的兴 趣偏好;算法2 对数据进行基础性变换,巧妙地从原本不具有可比性的模糊反馈数 据和项目评价信息中抽取用户之间的相似度,以此为基础进行推荐预测。一般意义 上而言,协作分析范畴的算法2 较基于内容分析范畴的算法1 具有更好的性能水平, 初步验证了模糊反馈数据在冷启动阶段的积极意义。 3 w e b 信息的爆炸式增长极大地激发了用户对于个性化的领域搜索服务的需 求。 本文提出并研究、实现了个性化的垂直搜索算法( p e r s o n a z l i e dv e r t i c a ls e a r c h a l g o r i t h m ,简记为p v s a ) ,该算法以领域特征为出发点,借助领域主题偏好向量、 领域元数据权重因子、检索名词差异化策略等4 个策略有效挖掘、表征用户的领域 个性化偏好,以此为基础生成基于用户偏好的垂直搜索算法,p v s a 算法在个性化 的领域搜索问题上取得了良好的效果。 北京邮电人学博i :学位论文 摘要 4 自动化的服务组合、服务推荐等是语义w e b 研究的重点。不同于完全地 依赖本体进行服务推荐的思想,本文从统计学角度出发,提出了基于用户偏好的 服务推荐算法f p r e f e r e n c e b a s e ds e r v i c er e c o m m e n d a t i o na l g o r i t h m ,简记为 p s r a ) ,该算法首先基于w 曲服务语义进行无效后继服务过滤,然后基于职业 本体、语义距离等针对人口统计学要素进行相似度计算,接下来融合人口特征至 推荐评价,相对有效地给出综合人口统计学要素和评价信息的新的轻量的用户相 似度度量,最后基于综合人口统计学要素和评价信息等特征的用户相似度给出满 足用户个性化需求的后继推荐服务输出,p s r a 在个性化服务推荐问题上取得了良 好的效果。 关键词:b p 神经网络;用户相似度;冷启动推荐;个性化;协作过滤;模糊 反馈;推荐;最近邻居;人口统计学要素 北京邮i u 人学博i :学位论义 a bstr a c t p e r s o n a l i z e di n f o r m a t i o ns e r v i c e sa r ef o c u s i n go nt h ef u l f i l l m e n to ft h ep e r s o n a l i z e di n f o r m a t i o n d e m a n d so fd i f f e r e n tu s e r sb a s e do nt h e i rp r e f e r e n c ec h a r a c t e r i s t i c s ,b e h i v o rp a t t e r n s ,e t c c o m p a r i n g w i t ht h et r a d i t i o n a lo n e s ,p e r s o n a l i z e ds e r v i c e sc o u l de f f e c t i v e l yc a t e rt ou s e r s p e r s o n a li n t e r e s t sa n d c o r r e s p o n d i n g l y , t h e ya r ew i d e l ya c c e p t e da n db e c o m i n g m o r ea n dm o r ep o p u l a r l o t so fs c h o l a r sa n d c o m m e r c i a lo r g a n i z a t i o n sa r ep a y i n gt h e i ra t t e n t i o n st op e r s o n a l i z e ds e r v i c e sa n dm a n yd i s t i n g u i s h e d d e v e l o p m e n t sh a v eb e e na r c h i e v e di nt h ep a s ts e v e r a ly e a r s i no u rp a p e r , w ep r e s e n to u rr e s e a r c ha n d d i s c u s s i o no nt w oi m p o r t a n tt e c h n i q u e s ,t h ep e r s o n a l i z e dr e c o m m e n d a t i o na n dp e r s o n a l i z e ds e a r c h t e c h n i q u e s t h em a i nc o n t r i b u t i o n sa r ea sf o l l o w s : 1 f o c u s i n go nt h ec o l l a b o r a t i v ef d t e r i n gp r o c e s s ,w ep e r f o r me x p l o r a t i o na n dd i s c u s s i o nf o rt h e n e wr e c o m m e n d a t i o ns t r a t e g y w ep r e s e n to n en o v e lm e t h o d ( t w o - l e v e lm u l t i p l en e u r a l n e t w o r k s b a s e dc o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o na l g o r i t h m ,t m n n c f r a ) f o rr a t i n g p r e d i c t i o ni nt h i sp a p e r m u l t i p l eb pn e t w o r k sc o o p e r a t i n gt o g e t h e r , t h eh i g h e rl a y e rn e u r a ln e t w o r k s p r o p a g a t e sc o n v e r s e l yt h eo u t p u td e v i a t i o nu n t i lt ot h el o w e rl a y e rn e u r a ln e t w o r k st om o d i f yt h e n e t w o r kw e i g h t s ,a n db a s e do nw h i c h ,i t e mr e c o m m e n d a t i o np r e d i c t i o ni sa c c o m p l i s h e db yt h e f o r w a r dp r o c e s sr e l y i n go nt h ef a c t o r ss u c ha sr a t i n g s ,e t c e x p e r i m e n tr e s u l t so nm o v i e l e n sd a t a s e t s h o wt h a tt i v i n n c f r am e t h o di se f f e c t i v ea n df e a s i b l ef o ri t e mr e c o m m e n d a t i o n 2 c o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o nh a sc o l d - s t a r tp r o b l e m t h er o o to ft h ep r o b l e ml i e s i nt h a tt h er a t i n g sa v a i l a b l ea l et o ol i m i t e d ,a n dr e c o m m e n d a t i o ns y s t e mc a nn o te f f e c t i v e l ym i n eu s e r s p r e f e r e n c e sw i t hs os c a r c ed a t a i n o u rp a p e r , w ep r e s e n tt h eb a s i cb u tn o v e li d e at oa l l e v i a t et h e c o l d - s t a r tp r o b l e mb yt a k i n ga d v a n t a g eo ft h em i n i n go fi m p l i c i tf e e d b a c kd a t a ( t w os t r a t e g i e sr e f e r r e d ) r e l a t i v et ot h et r a d i t i o n a lc o l d - s t a r ti m p r o v e m e n tm e t h o d sf o c u s i n gc o m p l e t e l yo nt h es p a r s ed a t a , o u r i d e ah a si t ss i g n i f i c a n c e i tp r e s e n t sa ne f f e c t i v ep e r s p e c t i v et oa l l e v i a t ec o l d s t a r tp r o b l e m - - f u l l y m i n i n gb yu s i n gc o r r e s p o n d i n ga l g o r i t h m sr a t h e rt h a no m i t t i n g t h ev a l u a b l ei m p l i c i tf e e d b a c kd a t al i k e t h et r a d i t i o n a lm e t h o d s w ep r e s e n tt w oi n d e p e n d e n ts t r a t e g i e st oe x p l o i tt h es i g n i f i c a n c eo fm a k i n g u s eo fu s e r s i m p l i c i tf e e d b a c kf o rc o l d s t a r tp r o b l e m i nt h ef i r s ts t r a t e g y , w eu s eb pn e u r a ln e t w o r kt o l e a r nt h ef e e d b a c kd a t ai t s e l f , b yw h i c ht om i n eu s e r s p r e f e n c e st o w a r d st h ef a c t o r ss u c ha si t e ms l o t , e t c ,f r o mt h e “r e l a t i v es u p e r i o r i t yo ri n f e r i o r i t y ”i nt h es e c o n ds t r a t e g y , w em a k et h eb a s i cb u t 北京邮i u 人学博i j 学位论文 a b s t r a c t e f f e c t i v et r a n s f o r m a t i o nf o rt h ea v a i l a b l ed a t a ,a n db yw h i c h ,t h es i m i l a r i t yi n f o r m a t i o nw i l lb e s k i l l f u l l ya b s t r a c t e df r o mt h ei m p l i c i tf e e d b a c ka n di t e mr a t i n g sw h i c ha r eo fn oc o m p a r a b i l i t y o r i g i n a l l y i nm o s tc a s e s ,t h es e c o n ds t r a t e g yb e l o n g i n gt oc o l l a b o r a t i v ef i l t e r i n gc a t e g o r yw i l lb em o r e e f f e c t i v ef o ri t e mr e c o m m e n d a t i o nt h a nt h ef i r s to n ew h i c hb e l o n g st ot h ec o n t e n t b a s e da n a l y s i s c a t e g o r ya n dt h es i g n i f i c a n c eo fu s e r s i m p l i c i tf e e d b a c kf o rc o l d s t a r tr e c o m m e n d a t i o nh a sb e e n p r e l i m i n a r yd e m o n s t r a t e di no u re x p e r i m e n t s 3 t h er a p i de x p a n s i o no fw e bi n f o r m a t i o ng r e a t l ys t i m u l a t e st h ed e m a n d sf o rp e r s o n a l i z e d d o m a i ns e a r c hs e r v i c e s i no u rp a p e r , w ep r e s e n tt h ep e r s o n a l i z e dv e r t i c a ls e a r c ha l g o r i t h m0 v s a ) b a s e do nd o m a i nc h a r a c t e r i s t i c s ,p v s ar e l i e so nf o u rs t r a t e g i e si n c l u d i n gd o m a i nt o p i cp r e f e r e n c e v e c t o r , d o m a i nm e t a d a t aw e i g h tf a c t o r sa n dd i s t i n g u i s h i n gd i f f e r e n tw e i g h t so fi n p u tt e r m s ,e t c ,t o m i n ea n dp r e s e n td i f f e r e n td o m a i np r e f e r e n c e so fd i f f e r e n tu s e r s c o n s e q u e n t l y , p e r s o n a l i z e ds e a r c h o u t p u t sa r eo b t a i n e d e x p e r i m e n t a lr e s u l t ss h o wt h a to u ra l g o r i t h mh o l d st h ep r o m i s eo fe f f e c t i v e l y p m v i d e r i n gt h ep e r s o n a l i z e ds e a r c hc a p a c i t yf o rd i f f e r e n tu s e r s 4 a u t o m a t e ds e r v i c ec o m p o s i t i o na n ds e r v i c er e c o m m e n d a t i o na r ee s s e n t i a lf o rs e m a n t i cw e b r e s e a r c h n o tt h es a m ea st h ec o m p l e t e l yo n t o l o g y d e p e n d e n ti d e af o rs e r v i c er e c o m m e n d a t i o n ,i no u r p a p e r , w ep r e s e n tp r e f e r e n c e b a s e ds e r v i c er e c o m m e n d a t i o na l g o r i t h m ( p s r a ) m a i n l yf r o ms t a t i s t i c s p e r s p e c t i v e f i r s t l y , p s r af i l t e r so u tt h ei n e f f e c t i v es u c c e e d i n gs e r v i c e sb a s e do ns e r v i c es e m a n t i c s , a n dt h e np e r f o r m st h ed e m o g r a p h i cs i m i l a r i t yc a l c u l a t i o nb a s e do nt h es t r a t e g i e ss u c ha so c c u p a t i o n o n t o l o g y , s e m a n t i c sd i s t a n c e ,e t c i nt h ef o l l o w i n g , b yi n t e g r a t i n gd e m o g r a p h i cf a c t o r sw i t h r e c o m m e n d a t i o n r a t i n g s ,p s r ae f f e c t i v e l yp e r s e n t s t h en e wa n d l i g h t - w e i g h t e ds i m i l a r i t y m e a s u r e m e n t l a s t l y , b a s e do nt h er e d e f i n e ds i m i l a r i t e sb e t w e e nu s e r sa n df o r t h es a m ec u r r e n ts e r v i c e , p s r ap r e s e n t sd i f f e r e n ts u c c e e d i n gr e c o m m e n d e ds e r v i c e st od i f f e r e n tu s e r st om e e tt h e i r p e r s o n a l i z e dn e e d s e x p e r i m e n t a lr e s u l t ss h o wt h a to u ra l g o r i t h mi sf e a s i b l ea n de f f e c t i v e k e y w o r d s :b p n e u r a l n e t w o r k s ;u s e r s s i m i l a r i t i e s ;c o l d s t a r tr e c o m m e n d a t i o n ; p e r s o n a l i z a t i o n ;c o l l a b o r a t i v ef i l t e r i n g ;i m p l i c i tf e e d b a c k ;r e c o m m e n d a t i o n ;n e a r e s tn e i g h b o r s ; d e m o g r a p h i c f a c t o r s lj 目录 第1 章绪论1 1 1 研究背景和意义1 1 2 主要研究ji :作1 1 3 论文的主要贡献3 1 4 论文内容和结构4 第2 章个性化推荐和搜索技术综述7 2 1 引言7 2 1 1 个性化服务的发展历程7 2 1 2 个性化服务的意义与典型系统8 2 2 个性化推荐和搜索相关技术综述1 0 2 2 1 个性化服务中的基本技术1 0 2 2 2 协作过滤推荐技术13 2 2 3 基于内容的推荐技术和混合推荐技术1 6 2 2 4 个性化推荐近期研究进展和个性化搜索概述。1 8 2 3 本章参考文献2 2 第3 章基于b a c k - p r o p 神经网络的协同推荐算法2 7 3 1 引言2 7 3 1 1 背景及相关t 作2 7 3 1 2 本文研究的基本思路。2 8 3 2 人工神经网络基础2 9 3 2 1 人工神经网络( a n n ) 的基本j :作机制2 9 3 2 2 d e l t a 法则和典型网络概要3 0 3 3 基于b p 神经网络的协作过滤推荐算法3 l 3 3 1 t m n n - c f r a 算法概述3l 3 3 2 特征相似度提取3 2 3 3 3 基丁b p 神经网络的协作过滤推荐算法3 3 3 4 试验评测。3 6 3 4 1 数据集3 6 3 4 2 评测指标与试验过程( s e t u p ) 3 6 3 4 3 试验结果。3 7 3 5本章总结4 2 3 6 本章参考文献。4 3 第4 章基于模糊反馈改善冷启动推荐性能4 5 4 1 ;i 言4 5 4 1 1 背景及相关t 作。4 5 4 1 1 1 何为冷启动问题4 5 4 1 1 2 针对冷启动问题的当前研究。4 6 4 1 2 本章研究的基本思路和意义。4 6 4 2 基于后向传播的神经网络学习刚户偏好4 7 4 2 1 川户模糊反馈的形式化描述。4 7 4 2 2 预备知识和用户喜好模型4 8 4 2 3 基丁斤向传播的神经网络从模糊反馈中学习川户的兴趣偏女r 一5 0 4 3 基于最近邻居学习川户的模糊反馈5 2 4 3 1针对模糊反馈的基本思考5 2 4 3 2 基于最近邻居学习用户的模糊反馈。5 :3 4 4 试验评估5 5 4 4 1 数据集5 5 4 4 2 评测指标和试验过程。5 5 4 4 3 实验结果5 6 4 5 冷启动推荐总结及进一步的思考。5 8 4 6 不同阶段的推荐问题综合5 9 4 7 本章参考文献6 2 第5 章个性化的领域搜索6 5 5 1 引言6 5 5 1 1 背景及相关j :作介绍。6 5 5 1 2 p v s a 算法概述和全文结构6 6 5 2 p v s a 构建个性化域搜索的四个基本策略6 6 5 2 1 基丁领域主题喜好( 向量) 的网页著异化策略6 7 5 2 2 基于领域元数据提升域需求同检索输出关联度。6 9 5 2 3基丁用户偏好的检索名词著异化策略。7 0 5 2 4 词典库更新策略7 4 5 3 个性化的领域搜索算法7 5 5 3 1 p v s a 算法描述7 5 5 3 2 p v s a 系统的基本工作流程7 5 5 4 试验评测7 7 5 4 1 实验平台搭建。7 7 5 4 2 实验过程与实验结果一7 8 5 5本章总结8 1 5 6 本章参考文献。8 l 第6 章基于用户偏好的服务推荐8 3 6 1 j ;l 言8 3 6 1 1 背景及1 :作介绍8 3 6 1 2 p s r a 算法的典型l = 作场景8 4 6 2 基于用户偏好的服务推荐的一般思考。8 5 6 2 1 基于川户偏好的服务推荐的内涵8 5 6 2 2 针对基丁用户偏好的服务推荐的一般考虑8 5 6 3 基丁用户偏好的的服务推荐算法p s r a 8 7 6 3 1 p s r a 算法的基本框架8 7 6 3 2 基于用户偏好的服务推荐算法。8 8 6 3 2 1 服务推荐候选生成。8 8 6 3 2 2 基于人口统计学要素的相似度测量。9 0 6 3 2 3 融合人口特征和评价信息的( 后继) 服务推荐9 l 6 4试验评测9 3 6 4 1评测指标与数据基本划分9 3 6 4 2 实验过科与实验结果。9 4 6 5推荐问题的进一步研究基于上- 卜文的资源推荐策略。9 7 6 6本章总结1 0 0 6 7 本章参考文献。1 0 0 第7 章结束语1 0 2 7 1论文总结和创新点1 0 2 7 2迸一步的研究和展望1 0 3 7 3本章参考文献1 0 5 攻读博士学位期间的主要论文1 0 6 致谢1 0 7 北京邮l 【1 人学溥i :学位论义第1 章绪论 1 1研究背景和意义 第1 章绪论 通用信息服务( 非个性化的信息服务) 为所有的用户提供一致的,无差化的服务 输出,一定程度上满足了用户的服务需求,但不具备个性化能力。不同自然人在自 身实际需要,偏好特点和行为方式等方面的不同,催发了社会对个性化信息服务的 需求,个性化信息服务是w e b 发展的必然结果。较传统的通用服务而言,个性化服 务因为能够更好地表征、迎合用户的个性化偏好而受到了普遍的认可。巨大的社会 需求面前,个性化的相关技术成为近几年来的一个新型的热门研究课题,受到了学 术界和商业机构的广泛重视。9 5 年至今的十几年时间罩,国际人工智能,w w 、m k d d 等顶级国际会议以及a c m ,i e e e 下的著名期刊连续发表了多篇个性化信息服 务原型系统的论文,推动了个性化服务技术的理论热潮和高速发展。g o o s en e w s 个性化( h t t p :n e w s g o o s e c o m 0 ,美国的n e t f l i x 个性化海量电影推荐网站 ( h t t p :w w w n e t f l i x c o m ) 作为个性化技术的应用典范,获得了巨大的商业成功。就当前 的个性化技术而言,个性化推荐是最为成熟而且被广泛应用的个性化技术,仅次于 其后的是个性化搜索。个性化推荐和搜索作为个性化服务中紧密关联而又最为核心 的两项技术,能够极大程度上地满足不同用户的差异化信息需求,具有广泛的应用 前景。 具体而言,在海量的w e b 信息面前,个性化推荐技术深度挖掘用户的个性化 偏好,采取主动式的信息“推送”方式,自动化地提供满足个性化需求的信息给用 户,而不是需要用户自己从海量的w e b 信息中寻找自己感兴趣的内容,极大地提 高了用户有效信息获取的效率。个性化搜索技术主要是相对通用非个性化搜索而言 的,个性化的搜索从用户的访问日志中挖掘用户偏好,针对相同的查询输入,针对 不同的用户提供满足个性化偏好的差异化检索输出,而不是提供统一的完全相同的 检索结果,从而更好的满足了用户的个性化需求。个性化推荐和搜索技术的意义和 实用价值是不难理解的,当前学术界的问题是如何更为有效地进行用户偏好的挖掘 和表征等,从而更为可靠地进行个性化的推荐和信息检索,本文的研究工作j 下是在 上述背景和需求下进行的有意义的尝试。 1 2主要研究工作 本文作者在博士研究生期间,主要从事垂直搜索引擎、数字音像内容互联与交 换系统,个性化推荐和搜索技术的研究和丌发工作,参加的相关课题包括: 北京邮i 乜人学博1 :学位论文 第1 章绪论 “1 1 4 领域化搜索引擎( 北京市教委产学研项目,项目编号:n o z h l 0 0 1 3 0 5 2 5 ) ; “智能移动业务平台的基础性研究”( 国家自然科学基金重大项目,项目编号:n o 6 0 4 3 2 0 1 0 ) “数字音像内容集成分发平台”( 国家十一五科技支撑重大计划项目,项目编 号:n o 2 0 0 6 b a h 0 2 a 1 1 ) 本论文是在这些项目的支持下完成的。概括起来,作者在攻读博士学位期间的 研发工作主要包括以下几个方面: 1 1 1 4 领域化搜索引擎 研究了垂直搜索技术和个性化技术的相关原理,重点研究并引入个性化能力至 领域化的搜索引擎1 1 4 g o o g l e ,使1 1 4 g o o g l e 能够提供“因人而异”地提供个性化 的信息检索能力以领域特征为基本出发点,1 1 4 g o o g l e 采用基于域词典的具有领 域特色的中文分词算法、用户的个性化偏好挖掘算法以及引擎的自动化跨领域扩展 技术来高效( 1 1 4 g o o g l e 以电信级应用为主应用场景) 、有效地满足用户的个性化的 领域搜索需求。 2 智能移动业务平台的基础性研究 智能移动业务平台的基础性研究的研究内容是提供一个丌放的、智能化的业务 ( 服务) 创建平台,具体涉及智能业务提供研究、服务个性化( 推荐) 研究、上下文感 知技术研究等几大方面。该项目将呼叫中心的话务员引入到业务组合过程中,利用 话务员直接与用户的交互,话务员可以辅助用户将需求转化为对系统的操作。在平 台研究的中后期以及接下来的延续性基础研究中,作者重点研究了个性化的服务推 荐策略,该策略能够根据采集到的用户的兴趣偏好自动地针对用户的当前服务给出 个性化的一步服务推荐,并根据用户反馈“完善服务推荐,极大地提高了用户的 服务满意度。 3 研究了数字音像内容集成分发平台的相关原理,研究并实现了数字音像内 容互联与交换系统。该平台是面向多家运营商、内容提供商、终端制造商以及消费 者的标准化综合平台,基于i p 网络完成数字音像内容的发布、发现、交易、传播 的全过程。作者作为互联与交换系统的项目组组长,参与了该项目的前期调研、需 求分析、设计、代码实现及测试的全过程,具体负责数字音像内容的发布、发现、 等的研究与实现工作,其中,作者重点研究并引入了个性化的资源推荐算法,基于 用户的个性化兴趣偏好进行资源推荐,高效、有效地加速用户针对有效资源的发现 过程。 4 对个性化技术中最为核心的个性化推荐以及个性化搜索进行了较为全面和 深入的研究。以项目推荐为基本出发点,在项目评价信息相对“足够”的情况下, 2 北京邮电人学博t - 学位论文第l 章绪论 从机器学习的角度提出了基于b p 神经网络的协作过滤推荐算法,针对传统协作过 滤方法存在的冷启动问题( 项目评价信息非常稀少) ,提出了借助用户的模糊反馈信 息改善冷启动推荐性能的基本研究思路( 涉及2 个算法) ;引入基于用户偏好的个性 化能力至服务推荐和垂直搜索领域,分别提出了基于用户偏好的服务推荐和个性化 的垂直( 领域) 搜索算法( 在1 ,2 中已提及) 。 限于篇幅和内容的一致性,本文主要给出作者针对个性化推荐和搜索中若干问 题的研究成果,其他研发工作根据论文主题需要亦有相关介绍或者没有涉及。 1 3论文的主要贡献 1 围绕协作推荐问题展丌,我们希望在遵循基本的协同的基础上,探讨新的 有效推荐的研究思路。以此为基本出发点,本文提出了一种基于自低至高两个层面 的多个b p 神经网络进行项目评价预测的方法( t w o l e v e lm u l t i p l e n e u r a l n e t w o r k s b a s e dc o l l a b o r a t i v e f i l t e r i n g r e c o m m e n d a t i o n a l g o r i t h m ,简记为 t m n n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026国网福建省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题及答案详解(夺冠)
- 2026国网福建省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题及答案详解(名师系列)
- 2025国网湖南省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题附答案详解(精练)
- 2026国家管网集团甘肃公司秋季高校毕业生招聘25人笔试参考题库(浓缩500题)带答案详解(完整版)
- 2026国网吉林省电力公司高校毕业生提前批招聘笔试模拟试题浓缩500题(含答案详解)
- 2026秋季国家管网集团福建公司高校毕业生招聘笔试备考试题(浓缩500题)附参考答案详解(基础题)
- 2026国网青海省电力公司高校毕业生提前批招聘(约450人)笔试备考题库浓缩500题及一套答案详解
- 2026秋季国家管网集团云南公司高校毕业生招聘笔试参考题库(浓缩500题)附答案详解(综合题)
- 2026国网甘肃省电力公司高校毕业生提前批招聘笔试模拟试题浓缩500题含答案详解(夺分金卷)
- 2026国网湖南省电力公司高校毕业生提前批招聘(约450人)笔试备考题库浓缩500题及答案详解1套
- 2025新外研社版七年级上英语单词汉译英默写表(开学版)
- 消化内科出科题目及答案
- 第7章广泛应用的酸碱盐(上)-2021学年九年级化学下册必背知识手册(沪教版)(默写卡)
- 南通市交通运输局及所属事业单位招聘政府购买服务岗位人员笔试备考题库及答案详解1套
- 中药泡脚课件
- 2025年铅酸蓄电池行业研究报告及未来发展趋势预测
- 工伤预防培训试题(附答案)
- 2025年消防中控员理论考试题库
- 过渡金属催化机理-洞察及研究
- 南航国际创新港一期配套市政道路建设工程环境影响评价报告表
- DB37-T4894-2025植物耐盐性田间鉴定设施建设技术规程
评论
0/150
提交评论