




已阅读5页,还剩57页未读, 继续免费阅读
(计算机应用技术专业论文)社区个性化资讯服务研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江人学硕l :学位论文 摘要 摘要 社区在我国社会发展和建设中起着重要的作用,社区和谐是社会和谐的基 础,为社区居民提供高质量、多样化的服务是促进社区繁荣稳定、提高人们生活 质量的重要手段。社区建设一直是国家关注的重点,国家信息化发展战略中把社 区信息化建设列为未来社区建设的重点,提出整合各类信息系统和资源,构建统 一的社区信息平台,改善社区服务;开展缩小数字鸿沟计划,逐步在行政村和城 镇社区设立免费或低价接入互联网的公共服务场所,提供电子政务、教育培训、 医疗保健、养老救治等方面的信息服务。 随着互联网技术和社会的发展,我们已处于信息的时代,信息资讯已成为现 代人生活中不可缺少的部分,生活在社区中的人群如何方便地获取电子政务、教 育培训、医疗保健、养老救治等社区服务资讯以及互联网资讯成为社区服务的重 要工作。 本文在分析了社区信息化和个性化技术基础上,提出和研究社区个性化资讯 服务,为社区广大居民特别是老年人、残疾人等不会上网、信息来源少的人群设 计和提供个性化资讯推荐服务,整合现有社区服务信息资源和互联网资讯资源, 将社区、网络资讯根据用户个性化特点推送给用户。本文从资讯服务内容和服务 方式两方面分析了社区个性化资讯服务的特点,并根据这种特点,提出基于家庭 信息终端的社区用户个性化建模方法。个性化服务中,推荐方法是其中的关键, 根据社区用户个性化模型,本文将用户、资讯分类信息和基于项目的协同过滤结 合起来,解决推荐过程中的冷启动问题,通过实验表明本文方法的有效性和准确 性。根据本文提出的用户建模和个性化推荐方法,从总体架构、家庭信息终端模 块、资讯收集模块、核心推荐模块等方面对社区个性化资讯服务系统进行设计。 关键词:个性化,用户建模,社区服务,资讯推荐 浙江大学硕i 二学位论文 a b s t r a c t a b s t r a c t c o m m u n i t yp l a y sa ni m p o r t a n tr o l ei ns o c i a ld e v e l o p m e n t p r o v i d i n gh i g hq u a l i t y a n dd i v e r s i t ys e r v i c ef o rc o m m u n i t yr e s i d e n t si ss i g n i f i c a n tw a yt oi m p r o v ep e o p l e s l i f e q u a l i t y s t a t e i n f o r m a t i o nd e v e l o p m e n ts t r a t e g yp u t sc o m m u n i t yi n f o r m a t i o n c o n s t r u c t i o no nf i r s tp l a c eo fc o m m u n i t yc o n s t r u c t i o ni nf u t u r e i te m p h a s i z e so n i n t e g r a t i n ga l lk i n d so fi n f o r m a t i o ns y s t e ma n dr e s o u r c e s ,b u i l d i n gu n i f o r mc o m m u n i t y s e r v i c ep l a t f o r m ,i m p r o v i n gc o m m u n i t ys e r v i c e ,a n dg r a d u a l l yp r o v i d i n gf r e ei n t e m e t a c c e s si np u b l i cp l a c et oo f f e re l e c t r o n i cg o v e r n m e n t ,e d u c a t i o nt r a i n i n g ,m e d i c a lc a r e s e r v i c ea n ds oo n w i t ht h ei n t e r n e tt e c h n o l o g ya n ds o c i e t ym o v i n go n ,n e w sa n di n f o r m a t i o n b e c o m ep a r to fo u rl i f e e a s ya n dc o n v e n i e n tt oa c c e s sc o m m u n i t ys e r v i c ei n f o r m a t i o n a n di n t e m e ti n f o r m a t i o nf o rc o m m u n i t yr e s i d e n t ss h o u l db ec o n c e m e d t h i s p a p e r s t a n d so na n a l y z i n gc o m m u n i t yi n f o r m a t i o n s e r v i c ea n d p e r s o n a l i z a t i o nt e c h n o l o g y , p u tf o r w a r da n dr e s e a r c ho ni n f o r m a t i o np e r s o n a l i z a t i o n s e r v i c ef o rc o m m u n i t y t h es e r v i c ei n t e g r a t e sc u r r e n tc o m m u n i t ys e r v i c er e s o u r c ea n d i n t e m e ti n f o r m a t i o n ,p u s ht h e mt o c o m m u n i t yr e s i d e n t se s p e c i a l l y e l d e r sa n d h a n d i c a p p e dw h o h a v el i t t l ei n f o r m a t i o ns o u r c ea c c o r d i n gt ot h e i rp e r s o n a lp r e f e r e n c e t h i sp a p e ra n a l y z e st h ec h a r a c t e r i s t i co fi n f o r m a t i o np e r s o n a l i z a t i o ns e r v i c ef o r c o m m u n i t yf r o ms e r v i c ec o n t e n ta n ds e r v i c ep a t t e r n a c c o r d i n gt ot h i sc h a r a c t e r i s t i c , p u t f o r w a r dc o m m u n i t yr e s i d e n t p e r s o n a lm o d e l i n gm e t h o d b a s e do nh o m e i n f o r m a t i o nc l i e n t r e c o m m e n d a t i o nm e t h o di st h ek e yi np e r s o n a l i z a t i o ns e r v i c e , a c c o r d i n gt ot h e u s e rm o d e l ,c o m b i n i n gu s e ri n f o r m a t i o ng r o u pa n di t e mb a s e d c o l l a b o r a t i v ef i l t e r i n g ,s o l v i n ga n da n a l y z ec o l ds t a r tp r o b l e mi nr e c o m m e n d a t i o n p r o c e s s b a s e do nu s e rm o d e l i n ga n dp e r s o n a l i z a t i o nr e c o m m e n d a t i o nm e t h o d ,w e d e s i g nt h ei n f o r m a t i o np e r s o n a l i z a t i o ns e r v i c es y s t e m ,i n c l u d i n ga r c h i t e c t u r e ,h o m e i n f o r m a t i o nc l i e n t ,i n f o r m a t i o nc o l l e c t i o n ,k e r n e lr e c o m m e n d a t i o nm e t h o d k e y w o r d s :p e r s o n a l i z a t i o n ,u s e rm o d e l i n g ,c o m m u n i t ys e r v i c e ,i n f o r m a t i o n r e c o m m e n d a t i o n 浙江大学硕一l :学位论文 图目录 图目录 图1 1 城乡居民不上网原因对比2 图1 2 城乡不上网居民主要信息渠道对比3 图13 北京市社区公共服务信息网7 图3 1g o o g l e 资讯推荐2 5 图3 2 上海社区网2 6 图3 3 家庭信息终端访问资讯2 7 图3 4 用户兴趣显性选择2 9 图3 5 基于用户r a tin g 的s p o t b a c k 资讯推荐3 0 图4 1m a e 随项目邻居数的变化3 9 图4 2m a e 随相似度线性组合参数t 的变化4 0 图4 3 用户实际评分与预测值比较4 0 图4 4m a e 随用户邻居数的变化4 1 图5 1 系统服务流程4 3 图5 2 推荐系统技术框架流程4 4 图5 3 家庭信息终端体系结构4 5 图5 4 终端与服务器交互一4 6 图5 5 家庭信息终端服务功能4 6 图5 6 资讯收集4 7 图5 7 核心推荐模块4 9 浙江大学硕上学位论义 表目录 表目录 弱靳拍 一 一 一 一 一 : 一 一 一 一 阵阵 巨 巨 矩矩 分阵分阵 评矩评矩 户别户别用类用类讯讯讯户资资资用 l 2 3 4 t t 禾今 表表表表 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成 果,也不包含为获得逝婆盘鲎或其他教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:夏嘶脚 签字日期:瑚年月眵日 学位论文版权使用授权书 本学位论文作者完全了解逝婆盘鲎有权保留并向国家有关部门或机构送交本 论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘鲎可以将学位论文的 全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段 保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:关升撕 导师签名: 互绣 签字日期:沙弼年月妒日 签字日期:加年舌月占日 浙江大学硕上学位论文第l 章绪论 1 1 课题背景 第1 章绪论 随着我国社区信息化建设的不断发展和完善,信息化社区服务,如社区信息 化医疗、数字社区等逐渐走入人们的生活当中。2 0 0 6 年国务院发布的2 0 0 6 - - 2 0 2 0 年国家信息化发展战略中提出推进社区信息化,整合各类信息系统和资源,构 建统一的社区信息平台,改善社区服务;开展缩小数字鸿沟计划,逐步在行政村 和城镇社区设立免费或低价接入互联网的公共服务场所,提供电子政务、教育培 训、医疗保健、养老救治等方面的信息服务。 结合国家社区信息化发展战略和人们的信息需求,社区个性化资讯服务针对 社区人群提供信息资讯个性化服务,通过整合互联网、社区服务有关的信息资讯, 以个性化推荐的方式根据社区用户的兴趣爱好,将有用的信息资讯通过网络推送 给他们。 社区是我国社会建设中的一个重要机构,对人民生活和促进社会稳定和谐有 重要作用。2 0 0 7 年8 月2 3 日,中共中央政治局委员、国务院副总理回良玉同志 对李学举部长在全国社区建设工作会议上的讲话建设和谐社区,为构建和 谐社会奠定基础做出重要批示:建设和谐社区是件大事,是构建和谐社会的基 础。近年来,社区建设蓬勃发展,管理体制、运行机制、服务体系不断完善,成 效十分显著。随着市场经济的发展和工业化、城镇化进程的加快,越来越多的“单 位人 转变为“社会人”,社区在经济社会发展中的地位越来越重要,作用越来 越突出,承担的任务也日益繁重。我们要不断适应新形势的要求,紧紧围绕构建 社会主义和谐社会这个主题,坚持以人为本,合力推进,努力建设居民自治、管 理有序、服务完善、治安良好、环境优美、文明祥和的社区,使之在提高居民生 活水平和质量上发挥服务作用,在密切党和政府同人民群众的关系上发挥桥梁作 用,在维护社会稳定和创造安居乐业的良好环境上发挥促进作用。要积极探索建 设和谐社区的规律,在内容、形式、方法、手段、机制等方面努力改进和创新, 1 浙江大学硕士学位论文第1 章绪论 扎扎实实地把建设和谐社区工作推向前进。 社区的信息化是社区发展的重点,是社区服务水平的重要体现。社区的信息 化有利与满足社区人群对信息资讯的需求,二十一世纪是个信息爆炸的时代,互 联网、通信技术、计算机软硬件等的发展,使得信息发布和传播越来越快,范围 越来越广,信息对人们日常生活、工作、学习的重要性不言而喻。与传统媒体如 报纸、电视、广播比较,互联网在信息传播上有着不可比拟的优势,一方面它的 信息资源无比丰富且传播速度快,另一方面信息可以根据人们的需求被检索到。 但是社区人群中很大一部分如老年人、残疾人、农民等,却无法或很难享受到互 联网带来的便利,主要原因包括没有接入互联网的设备;不会使用电脑上网;互 联网上信息太多,很难找到自己想要的等。这样,他们获取信息资讯主要通过报 纸、电视、收音机、聊天等,信息量很少,而且对于自己喜好的信息很难获取, 没法像在互联网上检索一样方便地找到自己感兴趣的信息资讯。 觉得上网没用不需要 年龄太p t 太 j 、 上网费用贵 家长老师不允许上网 没时间上网 担心受到伤害或不好的影晌 不感兴趣 不懂电脑网络 没上网设备 o 5 1 0 1 5 2 0 2 5 3 0 3 5 4 0 薯4 5 匦塑圃 数据来源:中国互联同络信息中心c c 照i c ) 图1 1 城乡居民不七网原冈对比 2 浙江大学硕士学位论义第】章绪论 电视报纸 书籍广播手机杂志 数据来源:中国互联网络信息中心( c h - f l i c ) 图1 2 城乡不上网居民主要信息渠道对比 根据中国互联网络信息中心( c n n i c ) 提供的“2 0 0 7 年中国农村互联网调查 报告”【l 】显示,城乡居民对网络服务的需求占5 0 以上,不上网的主要原因是不 懂电脑、网络和没有上网设备。随着经济的发展和国家的投入,居民的上网率会 逐渐提高。报告同时显示,在不上网的情况下,城乡非网民获取信息的渠道主要 是电视和报纸,居民个性化的信息需求没法得到满足。 目前很多地方的社区服务部门都在互联网上建立社区服务网站,提供信息资 讯服务,如社区新闻、社区活动预告、公共服务信息等。还有些专门针对社区人 群开展服务的网站,如婚姻网、慈善网、老龄网、儿童网、社区生活服务网等, 但这些网站信息和服务所能覆盖到的人群有限,很多社区内的老年人、残疾人、 儿童很少或没法使用这些服务。 综上所述,社区人群在信息资讯获取上面存在两个问题: 1 没有上网设备,不会用电脑、网络 2 没有适合社区弱势群体( 老年人、残疾人、儿童等) 使用的个性化资讯 服务 对于第一个问题,本文提出一种家庭信息终端,辅助不会使用电脑和上网人 群接收个性化资讯,并分析基于家庭信息终端的用户建模;对于第二个问题,本 文对社区个性化资讯服务进行研究,并提出协同过滤和基于内容的过滤结合的一 9 o o o 0 0 0 o 0 0 9 8 7 6 5 4 3 2 1 浙江大学硕士学位论文 第1 章绪论 种方法,对个性化推荐过程中的冷启动问题进行了分析和实验。 1 2 社区概念及信息化服务 1 2 1 社区概念 社会学中“社区”这个词最早是德国社会学家腾尼斯在1 8 8 7 年出版的社 区与社会一书中提出【2 】,他认为“社区”主要存在于传统的乡村社会中,它是 人与人之间关系密切、守望相助、富有人情味的社会团体。连接人们的是具有共 同利益的血缘、感情和伦理团结纽带,人们基于情感动机形成了亲密无间、相互 信任的关系。他并没有明确提出社区的地域性特征,他更多地是强调人与人之间 所形成的亲密关系和对社区强烈的归属感与认同感。因此,在滕尼斯的视野中, 社区的涵义十分广泛,社区不仅包括地域共同体,还包括血缘共同体和精神共同 体,人与人之间形成的共同的文化意识以及亲密无问的关系是社区的精髓。 “社区 一词是在2 0 世纪3 0 年代经美国“转口 引进中国的,费孝通等燕 京大学社会学系的部分学生首次将英文的c o m m u n i t y 译为“社区”,“社区 逐渐 成为中国社会学的通用语。 国内外对社区的定义众说纷纭,但归纳起来不外乎两大类:一类是功能主义 观点,认为社区是由有共同目标和共同利害关系的人组成的社会团体,即功能社 区;另一类是地域主义观点,认为社区是在一个地区内共同生活的有组织的人群, 即地域性社区。功能社区是有特殊目的的人所组成的群体,社区成员的目的和手 段不是特别明确,组织化的程度也不是很高,但是它强调为了共同的利益而参与 群体的活动。我国大部分社会学者则采取地域主义观点给社区下定义,认为社区 是指由居住在某一地方的人们组成的多种社会关系和社会群体,从事多种社会活 动所构成的区域生活共同体。 我国社区建设的概念是在社区服务的基础上提出来的。2 0 世纪8 0 年代以后, 城市基层逐渐全面展丌了以老年人、残疾人、优抚对象和便民利民为主要内容的 社区服务工作。随着社会转型的深入发展,社区服务已经无法包容和涵盖具有综 4 浙江大学硕士学位论文第1 章绪论 合性内容的社区工作。学术界和政府部门结合国外社区发展的理论和实践,适应 中国的国情,在1 9 9 1 年提出了具有中国本土特色的社区建设概念。政府倡导社 区建设的主要目的是为了解决社会转型期所出现的各种矛盾,如国有企业亏损、 工人下岗、老龄化的加剧与城市流动人口的增多,单纯依靠政府的力量无法解决 这些复杂的矛盾问题,因此动员民间力量,与基层社会结合,在城市基层开展社 区建设就成为一条行之有效的途径。另外,随着政府机构的改革和“单位制 的 被打破,城市居民逐渐由“单位人”转变为“社区人 ,推进社会发展的大量社 会事务要在社区落实,因此,必须尽快发展和完善基层社区的功能,加强社区建 设工作。 随着社区建设的发展,城市社区中“社区的范畴,即社区建设应在何种层 次、何种类型的社区中开展应予以明确。因为我们目前的社区建设多是以法定社 区作为操作单位的,更重要的是侧重于区、街、委这样一个基层的,所以对于社 区的界定也和社区建设的这一特点结合起来。社区界定的标准是地域界限明显、 与大社会沟通联系便捷的社会区域。具体而言,在农村指的是行政村或自然村; 在城市指的是街道办事处辖区或居委会辖区,以及目前一些城市新划分的社区委 员会辖区。因此,为了确定社区建设的最为适宜的载体,使得社区建设工作能够 行之有效地得以实施和操作,社区应该有明确的地域界限。从社区建设的角度来 讲,社区的地域界限不能太大,应限制在居民日常生活能够发生互动的范围之内, 或者限定在能够满足居民基本生活需要的生活服务设施、组织机构可以发挥作用 的范围之内口。因此,从我国社区建设的实践来看,社区的地域性特征已成为界 定社区的一个必不可少的因素。当我们把社区建设作为解决各种社会问题的有效 途径时,社区实际上是社会的载体,这里的社区已经不再是滕尼斯眼中的社区了。 2 0 0 0 年1 1 月,中共中央办公厅,国务院办公厅转发的民政部关于在全国 推进社区建设的意见,对中国社区作了如下定义:社区是指聚居在一定地域范 围内的人们所组成的社会生活共同体。同时,社区还应具有以下一些基本的构成 要素:( 1 ) 具有一定数量的,以一定社会关系连结起来的,参与共同社会生活的 人群;( 2 ) 有一定界限的地域,其界限一般来说是比较明确的;( 3 ) 有一套相对 浙江大学硕士学位论文第1 章绪论 完善的生活设施;( 4 ) 有一套相互配合的生活制度和管理机构;( 5 ) 生活在其中 的社会成员在情感和心理上具有一定的认同感和归属感。 随着互联网的发展,在网络上涌现出很多虚拟的社区,即互联网上有相同兴 趣爱好的人自发组成一个网络上的概念性上社区,如百度贴吧 ( h t t p :t i e b a b a i d u c o m ) 中的各个主题的贴吧、各种各样的b b s 论坛、网络游戏 社区等。 本文中关于社区个性化资讯服务中“社区”的概念,指的是我国民政部定义 的社区,文中涉及到概念有社区人群和社区服务。 1 2 2 社区信息化服务 社区服务信息化是提高社区服务效率,建立方便、快捷、高效的服务体系的 重要手段。 全国各个城市的社区服务经过多年的发展,已经积累了一些的社区服务资 源,涌现了一批如呼叫中心、报警热线等服务机构。山东泰安市泰山区岱庙街道 投资2 0 万元,引进了厦门厦华电子公司的网络呼叫系统,与1 1 0 、1 2 0 联网,利 用公众电话网和安置在家中的呼叫器,接受、识别居民的求救信息,并通过计算 机与公共服务网络单位的信息服务终端相联,迅速解决居民的各类问题,使社区 居民以最简单、便捷的方式发出各种求救信息并得到及时处理。在浙江的杭州、 金华、嘉兴等地区9 6 3 4 5 市民服务系统得到一定的应用。杭州市急救中心与浙江 省电信公司杭州市分公司合作建设“居家养老”呼叫服务模式,在固定电话网上 开放面向社区服务、为老服务的增值业务居家养老家庭呼叫服务业务。在上 海,“安康通”为老年人提供2 4 小时响应服务,在其用户中,独居老人和纯老家 庭占到9 0 左右,主要提供报警和响应服务。 随着因特网越来越发达,网络逐渐成为社区服务信息发布的载体,目前许多 社区都建立了社区服务网站,在百度上搜索“社区服务网”,返回共1 8 2 0 0 0 条相 关结果。这些社区服务网站基本都是以社区服务为基础,将相关信息,如社区建 设、社区新闻、生活提示、社区公告、家政服务、花木园艺等发布在网站上,为 6 浙江大学硕士学位论文第1 章绪论 社区群众提供生活信息访问、查询和便利,图1 3 是北京市社区公共服务信息网。 臻滋躐鬣露翟露豢鬻朦囱敏酝耱务孛办劲毖 曩圈黧懑# 琶= 三忑磊;磊品:淼茬罗葛藏僦 臻缓麓露嚣翟霞嚣瑟嚣隧。滋釜i 篆”8 7 6 一”4 ”。:8 ”“”“二 霸霪嚣縻孺露嚣露匿盈嬲l l 罄参 。媲震无赣、 有错 臻黧蹰氍嚣臻赣霞露翟目l 目暖劳 。蔑擐燧鬏棼牵心弦辩尧祷艨芬功i g 演点浆蔫动蜀 猢黼灞豳濯闺豳 囊 赣鬻豳霞翟磁舞i 匿嚣l 豳黪 * 耢义逸露并_ 9 6 :s 6 掬麓驻搭裔签约靛式 1 3 个性化服务 篼多爝患 i 馨堡婆翌堡一 m 番;串巽撼旗技区建设撑薤筑掰麓疑封楚建议 * 短 斯嚣愈鸯棼辘袈糌燃嬖摊澎赣袭农孛a 毡菹建 拶戮彩缀戮鼍 * 率鸯衡姑懿串治理无糍及聋 溶经慧堵点 * 老出势葬走壤细纯营建攮澎客 谧瓣管缝谊 * 惫出筠递奥运转措i 荤热薏摆 箨援餮受遣群境疆治上律锯 毽 a 期陌逸期平衡衡溅妻舒窟蔫 敬安挽程襄打王鸵z 彩h 毵王 免熟 图1 3 北京市社区公共服务信息网 个性化服务是指针对不同用户提供不同的服务策略和服务内容的服务模式 【3 】。与不区分用户的普通服务模式相比,个性化服务显然具有更高的服务质量。 实际上,个性化服务并不是一个现在才有的新概念。古语所说的“因材施教”, 就是教育领域中一种典型的个性化服务。在大工业生产之前,个性化服务是一种 司空见惯的服务模式,人们穿的衣服、鞋子都是根据个人的特点专门定做的。生 产力发展以后,为了提高生产的效率,大量的产品被标准化以利于批量生产,人 们消费的东西不再是为某个人专门制备,而是很多用户使用完全相同的产品。标 准化和批量化的服务是以降低服务质量为代价的。随着物质产品的日益丰富,个 性化服务又重新受到人们的重视。 目前,个性化信息服务已得到许多行业和领域的密切关注,并得到了大量的 实际应用,如个性化电子商务、新闻推荐、音乐推荐、情报系统等。涉及到教育、 通信、金融、商业、咨询、健康医疗、中介服务等行业,以及图书情报学、产业 7 澄 = ;n k j 档缝 n ;4 # 箍蝌 船 缝 “ 浙江大学硕士学位论文第1 章绪论 经济学、计算机科学、管理学、教育学等多个学科领域。 1 3 1 服务方式 最早的个性化服务是以个性化导航、过滤和推荐的服务方式出现。 个性化导航是指在用户访问i n t e m e t 的过程中进行前瞻搜索,找出用户感兴 趣的信息,提示用户下一步的浏览路径;个性化过滤则是指在用户访问i n t e m e t 的过程中对信息进行预处理,仅将用户感兴趣的信息呈现给用户;个性化推荐是 指在用户访问i n t e m e t 的过程中对信息进行预处理,将用户感兴趣的信息推荐给 用户,提示用户浏览。不难发现,“导航 和“过滤”在实现技术和实现目的上 与“推荐”是相似的,因而在此我们将“导航 、“过滤”和“推荐”统称为推荐。 随后,一些大型网站推出了以减少用户浏览负担、提高用户访问效率为目的 的个性化服务。由于这种个性化服务形式是网站提供并以提高网站易用性为目 的,因而我们称这种个性化服务形式为个性化站点。 随着i n t e m e t 中信息量的指数增长,如何从大量信息中检索到符合用户需求 的结果是搜索引擎关注的问题,根据用户检索历史和用户档案提供个性化的检索 是其中一种尝试,个性化信息检索成为一种新的个性化服务形式,目前商用搜索 引擎正在往这方面发展。 1 3 2 研究和发展 1 9 9 5 年3 月,卡内基梅隆大学的r o b e r t a r m s t r o n g 等人在美国人工智能协会 ( a a a i ) 春季会议上提出了个性化导航系统w e b w a t c h e r ,斯坦福大学的m a r k o b a l a b a n o v i c 等人在同一次会议上推出了个性化推荐系统l 弛。同年8 月,麻省 理工学院的h e n r yl i e b e r m a n 在国际人工智能联合大会( i j c a i ) 上提出了个性化 导航智能体l e t i z i a 。这三个系统被公认为个性化服务发展初期最为经典的系统, 标志着个性化服务的开始。 1 9 9 7 年,a t & t 实验室提出了基于合作方式的个性化推荐系统p h o a k s 和 r e f e r r a lw e b ;斯坦福大学的m a r k ob a l a b a n o v i c 和y o a vs h o h a m 推出了基于内容 浙江大学硕士学位论文第1 章绪论 和合作方式的个性化推荐系统f a b 。同年3 月, c o m m u n i c a t i o n so f t h ea c m ) ) 组 织了个性化推荐系统的专题报道,标志着个性化服务已经受到相当的重视。 1 9 9 9 年,德国d r e s d e n 技术大学的t a n j aj o e r d i n g 实现了个性化电子商务原 型系统t e l l i m ;麻省理工学院的h e n r yl i e b e r m a n 提出了基于合作方式的个性 化导航系统l e t sb r o w s e ;意大利t o r i n o 大学的l i l i a n aa r d i s s o n o 和a n l a ag o y 提 出了个性化网上商店s e t a 。个性化服务开始向全球发展。 2 0 0 0 年4 月,以美国为主的多国个性化研究机构和网络公司成立了个性化协 会,旨在推动个性化服务的发展,同时保护个性化服务中涉及的用户隐私。这一 年,我国也开始了个性化服务的研究。清华大学的路海明等提出基于多a g e n t 混 合智能实现个性化推荐。 2 0 0 1 年,纽约大学的g e d i m i n a sa d o m a v i c i u s 和a l e x a n d e rt u z h i l i n 实现了个 性化电子商务网站的用户建模系统l :l p r o ;m m 公司在其电子商务平台 w e b s p h e r e 中增加了个性化功能,以利于商家开发个性化电子商务网站;n e c 研 究院的e r i cg l o v e r 等人提出了个性化元搜索引擎原型系统i n q u i r u s 2 。我国也广泛 开展了对个性化服务的研究,提出了一些原型系统。清华大学的冯翱等人提出了 基于a g e n t 的个性化信息过滤系统o p e nb o o k m a r k ;南京大学的潘金贵等人设计 并实现了个性化信息搜集智能体d o l t r i a g e n t 。 近几年,个性化服务逐渐从学术研究走向实际应用,成为业界的热点概念。 很多公司纷纷推出个性化系统,提供个性化服务。很多网站,如g o o g l e 、m i c r o s o f t 、 a o l 、c n n 、l y c o s 、i b m 等,均推出了个性化功能;很多电子商务网站也注意 到了个性化服务的巨大商机,开始提供个性化服务,如a m a z o n 、e b a y 、b e s tb u y 、 e x p e d i a 等。 1 4 本文主要工作和组织结构 1 4 1 本文主要工作 社区信息化服务是社区服务的趋势,为满足社区人群的信息资讯需求,整合 9 浙江人学硕上学位论文 第1 章绪论 优化社区信息和服务资源,本文提出和研究了社区个性化资讯服务,将社区服务 中的电子政务、医疗保健、养老救治等资讯以及互联网上的资讯,以个性化的方 式提供给他们。 本文针对社区服务和用户的特点,从资讯服务内容和服务方式两方面分析社 区个性化资讯服务的特点,并根据这种特点建立社区用户兴趣模型,提出基于家 庭信息终端的社区用户建模方法,并分析了用户数据收集、模型表示和模型更新。 根据社区用户模型,本文对现有推荐方法进行了改进,将用户、资讯分类信息引 入基于项目的协同过滤推荐,解决推荐过程中的冷启动问题,包括新用户和新项 目问题。采用被广泛认可和使用的数据集对算法进行实验分析,与传统算法进行 了对比。在以上分析实验的基础上,本文对社区个性化资讯服务系统进行了设计, 从总体框架、家庭信息终端模块、资讯收集模块、核心推荐模块等方面进行设计 和分析。 1 4 2 本文组织结构 第一章从社区信息化的重要性和社区人群对资讯的需求角度阐述社区个性 化服务的背景及意义,对社区信息服务和个性化服务的相关概念和发展情况进行 概述。 第二章对个性化服务的关键技术用户建模、推荐技术进行综述。用户建 模是个性化服务的基础,分为用户数据收集、模型表示、模型学习、模型更新四 个主要步骤。推荐技术经过长期发展和研究,形成了基于内容的推荐、协同过滤 推荐和混合推荐三类方法,其中混合推荐方法综合了其他两种方法的优点,实现 优势互补,在实际应用中被广泛采用。 第三章从资讯服务内容和服务方式方面分析了社区个性化资讯服务的特点, 并根据这种特点对社区用户进行个性化建模,包括用户数据收集,模型表示和模 型更新,并提出基于家庭信息终端的建模方法。 第四章根据用户模型进行个性化推荐,采用混合推荐的思想,将用户、资讯 类别信息与基于项目的协同过滤推荐结合,解决分析推荐中的冷启动问题,包括 1 0 浙江大学硕士学位论文第1 章绪论 新用户和新项目两方面。并采用m o v i e l e n s 数据集对算法进行实验,结果表明, 本文的方法对解决冷启动问题效果良好。 第五章从总体架构、家庭信息终端模块、资讯收集模块、核心推荐模块几个 方面对社区个性化资讯服务系统进行了设计。 第六章对本文进行了总结,对未来社区个性化资讯服务的开展和研究进行了 展望。 浙江大学硕士学位论文第2 章个性化推荐技术综述 第2 章个性化推荐技术综述 社区服务要以居民便利为先,采用推荐技术将服务送到他们的手中是提高服 务效果的重要手段;社区人群结构复杂,不同人的需求差异较大,需要根据不同 人的特点满足他们不同的需求,因此个性化技术是关键。 2 1 用户建模 在个性化推荐系统中,用户建模是基础和核心要素之一。一般推荐系统要经 过用户建模、模型匹配、输出推荐三个步骤。用户兴趣模型是推荐系统中的一个 模块,是在计算机中建立的对用户兴趣特征的描述,能获取、表示、存储和修改 用户兴趣偏好,能进行推理,对用户进行分类和识别,帮助系统更好的理解用户 特征和类别,理解用户的需求和任务,从而更好的实现用户所需要的功能。也就 是说用户兴趣建模是从有关用户兴趣和行为的信息( 如访问内容、浏览行为、下 载行为、背景知识等) 中归纳出可计算的用户兴趣表示的过程。其结果将产生一 个表示用户特有兴趣、需求、偏好或模式的用户模型。这个模型是匹配和推荐的 依据,它的准确性和有效性是推荐系统的关键之一。 用户模型从不同的角度可以有多种分类的方式【4 】:a 按照建模的对象,可以 分为组用户模型和单个用户模型;b 按照信息源,可以分为显式模型和隐式模型; c 按照时间尺度,可以分为长期模型和短期模型;d 按照更新方式,可以分为静态 模型和动态模型;e 按照表现形式,可以分为基于属性的模型和基于知识的模型。 用户建模通常包括数据收集、模型表示、模型学习与模型更新四个步骤【5 ,6 】。 2 1 1 数据收集 数据收集是获取用户个人特征、爱好或活动相关的信息的过程。它为用户模 型的建立提供了必要的数据来源,通常可以采用显性和隐性两种方式实现。显性 的数据收集方式要求用户手动提供表示其兴趣偏好的各种数据,包括用户对项目 的评分、明确给出的个人信息、显性的描述信息等。相对于显性收集方式,隐性 1 2 浙江大学硕士学位论文第2 章个性化推荐技术综述 方式不需要用户反馈参与,而是由系统在不打扰用户正常活动的情况下自动完 成,如通过代理服务器日志、w e b 服务器日志、w e b 数据挖掘、w e b 公用资源获 取信息等。 2 1 2 模型表示 用户模型的表示提供一种结构化的模型存储形式,常用的用户模型表示方法 主要包括以下几类 7 , 8 1 : ( 1 ) 基于向量空间模型的表示 向量空间模型是目前为止最流行的用户模型表示方法。该方法将用户模型表 示成一个n 维特征向量,向量的每一维由一个关键词及其权重组成。权重可取布 尔值和实数值,分别表示用户是否对某个概念感兴趣以及感兴趣的程度。基于向 量空间模型的表示方法能够反映不同概念在用户模型中的重要程度,而且方便了 使用标准向量运算来进行后续阶段的项目匹配任务。 ( 2 ) 基于神经网络的表示 基于神经网络的表示采用网络稳定后连接权重所特征化的网络状态来表示 用户模型。网络状态由网络输入状态、网络输出状态以及输入与输出之间的连接 状态组成。网络输入状态表示系统对用户偏好的假设,如用户偏好的新闻项目 9 1 或文本中的关键词【l o 】,网络输出状态表示神经网络从输入假设中抽取或识别的适 合于具体用户的模式类。这些模式类有时直接表现输入假设与用户兴趣的关联, 被标记成感兴趣不感兴趣类;有时仅表示对输入假设的普通分类,需要将这些类 与其它判别准则如用户规定的兴趣因子关联来判别每个类与用户兴趣的关联。网 络输入到输出之间的连接状态由此时的网络连接权重来描述。 ( 3 ) 基于案例的表示 基于案例的表示将用户检索过的案例或者与案例相关的一组属性值来表示 用户模型。例如在c a s p e r 1 1j - l - _ 作推荐系统中,用户模型被表示成用户检索过的 工作列表的形式,表中的每一行包含了一个工作的i d 号以及用户对该项工作的 导航信息如点击次数、浏览时间长度以及保存、申请等。显然,基于案例的表示 浙江大学硕士学位论文第2 章个性化推荐技术综述 仅基于用户的单次查询,反映的是用户的短期需求。其表示的用户模型仅在本次 会话中有效,而不能被下次会话所重用。 2 1 3 模型学习 用户模型的学习是对收集到的数据进行解释和推理,从中去除噪音,形成关 于用户兴趣的有用知识,并且形式化这些知识,以产生最终的具有结构化表示的 用户模型。常见的用户学习技术【1 2 】包括t f i d f 、决策树归纳、神经网络。 ( 1 ) t f i d f t f i d f 是信息检索领域最成熟和最成功的一种文本学习技术,其主要思想 是:如果某个词或短语在一篇文章中出现的频率t f 高,并且在其他文章中很少 出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。 它是将一篇文档d 表示成向量空间中的一个向量,向量的每一维由文档d 中 的一个单词乞和其权重组成。每个单词的权重w i 通过下式计算产生: w i = t f 心d ) l o g 晶 公式( 2 1 ) 式中前一项t f 如,妨是词频( t e r mf r e q u e n c y ) ,表示单词在文档d 中出现的 次数;后一项是单词乞的逆向文档频率( i n v e r s ed o c u m e n tf r e q u e n c y ) ,表示包含 单词t l 的文档数量越多,龟在区分文档中的作用越小。其中i d i 是文档的总数量, d f ( t ) 为文档频率,是单词毛至少在其中出现一次的文档的数量。 ( 2 ) 决策树归纳 决策树归纳是使用最广泛的一种预测技术,它通过建立决策树来标记或者将 实例分类到一个已知类集中。决策树的建立通过将实例递归地划分成子组来完 成,每次划分都依据了对实例某种属性的检验,即使用一些条件来决定数据集应 该如何被分割。这种划分直到每个子组所包含的实例都属于单一类为止。使用决 策树归纳作为用户模型学习技术的系统将用户偏好的获取过程表达成一棵决策 树,用户从根节点开始,被引导来回答一系列问题。树的每个节点表示了决策点, 所采取的方向取决于对问题的回答或者对可用数据的计算。一旦叶节点被达到, 则可得到对用户偏好的完整描述。 浙江大学硕士学位论文第2 章个性化推荐技术综述 ( 3 ) 神经网络 神经网络是一类具有很强的自学习、自组织和自适应能力的信息处理系统。 采用这类学习技术的系统将用户建模过程看成是一个模式分类过程。该过程运用 神经网络学习算法,如胜者为王学习规则、d e l t a 学习规则、b p 算法等,对系统 对用户偏好的输入假设进行学习并调整网络连接权重,直到网络中的所有节点达 到稳定激活状态。此时输出层中被激活的节点所对应的模式类,如感兴趣不感兴 趣类,即表示了系统识别的用户偏好。 2 1 4 模型更新 用户模型更新根据用户对推荐的显性或隐性反馈改进原有用户模型,以确保 模型能够匹配用户的最新偏好,从而提高模型精度和推荐质量。目前采用的用户 模型更新技术主要可以分成如下三类 1 3 , 1 4 1 : ( 1 ) 信息增补技术 这是目前为止使用最多的一类用户模型更新技术。它又包括了直接的信息增 补以及涉及权重调整的信息增补两种类型。前者将获取的用户对推荐的反馈信息 直接添加到用户模型中。这种更新只是简单地添加了新信息,并没有删除或削减 无效的旧信息在用户模型中的作用,因此很可能导致推荐阶段假阳性错误的出 现,即将用户不喜欢的项目推荐给了用户。相比之下,采用后者作为更新技术的 系统,不仅将用户新的反馈信息增加到用户模型中,而且还会调整用户模型中新、 旧信息的权重,使反映用户最新偏好的新信息在推荐中起到更为重要的作用,同 时无效的旧信息将随其权重的不断减小而最终从模型中被删除。 ( 2 ) 遗传算法 遗传算法是一种基于自然选择和遗传机理的迭代搜索优化技术,由适应度函 数、染色体种群以及选择、交叉和变异三个主要操作算子组成。每一代种群包含 了若干个个体( 被称为染色体) 。依据每个个体的适应度函数值,种群经过选择, 交叉和变异操作一代代向更优良、更适应环境的方向进化,从而逐渐逼近最优解。 使用遗传算法作为模型更新技术的系统。通常将用户模型编码成一个染色体并随 浙江大学硕二b 学位论文 第2 章个性化推荐技术综述 机产生其他染色体作为初始种群。当初始种群进化迭代到满足终止条件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 统编版五年级语文上册期中拔尖测评卷(含答案)
- 广西壮族自治区柳州市2024-2025学年五年级下册期末考试语文试卷(有答案)
- 北师大版五年级上册数学期中检测卷(无答案)
- 空调消防改造合同范本
- 房租合同范本电子档
- 社区摄影基础知识培训课件
- 上门讨要赔偿合同范本
- 店面出租消防合同范本
- 沥青储罐安装合同范本
- 食品原料oem合同范本
- 2025四川内江市法院系统招聘聘用制审判辅助人员120人笔试参考题库附答案解析
- 2025年内江市总工会公开招聘工会社会工作者(14人)笔试备考试题及答案解析
- 医药代表开发医院经验分享
- 墓地管理员实操培训课件
- GB/T 45993-2025元宇宙参考架构
- 2025年防汛应急知识竞赛题库
- 2025中国高血压防治指南
- (高清版)DB44∕T 1024-2012 《水性环氧防腐涂料(双组分)》
- 玉露香梨树栽培管理技术
- 校园方责任保险服务项目方案投标文件(技术方案)
- 军工计价管理办法
评论
0/150
提交评论