




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于个性化服务的用户需求信息的深层挖掘 摘要 内容摘要:个性化服务是一个自动获取用户对信息资源或借助信息形态表征的 实物资源的使用信息,分析这些信息得到用户的特定兴趣和需求,然后根据分 析结果在合适的时间向每一位访问者发送正确信息的过程,具有针对性、自动 性特点。本文就图书馆个性化服务中用户需求信息的深层挖掘问题进行了研究, 首先对个性化服务中用户需求信息的研究进行了综述。在基于个性化服务与用 户需求信息具有密切关系的理念上,指出应以深层获取用户需求信息为基础研 究个性化服务,同时也分析了国内外个性化服务的成功案例,如康奈尔大学的 m y l i b r a r y 个性化服务系统和我国的i l a s 个性化服务系统,着重从理论和实践上 对康奈尔大学的m y l i b r a r y 个性化服务系统进行多角度的审视,做了系统的归纳 和深入的研究。其次,本文分析了图书馆个性化服务过程中用户需求信息的体 现方式与描述方式。根据用户需求信息的体现方式,将其划分为明显信息和隐 含信息,同时将用户需求信息的描述方式归纳为基于评分的表示、基于内容的 表示、基于知识的表示三种。最后,提出了数据库统计、w e b 数据挖掘、反馈互 动三种深层挖掘用户需求信息的方法,并对这三种方法进行了比较,为在图书 馆个性化服务中建立一个综合有效的用户需求信息挖掘系统提供了参考。 关键词: 图书馆;个性化服务;用户需求 基于个性化服务的用户需求信息的深层挖掘 a b s t r a c t c o n t e n t :w i t ht h ec o n t i n u o u sg r o w t ha n dp r o l i f e r a t i o no ft h ew e b b a s e di n f o r m a t i o n s y s t e m s ,p e r s o n a l i z a t i o nh a se m e r g e da sac r i t i c a la p p l i c a t i o nw h i c h i se s s e n t i a lt ot h e s u c c e s so faw e bs i t e ,p e r s o n a l i z a t i o nc a nb ed e f i n e da sa n ya c t i o nt h a tt a i l o r st h ew e b e x p e r i e n c e t oap a r t i c u l a ru s e r ,o rs e to fu s e r s t h ep r i n c i p l ee l e m e n t so ft h e p e r s o n a l i z a t i o ns y s t e mi n c l u d em o d e l i n gt h ew e bo ! b j e e t sa n ds u b j e c t s ,m a t c h i n g b e t w e e na n da c r o s so b j e c t sa n ds u b j e c t s t h i sp a p e ri sd i r e c t e da g a i n s tt h eq u e s t i o no f o b t a i n i n go ft h eu s e r sd e m a n di n f o r m a t i o ni nl i b r a r yp e r s o n a l i z e ds e r v i c e s ,d i s c u s s e s t h eb a s i ct h e o r yo ft h eu s e r sd e m a n di n f o r m a t i o ni nl i b r a r yp e r s o n a l i z e ds e r v i c e s s u g g e s tw es h o u l di n v e s t i g a t et h el i b r a r yp e r s o n a l i z e ds e r v i c e sb a s e do nt h ea n a l y s e s o ft h ec o n c e p to fp e r s o n a l i z e ds e r v i c e sa n dt h eu s e r sd e m a n di n f o r m a t i o n ,a n dt h e p a p e ra l s oa n a l y s e st h ec a s e so fp e r s o n a l i z e ds e r v i c e s ,s u c ha sm y l i b r a r y l c o m e l l a n dt h ep e r s o n a l i z e ds e r v i c eo fi l a s t h ep a p e re m p h a t i c a l l yi n v e s t i g a t e st h e p e r s o n a l i z e ds e r v i c e so fm y l i b r a r y c o m e l la n dp o i n t so u tt h es t r a t e g yt od e v e l o p p e r s o n a l i z e ds e r v i c e so fd i g i t a ll i b r a r y s e c o n d l y ,t h ep a p e ra n a l y z e sr e f l e c t i v es t y l e a n dd e s c r i p t i o ns t y l eo fu s e r sd e m a n di n f o r m a t i o ni np e r s o n a l i z e ds e r v i c e s f i n a l l y , p r o p o s a l sd a t e b a s es t a t i s t i c s 、w e bd a t am i n i n g 、f e e d b a c ka n de x c h a n g ev i s i t s t h e s ew a y st oo b t a i nu s e r sd e m a n di n f o r m a t i o na n dg i v e sac o m p a r i n go ft h e s et h r e e m e t h o d s ,p r o v i d e sac o n s u l tf o rl i b r a r yp e r s o n a l i z e ds e r v i c e st ob u i l das y n t h e s i z e d a n de f f e c t i v eu s e r sd e m a n di n f o r m a t i o no b t a i ns y s t e m k e yw o r d s :l i b r a r y ;p e r s o n a l i z e ds e r v i c e s ;u s e r sd e m a n d 学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论文 中除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或发表过的 研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均已在论文中做 了明确的声明并表示谢意。 学位做作者签名:粱碉 日期:妒吹厂 学位论文版权的使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及 学校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅和借 阅。本文授权辽宁师范大学,可以将学位论文的全部或部分内容编入有关数据库 并进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密 的学位论文在解密后使用本授权书。 学位论文作者签名粱翮 指刷币铭玩秀易 日 期。扩r 基于个性化服务的用户需求信息的深层挖掘 第一章绪论弟一早珀下匕 1 1 选题背景 基于网络的个性化服务思想在国内外图书馆和信息服务系统中已经有了 一定的发展,许多门户网站和信息提供者推出了个性化定制服务系统 ( p e r s o n a l i z e dc u s t o m i z a t i o na n ds e r v i c e ) 。美国图书馆与信息技术联 合会( l i b r a r ya n di n f o r m a t i o nt e c h n o l o g ya s s o c i a t i o n ,简称l i t a ) 的 l o 位著名的数字图书馆学家在1 9 9 9 年的讨论会上,把个性化定制服务列为 数字图书馆技术发展7 大趋势之首。 目前的个性化服务虽然取得了一定进展,但大都是针对用户定制的特定 需求而被动提供服务,只有更进一步的挖掘隐藏的用户需求信息,发展主动 推进式的服务,才能更好的吸引用户对个性化服务的使用,从而实现个性化 服务水平的飞跃心1 。为解决这一问题,相关专家学者己提出多种方法口一1 。以 个性化检索为例:g o o g l e 既为用户返回文档信息,也返回相关分类信息。但 是,即使人们能方便的利用搜索引擎查找信息,效果仍然不使人满意。当用 户输入关键词后,搜索引擎返回的结果往往包含大量与用户兴趣不相关、重 复、甚至过时的信息,从中找出用户真正需要的信息是一个繁琐的过程。针 对这一问题,一些关于元搜索和分布式检索的研究,正在探索把用户的提问 映射到某一类别集合范围内。这些方法可以限定返回结果的类别,缩小返回 的信息量,但对于一个给定的提问,仍然返回同样的结果,不能结合每个用 户的意图为其量身定制,返回不同的检索结果。设想一名教师与一名学生同 样利用“数字图书馆”这个关键词检索,搜索引擎会检索出相同的文章,而 教师可能需要的是关于数字图书馆的研究论文,学生可能想要了解数字图书 馆的概念性知识。因此,在众多搜索引擎已经检索了海量信息的情况下,能 否得到信息已经不是很重要的问题,问题是如何提高信息检索的效率来满足 用户个性化的需求。 1 2 研究意义 随着电子化、数字化、网络化发展,图书馆逐渐突破了传统意义上的 “馆藏”,实现了文献资源的数字化,信息传递的网络化和共享化。数字图 书馆依照不同学科、不同领域为用户收集了大量零散的网络信息,通过有序 的组合存放于网页提供用户检索及浏览。传统图书馆历来是以典藏文献、等 待读者上门的被动运作,而发展中的数字图书馆及虚拟图书馆不仅在现代技 基于个性化服务的用户需求信息的深层挖掘 术上进行了革新,同时强调服务方式必须由被动转为主动,树立用户至上的 理念,依照用户要求量身定制,从而激发潜在的用户群。譬如在高校图书馆 中,随着研究方向的多元化,读者信息需求也逐步趋向个性、特殊化。如果 能够依据各个类型用户的需求,动态提供相关学科最新网络资源,使用户能 够及时了解专业领域相关的学术信息而无需在海量的馆藏资源中大海捞针, 就能够节省大量的浏览与检索时间,体现图书馆的亲和性。 可见,无论从信息获取还是服务提供的角度,如何根据个人爱好和兴 趣,提供主动的图书馆个性化信息服务方式已经成为关注的焦点。为了针对 不同用户的个性化需求,提供特定的个性化信息服务,这就需要全面深入获 取、分析用户信息,建立合适的用户模型,在此基础上进行高效的个性化信 息服务。 本文研究是基于网络信息环境的背景下,针对图书馆个性化服务中用户 需求信息的深层挖掘问题展开研究的。目的是在详细分析图书馆个性化服务 过程中用户需求信息的体现方式的基础上,研究深层挖掘用户需求信息的方 法,并对不同的获取方法进行比较,从而探索全面获取图书馆用户个性化需 求的思路和方法。本文研究的理论意义在于为我国图书情报机构开展个性化 服务提供理论依据。实践意义在于为提高图书馆个性化服务质量和效率提供 借鉴。 1 3 国内外研究现状 个性化服务作为一门新兴的技术,涉及人工智能、机器学习、数据挖掘 等理论,吸引了越来越多研究人员的关注。人们也越来越深刻的认识到,提 供主动准确的个性化服务需要全面获取用户的需求信息,在这个研究课题 上,目前的研究重点是个性化推荐和个性化信息检索哺1 。 个性化推荐是指根据用户的兴趣特点,向用户推荐其感兴趣的信息。个 性化推荐的原理是根据用户模型寻找与其匹配的信息,或者寻找具有相近兴 趣的用户群而后相互推荐浏览过的信息,是一种“信息找人 的服务模式 阳3 。个性化推荐能够根据用户的兴趣主动的将信息推送给用户,减少用户寻 找信息的时间,提高浏览效率。个性化推荐还可以引导用户的信息需求,使 用户发现新的兴趣。用户对信息的反馈活动使系统能够自动的更新用户的兴 趣,始终提供最能够满足用户需求的信息。此项技术的研究已经取得了显著 的成果,除了学术领域外,个性化推荐技术正在迅速朝商业领域进军,可以 2 基于个性化服务的用户需求信息的深层挖掘 预见,在不久的将来,此项技术将在商业领域得到更为广泛的应用,并将获 得巨大的商业效益。 目前的网络信息检索服务没有考虑用户的差异,对于任何用户,只要输 入的关键词相同,返回的检索结果就完全相同。而现实中,不同的用户由于 背景知识、兴趣爱好等方面的差异,需要的信息往往是不同的。特别是由于 一些词存在多义性,这些不同领域的内容将混合呈现在返回的结果中。随着 网络信息量的迅猛增长,这种不区分用户的检索必将大大耗费检索的时间, 导致检索信息的效率低下。与一般的搜索引擎相比,个性化信息检索可以通 过长期观察用户的搜索行为,从中识别用户的信息需求偏好,并且能够根据 用户对检索结果的评价,自觉调整检索策略,使得对于同一检索请求,不同 用户能够得到不同的满足自己需要的信息。由于在检索中考虑了用户的差 异,个性化信息检索可以大大提高检索的效率。个性化信息检索目前尚处于 研究阶段,还没有成熟的系统问世。但随着智能技术的不断发展以及学术理 论的逐渐成熟,个性化信息检索必将取得突破性的进展。 1 4 本文的研究内容 ( 1 ) 对用户需求信息体现方式的研究。根据用户需求信息获取难易的不 同,将用户需求信息分为了明显信息和隐含信息两类,并分别对两类信息进 行了详细划分。 ( 2 ) 对用户需求信息描述方式的研究。包括基于评分的表示,基于内容 的表示和基于知识的表示。基于评分的表示保存用户对资源项的评分信息, 没有对评价的资源进行“泛化”表示,在使用上,主要利用用户评价和统计 方法在当前用户和其他用户之间建立关系进行协同推荐。基于内容的方式保 存用户需求的内容,是用户对个性化需求的一种“凝聚与“泛化表示, 这样可以用和资源内容的匹配进行推荐。另外,还介绍了两种简单的描述用 户知识状态的模型:基于知识的用户模型和铅版模型。基于知识的用户模型 表示常用于自适应超媒体与个性化教学领域。模型有用户声明的知识库中的 事实,从中可以获取用户的需求和模式。铅版模型实际上是一个组用户模 型,将用户分为几组。这种方法通过向用户提问问题或与用户交谈来获取用 户的需求。 ( 3 ) 对用户需求信息的获取方式的研究。提出了数据库统计、w e b 数据 挖掘、反馈互动三种深层挖掘用户需求信息的方法,其中详细介绍了三种不 基于个性化服务的用户需求信息的深层挖掘 同方法的原理、相关技术以及特点。并且对数据库统计、w e b 数据挖掘、反 馈互动这三种深层挖掘用户需求信息的不同方法进行了比较,分析各自的 优、缺点,在此基础上提出用户需求信息获取方式的客观评价,为下章建立 用户需求信息挖掘模型的研究做准备。 ( 4 ) 对构建用户需求信息深层挖掘模型的研究。根据对数据库统计、 w e b 数据挖掘、反馈互动三种深层挖掘用户需求信息的不同方法进行比较, 以及在此基础上提出的用户需求信息获取方式的客观评价,构建了一个综合 有效的用户需求信息获取模型,为在图书馆个性化服务中建立一个综合有效 的用户需求信息挖掘系统提供了参考。 1 5 研究的创新之处 个性化服务思想在国内外图书馆和信息服务系统中已经有了一定的发展, 许多门户网站和信息提供者推出了个性化定制服务。目前的个性化服务虽然 取得了一定进展j 但大都是针对用户定制的特定需求而被动提供服务,只有 更进一步的挖掘隐藏的用户需求信息,发展主动推进式的服务,才能更好的 吸引用户对个性化服务的使用,从而实现个性化服务水平的飞跃。为解决这 一问题,相关专家学者已提出多种方法。以个性化检索为例:g o o g l e 既为用 户返回文档信息,也返回相关分类信息。一些关于元搜索和分布式检索的研 究,正在探索把用户的提问映射到某一类别集合范围内。这些方法可以限定 返回结果的类别,缩小返回的信息量,但对于一个给定的提问,仍然返回同 样的结果,不能结合每个用户的意图为其量身定制,返回不同的检索结果。 鉴于此,本文针对图书馆个性化服务中用户需求信息的深层挖掘问题,分析 了图书馆个性化服务过程中用户需求信息的体现方式,提出了数据库统计、 w e b 数据挖掘、反馈互动三种深层挖掘用户需求信息的方法,并对这三种方 法进行了比较,为在图书馆个性化服务中建立一个综合有效的用户需求信息 挖掘系统提供了参考。 4 基于个性化服务的用户需求信息的深层挖掘 第二章个性化服务与用户需求 2 1 个性化服务的含义 个性化信息服务是以信息活动中所涉及的用户信息需求、兴趣爱好、学 科背景、工作任务、检索策略等为依据,通过软件为用户构建个性化信息环 境的服务机制,该服务机制能够帮助用户建立自己所需要的个人资源集,定 制并集成与用户需求相关的信息服务项目,有效支持用户检索、处理、利用 信息以及解决问题的全过程口1 。个性化信息服务减少了信息过载,提高了用 户的学习和工作效率。个性化信息服务的实现涉及两个重要环节:一是根据 信息活动中所涉及的各种用户需求条件,构建个性化的用户模型:二是根据 已建立的用户模型,将用户所需的信息从全局信息空间中分离出来,形成与 用户需求匹配的个性化信息集合1 。因此,简单地说,个性化信息服务是根 据用户的需求条件,从全局信息空间中构建主动的、集成的个人信息空间的 服务机制。这个基本内涵正在随着信息技术的深化发展和数字图书馆的深入 研究而不断扩展。 2 2 个性化服务的产生背景 信息服务的最终目的是为用户提供其所需要的各种信息资源及服务。用 户的需求不仅决定了信息服务机构的服务内容,而且决定了其服务机制和模 式。一方面,数字图书馆环境下,用户对信息的需求日益个性化,传统信息 服务机构面向所有用户提供无差别的信息服务越来越难以满足用户的信息需 求;另一方面,现代信息技术的飞速发展又为满足这些个性化需求提供了可 能。为了在竞争中争得有利的地位,一些信息服务机构率先在网上推出有针 对性地个性化信息服务。 早期的个性化信息服务主要由新闻剪裁、股票报价和目录推荐等内容组 成。这些内容都是通过浏览器的c o o k i e 文件和一些信息服务商提供的智能 后端实现的。现在网上流行的个性化信息服务是为用户创建和管理自己的信 息和兴趣群组。如“m y y a h o o ,“m y b o o k m a r k ”,“m y i n f o 等,它们都 是基于用户定制来提供个性化的页面和服务。由于这些分类定制的个性化信 息服务不能根据用户的偏好和反馈来及时获取用户喜欢的最新信息实现主动 信息服务,人们开始探索一种更具智能化的软件一一个人信息代理 ( a g e n t ) ,来提供自动化的主动信息服务。利用智能代理技术已经开发出 基于个性化服务的用户需求信息的深层挖掘 一批成功的智能代理系统,如w e b v a t c h e r 。技术的发展不断丰富着网上个性 化信息服务的类型,垂直门户、可视化帮助、呼叫中心等个性化信息服务的 产生和发展,使得用户个人的网上生活更加便捷。 网上的个性化信息服务一出现就大受用户欢迎,如今i n t e r n e t 的个性化 服务思想逐渐渗透到网上生活的各个领域,如基于用户的个性化电子商务、 基于m y l i b r a r y 的图书馆个性化信息服务等等,个性化信息服务向我们预示 着未来信息服务的前景。 2 3 个性化服务实例 随着个性化服务思想产生以来,国内外各图书情报机构都充分利用现代 网络信息环境,通过对用户需求的分析,为用户提供经过信息分析、重组、 创新、集成的符合用户需要的个性化服务产品,在实践中不断提升个性化服 务的水平,不断推进个性化服务的发展旧1 。 2 3 1 康奈尔大学图书馆m y lib r a r y 康奈尔大学2 0 0 0 年推出了m y l i b r a r y 的服务,使查找和利用图书馆资 源比以前更加方便快捷。康奈尔大学图书馆的m y l i b r a r y 主要为该校学生、 教工提供个性化服务,包括个性化链接( m y l i n g k s ) ,个性化更新 ( m y u p d a t e s ) ,个性化内容( m y c o n t e n t s ) ,个性化目录 ( m y c a t a l o g s ) ,个性化文献传递( m y d o c u m e n t d e l i v e r y ) u 引。 m y l i n k s 是为用户个人搜集和组织数字化资源的一种工具。用户利用 m y l i n k s ,可以方便地搜集、组织和维护由图书馆网站提供的馆藏数字资源 以及互联网上的各种网络资源的链接,将个人所需要的资源组织在自己专门 的m y l i n k s 中,以后可以用任意的电脑方便地登陆康奈尔大学图书馆网站, 查询信息资源,相当于用户的个人主页。用户可以在m y l i n k s 中创建不同的 文件夹,将不同的数字化资源链接组织到不同的文件夹中,并可以对文件夹 中的资源进行命名、添加和删除等操作。 m y u p d a t e s 具有将图书馆新到资源及时通知用户的功能。图书馆网站的 信息资源经常处于动态变化之中,但是用户往往只是关注对自己有用的新信 息。m y u p d a t e s 允许用户确定自己的信息需求范围并据此对图书馆新到资源 ( 书目、期刊目录) 进行检索,当有相关新资源检出时,由系统定期自动通 知用户。利用m y u p d a t e s ,用户将需要定制的信息的专业或其他要求输入 m y u p d a t e s ,系统就会定期检索图书馆新到资源的联机目录,确认哪些资源 6 基于个性化服务的用户需求信息的深层挖掘 是新资源,如果这些新资源符合用户预先确定的要求,就自动发送电子邮件 通知用户,用户就不再需要上网鉴别旧资源,可将这些资源组织到自己的 m y l i n k s 中。m y u p d a t e s 同时还具有检索定制功能。用户通过调整检索词和 布尔逻辑式,扩大或缩小检索范围,构建符合自己要求的检索式,并存入系 统。 m y c o n t e n t s 用来推送用户所选期刊的最新一期目次。它是面向用户主 动提供期刊目录的一种服务工具,用户通过选择m y c o n t e n t s 服务,将需要 定制的期刊信息或其他要求输入m y c o n t e n t s 中,m y c o n t e n t s 就会定期检 索,当新期刊到馆之后,m y c o n t e n t s 就会将用户选定的期刊的目录通过电 子邮件发送给用户,或是在m y c o n t e n t s 的界面内,按照用户定制的表格形 式一一罗列出来,以供用户上网查看。 m y c a t a l o g 是为用户提供个性化的联机目录检索服务。它就相当于一个 服务器端的个人文件夹,用于存放用户个人喜欢的检索结果、外部资源等。 用户可以根据自己的需求定制联机检索目录,这样在用户进行信息检索时就 只需要从自己选定的那部分检索目录中进行搜索,从而提高了检索速度。同 时,m y c a t a l o g 还具有保存功能,即可以将用户检索时的个人偏好、某次检 索记录及特定检索记录等进行保存,方便用户日后进行查询。 m y d o c u m e n t d e l i v e r y 是一个附加功能,它是在个性化定制和检索的基 础上为用户提供原文传递服务。这几部分共同构成m y l i b r a r y 系统,系统遵 循共同的开发方法和核心技术,用j a v a 动态创建h t m l ,运用o r a c l e 数据 库技术存储大量的用户信息。而且在m y l i n k s “图书馆服务”文件夹中,也 有一个链接与m y u p d a t e s 相联系,使m y l i b r a r y 的个性化服务功能集成在 一起。 该系统只面向本校人员使用,非校内用户无法使用。 2 3 2 国家科学数字图书馆“我的数字图书馆 “我的数字图书馆是中国科学院国家数字图书馆基于美国北卡罗莱纳 州立大学m y l i b r a r y n c s t a t e 系统开发的个性化服务系统。该系统所提供的 资源分别按照类型和学科进行了细分,其中类型包括我的参考书架、我的数 据库、我的电子文档和电子期刊3 部分,而学科则分为2 5 大类。用户可以 根据需要逐步缩小浏览范围,最终找到所需资源进行定制。该系统还设有 “参考咨询服务 ,系统根据用户填写的学科信息自动指定一些本学科的参 基于个性化服务的用户需求信息的深层挖掘 考馆员,用户可以与他们进行e - m a i l 交流;此外,还设立了参考咨询服务 台的链接,点击链接进入后,用户可以进行参考咨询活动。同时,该系统已 经将网上的信息资源进行了集成,用户可以飞速地链接到国内外可能包含有 所需资源的图书馆目录、数据库、电子期刊等的主页上。系统还提供了快捷 的学科搜索引擎,方便用户信息查询。 该系统对用户身份认证不采用i p 地址控制,可以扩大系统的用户数 量,满足不同地域用户的信息需求。系统在实际使用中还存在几点不足:首 先,数据库还有待整理和开发,比如在笔者定制了“图书情报学科信息 后,学科信息一栏始终没有内容;其次,参考咨询台中的实时咨询没有开 通;再次,有些链接点击进入后是死链接1 。 2 3 3il a s 系统 i l a s ( i n t e r g r a t e dl i b r a r ya u t o m a t i o ns y s t e m ) 是我国文化部于 1 9 8 8 年作为国家重点科技项目下达,由深圳图书馆承担并组织开发的全套图 书馆自动化集成系统。i l a s i i 网络版中捆绑的个性化服务子系统提供了全 方位的图书馆自动化解决方案。i l a s i i 包括了普通o p a c 、新书通报、信息 查询、期刊篇目查询等,还特别引入了“我的图书馆”,只要从主页先登入 “我的图书馆”,就可进行书目查询、期刊篇目查询、新书通报查询、信息 查询、联合目录查询、馆际互借查询,更新资料等,而且涉及续借等事务时 无须再次登录,只要是该馆读者即可。目前,根据用户的多样性和复杂性, i l a s 推出了5 个版本:大学版、公共版、企业版、小型版、b i g 5 版( 针对 港、澳、台地区推出一套基于b i g 5 的平台中西文版系统) 引。 该系统总体上而言,具有较高的科学性、完整性、开放性和实用性,国 内许多图书馆的个性化信息服务都是以i l a s 系统“我的图书馆”为基础而 开展,比如华南师范大学图书馆、华南农业大学图书馆、安徽师范大学图书 馆、汕头市图书馆等。但i l a s 个性化网络服务子系统与一些优秀的图书馆 个性化信息服务系统相比,i l a s 系统的个性化特征相对要差得多,也没有 进行更深层次的知识挖掘,还停留在文献服务的水平上,并且对于网上资源 的提供基本上是个空白。这样是难以吸引用户的,其个性化服务功能有待于 进一步提高和完善。 2 4 个性化服务中的用户需求信息 网络环境下用户的信息需求日益个性化。网络的自由、开放为人的个性 基丁个性化服务的用户需求信息的深层挖掘 发展提供了广阔的空间,给用户带来了难以想象的信息能力,为用户获取更 多的、更有效的信息资源提供了实现的条件。网络跨越时空的特性使沟通的 障碍和成本大大降低,互动的沟通方式和及时的反馈机制使信息供求双方可 以实现面对面地交流,这使信息服务机构满足用户的个性化的需求成为可 能。 网络信息的供求矛盾使用户的个性化信息需求更加强烈。网上的信息资 源虽然极为丰富,但粗浅、重复的信息泛滥,信息噪声和信息垃圾充斥,与 个人信息需求相关的信息被分散在各地,这使得用户日益置身于信息海洋之 中。一方面,在用户所查询的信息中经常存在大量的冗余信息,即所谓“信 息过载”:另一方面,用户不知道如何贴切地表达自己对网上信息资源的真 正需求,也不知道如何准确有效地搜寻,即所谓的“信息迷向”。用户获取 信息容易,但获取所需要的准确信息难,获得有价值的个性化信息难。因 此,用户的个性化需求日益迫切,用户期望获取针对个人特定需求的信息服 务m 1 。 用户需求在个性化服务中的主要表现有: ( 1 ) 创建适合个人心理和行为的信息环境,构筑个性化网上私人空间。 ( 2 ) 为检索到有针对性地、全面的、准确的信息获取必要的帮助。 ( 3 ) 聚集与个人相关的信息资源。 ( 4 ) 建立与个人信息资料的有机融合。 2 5 用户需求对个性化服务的影响 网络互动的交流方式和及时的反馈机制使信息供求双方可以实现面对面 的交流,这使信息服务机构满足用户的个性化需求成为可能。网络信息服务 的最终目的是为用户提供所需的各种网络信息资源及服务。用户需求信息不 仅决定了信息服务机构的服务内容,而且决定了其服务机制和模式。个性化 信息服务的目的就是满足用户需求,提供信息以解决用户特定环境下的特定 问题,有效的个性化服务必须针对具体用户的问题、环境、心理等特征来实 施。以用户为中心,为用户提供满意的信息服务,这始终是个性化服务的宗 旨。数字图书馆环境下,用户的信息需求日益个性化,引发了信息机构服务 模式的深刻变化,以往的以“信息服务机构为主导”的服务模式正在向“以 用户为中心的服务模式转化1 。个性化信息服务必将成为信息服务的主导 方向,而用户的信息需求又引导着个性化服务的发展趋势。用户需求信息引 9 基于个性化服务的用户需求信息的深层挖掘 导下的个性化服务将呈现出新的发展趋势有: ( 1 ) 针对性趋势。传统信息服务机构“以一适全的服务模式不能有效 地满足用户的个性化信息需求。针对用户特定的信息需求提供帮助正在成为 信息服务的重点。信息服务机构通过高效的、灵敏的交流和反馈机制,对用 户的信息需求准确定位,量身定做为用户提供合适的信息内容和系统服务。 一旦用户当前的需求发生变化,它总是能够及时地捕捉到这一信息并做出相 应的回应。 ( 2 ) 专业化趋势。粗而广的信息在网上很容易得到,但对用户的个性化 需求没有什么帮助。任何用户都是生活在特定的专业和行业背景中,他们需 求的是基于自己的专业的高质量的信息。垂直信息网站的出现和发展正是基 于此,它通过分类组织为用户聚集与专业相关的信息资源,通过深加工为用 户提供高质量的增值信息。 ( 3 ) 精品化趋势。网络环境下,网上的信息资源呈现“爆炸性 的增 长,用户面对的是一个信息冗余的信息环境,他们对获取信息有着很宽的选 择面。网上信息服务机构面临着激烈的竞争,它们已经逐渐意识到,用户对 信息的需求,不在于信息的绝对数量,而在于信息的内在含量,要有其信息 的内在质量保证,因而要实施精品品牌战略,向用户提供价值大的、质量高 的适用信息。 ( 4 ) 主动化趋势。通过用户信息库,对用户个性和需求进行分析,把握 用户定位,调整服务角度和内容,利用先进的网络通讯技术和网上信息资 源,充分采集用户可能感兴趣的信息,不需要用户的及时请求而主动将数据 传送到用户手中,既节省了用户的时间,又提高了用户服务的效率。 ( 5 ) 智能化趋势。由于用户检索经验缺乏、知识的相对不足或网络检索 工具的缺陷,用户检索到的信息往往偏离了自己的真正兴趣和需求。技术的 发展,为用户提供了更低的网上生活门槛。智能代理的发展与应用将为用户 提供更简洁、便捷的用户界面,它可以理解用户用自然语言表达对信息资源 的需求,帮助用户克服信息内容的语言障碍,自动捕捉用户的兴趣和偏好, 推测用户的意图并代替用户完成工作。 l o 基于个性化服务的用户需求信息的深层挖掘 第三章用户需求信息的体现与描述方式 3 1 用户需求信息的体现方式 通常情况下,用户的数据往往很多、包括用户注册的信息、日志信息、 用户的行为数据、页面超链接信息、文本页面内容数据、站点拓扑结构信息 等n5 1 。根据获取的途径以及难易程度,用户需求信息表现为明显信息和隐含 信息两大类。 3 1 1 明显信息 ( 1 ) 注册及定制信息 用户在进行个性化信息服务系统的使用时,需要进行用户信息的基本注 册。这类用户需求信息的优点是获取简单,但也存在一些问题。网络时代的 图书馆在进行个性化信息服务初期,获取用户个人资料时应定制详细的用户 资料保密措施,以获取用户的信任和支持。同时,用户在提交个人资料时, 有时需要填写冗长的表格,这往往会导致一些用户望而却步,或者提供不完 全的,甚至是错误的信息,这就需要图书馆从其他途径获取用户的需求信 息。 ( 2 ) 服务反馈信息 在对用户的提交信息和定制需求有了了解后,图书馆就可以为用户提供 相应的个性化服务。提供完服务并不意味着个性化服务工作的结束,还需用 户对服务结果进行评价,图书馆以此来估测服务中的缺点和不足,并根据评 价来改进图书馆个性化服务过程。与此同时,图书馆能根据用户的这些反馈 信息来推测用户的潜在需求,并对当前错误需求信息进行改正。这种反馈信 息的获取同样存在隐私权保护的问题。在考虑保护用户的隐私权的同时,图 书馆也应考虑怎样才能获得用户的积极配合以顺利开展评估反馈工作。 3 1 2 隐含信息 用户在对图书馆的个性化服务系统使用时,一般是利用网络上的客户端 或服务器( 一般是浏览器) ,点击由程序或脚本语言编写的可执行命令,对 安装于操作系统上的数据库进行操作。w e b 服务器具有完整的l o g 日志机 构,当用户访问w e b 站点时,与访问相关的页面,时间,用户i d 等信息, 日志中都作了相应的记录,这些日志数据通常以文本文件的形式存储在服务 器上。例如,大多数访问的用户都会对自己感兴趣的某些书籍进行查询。这 些查询信息就通过登记信息连接到服务器的访问日志上。分析这些w e b 访问 基于个性化服务的用户需求信息的深层挖掘 记录中用户的隐藏需求信息,会从另外的角度获取用户潜在需求。这些信息 主要包括: ( 1 ) 用户浏览的内容:包括用户访问的页面、用户的邮件、用户输入 的检索词等。 ( 2 ) 用户浏览的行为:包括用户在每个页面上驻留的时间、对每个页 面进行的操作( 如下载、保存、打印页面、将页面存入b o o k m a r k ) 、对鼠标 和键盘的操作等。 ( 3 ) 收藏:用户从推荐列表中选择一些资源保存到我的收藏夹中。 ( 4 ) 下载:用户把推荐资源的全文下载到本地。 ( 5 ) 查询:当被推荐的资源不足以满足用户需要时,通过用户提交的查 询检索文献。 ( 6 ) 浏览:记录用户进入页面的起始时间和离开时间。 ( 7 ) 查询:用户可以借助系统的检索功能获得资源,这些查询信息 ( 用户标识、查询概念、关键词、时间) 被保存下来作为用户潜在兴趣的一 部分。 ( 8 ) 服务器日志:用户对网站的访问会被服务器记录下来,包括用户 的i p 、访问时间、用户所在的时区、访问的页面、页面的大小等信息。服务 器日志可分为代理服务器日志和网站服务器日志。代理服务器日志记录用户 对所有网站的访问,网站服务器日志只记录用户对某个网站的访问。 3 2 用户需求信息的描述方式 用户需求的描述方式主要可以分为三类:基于评分的表示( r a t i n g b a s e d ) 、基于内容的表示( c o n t e n db a s e d ) 和基于知识的表示( k n o w l e d g e b a s e d ) n 6 1 7 1 。基于评分的表示保存用户对资源项的评分信息,没有对评价 的资源进行“泛化”表示,在使用上,主要利用用户评价和统计方法在当前 用户和其他用户之间建立关系进行协同推荐。基于内容的方式保存用户需求 的内容,是用户对个性化需求的一种“凝聚与“泛化表示,这样可以用 和资源内容的匹配进行推荐。基于知识的方式通过向用户提问问题和与用户 交谈来获取用户的需求,用户模型中有用户声明的知识库中的事实,从中可 以获取用户的需求和模式。 3 2 1 基于评分的表示 基于评分的表示通常应用于协同过滤系统,这种方法无须考虑资源的内 1 2 基于个性化服务的用户需求信息的深层挖掘 容特征,用户的兴趣表示为资源评分项的列表,资源项的评分表示用户对该 项资源的需求度。用户对资源的评分通过用户对资源的相关反馈获取。 3 2 2 基于内容的表示 如资源的描述方式,基于内容的用户需求表示方式通常应用于文本领 域。具体的表示方法有: ( 1 ) 加权关键词向量表示方式:加权关键词向量是基于内容的过滤系统常 用的用户需求表示方式。关键词的权重可以是“0 ”或“1 ,表示文档中是 否存在该关键词n8 1 ;也可以通过其它的权重计算方式获取。在新闻过滤系统 n e w s w e e d e r n 9 1 、s i f t 1 、智能导航软件w e b w a t c h e r 2 、f a b 的早期版本m 1 中 利用了加权关键词向量表示用户兴趣。 ( 2 ) 正反二类表示:在一些系统中,用户的需求通过正反两个类表示。正 向通过用户评价为感兴趣文档向量的集合表示,反向类通过用户评价为不需 要文档词频向量的集合表示。正反类的表示适宜采用多种机器学习方式来得 到用户的兴趣。 ( 3 ) 多类别p r o f i l e 表示:p r o f i l e 的表示方式是采用多类别表示用户的 多个领域的需求,而不仅仅是简单的需求类和不需求类。用户需求采用多个 加权关键词向量表示,每个向量对应一个用户的需求类,需求类别之间是独 立的;采用领域o n t o l o g y 来表示用户的需求,用户需求和o n t o l o g y 中的 类别概念关联,每个概念采用一个关键词向量表示瞳“2 副。这里o n t o l o g y 本 质上是一个领域分类体系,它使用户需求类之间建立了特化、泛化然后再更 新用户p r o f i l e 中相应类别的需求度。p r o f i l e 的多类别表示要比二类表示 复杂。首先,采用多类别降低了每个类中的样本数,这样也就降低了采用的 机器学习算法的精确度。另外,由于类在用户之间是共享的,与二类表示相 比,会丢掉用户的某些信息。因为二类信息中,每个用户都有自己的样本 集。目前,只有很少的系统采用多类表示乜刨。 3 2 3 基于知识的表示 基于知识的用户模型表示常用于自适应超媒体与个性化教学领域。在建 模型之前,这种方法通过向用户提问问题和与用户交谈来获取用户的需求。 模型有用户声明的知识库中的事实,从中可以获取用户的需求和模式。 k o b s a 幢 对此做了详细的介绍。 在使用性教育超媒体系统中,知识状态是用户模型中重点描述的对象, 基于个性化服务的用户需求信息的深层挖掘 通常是采用覆盖模型( o v e r l a ym o d e l ) ,即在领域知识模型中的每个概念 上附加一个权值来表示用户对该概念的掌握程度。因此,用户模型是序偶对 ( c o n c e p t v a l u e ) 的集合,其中c o n c e p t 代表概念,v a l u e 是一个代表掌握 程度的值,一般地,v a l u e 可以是一个二进制值( 知道、不知道) ,或定性 描述( 好、一般、差) 或统计值( 0 1 0 0 ) ,在一些系统中,可能有多个因 素来描述一个概念,如阅读情况、练习得分情况、或能从其它概念可以推算 出对该概念的掌握情况,综合这些因素,得出该概念的整体分值。 另外还有一种简单的描述用户知识状态的模型,叫做铅版模型 ( s t e r e o t y p em o d e l ) 。它实际上是一个组用户模型,将用户分为几组。这 种方法通过向用户提问问题或与用户交谈来获取用户的需求。模型有用户声 明的知识库中的事实,从中可以获取用户的需求和模式。例如,某系统对用 户进行分类,有两个维度,一个维度有“新手”、“初学者”、“中级”、 “高级 4 个值,另外一个维度有“掌握初步计算机基础知识”、 “懂 u n i x 两个值,这样就将用户分成了8 种不同的类型,铅版模型同样可以用 序偶对( s t e r e o t y p e v a l u e ) 来表示。铅版模型比较简单,容易实现,但是 适应的力度不够细。一般将覆盖模型和铅版模型结合起来,铅版模型用来对 覆盖模型赋初值,在系统运行过程中利用覆盖模型来表现出对用户的适应。 1 4 基于个性化服务的用户需求信息的深层挖掘 第四章用户需求信息的获取方式 4 1 数据库统计 图书馆个性化服务系统需建立本地用户数据库,用来存储用户个人信息 以及用户满意并需要保存的个性化信息,这些信息按主题存放。这样,搜索 起来的效率很高。在本地信息库中存储文档的元数据( m e t a - d a t a ) ,( 如 u r l ,作者,标题,日期,关键字,摘要,有效期等) 以及存储该文档的用户 i d 和个人资料( 如用户姓名,住址,电子邮件地址,职业,收入,爱好,需 求方向等) 。 用户数据库中的这些信息的分析可由集成系统的查询和统计来实现,以 此来得出用户的需求信息并记录在案,以备以后继续使用。如:读者增长量 分析,读者数量动态分析,读者成分分析,读者借阅量分析,高利用率图书 列表等等。通过这一张张的数据报表和对数据报表的综合分析,图书馆人员 可轻松获得用户需求或用户需求倾向的信息1 。 4 2w e b 数据挖掘 w e b 数据挖掘( w e bd a t am i n i n g ) ,简称w e b 挖掘,是从与w w w 相关的 资源和用户浏
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年甘肃秦融文化传媒有限公司招聘10人考前自测高频考点模拟试题及参考答案详解1套
- 2025年合肥师范学院辅导员招聘32人考前自测高频考点模拟试题及答案详解(名校卷)
- 2025年吉林省特岗教师招聘考试职位表模拟试卷附答案详解(典型题)
- 2025年深圳市烟草专卖局(公司)招聘(22人)模拟试卷及答案详解(全优)
- 2025江苏海晟控股集团有限公司下属子公司招聘第一批任务型合同制员工人员考前自测高频考点模拟试题附答案详解(模拟题)
- 2025广西百色干部学院公开招聘教研人员3人考前自测高频考点模拟试题有完整答案详解
- 2025黑龙江大庆市萨尔图区市场监督管理局招聘1人考前自测高频考点模拟试题附答案详解(黄金题型)
- 2025年4月贵州黔南州福泉市招聘城镇公益性岗位4人考前自测高频考点模拟试题及1套完整答案详解
- 2025湖南省邵阳学院公开招聘事业编制人员22人模拟试卷参考答案详解
- DB12T 418-2010 杨树速生丰产栽培技术规程
- 生物试剂库存管理办法
- 海上风电场安全监测技术的现状与未来发展趋势
- 渠道考试题及答案
- QC/T 983-2025汽车变速器总成清洁度检测方法
- 村级财务业务知识培训课件
- 美术基础 课件全套 第1-5章 美术简介 -中国民间美术
- 2025年青少年法制知识竞赛题库
- 2025年《临床输血技术规范》
- 《中职工程测量技术专业《GNSS测量技术与应用》课程标准》
- 公安部门大数据管理办法
- 骨科患者围手术期营养管理
评论
0/150
提交评论