个性化用户兴趣模型的研究_第1页
个性化用户兴趣模型的研究_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 论文发表专家一 越中国学木卿刊网 个性化用户兴趣模型的研究 摘要:随着人们对信息获取手段和效率提出越来越高的要求,传 统互联网的服务模式正在逐渐向主动式、个性化、高效率的转变。 个性化服务技术的出现在一定程度上解决了 in ter net中信息海量 增长与用户获取信息手段相对简单之间的矛盾。用户兴趣建模技术 作为个性化服务的核心问题, 主要研究如何有效地进行用户兴趣的 表示、 更新、 存储以及计算。 关键词:个性化;用户模型;数据挖掘 用户模型的应用领域是广泛的,在信息检索过程中引入用户模 型,有利于实现自适应检索,既提供一种个性化智能化的信息检索 服务。通过对用户检索行为历史中的记录和学习

2、,可对用户检索提 问分析得更为准确,这实质上就是提高检索结果与用户需求之间的 相关性,通过提高用户相关度来提高用户的满意度。同时,用户模 型有助于预期定位用户的需求,进行主动服务。 用户兴趣模型的定义为:用户兴趣模型是用来捕获用户需求及其 兴趣点,并记录、管理用户兴趣,描述用户潜在的兴趣及需求的模 型。 1.2研究现状 早期用户模型主要是用在自适应人机界面(adaptive huma n computer in terface) ,同时也是信息过滤(i nformatio n filteri ng) 机制研究的一个核心问题。用户界面是直接与用户交互的接口,通 过与用户的交互,接收用户的行为,积

3、累用户处理事务的经验,以 医一论文发袤专家一 J中国黠斛网中国黠斛网 fwww.qikanwang. nel 应对用户出现的新的动作。用户模型是用于存储和管理用户行为历 史,存储学习用户行为的知识和进行相关推导的知识功能的集合。 信息过滤是研究的是面向个体进行信息过滤筛选,它关注用户的长 线需求(在一段时间内为固定不变的需求),提供与其相关的信息。 用户描述文件还没有一个统一的标准,如 w3c()有 两个涉及用户描述文件的标准: pics(platform for in ternet content selecti on) 禾口 appel1.0(a p3pprefere

4、 nee excha nge Ian guage 1.0),pics 是父母和老师用来控制孩子的浏览能力的, 提供了过滤规则定义语言 picsrules.appel1.0 可定义用户感兴 趣的站点和过滤规则,这些规则大部分是在 picsrules 的基础上 发展起来的。此外,netscape,firefly 和verisign 曾向w3c的 p3p(platform for privacy prefere nces) 工作组提交了一个 ops(open profiling standard) 草案,由于目前 p3p 版本不打算 考虑如何进行数据传输,因此该草案被搁置一边, ops描述了如何 表

5、示一个用户描述文件以及用户与 web站点交互的问题。文件可以 用文件来组织,也可以用关系数据库或其它数据库来组织。目前有 一些系统采用基于 xml 的 rdf(resource definition framework) 来表达用户描述文件,并利用支持 xml的数据库系统来存储用户 描述文件。这样,不仅利用了 xml的优点,也保持了系统的性能 表1从用户描述文件创建的数据源和表达方式比较了几个典型的个 性化服务系统。 1.3存在的问题 论文发表专家一 J中国学木期刊网 %ww .q i kanwang Pnei 通过大量的调研学习发现:首先,目前大多数个性化系统的用户 兴趣模型都是基于内容进行

6、用户兴趣挖掘的,偏重于用户浏览内容 的学习和研究,而对用户行为的分析研究尚不充分,未能有效地利 用用户行为来发现用户兴趣及过滤噪音。由此所构建的用户兴趣模 型的客观性和准确性都受到了限制。其次,用户及文档特征的表示 方法单一,通常将文档或用户当作一个“整体”进行描述,这样的 特征表示方法缺乏层次性,表示粒度有限,难以真正体现“个性化” 的初衷。再次,用户兴趣模型学习过程中所用的训练文档都被假设 为用户“兴趣文档”,没有对其中的“非兴趣文档”加以区分,因 此引入了许多个性化系统自身系统框架及算法难以过滤掉的噪音。 表1典型的个性化服务系统的用户描述文件对比 个性化服务系统数据源用户描述文件的表示方式 broadvisi on用 户注意信息用户静态的信息表示,显示创建 perso nal web watcher文档页面之间的超链接信息基于加权关键词矢量表示, 隐式创建syskill & webert 用户显式反馈的信息基于加权关键词 矢量表示,隐式创建letizia 用户浏览页面的行为和馈信息基于加 权关键词矢量表示,隐式创建citeseer用户浏览面页行为和反馈 信息一个文件集合表示,显式或者隐式创建 ifweb用户反馈的信息 基于加权语义网表示,显式创建pva用户浏览日志信息一种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论