基于用户情景感知的动态兴趣模型及其应用.doc_第1页
基于用户情景感知的动态兴趣模型及其应用.doc_第2页
基于用户情景感知的动态兴趣模型及其应用.doc_第3页
基于用户情景感知的动态兴趣模型及其应用.doc_第4页
基于用户情景感知的动态兴趣模型及其应用.doc_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号士学位论文硕基于用户情景感知的动态羞垫 、蝴篜 华中师范大学学位论文原创性声明和使用授权说明学位论文版权使用授权书学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。艿难宦畚脑诮饷芎笞袷卮斯娑作者签名:玛良 关键词:情景感知,兴趣模型,情景兴趣,偏好漂移,书目推荐 琣 瑃 ,瓸 目谛说耐萍觥自定义兴趣模型 验证方法全文总结研究展望参考文献一攻读硕士学位期间的成果一致谢一 研究背景及意义 研究现状 会议上,讨论了怎样用情景信息来提升信息检索情景感知推荐系统的提出要稍晚于推荐和情景感知的提出,是由 并根据用户反馈对该模型实时更结合适当的推荐算法,并将其运本文第五章是根据之前建立的实时兴趣模型,用到图书馆推荐系统之中。 将情景一词定义为个人层、项目层鹤椴和组织层等多个不同的层次结构。从这些结构的角度出发,每一个层次中的情景都有其不同的代表价值。在个人层中,情景包含了个体当前的活动信息,比如他们什么时间在什么地方,他们读哪些文档,他们读该文档时和谁在一起。这些信息是个性化的,是该用户独有环境下做出的反应行为,与协作组以外的人无关。在项目层面,情景包括项目的最后期限以及与项目合作伙伴的所有信息。在群组层,情境和日常活动的关系较弱,但值得关注的是整体性、全局性和长期性。在组织层,情景不仅从战略层面上考虑,也会关注其他群组的相关活动。文献刚是从行为时间的侧面对情景进行理解,将情景定义为确定应用行为或应用事件按用户要求发生的环境状态和设置的。獽蟡蝌刀等在这一基础上把情景的定义做了进一步扩充,将其表述为可以对一个实体的态势特征化的信息。定义中所涉及到的实体在这里是指人、地方或者是真实存在的一个客体。还有的文献对如何表示和识别情景做了一定的理论推断,他们认为:情景描述的是一种状态或者是一个场景,而每一个场景都是独一无二的,只能用一种符号来对其进行标示,这组标识的符号就是这个情景的一组特征值向量。因此,每个不同的情景,都可以用一组不同的特征值想来对其进行描述,每个情景也是确定的、唯一的,无论该场景是隐式的还是显式 琾,”产品或是体验服务的。但是如果通过实地研究来考察用户的使用情景,一方面是所采集的数据不够全面,另一方面海华话费较高的成本。通过运用情景感知计算,可以直接获取到用户周边环境信息,尤其是对移动设备来说,手机传感能达到较高的精度,也能够进行主动的实时信息推送服务。不仅如此,还能自适应地随时调节,就像手机中的情景模式自动调节一样,传感器感应到你在户外,就自动开启户外模式,感应到你的手已经将电话拿起来,就自动降低音量,更换模式。这方便了用户的使用,也提升了用户的使用感受。来说有一定的便利性,可以用于发现情景并且使用情景。例如时间信息、设备信息、 ,瑃琫琫层面来理解。,指的是根据情景的榫盎畔噶景信息能产生不同的结果;项目以来,情景感知和情景感知系统的研究工作已经开 在获取情景信息的时候,信息来源于普适环境中的硬件传输,而传输过来的信息可能有多种信息源,因此存在来源的异构性。举个简单的例子,在获取用户身份信息的时候,信息来源有可能是直接由定位而来,也可能是有指纹输入获取的,还有可能是从硬件设备的登录信息中得到的。因此,情景信息源的异构性造成了系统间的信息传输困难,使得信息不能具备通用性。 与基于协同过滤的推荐不同,基于内容的也是较为常见的推荐算法,它的原理是根据项目本身的文字内容,通过研究信息项与用户兴趣项之间的关系来预测用户感兴趣的内容,而不是周边人或者同类人的选择来左右自己的决定。例如,书籍推荐系统可以根据读者借阅的书籍信息和这些信息里的内容向用户推荐与这些已有内容相似的书籍信息。使用基于内容的推荐需要对信息过滤和信息检索有一定的认识,因为这种推荐算法具有一定的专业性,需要对内容的提取达到相对精确的标准才能进行推荐,而不是靠与自己相似人群的经验来实施推荐。对于基于内容的推荐系统来说,已有信息的关键词识别很重要,关键词识别得准确,所推荐的信息也就越准确。 情景分类技术在计算机智能的高速发展下也有了巨大的变化,等; 除了根据实体来划分情景之外,情景也可以按级别分为初级情景和高级情景。初级情景主要是指一些比较容易获取到的情景信息。例如,位置,时间,光线等客观存在并且可以易于表示的信息。而高级情景相对而言更难表露出来让计算机知道。例如,周围的人物,自身的情绪,用户的情感等。机器很难去捕捉到这类信息,就算捕捉到了也很难分析和表达。 我们筛选掉已经关门的餐厅;宽带网络就是要清楚表述应用需要哪些情景,这也算是 情景的应用过程情景表示会随着情景模型的不同而不同。表示情景时,一般不会直接使用没有经过处理和解释的信息。例如,对于温度的诠释,我们也许需要的并不是直接的温度信息,而是根据温度的高低来判断今天要不要穿裙子,或者能不能去游泳,因此,需要设计一些情景信息的转换工具来实现信息的转换,从而得到更直接的表示。用户情景的表示可以使用多元数组来表示,每一个数据项都有唯一的标识与其对应。例如:琭,瑃通过对多个维度情景的获取来表示一个情景量,在该情景量中可以用不同的数据类型分别表示。例如,在华中师在获取信息的过程中我们可能会得到与应用目的无关或是关系不大的一类信息,但是这类信息在我们还未进行情景数据收集时,我们并不能判断它是否起作用。有些情景经过一段时间获取后发现是恒定不变的,例如,温度信息,在一段时间内温度变化不大时,对于温度信息的获取只需要一个恒定值就可以了,因此,只用记录一个,多余的信息就要利用情景筛选技术过滤掉。 过程称为情景应用 。经过以上步骤,我们便关情景信息这是一个迭代过程。,目的是只选和应用相关的情景信息。情景选择也最后是情景的协调和应用。情景协调是通过执行不同的命令来实现情景操作的一致性。这样做是为了能将所有的情景协调应用于推荐操作中。情景应用就是对情景信息的使用方式,其中包括主动情景感知和被动情景感知。主动感知也就是应用改变行为自动适应发现的情景;被动情景感知,即应用向感兴趣的用户呈现新状态。 本文将用户的实时兴趣总的分为三大类:标签兴趣项、行为兴趣项和情景兴趣项。标签兴趣项,其实就是所谓的显式兴趣。这类兴趣一般都是通过用户自定义的方式获取。这是最直接能够了解用户兴趣的途径。但是这类获取方式同时存在一定的问题,以为并不是所有用户都能真正知道自己的兴趣点在哪个方向,就如同他们在进行信息检索的时候不能准确的输入关键词一样。所以并不能完全依靠用户自身提供的信息,大部分的用户兴趣还是在用户行为中展现出来的。这部分兴趣是从浏览数据中挖掘出来的,有较高的可靠性,可是容易变动。同时,这两大类兴趣都没有与用户的实时环境相结合。用户情境的变化会随时影响他们的决定,也是用户实时兴趣模型中不可或缺的一部分。本章在结合显式和隐式兴趣的同时也添加了用户情景的感知,通过对用户情景项目的获取得到情景兴趣项,从而还原了用户真实兴趣,使推荐结果更加准确。模型建立流程图如图所示:图实时兴趣模型结构流程图 自定义兴趣模型荐方向上少有提及。因为标签实际上是一种线索,一种结合了用户情感,能反映用户的事实情景,表达用户的兴趣的线索。用户的所有兴趣都需要通过一个载体以计算机能理解、识别的方式的明确的体现出来,无论是长期兴趣还是情景兴趣。只有兴趣标签能在大量的数据中搜寻到用户所感兴趣的内容提供重要帮助,并且它还能不断提高用户所需的个性化服务质量。通过对标签数据的全面理解,兴趣标签有三大特征: 是在向量空间表示法的基 狪,、,苩嗡土该计算式中硎咎卣飨钤谖谋綝械娜兀琋为训练集中总的文档数,是训练集中出现的特征项屯的文档数。 用户的兴趣是变化的,随着时间的推移,兴趣也会慢慢发生偏移,也许这种潜意识的兴趣是你以前完全没有觉察到的。因为每个用户都有其差异性,此刻的兴趣不能代表你永久的兴趣。就像河中的流水,每个时刻都在变化。这种变化虽然并不是我们能完全捕捉的,可是用户每一时间的行为也一样是在变化的。这种行为上的变化,反应到兴趣模型中就是用户兴趣变化的一种趋势。用户的浏览行为包括打开过哪些网页,在网页停留了多久。这些显著的行为特征,都是为我们预测用户下一刻的兴趣提供依据。在分析用户浏览行为时,我们需要关注的几个种因素是:保存下载页面、打印页面、收藏页面、页面访问次数、页面停留时间,这五个主要行为点构成了预测用户兴趣度的最小浏览行为组合畸。例如:用户频繁下载某明星的海报照片,可以说明,该用户对这一明星有显著兴趣,可以以此为推荐依据。在众多的间接行为中,用户在页面的停留时间可以间接的反应其他典型的间接行为。可是要注意的是,在识别停留时间数据时,要对造成干扰的噪声数据进行处理。 用户行为除了保存、打印、收藏外就是页面访问次数和页面停留时间了,这两 每次记录的历史情景信息可以表示为集合:当用户进行一段时间的浏览行为之后,记录下该次的情景信息并计算出当前行为情景与历史行为情景的相似度。情景相似度的计算公式如 用户实时兴趣计算用加权平均的方法来计算其在实时兴趣模型中的权重: 情况下用户自定义的标签可能有,也可能用户并没有为自己定义任何标签,因此,用户会随着时间的推移和技术更新改变自己的兴趣,有的兴趣会消失淡化,有的兴趣会新生萌发,就像万事万物的生长和衰老一样。兴趣的转变是漫长的过程,不仅仅是要对模型进行维护,也要定期对其进行更新,这就需要随着用户兴趣的不断变化而进行调整。一个成功的兴趣模型特别是在建立初期是需要不断调整和完善的。这种调整可以是系统的自我调整,也可以是根据用户自己的选择手动调整。我们在模型中把用户自己输入或者说是自己给自己定义的标签称之为自定义兴趣模型。这种标签表示的是用户的固定属性,所以也可以称之为稳定的兴趣模型。因此,一般情况下这种兴趣是不会消失的,只是会随着时间和新事物的兴起而变淡,使人对旧事物的兴趣降低。就像人的大脑一样,我们也有一个记忆的时效性,我们要对有用但是没有标注的信息定期添加,把没用的标签也要及时删除,以免造成数据的冗余。人的这种行为是一种符合自然规律的过程的。在经历一段比较长的时间后,人们逐渐失去对新鲜兴趣的关注度,导致对其的兴趣度也逐渐降低,最终到达某一固定值,只有当用户经过某种刺激的情况下,重新开始关注该事物时,它的兴趣度 由于自定义兴趣模型、行为兴趣模型和情景兴趣模型这三者的性质不同,所以它们结合产生的实时用户兴趣模型的更新,需要对它们分别更新然后再组合起来。 情景对读者的影响,这里只考虑两个主要的因素:时间和地点。因为对于借阅行为而言,时间情景和地点情景是主要影响因素。比如说在时间这个情景维度上,学期刚开始学生可能会关注一些自己真正感兴趣的东西,这时的浏览和借阅行为一般会比较少,并且更具有多样性。而在学期末可能就更有针对性一些,只对考试或者专业相关的数目感兴趣。针对地点而言,移动图书馆本来就是在一个动态的地点情景下进行的,因此,获取位置信息是必然的。例如在馆内,每一层楼都分别有不同的馆藏文献,可以根据楼层信息来判断用户兴趣偏好。 圆圆圃圆圆圃 能说明用户的兴趣之间的线性相关性,则可以计算出该用户对任意一个项目的兴趣 为了检验该模型算法的使用效果,本节从数据的查全率来考察该模标签数 全文总结首先,本文详细介绍了情景感知技术的发展和应用,以及各种推荐算法的实现。目前个性化推荐领域发展的现状是,混合推荐算法逐步发展成熟。各界学者在总结算法不足的同时,对于算法的运算速度和计算精度逐步改进,将各类算法的优势发挥出来。随着商家越来越重视用户感受,开始从各方面引入情景和情景感知的概念,希望能从用户的角度出发,提升满意度。研究展望 用户行为之间的一些内在联系。 【吭玻榫案兄W允视和际楣莞鲂曰裥路较蛩模际榍楸鳎:【柯砜危莆模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论