一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统_第1页
一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统_第2页
一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统_第3页
一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统_第4页
一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 一种融合了基于朴素贝叶斯算法与情境感知的协同推荐系统 程秀峰 范晓莹 杨金庆Summary:目的/意义将情境感知技术引入图书馆以提高服务的智能化,已成为数字图书馆的发展趋势之一。为了提高情境感知模型中推荐结果的准确度。方法/过程本文研究并提出了一种融合了朴素贝叶斯算法与情景感知功能的协同推荐模型,并通过实验对推荐效果进行了评估。具体为:首先,获取用户的当前任务和情景信息,同时提取历史信息库用户的行为偏好;其次基于属性加权贝叶斯算法计算用户的行为相似度,继而进行协同推荐;通过计算目标情景中所有情景属性对所推荐资源的影响的权值,对协同推荐所得评分进行加权处理,形成最终的预测预测;最后通过实验对模

2、型进行检验。结果/结论结果表明:使用该模型得出的推荐结果优于传统的協同推荐结果。因此该模型能够更好地为为个性化信息服务提供支持。Key:情景感知;朴素贝叶斯;协同推荐;图书馆DOI:10.3969/j.issn.1008-0821.2019.02.007TP391A1008-0821(2019)03-0057-09随着互联网技术的日益发展,知识库中的信息量呈指数增长,用户的专业性知识需求随之增加,简单的非语义化搜索引擎已经很难捕捉、定位到用户真实需求。作为知识存储、组织与利用重要机构的图书馆,其自身拥有的个性化服务虽能在表面上满足大多数用户需求,但在深层需求挖掘与感知上,仍然表现出诸多不足,具

3、体表现为:1)情境适用性差。虽然查询系统十分方便,但仍不能获取用户潜在需求;2)推荐结果不够精确。即使能通过网络信息显式获取用户需求,但可用性和可靠性仍不理想;3)资源匹配自适应性低。当用户的信息需求不具有很强目的性,或无法准确被描述时,系统很难根据画像推出用户可能感兴趣的信息。针对以上问题,基于情境感知技术的推荐系统能够很好地解决图书馆目前面临的困境。个性化推荐能够针对用户的兴趣点进行推荐,可以更好地满足用户的需求。情境感知技术具有探测用户潜在需求与感知性描述用户情境的功能,从而使得具有这种功能的推荐系统能够有效感知处于不同位置、不同时间和不同状态下的用户需求1。两者相结合的新型推荐系统将是

4、一个解决数字图书馆目前面临问题的有效方案。本文将利用基于属性加权的朴素贝叶斯算法的情景化用户资源类别偏好学习以及融合该类别偏好的协同过滤个性化信息推荐,通过加入情境感知算法,即对不同影响力的情境因素赋予权重来提高传统协同过滤算法的准确度,从而为读者在不同情景因素下提供更加准确地推荐服务。1相关研究情景,是指用来描述实体情形和特征的任何信息2,利用情景向用户提供相关信息服务的过程就是情境感知服务3。引入情景和情景感知能使推荐系统能够具有“个性化”和“普适计算”的优势,进一步提高个性化服务的精准度和用户满意度4,这引起了学者的普遍关注。Kim J等将情境感知与个性化推荐用个性化健康服务系统中,他们

5、将提出的情境感知模型应用于协同过滤过程中的用户偏好缺失值提取上,实现了协同过滤与情境感知的结合5。Kown O等创建的NAMA原型系统通过用户情境、用户描述等信息来发现用户的信息需求,从而为电子商务购买者提供个性化信息6。Mylonas P等分析了用户的历史情景和当前情景的表示,并对不确定环境下的模糊情景(如用户注意力和愿望等)展开了研究,认为情景是提升个性化信息服务质量的有效手段7。李晟建立用户观影的情景模型,将用户观影情境因素应用到现有的推荐系统中,提升电影推荐的用户满意度8。对于图书馆来说,情景感知作为普适计算的核心技术之一,能够利用传感器使软件根据使用地点、服务器、相关用户、周边设备等

6、变化而调整自身状态,以达到支持用户随时随地获取符合个性化需求的信息的目的9。Lee提出通过提供图书状态信息、内容信息、电子书是否可借阅等实现情感感知在图书馆中的应用10。Aittola M等提出将情境感知与导航系统相结合,从而读者在图书馆中可通过手持PDA设备获取位置感知服务,根据有关书籍的地图向导迅速找到所需图书等11。对于图书馆的使用者来说,图书馆最主要的用途是为其提供所需要查阅或浏览的书籍。当用户无法明确描述自己的需求时,就需要系统为其提供合适的内容推送。结合情景感知的推荐系统相较于传统推荐系统能够更加动态、主动地察觉用户的潜在需求,从而为用户推荐恰当、符合当前场景的内容,如何将情境感知

7、与图书馆个性化服务结合起来。张剑等集成情景感知的图书馆服务体系框架,将图书馆的管理及信息服务与情境感知技术相结合,通过用户的信息和定位为用户提供服务12。黄传慧将情境感知理论应用于图书馆学术信息推荐系统,并提出基于情境感知目标用户资源协同驱动推荐模型,采用隐式获取用户情景偏好信息的方式,结合协同过滤为学术用户提供科研方面的推荐13。洪亮等基于移动数字图书馆的特性,提出了一种WSSQ算法构建用户信任网络,由此给出改进的情境感知推荐方法,并将情景作为参数纳入用户信任度、相似度的计算中,以体现情景对用户选择的影响14。综上所述,图书馆作为一个知识信息中心,必须要适应新技术的变化,将情景因素考虑到个性

8、化推荐中,才能满足用户的不同需求。目前的情境感知推荐系统中,存在的主要问题有构建的模型无法用于现实、推荐内容与用户实际需求匹配度较低等问题。一方面是因为提出的模型太过于理想化,偏向于静态、稳定的环境,而现实图书馆的推荐系统需要面对的是一个动态、变化的环境;另一方面则是没有考虑到在一个情景中不同的情景属性对用户选择影响是不同的。基于此,本文提出对判断在某一场景下用户选择某类资源的概率的朴素贝叶斯算法进行属性加权的想法,通过计算特定场景中不同情景属性对用户选择该类资源影响程度的大小,使得朴素贝叶斯算法的概率计算更加精确,从而适应在动态的环境中的推荐。2图书馆情景感知自适应个性化服务的应用模式在传统

9、的信息交流体系中,图书馆是传播科学知识和提供知识服务的重要角色。但随着数字资源和信息技术的发展,用户获取和使用信息的方式也相应发生了变化,图书馆若要避免自己信息服务中心的地位发生变化,就必须寻找并精确地满足用户变化的信息需求。因此,如何将基于情景的推荐系统与图书馆个性化服务结合,实现图书馆信息服务的可持续发展,受到了许多学者的关注。现有图书馆的个性化推荐主要考虑用户和资源或用户和服务两个方面的因素,而基于情景感知的个性化推荐在尝试通过用户的需求和服务情景生成精准度更高的推荐,由于科技水平等方面的限制,还无法完全智能化的捕获情景信息,实现全面、准确的推荐还存在困难。Mighali V等提出的“物

10、联网情境感知服务模型”,通过可捕捉和处理用户观察内容的穿戴设备,将用户的情景信息发送至可与设备交互的处理中心15。张帅等提出的“基于情境感知的高校移动图书馆个性化推荐模型”,采用向量空间模型表示方法和智能信息处理技术,并通过对环境变化和已有情景信息的挖掘实现对用户个性化信息推荐服务16。周玲元等提出了一种“智慧图书馆”情境感知服务模式,通过情景感知技术构建“智慧图书馆服务平台”,实现图书馆实体与线上移动设备融合的个性化服务17。因此,如何将情景信息,尤其时间信息,融入多维关系模型,是我们在构建模型时重点讨论的问题。在我们的推荐系统中,用户直接接触和接受反馈的是图书馆在每个楼层中提供的图书查询机

11、。查询机中的系统完成的两个主要任务:通过定位和系统自带程序收集用户此时的情景信息及需求信息,其中位置信息由查询机中的定位系统采集,时间信息由系统的时间系统获取,需求信息(包括阅读目的和类别)由用户输入的内容和查询时类别选项的勾选进行判断。将结果发送至推荐系统,然后由负责分析情景加权和协同推荐的功能完成搜索结果的推荐并将结果反馈给查询机的系统终端。由图1可知,“数字图书馆服务推荐模型”的基本服务过程可划分为图书馆服务平台、情景数据获取层、情景数据分析层和智能推荐层4个模块。读者通过数字图书馆系统终端进入并使用图书馆时,推荐系统的数据采集层将会自动获取用户的当前任务和情景信息,如用户的位置、使用时

12、间、阅读目的和目标图书类别,并将所获得的数据进行处理,以便根据用户历史信息库中存储的用户偏好和情景信息和用户浏览或检索的Key,合并生成相应的情景信息模型。在情景数据分析层,数字图书馆平台根据其他读者在相同情境下对资源的需求,计算出基于协同过滤的用户相似度,找到与目标读者相似的邻居读者,向目标读者生成推荐信息候选集。最后,智能推荐层通过计算该情景中所有情景属性对所推荐资源的影响的权值,综合得到用户此时的情景化信息需求,生成最优的个性化推荐信息列表推送给用户。用户根据推荐结果进行浏览并反馈,数字图书馆系統将用户反馈和获取到的当前情景信息录入用户历史信息库,将系统推荐给读者的资源录入情景信息库和基

13、本信息库,为以后系统进行相同推荐提供数据和便利。3基于属性加权朴素贝叶斯算法的个性化图书馆服务推荐模型传统的情景感知信息推荐模型是基于“所有的情景属性对于信息推荐所起的作用是相同的”这一背景所进行推荐,即这些推荐方法假定在任何情境下,不同情景因素对信息影响的权重值相同18,属于静态、封闭环境中的推荐方法。在实际生活中,读者对相同的情境信息中的不同情景因素通常有不同的偏好,有些情景因素比其他情景更能改变用户的最终选择。有学者将同一读者对于不同情境发生变化的感知能力的不同称之为“情境感知度”19,即有些情景只是发生细微的变化,读者对同一资源的兴趣程度就会发生明显的改变;而有些情境虽然发生较大的变化

14、,但读者对该资源的图1图书馆情景感知个性化服务的应用模式兴趣程度仍然保持不变。按照这一理念,我们将读者对不同情境的不同感受定义为“情境感受性”,它反映了情景变化对读者兴趣变化的影响程度。例如,对于推荐的娱乐类书籍,在“时间”情景因素下,用户可能更倾向于在周末的非工作时间的情景属性中选择娱乐类书籍;而在“完成论文”这个情景属性下,用户更可能在工作时间选择科研类的书籍,以此获得更多有用的信息。为了确定不同环境因素对信息推荐所产生的不同影响,本文提出了“基于属性加权朴素贝叶斯算法的协同推荐模型”来度量用户的情境感知性。由于环境中情境属性之间彼此的相关性较小,即用户查阅时间的不同并不会影响用户所在楼层

15、这一情景属性,而朴素贝叶斯算法对属性相关性较小的数据有着较好的分类效率和质量。因此相较于其他分类算法,属性加权朴素贝叶斯算法更适用于对协同推荐进行情景加权处理,在动态、开放的环境下对用户进行推荐。3.2当前情境下读者相似度计算推荐系统可采用的推荐方法有:基于内容过滤,协同过滤以及混合推荐,我们采用的是应用较为广泛,分类效果也相对较好的协同过滤来对用户进行初步推荐。相较于传统过滤推荐算法的用户、事件的二维关系,基于属性加权贝叶斯算法的协同过滤推荐是将其扩展为用户、事件、环境的三维关系,在算法中融入了情景信息。推荐步骤主要分为3步:第一步,根据“用户资源”评分矩阵计算用户之间的相似度;第二步,根据

16、用户间的相似度为当前用户寻找近邻,对其进行预测评分;第三步,结合属性加权的贝叶斯算法,计算出情境权重,继而实现推荐。4实证4.1实验数据获取本文数据集来源于事先从华中师范大学数字图书馆的官方网站上,选取热门借阅提供的22个分类中的10个分类,分别用爬虫工具抓取30个左右的书籍名称,共计330个,人工将其分为哲学社科类(如马列主义等)、人文艺术类(如文学、艺术等)、工业技术类(如计算机技能等)和综合科学类(如数理科学等),以下简称为社哲类、人文类、工技类和科学类,每个分类下约有80个书籍名称,作为此次试验中受试者进行评分和情景选择的对象。实验中考察的情境因素共有3个,分别为:时间(工作日,周末)

17、、地点(图书馆19楼)、阅读目的(科研、扩展、休闲、技能等)。在实验中如果受试者对某类书籍的阅读情景的选择为组合A:(周末,图书馆5楼,休闲),那么当该受试者再次遇到情景组合A时,系统将会优先为他推荐该类书籍他更可能想要的书。本实验共选取8名1922岁的在校大学生作为测试者。实验分为训练集准备和推荐集测试两个部分。在训练集准备阶段,所进行的实验是通过发放调查问卷的方式为模型收集足够的情景信息和用户偏好;在推荐集测试阶段,在指定情境下通过协同推荐和朴素贝叶斯算法情境加权计算为受试者形成推荐书单,再让受试者对书单的内容进行打分,从而判断改良算法相较于传统算法的优劣性。在准备阶段,笔者为每个测试者提

18、供了1份包含50个书籍名的书单,书籍名均从以上4类中随机抽取,为保证数据集的可靠性和真实性,每份书单中的书籍名都有一定的重复率,测试者需对其进行阅读情境的选择和情感偏好的评分,其中情感偏好的评分范围为15,从低到高分别表示非常不喜欢、不喜欢、无所谓、喜欢、非常喜欢。例如,受试者在对百年孤独进行场景选择时,时间上更倾向于选择周末,地点一般是在2楼,阅读目的一般为休闲,比较喜欢阅读百年孤独类小说但更喜欢同书单的白夜行,所以打分为4分。将所有问卷回收后,根据分类标准将所得数据进行整理后,所得数据如表1所示。4.2数据处理与分析4.2.1情景因素权值获取由于每份书单中都有一定的重复率,且不同受试者对同

19、一本书的情景属性选择不同,因此我们将其看做两条不同的数据进行统计,一共得到400条数据,除去不确定的数据条后所得有效数据为378项。将收集到的数据按照不同类别和不同属性的交叉对应关系进行数量统计,分别计算每个属性值在不同类别下所占比例,再计算不同类别在同一属性值下出现的概率,将所得数据进行归一化处理后,可得到单项情景因素属性对不同类别的影响权重。例如,在人文类书籍中,选择工作日查阅的书籍共有13本,选择在周末查阅的书籍共有80本,经过统计所得工作日对人文类书籍影响权重为0.138,而周末对人文类书籍的影响权重为0.862,这说明受试者在阅读人文类书籍时更习惯于在周末进行。此处为避免权值为0,我

20、们将所有的权重进行加1处理,所得结果如表2所示:4.2.2协同过滤推荐与属性加权在推荐集测试阶段,我们首先让受试者选择一个情景M,系统将生成一组符合用户所选情景的推荐A和一组以传统协同过滤算法生成的推荐B供受试者选择,受试者根据情景M和自身的阅读习惯对所提供书单中的书籍一一进行推荐准确度的打分,重复进行多次不同情景的实验,最后通过计算A、B两组书单中书籍的最终得分,比较两种算法的优劣性。在生成推荐列表A时,由于情景此时已经确定,不属于此情景的数据对推荐无任何用途,反而会成为干扰项对最终的推荐造成偏差,所以为减少运算花费的时间,我们尝试将与所选情景中属性值均不相同的数据行置为零,事实证明该操作是

21、可行的。构建用户物品的二维矩阵并将用户的评分填入关系矩阵中,然后根据皮尔逊相关系数计算用户之間的相似度形成用户评分相似矩阵:因为用户物品矩阵较为稀疏,所以我们选择相关系数较高的前两位用户作为相似用户组建近邻矩阵,按照最后评分高低得到排名前15的推荐列表。前面实验步骤所得的情景权值已知,根据情境M的属性值,将用户的推荐结果进行加权处理后重新排名,选取排名前10的结果形成最终的推荐列表。例如此处我们为用户B设定的情景M为工作日,5楼,科研,在传统算法中演讲的艺术排名非常靠前,这是因为用户B和他的相似用户群体对这类书籍的兴趣较高。但在改良方法中,演讲的艺术排名较低,并不在前五的行列中,这是因为演讲的

22、艺术属于人文类书籍,在情景M中它的情景因素属性加权值较低,因此最后的综合得分较低。经过整理后部分结果如表3所示:表3本文方法与传统方法推荐结果对比(部分)用户A用户B改良方法传统方法改良方法传统方法1马克思民主观的文本研究马克思民主观的文本研究管理心理学演讲的艺术2列宁论科学社会主义元代理学伦理思想研究社会心理学平凡的世界3社会契约论社会心理学社会研究方法实用教程爱情心理学4元代理学伦理思想研究列宁论科学社会主义老年社会学精读鲁迅5老年社会学SQL Server范例开发大全爱情心理学管理心理学4.2.3推荐效果评价基于情景感知的个性化推荐是为帮助用户更准确的找到所需要的资源,而广泛采用的平均绝

23、对偏差MAE(Mean Absolute Error)反映的是实际预测误差的大小,无法判断用户对推荐资源的满意程度。本文实验中借鉴了前人的评价方法21,即用读者接受度(Reader Acceptance Radio,RAR)来判断推荐的优劣,计算公式如下:RAR=RInterestI.1,I.2,I.N(Top-N Book)(Top-N Book)(9)其中RInterestI.1,I.2,I.N表示目标读者感兴趣的文献资源,Top-N Book表示在该列表中读者对资源的采纳程度。则RAR的值越高,该推荐方法在当前情景下给读者推荐的资源越合适。在对推荐效果进行评价时,推荐系统算法根据指定情景

24、M生成两组推荐推荐书籍,其中一组是符合用户所选情景的推荐书单A,一组是以传统协同过滤算法生成的推荐书单B,受试者根据设定的情境M分别对推荐书单A、B中的项目进行反馈,如情景M为周末,7楼,技能,对推荐书单中的书籍博弈论导论,受试者根据个人喜好和阅读目的对推荐书籍与目标书籍的相似度进行评价,即在满分10下对书籍的满意度进行打分。设定评分大于等于5的书籍为读者采纳资源Top-N Book,评分大于等于8的书籍为读者感兴趣的资源RInterestI.1,I.2,I.N,最后统计书单A和书单B中符合要求的书籍的个数,计算读者接受度(RAR)。为保证实验的准确性,笔者为每个用户提供多个情景,对不同的情境

25、系统推荐的资源不同,均需测试者提供反馈。根据提供的反馈进行推荐准确率的计算,从而衡量推荐的质量。将用户反馈的数据进行剔除和筛选后,计算传统协同过滤算法和改进的方法的读者接受度,对比结果如图2所示。因为每个测试者对应多种情境的推荐,此处的接受度为多种情况推荐的接受度的均值,最后一组的数据为前八组数据的均值。图2两种协同过滤出信息推荐方法的比较从图2中可以看出,A组数据的推准率普遍优于B组。说明在实际情况下,本文提出的算法相较传统协同过滤算法,有着较高的准确率和性能优越性。因为传统协同推荐算法在为用户进行推荐时,仅仅只是依靠之前的数据为用户提供他会感兴趣的内容,但凡场景发生些许变化,传统算法就很难

26、再处理好高评分内容和实际需求内容之间的关系。而基于朴素贝叶斯加权的情境感知协同过滤推荐算法在传统算法的基础上融入了情景信息,由原来的用户资源的二维关系变为用户资源情景的三维关系,从而通过对不同情景下的用户进行不同内容的推荐来满足用户个性化的需求,而非对任何情景都进行单一内容的推荐。实验结果也表明,基于朴素贝叶斯加权的情境感知协同过滤算法能够更好地识别不同情景对信息推荐的影响力大小,能够提供给读者更加精准的个性化推荐,提高推荐系统的质量、水平和准确性。5结语在移动互联网高速发展的背景下,图书馆需要从被动满足读者需求变为主动感知用户情境并进行个性化服务推荐,简单的资源内容推送已经难以发挥馆藏的最大

27、价值,也不能突出图书馆本身的特点和实现社会信息沟通的目的。引入情境感知技术以提高服务的智能化、人性化、个性化,已成为数字图书馆的发展趋势。本文从情境感知的角度,针对图书馆个性化服务推荐进行研究,并提出了基于朴素贝叶斯算法的属性加权情景信息结合传统协同过滤方法对图书馆的用户进行智能化推荐的算法,能够根据用户的时间、地点等信息,向用户推荐符合当前情景的信息。通过实验表明该算法相较于传统协同推荐算法有着更好的推荐效果和准确率。然而,本文虽然实验数据足够,但实验者数目较少,考虑的情景影响因素量也有待增加,同时实验中存在较多泛化因素,因此实验还有待于进一步提高。此外,下一步的研究方向可以是用户情境感知信

28、息的有效获取和多维情景信息下对推荐的影响,以进一步证明该模型的有效性和推荐的准确性。Reference1袁静.情景感知自适应:图书馆个性化服务新方向J.图书情报工作,2012,56(7):79-82,97.2Dey A K,Abowd G D,Salber D.A Conceptual Framework and a Toolkit for Supporting the Rapid Prototyping of Context-Aware ApplicationsJ.Human-computer Interaction,2001,16(2-4):97-166.3Dey A K.Understa

29、nding and Using Context Personal and Ubiquitous Computing JournalJ.Personal & Ubiquitous Computing,2001,5(1):4-7.4郭高尚.情景感知的移動推荐研究D.邯郸:河北工程大学,2014.5Kim J,Lee D,Chung K Y.Item Recommendation Based on Context-aware Model for Personalized U-healthcare ServiceJ.Multimedia Tools & Applications,2014,71(2):

30、855-872.6Kwon O,Choi S,Park G.NAMA:A Context-aware Multi-agent Based Web Service Approach to Proactive Need Identification for Personalized Reminder SystemsJ.Expert Systems with Applications,2005,29(1):17-32.7Mylonas P,Vallet D,Castells P,et al.Personalized Information Retrieval Based on Context and Ontological KnowledgeJ.Knowledge Engineering Review,2008,23(1):73-100.8李晟.基于情境感知的个性化电影推荐D.北京:北京邮电大学,2012.9Schilit B,Adams N,Want R.Context-Aware Computing ApplicationsC/The Workshop on Mobile Computing Systems & Applications,1994:85-9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论