版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于游客兴趣点的旅游路线系统设计目录1绪论 41.1研究背景和现状 41.1.1智慧旅游的背景与现状 41.1.2国内外相关研究现状 41.2研究目的和意义 51.3本文主要工作内容 52问题分析 63相关算法研究 73.1游客兴趣点识别算法 73.1.1MMHC贝叶斯网络算法设计 73.1.2建立贝叶斯有向无环图 83.1.3模型参数调整 83.1.4效果验证 93.2旅游路线推荐算法 103.2.1初始化路线 103.2.2插入过程 113.2.3抖动过程 113.2.4迭代局部搜索 114旅游路线推荐系统的设计与实现 134.1系统整体框架设计 134.2数据处理 144.2.1对移动数据分类 144.2.2数据清洗 154.3模型建模 154.4前台业务呈现 154.4.1系统功能设计与实现 154.4.2系统页面展示 165总结和展望 185.1总结 185.2展望 18摘要:随着旅游市场的火爆以及旅游信息的飞速增长,在线旅游应用成为互联网+的重要行业应用。由于很多游客在出游时难以及时寻找到自己的心仪路线,基于游客兴趣点分析的旅游路线推荐系统应运而生,其为游客提供可能感兴趣的旅游路线,帮助游客完成出游计划。现有的很多旅游推荐系统都将目光集中在游客的兴趣点挖掘上,认为对游客的兴趣进行针对性推荐就可以满足游客的需求,但是它们存在游客个人特性挖掘方法缺乏创新、推荐准确率不高等问题,难以达到令游客满意的效果,因此,“以游客为中心”的智慧旅游推荐系统成为本文研究的重点和方向。本文基于移动游客海量数据为依托,采用基于贝叶斯网络算法的大数据分析技术进行游客兴趣点分析,发现游客兴趣点不同导致他们的景点路线选择情况各异,因此设计了基于游客兴趣点的旅游路线个性化推荐方案,并研究提出了基于旅游游客兴趣点的个性化路线推荐算法。最终,设计和实现了基于智能终端的旅游路线推荐APP系统。该系统以游客兴趣点分析算法为核心,通过数据采集、数据处理、模型建模以及前台业务呈现四部分实现。为游客提供了一个以游客兴趣点为核心的旅游出行的智能化掌端路线推荐系统。关键词:大数据智慧旅游游客兴趣点路线推荐1绪论1.1研究背景和现状1.1.1智慧旅游的背景与现状20世纪以来,互联网技术和大数据技术快速发展,已经和人民群众的生活息息相关,智慧旅游作为应用大数据技术的一个热门项目,受到社会大众的广泛关注,智慧旅游建设必然需要架构科学合理的管理系统。近几年来,随着我国经济的发展,人民的生活水平逐渐提高,旅游业随之发展。当今社会,如何将我国旅游业和大数据技术结合起来建设智慧旅游成为旅游业发展的一个重要问题。在大数据技术应用的大背景下,架构科学合理的智慧旅游管理模型,将大数据技术与旅游业深度结合,能够解决旅游业中出现的各种问题。如何提升通旅游行业景区质量和服务水平来获取游客满意是“智慧旅游”关注的重点。各个省市的景区都在尽力规划景区建设,利用信息化的技术,把一些旅游资源进行整合,然后为广大游客量身定做,提供适需对路的旅游产品。传统旅游行业吸引游客的方法和手段无法分析游客实际使用感知体验,导致客户满意度下降,而这些都将是“智慧旅行”概念所主要解决的问题。1.1.2国内外相关研究现状国内外学者针对“智慧旅游”这一问题已经展开了一些相关研究:英国伦敦基于3G网络逐渐推出伦敦智能导游系统,韩国针对自助游客推出了智慧网络系统,美国科罗拉多州的滑雪场推出了RFID技术的定位装置反馈系统,而在国内,包括携程网、途牛网、去哪儿网、天猫在内的众多网络平台开始推进与国内景区的合作,开展门票为核心网络售票业务。尽管智慧旅游的呼声很高,但是由于它与最新信息技术相关性高、缺少以游客为中心的智能分析与推荐,以及出现的时间尚短等原因,智慧旅游的研究和实践还很缺乏,呈现出雾里看花的表象[1]。1.2研究目的和意义在疫情防控常态化背景下,如何将现代信息化技术全面融合于旅游业服务过程中,综合考虑疫情防控、经济复苏和旅游业复工复产,系统构建智慧旅游服务创新模式,成为统筹推进疫情防控和旅游业复工复产的关键[2]。本课题以移动网络大数据为基础,为新一代的智慧旅行路线规划提供理论及实践支持。移动游客的位置、兴趣偏好与行为模式的移动大数据可以有助于影响公众旅游活动中行程路线的规划、选择以及推荐策略。基于移动通信网络大数据,进行路线规划和推荐是未来智慧旅游的大趋势。1.3本文主要工作内容在海量游客的移动行为轨迹数据中可以从不同的方面体现出各个地点的热度,以及地点之间的相互关联。某个地点是否可以判为游客兴趣点是一个研究问题,并且在特定的时间段内根据游客兴趣点,如何高效合理进行个性路线推荐又是一个研究问题。也因此,在解决前一个问题的基础上,可以进一步解决第二个问题,从而得到更有针对性、更有效率的路线推荐方案,进而提高游客体验。本文基于移动大数据来为游客设计个性化的景点路线推荐系统。本文的主要工作如下:(1)根据互联网上收集到的游客历史记录信息,对游客的出游路线进行分析,发现游客兴趣点不同会导致游客在景点路线选择时表现出明显的不同,因此,计划对基于游客兴趣点的个性化路线推荐方法进行研究。(2)游客兴趣点识别算法进行研究。为了识别出游客兴趣点,采用可一种最大最小爬山(MMHC)的贝叶斯网络算法进行兴趣点识别。通过建立贝叶斯有向无环图、调整网络参数,最后得出游客兴趣点的贝叶斯网络拓扑图。通过结果对比发现随着时间推移、数据量的积累,贝叶斯结构学习算法会不断调整参数、优化结构,使贝叶斯网络不断完善,从而出现更准确的预测结果。(3)对个性化路线推荐算法进行研究,基于识别出的游客兴趣点,采用一种基于迭代局部搜素算法的景区线路规划算法。通过结果验证,发现将游客兴趣点及参观时间作为评判最优解的标准,可以有效避免规划出的路线冗余和耗时的问题。(4)进行路线推荐系统设计和实现,将系统分为数据采集、数据处理、模型建模和前台业务呈现四个主要层,在系统的整体运行上考虑了大数据挖掘算法的需要,构建了数据采集层和数据处理层,同时依照算法流程建立了模型建模层,最后考虑到推荐系统的游客使用方面,设计并实现了业务应用层,将个性化路线推荐结果通过掌端APP形式展现给游客,为游客提供服务界面。2问题分析当一个游客来到一个陌生的城市旅行,他可能想要观光,或者此时他正想要找一个地方享受一顿美餐,兴趣点推荐的目标就是在这种时刻,为游客提供建议和帮助,筛选出有价值、游客感兴趣的地点进行路线推荐。然而,在许多实际的应用场景下跨城市的旅行者在当地的访问数据非常稀疏,使得游客喜好建模变得非常苦难。图1游客兴趣点分析示意图根据统计收集到的互联网旅游信息中游客历史访问记录中的类别信息,发现不同的游客其访问的景点类别分布有着较大差异,并且部分游客在不同时期的访问类别分布也有很大差别。本文基于访问类别分布情况,将游客大致分为三种。第一种游客,他们的兴趣比较单调,这类游客的兴趣爱好相对比较固定的,游客的喜欢景点类别也是单一的,这种游客大部分旅游目的地都是统一类别的景区。第二种游客,他们的兴趣多种多样,这种游客的兴趣点也是固定的,然而,与第一种游客不同的是,第二种游客的喜好不止一类,他们喜欢的景区类别会有多个,但是这些类别在访问分布中的差距并不大。第三种游客,他们的兴趣变化很大,这种游客的兴趣不是固定的,而是会随着时间的变化而发生变化,这中游客的类别访问分布有时是难以确定和预测出来的。对于三种游客,能够发现不管是基于群体的推荐还是基于游客兴趣点的推荐都不是很好描述所有游客的情况。基于群体的推荐在为兴趣变化游客进行推荐时很可能将兴趣多样游客作为其邻居,在这样的情况下推荐的结果是兴趣变化游客曾经经常访问的景点,但是目标游客可能已经改变了兴趣,所以推荐结果不能得到较好的效果。基于游客兴趣点的推荐在针对兴趣变化游客进行推荐时,也会产生游客曾经感兴趣的景点类别,造成景点推荐的结果不满足游客的需求。本文的路线推荐算法考虑到以上旅游推荐问题,将游客的兴趣点作为研究的主要特性,能够在一定程度上解决兴趣变化游客的景点路线推荐问题。3相关算法研究数据挖掘算法一直是大数据分析推荐系统最为重要研究部分,不同大数据分析推荐系统的独特性就在于其所使用的数据挖掘算法不同,可以说数据挖掘算法的不断优化是大数据分析更新换代的动力。下面详细对游客兴趣点识别和旅游路线推荐采用的数据挖掘算法进行研究。3.1游客兴趣点识别算法本文采用一种贝叶斯网络的数据挖掘算法进行游客兴趣点识别。传统的贝叶斯网络结构学习方法是对样本数据进行一次学习,模型的结构和参数在之后的预测中不再改变。而本文是对海量的移动数据进行挖掘分析,面对移动实时数据波动性大的特性时,本文在选取建立贝叶斯网络模型的结构学习算法时选取一种MMHC贝叶斯网络结构算法。详细实现步骤如下:3.1.1MMHC贝叶斯网络算法设计经过分析研究,设计MMHC贝叶斯网络算法的过程如下:图2MMHC贝叶斯网络算法流程图通过对数据集中的属性进行自动学习,找出属性之间的关联度,从而构建基于贝叶斯网络的游客兴趣点模型结构。本文应用的数据集非常大,有3千万条数据,是一个大规模数据集。普通的网络结构学习算法最多只能学习约2万条数据。改进的MMHC贝叶斯网络算法通过启发式搜索确定网络结构边的方向,对模型结构进行学习,能够适应大规模的数据集。3.1.2建立贝叶斯有向无环图利用信息熵的方法确定网络模型的骨架结构,枚举计算网络模型的两个节点之间的信息熵判断两个节点之间的关联强度。并将两个节点间有联系的连接一条无向边,这样构成一个网络模型的骨架结构。贝叶斯网络的有向无环图建立的过程如下图所示:图3有向无环图建立过程然后通过打分搜索算法,确定边的方向,使网络结构模型的效果达到最优。3.1.3模型参数调整贝叶斯网络算法能够根据历史数据,对已构建的模型结构进行参数学习,调整模型结构节点的参数,使得模型参数最大化,从而构建最优的模型。通过倍增学习的方式动态改变用户离网预测模型的结构。如下公式所示,通过对上一次学习得到的结果和最近一次学习得到的结果进行加权,对参数进行调整,使模型的结构逐渐趋向于稳定。通过确定的网络结构来量化变量之间的依赖关系,确定每个变量对应的条件概率分布表,即确定网络参数。图4参数调整过程示例截图3.1.4效果验证本文选取了2000个样本对该模型进行分析,经过试验验证,可以看出,贝叶斯网络建模方法具有更加稳定的性能和更高效的处理效率,且预测结果更加准确。表1贝叶斯网络算法实验结果分析表模型样本数比率(%)标准误差贝叶斯模型正确153276.60.009467错误46823.4图5贝叶斯网络算法实验结果分析图可以看出,本文采用的MMHC贝叶斯网络建模方法是贝叶斯网络的一种优化与延展,其具有强大的不确定性问题处理能力。MMHC贝叶斯网络用条件概率表达各个信息要素之间的相关关系,能在有限的、不完整的、不确定的信息条件下进行学习和推理。随着时间推移、数据量的积累,贝叶斯结构学习算法会不断调整参数、优化结构,使贝叶斯网络不断完善,从而出现更准确的分析结果。3.2旅游路线推荐算法本文提出一种基于迭代局部搜素算法的景区线路规划算法,将游客兴趣点及参观时间作为评判最优解的标准,可以有效避免规划出的路线冗余和耗时的问题。同时,本文提出的算法对于起始点和终点相同的情况,也可以给出适当的线路规划方案,而且可以在时间允许的情况下,以游客兴趣点作为本次路线的重要依据。本技术方案需要实现的最终目标效果:在迭代局部搜索算法的基础上,改进其规划出的路线行程花费较长的缺点,同时游客的兴趣点一定会被包括在推荐的路线中。算法的详细实现步骤如下:3.2.1初始化路线首先,根据游客输入的开始时间、时间预算、起始位置和结束位置,首先将起始位置和结束位置规划到线路中,认为游客访问完开始位置后,直接访问结束位置,更新路线中的起始位置及结束位置的到达时间、等待时间、开始参观时间,并更新目前为止总时间消耗及总分数,以及同时间预算相比,还可以用于访问其它位置的时间。然后在起始位置和结束位置之间插入游客兴趣点信息,插入规则与上文插入过程相同。然后更新路线总分数及总时间消耗。3.2.2插入过程对于没有达到局部最优的路线(剩余的预算时间还可以访问其它景点),会遍历Locations数组,对于flag=0的所有位置都会计算该位置插入到目前线路中任意两个景点之间的时间消耗shift,记录最小的时间消耗minShift以及对应的最佳插入位置(记录前一个景点及后一个景点),对于所有flag=0的位置,都会计算一个插入比率ratio,计算方法为该位置的分数的平方除以该位置的minShift,将比率最高的景点插入到路线中,插入位置为记录的最佳插入位置。该景点插入到线路之后,更新路线中其它访问的到达时间、等待时间、开始访问时间,以及路线的总分数、总时间消耗,以及剩余的预算时间,同时将该位置的flag设置为1。该方法为递归的方法,会重复执行上述步骤,直到达到局部最优解(剩余的时间预算没有办法参观任意其它景点)。3.2.3抖动过程抖动过程是从线路的某个景点开始,连续删除后续的几个景点,之后将删除段之后的景点前移,更新删除后线路中景点的到达时间、等待时间、开始参观时间,以及路线的总时间、总分数、剩余的预算时间。目的是对删除之后的线路重新执行插入操作,避免陷入局部最优解。抖动过程有两个参数,s和r,s表示开始删除的数组下标,r表示连续删除的景点个数。图6删除中间某段访问的路线的示意图3.2.4迭代局部搜索迭代局部搜索算法结合插入与抖动步骤,给定无改进的最大迭代次数max(一般为150次),对于确定的最优解执行抖动之后再插入的操作,如果再次插入得到的结果没有原先的最优解好,那么迭代次数加1,更新抖动步骤的参数之后对再次插入的结果继续执行抖动步骤,然后再次执行插入步骤,直到max次迭代之后,确定的最优解都没有找到更好的结果,那么我们就认为目前确认的这个方案就是全局最优解;如果某次抖动之后再插入的结果好于原先的最优解,那么替换最优解,重置抖动步骤的参数及迭代次数,对新的最优解重新开始上述步骤。流程图如下:图7迭代局部搜索算法流程图本文选择在迭代局部搜索算法的基础上,改进其规划处路线行程花费较长的缺点,同时又根据需求提出新的功能,即起始位置和结束位置可以为同一位置并且必须访问到游客兴趣点的景点。在此基础上进行算法的设计与实现,根据试验对该算法的性能进行测试,测试结果表明当路线总分数相同的情况下,本文算法更倾向于选择时间消耗更小的路线,同时能够正确处理起始位置与结束位置相同的情况以及包含游客兴趣点的情况。并且,该算法能够在几秒的时间内完成计算输出结果。a)算法路线时间对比图b)算法执行时间对比图图8迭代局部搜索算法试验对比图4旅游路线推荐系统的设计与实现4.1系统整体框架设计为了保证基于游客兴趣点的旅游路线推荐算法能够应用于实践中,本文设计并实现了基于掌端的路线推荐系统。系统框图如下:本系统架构共分为四个层次,分别为数据采集层、数据处理层、模型建模层、可视化应用层。数据采集层主要对系统所需的移动用户行为轨迹、上网信息等数据通过大数据平台进行汇总,数据处理层主要完成数据的统计和筛选和入库,模型建模层主要是通过R语言、算法库等技术完成数据分析,可视化应用层主要完成面向用户的可视化平台搭建工作。系统架构图如图9所示。图9旅游路线推荐系统架构图4.2数据处理数据处理层包含了两个部分:对原始数据的预处理和预处理后的数据汇总。图10为数据预处理的数据流程图,原始用户轨迹数据和上网数据存储在Hadoop集群的大数据平台上,本系统使用Hive和MapReduce程序从Hbase中的原始数据抽取需要的字段。然后经过汇总和筛选。图10数据预处理流程图4.2.1对移动数据分类辽宁移动拥有用户海量的数据资源和完备的底层Hadoop集群架构,本文数据数据是基于辽宁移动的大数据平台提供的用户轨迹数据,上网数据等数据资源信息。通过对移动现有的数据进行充分的研究分析,对数据分类如下:表2数据分类表分类数据源量级用户上网日志携程200M/日途牛400M/日去哪儿150M/日天猫30M/日用户轨迹数据用户ID1.5T/日经纬度400G/日时间800G/日4.2.2数据清洗将原始数据存储在大数据平台的Hadoop集群上,并从Hbase中的原始数据中抽取出需要的字段。对这些数据在Hadoop硬件集群中进行清洗处理,整理数据并过滤掉个别坏点。最后从用户轨迹数据、上网日志中抽取并清洗后,得到以下与游客兴趣点相关的数据信息:图11清洗后的数据信息表截图4.3模型建模完成数据处理工作之后,模型建模层就能够利用数据库中的规整数据进行游客兴趣点识别,然后基于识别出的兴趣点实现路线推荐算法架构搭建了。模型建模层通过与数据库的协同工作,提取游客兴趣点和旅游推荐算法所需的数据,保证模型计算层整体顺利运行。在之前己经介绍过旅游路线推荐系统使用的游客兴趣点识别和路线推荐算法的整体过程,所以本节不进行详细说明。4.4前台业务呈现业务应用层是为了让游客能够更好的使用旅游推荐系统的服务,所以要将推荐系统的成果输出到可见页面上。4.4.1系统功能设计与实现本系统采用APP方式在掌端进行呈现,系统的功能图如图12所示。图12旅游推荐系统功能图4.4.2系统页面展示(1)路线推荐功能页面展示下面对路线推荐掌端APP中的路线推荐功能进行详细说明。首先,点击路线规划界面后可以进入景点内路线规划,点击景点规划跳转到游玩景点推荐与规划,点击相应的按钮进行规划和分析。图13路线推荐功能页面展示图(1)在路线规划界面点击查询后可以进入详细页面,点击时间可以选择起止时间,点击景点可以选择想要游玩的景点,点击开始导航按钮进行路线规划,展示了游玩时间和游玩顺序。图14路线推荐功能页面展示图(2)(2)地图管理功能页面展示用户信息管理功能主要包括用户定位、实时路况、用户导航等,部分展示页面如下图所示。图15地图管理功能页面展示图(3)用户信息管理功能页面展示用户信息管理功能主要包括用户登录、用户注册、系统设置、用户信息设置等,部分展示页面如下图所示。图16用户信息管理功能页面展示图5总结和展望5.1总结在国内旅游市场呈爆炸式发展,旅游信息呈指数式增长的情况下,人们在决定旅游计划的时候面临着很多可能的选择,旅游推荐系统为游客提供其可能感兴趣的景点,在一定程度上解决了游客选择难的情况,并且良好的推荐效果会促使游客选择推荐列表中的景点出游。因此各大旅游网站纷纷设计旅游推荐系统来更好地为游客服务,也为了增长自己的销售量[3]。游客在一个陌生的城市,亟待快捷方便地找到热门旅游景点并规划好游玩路线。本文从用户大量轨迹信息中发掘游客兴趣点,以此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年深圳低空经济产业配套服务发展报告
- 遗址保护利用保障承诺书4篇
- 销售与客户关系管理标准模板
- 标准化采购流程表单物料需求管理模板
- 个人职业健康安全保障承诺书5篇
- 客户服务满意度调查与改进方案工具
- 行业采购合同模板及使用指南
- 团队项目分工与协作矩阵
- 垃圾分类从小事做起周记作文(11篇)
- 物流运输管理调度模板及工具
- 蒸汽管道安装施工方案
- 2024-2025学年北京市通州区五年级上学期期中数学试卷(含答案)
- 《课程理论-课程的基础、原理与问题》施良方
- 4.2.1指数函数及其图像与性质省公开课获奖课件说课比赛一等奖课件
- 全国一等奖人音版一年级音乐上册《口哨与小狗》课件
- Unit 1 Food for Thought 词汇教学设计-2023-2024学年高中外研版(2019)英语必修第二册
- JT∕T 1477-2023 系列2集装箱 角件
- 临床技术操作规范骨科分册
- 《9.1.2-不等式的性质》说课稿
- 国际音标发音口型图解
- (高清版)DZT 0426-2023 固体矿产地质调查规范(1:50000)
评论
0/150
提交评论