




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于数据挖掘的旅游电子商务个性化服务研究以携程旅行网为例一、概述(一)选题意义随着我国旅游产业的不断发展、旅游产品的更新升级,以及游客资源市场的不断变化,个性化的旅游方式越来越受到青睐。而在我国现有的旅游客户资源中,80后和90后的客户群体占了很大的比例,对于这些逐渐年轻化的消费群体来说,他们不再满足于观光、合影、购物等过时的旅游方式,而是开始关注旅游背后的文化、历史,追逐更加注重自我、个性化、深度化的旅游体验,根据网络数据显示,78%的年轻旅行者愿意进行个性化的旅行,70%的旅行者则表示希望在线旅行公司能提供个性化的服务。本论文基于数据挖掘技术并结合近些年电子商务个性化服务研究成果,在深入研究携程旅行网具体案例的基础上,分析了旅游电子商务个性化服务的现实状况和建设中的不足,为我国旅游电子商务个性化服务的建设提供相关策略与解决方案。(二)相关理论1、个性化和电子商务个性化个性化,常用来指具有个体特性的需求和服务。国际数据公司 2014年年初发布报告称,全世界数字化信息的数量4.4ZB,而且这个数量还在飞速增长,因此,互联网用户如何从浩如烟海的信息中挖掘到自己需要的数据成为一大难题。在20世纪90年代中期,卡内基梅隆大学的Robert Armstrong等人提出的Web Watcher个性化导航系统、斯坦福大学的Marko Balabanovic等人推出的LIRA个性化推荐系统和麻省理工学院的Henry Lieberman在国际人工智能联合大会上提出的Letizia个性化导航智能体这三个系统被公认为是个性化服务发展初期最经典的系统,它们的产生标志着个性化服务研究的开始。余力. 电子商务个性化理论、方法与应用M.清华大学出版社,2007.电子商务个性化是个性化在电子商务中的拓展和的应用和发展领域。电子商务个性化服务的内容主要包括:(1)、消费者的需求个性化,消费者对商品和服务的不同类型的需求成为企业发展创新的巨大推动力。(2)、信息的个性化定制,例如,随着旅游业的发展,游客不但可以在线订购旅游服务,还可以参与到定制旅游的活动中。(3)、对个性化商品的需求,消费者可以将个人的偏好参与到消费品的设计和制造过程中。2、数据挖掘的概念及方法数据挖掘( Data Mining)旨在从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的而又潜在有用的信息和知识。数据挖掘涉及机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。高丽,遗传算法与关联规则挖掘算法研究与应用D,华中师范大学,2007数据挖掘具有以下几个常用方法:聚类分析(clustering analysis),源于统计学、生物学以及机器学习等。决策树(decision tree),主要用于分类和预测,是最受欢迎的数据挖掘方法之一,核心思想是在一定的约束条件下会得到特定的值。人工神经网络(ANN),是模仿人脑神经网络的结构和某些工作机制而建立的一种计算模型。粗糙集(rough set),是一种处理不确定、不完备数据和不精确问题的数学理论。关联规则挖掘(association rule mining),是数据挖掘中最活跃的研究方法之一。统计分析(statistics analysis),是从事务的外在数量上的表现去推断该事务可能的规律。3、数据挖掘在电子商务中的应用(1)、基于Web数据挖掘的智能化搜索引擎但是目前信息技术环境下,由于技术限制等因素使得没有优秀的搜索引擎来保证用户所获得数据的精准度,要解决这些没问题就要在搜索引擎中使用Web数据挖掘技术,使其朝着智能化方向发展,帮助搜索引擎使用者获得更多具有高精度的、潜在价值高的更加全面的数据信息,从而提高搜索效率和结果的精准度。将数据挖掘应用于搜索引擎首先需要进行大量的样本学习,在此基础上归纳分析数据之间的规律,并进行相关信息提取,根据提取信息建立用户的兴趣偏好,根据用户兴趣偏好将用户搜索的关键词进行扩充,使用户搜索结果更接近其所需信息。另一种方法是通过分析用户的历史浏览记录数据来获得客户的兴趣偏好,然后调用个性化推荐系统来推荐相符合的搜索结果。智能化搜索引擎的处理流程如图1:图1 智能化搜索引擎的处理流程(2)、数据挖掘在客户关系管理中的应用在客户关系管理中运用数据挖掘有利于促使企业准确定位客户的特点,帮助企业实施客户满意度分析、忠诚度分析、产品设计分析、市场影响活动分析、客户联系时机优化分析和增量销售分析等活动,以便促使企业更好的根据分析数据提供更好的个性化服务。通过挖掘分析与客户行为相关的数据信息包括客户的点击习惯和客户的兴趣偏好,对客户进行聚类分析,预测客户消费倾向,以此来挖掘发现潜在客户群体;针对不同兴趣偏好的用户进行不同的个性化内容推荐和新产品推荐,以此来最大程度的保持客户的产品忠诚度,减少客户流失;同时可以利用大数据分析得出客户的最佳联系时机,通过间隔性的联络客户获取客户的最新消费偏好数据,并且保持不间断的客户关怀活动,以此来减少因企业关怀度降低造成的客户损失。(3)、数据挖掘在个性化服务推荐系统中的应用电子商务个性化服务推荐系统能够帮助企业在原有客户数据库的基础上使用个性化推荐,深入挖掘客户数据库中潜藏是数据价值,有利于企业实施交叉销售的方案,更好的执行“以用户为中心”的销售策略。该系统主要是采用类似于智能化搜索引擎的数据处理思想。首先将企业通过各种途径收集的客户行为数据采用数据挖掘的各种方法分析,得出客户的访问规律并进行总结归纳,然后对使用关联规则和统计方法对实时访问客户进行分类,最后根据分类结果对访问的客户进行个性化推荐。同时该类系统还可以根据用户当前的访问规律进行客户识别,实时调整推荐内容,更好的做到个性化。(三)旅游个性化的发展前景1、中国在线旅游市场交易规模持续增长根据艾瑞咨询数据(见图2),中国在线旅游市场2014全年交易规模达2772.9亿元,比上一年增长27.1%,继续保持高速增长。而到2016年,预计中国整体休闲旅游市场将达到4500亿元人民币的巨大规模,在线休闲旅游也将以更高的增长速度增长。图220112018年中国在线旅游市场交易规模及增速(含预测数据)2、移动端OTA市场的迅速发展中国移动端在线旅行业务迅速增长,以2013年12月为例,移动端访问人数已覆盖进一亿人,同比上一个月增长近一倍。移动互联网与旅游产品的结合具有绝大的优势,尤其是在当年4G时代的到来,移动网络已经完全能够满足旅游业务发展的需要,在线旅游业务也将更多的转向旅游产品消费、消费品预定和个性化服务组合发展的方向,因此,在线旅游产品的在移动端的发展将迎来巨大机遇。以携程为例,利用丰富的旅游产品组合、先进的技术系统、完善的后台服务和强大的呼叫中心服务系统,携程的移动平台能够提供优越的个性化服务。根据网络数据显示,截至2014年年底,携程旅行移动客户端的下载量已经超过六亿次,环比增长70%。尤其是在2015年春节期间,移动平台的交易量更是超过总交易规模的70%,成为在线旅游业交易规模与盈利能力最强的应用平台。数据来自艾瑞咨询:/research/ec/3、自助游持续升温虽然跟团游这一传统模式在一部分细分类型客户中依然具有很强的不可替代性,但是随着生活水平的提高,跟团游越来越无法满足人们对于旅游的期待心理,而且更多的跟团游则是广受诟病的变相“购物游”。而且2012年度的中国在线旅游市场结构中,跟团游规模只占有约45%的市场份额,二者的年度增长率分别约为30%和85%。可以看出,跟团游虽然看似生命力顽强,但是在自助游持续升温的背景下,则成了实际中的“夕阳产业”。(四)创新点和写作框架1、本文的创新点首先,本文以旅游电子商务个性化服务为研究对象,结合大数据时代的数据挖掘理念及技术,提出了适合旅游电子商务个性化服务的建设方案。其次,利用学科知识的融合,基于数据挖掘的信息处理理念,系统的分析了旅游电子商务个性化服务中存在的问题。最后,本文将理论与实践结合,针对我国旅游电子商务个性化服务的建设提出具体措施,分析了个性化服务在我国旅游类电子商务个性化服务中的应用方法。2、本文的写作框架二、旅游电子商务个性化服务面临的主要问题(一)数据采集过程中存在的问题数据采集渠道中存在的问题是大多数使用大数据业务企业中共同存在的问题,由于数据采集渠道非常多,因此面临的问题也非常复杂,从数据采集渠道的选择到网络技术因素的限制等问题都是非常难以解决的。下面对数据采集渠道中存在的主要问题进行介绍:1、Web服务器端存在的错误。主要包括多服务器日志问题和服务器日志难以识别的问题。多服务器日志问题主要是指多台服务器的分布使得服务器日志记录的访问者数据可能发生重复等混乱状况,从而可能会影响到数据分析结果的准确度。而服务器日志难以识别的问题主要是指由于本地缓存、代理服务器IP转换、防火墙拦截等因素造成的用户发送请求时服务器没有记录。这里还涉及到局域网络的IP设置问题,由于以上这些设备的使用,有可能造成IP冲突,在用户使用设备网络时,有可能数据库将设备发送的多条信息记录为来自同一个IP,也可能将同一个用户发送的信息记录为不同的IP,这就导致了Web服务器日志数据难以分析的问题。2、获取客户端数据过程中存在的问题。由于企业本身的技术实力和程序漏洞等因素,一些旅游电子商务企业开发的客户端不能准确记载用户访问网站的时间,其系统JavaScripts功能无法获取用户的点击信息,即使能够识别点击流数据也会有捕获事件层次低、语义简单、难以关联分析等问题。也可以采用获取客户端宏记录文件扫描的方法,但是这样又会造成点击流信息无法获取的困境。此外,大多数用户难以接受企业网站收集其数据的行为。3、Cookie存在的问题。Cookie文件是网站服务器在本地计算机设备上留下的网站已访问页面的缓存文件,因其可以快速打开浏览过的网页却不用重新访问网站服务器这一功能而被广泛利用。但是,这一优点却也是数据收集过程中一个难以克服的缺点。例如,当多个用户同时使用同一设备时,数据收集方无法根据用户留下的Cookie文件来分析出用户的兴趣偏好,即使分析出结果也存在巨大的误差,无法进行个性化的推荐服务。或者部分用户在使用浏览器过程中可能会删除本地存储的Cookie文件,当再次访问该网站时可能会被误认为是新用户而对其重新定义,这样不但造成了数据结果的不准确,而且占用了大量数据库资源。(二)数据管理过程中存在的问题1、产生的数据类型较多目前的数据类型有结构化数据、半结构化数据和非结构化数据三种。包括文字、音频、视频、图片等等。结构化数据是常用的数据形式,基本上是表格式的数据。每条数据的内容可以不同,但是结构是一样的。一般利用Excel工具就可以对结构化数据进行分析处理,而大型的结构化数据则可以采用一些较为成熟的的商业软件,如SPSS等。非结构化数据是所有数据中占比例最多的数据,包括高清图像、影音文件等多媒体文件都属于非结构化数据类型。其实所谓的非结构化数据就是数据的结构比较复杂而已,虽其处理方式较结构化数据要复杂的多,但是现在也已经找到了合适的处理方式,从数量上看,非结构化数据是结构化数据的5倍以上,所以,对非结构化数据的分析挖掘将是大数据发展的重要方向。半结构化数据在本质上属于结构化的数据,但是其结构变化很大,所以称为是介于结构化数据和非结构化数据之间,由于结构化数据和非结构化数据的处理方式都对它无效,因此在处理这类数据时通常需要一些特殊的方法。在旅游电子商务个性化服务中同样需要收集大量的数据,主要为服务器信息、图像和文字等数据,大多数为结构化数据和非结构化数据,包括用户的注册信息、网站浏览记录、在客户服务系统中的咨询信息、对于个性化的旅游产品的交易信息、消费评价信息、旅游产品点评信息和游记信息等。2、数据的管理成本过高大数据时代的数据采集和数据存储呈指数级增长,在旅游电子商务个性化数据挖掘过程中如果要运用大数据来挖掘游客的行为信息,首先旅游电子商务企业必须具有存储TB甚至PB级的海量数据,因此企业通常需要构建自己的数据管理中心,招收专业的IT运营实施团队,对所收集的数据进行分析、处理、挖掘,提出相关法律和重要信息,帮助进行客户定位、旅游产品设计和消费引导。由于大多数旅游电子商务企业主要业务并不是IT类业务,因此其计算中心传统的数据存储和处理手段已经远远不能满足海量数据存储和实时性处理的要求,而且缺乏先进的资源管理和任务调度系统,没有充分的经验来实施大数据战略,这就很容易造成企业的数据资产闲置、浪费甚至是被丢弃的状态。数据处理中心使用的计算机设备性能欠佳,无法顺利完成数据处理任务的分发、数据库数据处理的顺序问题,当遇到更大型的数据资源时这种问题会更加突出,数据计算系统的扩展性和容错性等问题更加凸显。而且企业内部的计算资源难以合理分配,当处理不当时可能会造成决策误区,造成资源严重浪费。(三)数据结果分析过程中存在的问题1、数据的处理速度较慢随着信息技术的迅速发展,信息终端设备多样化,信息浏览方式也不再仅限于企业网站,出现了一些其他类型的社交网络,因此也带来了大量的难以标准、快速处理的非结构化类型的数据,大量难以快速处理的数据加大了数据中心计算机的运行压力,而在旅游电子商务运营中,客户的旅游产品的购买往往具有实时性和紧急性,没有过多的时间来让用户等待,这就要求旅游电子商务个性化推荐系统能够具有根据用户请求实时快速的进行个性化推荐的功能。2、对数据趋势的预测没有统一标准企业运营过程中会产生不计其数的不同结构类型的数据,而且这些数据中往往包含着一些具有潜在商业价值的趋势变化信息。在注重客户积累和产品创新的在线旅游行业中,这些潜在的趋势变化信息极为重要,有利于营销方案的制定、决策的制定,甚至影响到企业是否能够继续生存。目前对于这些变化趋势的预测国际上并没有制定统一的标准,虽然这样极大的增加了数据预测的自主性和灵活程度,但同时也造成了企业在数据分析过程中无法处理一些半结构化的非标准化数据的问题,这给企业的数据挖掘进程带来了极大的阻力。3、数据模型的可靠性无法衡量数据模型包括三种不同的形式,分别是概念模型、逻辑模型、物理模型。数据挖掘的模型主要包括数据处理模型、数据采集模型等一些模型,但是在这些模型中都或多或少的存在一些缺陷。因此,在数据处理过程中如果采用的数据模型不同就可能会出现不同的处理结果,产生差别极大甚至互相的数据结果,而这种情况就涉及到了数据挖掘过程中的数据结果的可靠性问题。4、数据分析结果维度难以精确在旅游电子商务中,旅游产品具有广泛性、不可移动性、虚拟性、易波动性、季节性等特点。根据数据挖掘的结果可能得出最近邻居具有相似兴趣的结论,但是在某次产品的购买过程中,用户可能更关心商品本身的属性,例如:价格、时间、地点、天气等。仅仅把相似用户偏好的产品推荐给另外一位用户没有考虑用户现在所关心的产品的维度往往是不准确的。所以我们在进行旅游产品推荐时还要依赖用户关心的产品维度对将要推荐的产品进行筛选。三、携程旅行网对于数据挖掘的利用(一)对数据收集管理情况的分析携程拥有世界上最大的旅游业呼叫中心。携程旅行网能够有效利用呼叫中心收集客户的行为信息。在收集大数据的同时,携程也在利用大数据的分析结果来优化呼叫中心的服务状况。从2014年第三季度开始,携程的呼叫中心开始改革数据挖掘技术项目,通过数据分析模块的分析结果来预测客户的来电意向;同时呼叫中心的电话平均接通时间从原来的八秒降到现在的两秒,通话的平均时间也从两分钟降至一分钟,其呼叫中心采用了“六西格玛”的标准控制服务流程,在极大地改善了用户体验度的同时也降低了服务成本,在用户心中留下了携程“服务质量一流”的印象。在数据的收集问题上,携程从2012年开始进行了较大规模的改革。首先,携程进一步扩大自己的平台开放规模,对其合作企业提供了包括餐饮住宿、票务预订、在线支付等各类业务所需的应用程序编程接口,以便更多的合作企业和业务分销机构可以更为便捷的接入。其次,调整企业的运营模式和组织架构,由于企业转型,所以其业务模式也必须发生较大改变以此来适应公司的业务变化,企业内部各部门的职能不尽相同,其线下数据处理中心和线上数据业务中心的组织架构和业务模式有所不同,员工的工作内容和职责都发生了较大改变,因此要分开为两个部门进行运营。处理组织结构分离,其工作流程所使用的各类软性资源也必须分开使用。携程企业业务平台的开放和内部机构的重组大大加快了携程在数据收集和管理渠道上的发展进程。(二)对数据分析结果的利用状况分析1、利用数据挖掘实施客户关系管理目前国内大多数旅游电子商务网站都还没有在客户管理方面实施个性化推荐技术,这与个性化的服务模式是极不协调的,严重不利于客户的挖掘与维护。携程网采用大数据挖掘的方式收集客户行为信息,在客户关系管理方面努力实现客户关怀,增加客户的产品忠诚度。客户数据管理功能:客户信息数据管理为个性化的推荐内容提供客户智能等技术基础。包括客户数据清洗、集成的能力,为企业的发展决策提供多种数据视图。为系统的数据挖掘模块提供优质的数据资源,增加数据处理分析的速度和结果的精确度。携程网收集呼叫中心、网络社区、注册信息等数据来进行分析并管理管理客户数据。客户信息挖掘功能:利用数据挖掘技术从大量的客户行为信息中分析出客户的兴趣偏好等信息。这些知识具有隐蔽性、未知性、具有潜在价值的。携程网利用客户信息数据库挖掘出有利信息,制定不同的营销方式。客户群体维护:好的客户管理功能必须实现对已有客户的挽留,利用技术手段挽留有效客户无疑是性价比极高的。携程网通过其先进的技术系统采用分类模型识别技术来对访问客户所属类别进行识别区分,根据系统的分类判断,由客户管理系统来决定把访问客户划分为潜在客户类型还是企业老客户群体,并进行区别的对待,进行不同内容的个性化推荐服务。通过总结有价值的客户来源,发现其共性,从采取对于某个客户群体挖掘和维护的措施。2、利用数据挖掘进行客户行为分析携程企业所有的用户数据信息都将经过这样的一个过程:在携程客户端(包含PC客户端端和移动平台端)进行收集用户行为数据信息,客户在携程客户端中进行的每一个动作,包括用户的鼠标点击、键盘输入、网页浏览、停留时间、搜索行为和消费行为都转化为数据信息存储进携程的数据库系统,来供数据挖掘系统和企业的数据分析专家进行数据挖掘。利用所收集的这些数据,携程的个性化推荐系统能根据数据挖掘分析系统的分析结果快速、准确的将符合规则的产品推荐给访问者。在利用数据进行分析网站客户访问信息的同时,携程的数据系统还能够将所分析的数据结果分享给企业的供应商。供应商同样关心数据中能够带来的销售转换率。以携程的酒店业务为例,携程数据业务中心将数据系统所收集到的关于酒店的数据信息包括:客户的评价、搜索指数、搜索条件限制、价格优势等信息进行综合分析,将分析结果反馈给酒店供应商,在提高酒店业务的同时还能带来客户对于携程旅行网的用户体验度,可以做到双赢甚至是多赢。3、利用数据挖掘进行产品创新在企业的旅游业务产品设计问题上,携程的数据挖掘分析结果同意具有巨大的积极作用。当携程的数据业务中心收集到关于同一类型的产品大量的数据后,根据用户搜索和点击量的多少来决定是否让业务部门来进一步完善该产品,或者按照客户要求(客户提出的或是数据挖掘分析出的结果)来进行相关产品的创新研发。例如,携程会根据客户在网站的搜索量进行分析旅游者目的地及所需品,根据这一结论进行相关产品开发,携程在龙脊梯田景区的住宿和票务预订业务开发就是属于数据业务中心对客户搜索行为和需求建议数据的分析结果。根据携程的业务开发规划,未来的旅游产品组合、路线开发、票务预订业务、租车业务和偏远地区的酒店供应等业务都会根据数据库的分析结果进行开发。(三)个性化的推荐系统要做到个性化的推荐,首先要对客户的行为信息进行综合分析,得到客户兴趣偏好的数据;其次根据分析出的客户的兴趣偏好寻找最近的关联规则数据集;然后运用高效的数据挖掘技术在最近邻居集内进行推荐算法计算;最后通过分析客户关心的产品维度对推荐的结果进行筛选,提高个性化推荐的准确性,提高个性化服务质量。明确客户的兴趣偏好信息非常重要,而建立用户数据库则对分析客户的偏好信息数据起到很大的作用,携程会将用户的数据信息转化为相应的数据标签,并以此来区分不同的用户群体,个性化的推荐系统会通过识别访客的标签信息来向访客提供个性化的优质服务。携程旅行网注意收集用户在其网站和合作网站上的操作产生的数据,并由数据挖掘系统将这些数据进行甄选、分类。携程网的官网首页就设置了一个“猜你喜欢”的板块,该板块后台系统通过识别客户的行为信息并对比数据库的客户行为信息标签来分析需要为该客户提供的个性化服务内容。运用个性化服务的推荐系统对客户进行分析,对每一位网站浏览者根据其个性标签推荐符合其个性标签内容的广告信息。四、基于数据挖掘的旅游电子商务个性化服务的实现(一)基于数据挖掘的旅游电子商务个性化服务的设计思想基于数据挖掘的旅游电子商务个性化服务系统主要是在普通电子商务系统中加入数据挖掘的处理方式,使之成为具有个性化自主处理能力的系统。在电子商务系统建设中,数据挖掘的途径主要是客户的Web行为挖掘,通过获取客户端、服务器等工具中的数据来进行数据分析,找出访问客户的访问规律与行为习惯并建立客户行为信息数据库,根据分析出的客户访问规律与客户兴趣偏好等信息来对客户进行归类划分,确定客户所属的消费群体,并为其建立特有的客户识别标签,根据客户所属的群体由系统预测客户的访问目的,然后由系统自主推荐个性化的内容,实现个性化服务策略。(二)基于数据挖掘的旅游电子商务个性化服务的体系设计旅游电子商务个性化服务体系的核心思想仍然与普通推荐系统大致相似,其工作原理是首先通过各种渠道进行客户行为信息数据的收集,然后对数据进行关联、聚类的分析,并以此为基础对客户建立标签库,其后才对新的数据信息进行识别与发现,根据识别内容由该系统进行不同内容的个性化内容推荐。目前,旅游类电子商务个性化服务体系主要包括访客数据搜集子系统、数据分析子系统、个性化推荐子系统、网站用户子系统四大组成部分。其结构如图3所示:访客数据收集子系统数据分析子系统网站用户子系统个性化推荐子系统图3旅游电子商务个性化服务体系结构访客数据收集子系统是整个系统中最基础的部分,通过各种途径进行客户行为信息的收集。数据分析子系统主要是包括预处理、存储和数据挖掘部分,是系统作出决策的数据基础。个性化推荐子系统是根据数据分析结果对客户推荐不同内容的系统。网站用户子系统是对网站控制的子系统,一方面通过个性化系统是识别结果来动态调整网站的显示内容和整体布局,另一方面也收集用户在网站的行为数据并传输给数据存储模块。(三)基于数据挖掘的旅游电子商务个性化服务的系统模型基于数据挖掘的旅游电子商务个性化服务系统模型由六大模块组成:数据搜集模块、数据预处理模块、数据存储模块、数据挖掘模块、用户访问推荐模块和电子商务网站调整模块。申云凤. 基于Web数据挖掘的电子商务网站个性化服务的研究J. 中国管理信息化,2011,08其系统结构模型如图4所示:图4基于Web数据挖掘的电子商务个性化服务系统结构模型数据搜集模块通过各类服务器、客户端和代理服务器搜集客户访问时留下的数据资料,形成客户信息数据资源库。数据预处理模块能够对数据搜集模块中采集到的客户行为信息进行预处理,通过数据的清理、转换和规约,为数据存储模块和数据挖掘模块的处理奠定基础。数据存储模块是用来处理数据的存储功能的模块,它可以将在数据预处理阶段中处理的数据信息整理分类,然后再存入对应的预设数据仓库中,该模块对于数据整理分类的类似于客户的兴趣偏好分类处理过程,先将客户浏览的信息记录,再记录其主动查询的信息,最后分析用户的真实需求。数据挖掘模块是个性化推荐系统中的核心模块之一,其核心功能通过使用数据挖掘常用的一些技术,如关联规则、聚类分析等方法,来分析数据存储模块中经过预处理的优质数据资源,通过聚类分析等来识别客户的行为信息,并归纳客户所属类型,然后将其进行建模计算,将符合客户特点的模型作为指导模型对客户进行产品推荐。用户访问推荐模块是利用Web服务器来进行实时数据分析并进行推荐的功能,通过对客户信息的即时分析来确定对客户的个性化服务推荐内容。网站调整模块是根据该系统得出的结果在客户访问当前页面进行数据信息的实时添加、调整,最大限度的将当前页面显示的内容所当前客户的兴趣偏好相匹配。(四)基于数据挖掘的旅游电子商务个性化服务的实现方法个性化推荐是实现在线旅游业个性化服务的重要技术基础,在个性化服务整体架构的基础上,采用个性化的推荐服务能够将设计思想全面表达出来,将旅游电子商务个性化服务体系的架构从理论变成实践。通常,根据国际上关于个性化推荐系统建设的主流技术,旅游类电子商务个性化服务的推荐服务通常采用以下方式来实现:(1)、基于内容的推荐技术,即通过客户行为信息为客户建立的信息标签与客户信息数据库、推荐服务模型进行数据比对,根据比对结果进行个性化的内容推荐。(2)、基于规则的推荐,根据数据收集的结果分析所收集数据类型。首先找出所有的高频项目组,然后根据关联规则进行数据分析,并计算各数据与关联规则之间的最小支持度(Min support)和最小支持度。例如,通过关联规则分析客户订购景区门票后也会对酒店和交通工具的预订,因此可以在客户订购旅游产品时推荐其所订购旅游产品附近的餐饮酒店业务和交通工具等,实现组合销售。(3)、定向推荐,分析出客户的兴趣偏好,比对客户标签数据库,将与客户浏览产品相同类型和相似类型的产品进行同时推荐,即先对客户行为数据进行分析,根据分析结果对客户进行分类,最后根据客户类别进行产品定向推荐。这种定向推荐方式可以用于对于门票、酒店、餐饮和交通工具的预订,对于旅游行业来说尤其适合。(4)、组合推荐,与互联网的P2P下载技术相类似,个性化的推荐方式同样可以采用客户对客户的推荐模式,不同的是这种模式需要先对客户标签数据库进行比对归纳出相同兴趣偏好的客户群体,然后将该用户群体中搜索查询较多的产品在该客户群组内进行推荐。这是一种非常先进的个性化推荐方法,与其他方法相比,这种方法不但节省了计算机资源,而且定位准确,推荐信息准确度更高。五、结束语本文在对旅游电子商务个性化服务分析过程中,采用了基于数据挖掘的方法,同时结合携程网的具体案例,分析了旅游电子商务企业在个性化服务中存在的数据收集、数据管理、数据结果分析方面的主要问题,又分析了携程旅行网在数据挖掘方面的优势,通过对携程旅行网在数据收集、数据管理和个性化推荐系统方面的优势措施具体的分析,给其他旅游电子商务个性化服务的建设以巨大的经验借鉴。本文着重分析了在旅游电子商务个性化服务建设过程中该如何有效利用数据挖掘的思想及具体方法,即如何正确处理个性化服务体系的组织问题,包括对访客信息搜集子系统、数据分析子系统、个性化内容推荐子系统、网站用户子系统四大组成部分的组织架构及具体的建模分析。但是,电子商务是一个发展极为迅速的行业,同样在电子商务个性化建设过程中也存在着很多未知的研究方法,而且关于个性化的研究时间不过短短数十年,很多技术人就处于研究阶段,在技术上有很大的不成熟性,在数据挖掘方面的技术方面也面临很多困难。例如,本文中提到的数据挖掘过程中关于数据收集方面的问题并未完全得到解决,关于对用户网络的IP识别和Agent识别问题仍然需要更先进的技术支持;在数据存储方面,仍然需要更先进的数据存储方式来解决海量数据的存储问题;在数据处理方面,对于非结构化数据的处理方法仍然过于粗糙,无法详细解决非结构化数据的处理难题。参考文献1阳晓萍. B2C旅游电子商务网站个性化服务研究D.东华大学,2007.2闫飞. 电子商务网站个性化服务需求研究J. 科技创新导报,2008,18.3李明晶. 基于web挖掘的电子商务个性化推荐系统研究D.北京交通大学,2008.4罗昭君. 消费者在线订购旅游产品的影响因素分析D.华东理工大学,2014.5邵波,宋继伟. 国内外电子商务个性化服务研究分析J. 情报杂志,2008,07.6申云凤. 基于Web数据挖掘的电子商务网站个性化服务的研究J. 中国管理信息化,2011,08.7陈思佳. 电子商务个性化服务系统的研究与实现D.南京航空航天大学,2007.8蔡华利. 基于Web使用挖掘的电子商务个性化服务研究D.山西大学,2007.9邓晓懿. 移动电子商务个性化服务推荐方法研究D.大连理工大学,2012.10冯伟. 面向旅游电子商务的数据挖掘研究D.杭州电子科技大学,2014.11方长秀. 旅游电子商务个性化在线定制发展探析J. 现代商业,2010,06.12谭磊. 大数据挖掘M.电子工业出版社,2013:250-25213余力. 电子商务个性化理论、方法与应用M.清华大学出版社,2007.14詹荆.电子商务的个性化特征及其实现方法的研究D.北方交通大学,200115吴琴南. 基于技术变革的旅游商务模式创新研究以携程旅行网为例D. 厦门大学,2006.16庄玲盈. Web数据挖掘在个性化自适应网站中的应用D.重庆大学,2006.17冯丽桥. 基于Web挖掘技术的电子商务个性化推荐算法研究D.河北工业大学,2014.18张兴会. 数据仓库与数据挖掘技术M.清华大学出版社,2011:4-519吴昱. 大数据精准挖掘M.化学工业出版社,2014:6-720赵勇,林辉,沈寓实. 大数据革命理论、模式与技术创新M.电子工业出版社,2013:93-9521李森. 基于数据挖掘的旅游电子商务系统研究与实现D.电子科技大学,2011.参考: 毕 业 论 文论文题目学 院专 业年 级姓 名指导教师职 称(200 年 月)教务处制毕业设计说明书与毕业论文撰写的规范化要求一篇完整的毕业设计说明书或毕业论文有题目、摘要及关键词、目录、引言(前言)、正文、结论、谢辞、参考文献、附录等几部分构成。要求理工科专业不少于4000字,文科专业不少于6000字。一、毕业设计说明书撰写的主要内容与基本要求一份完整的毕业设计说明书应包括如下主要内容:1题目设计课题名称,要求简洁、确切、鲜明。2中外文摘要及关键词应扼要叙述本设计的主要内容、特点,文字要简练。中文摘要约300字左右;外文摘要约250个实词左右。关键词35个。3目录主要内容的目录。4前言应说明本设计的目的、意义、范围及应达到的技术要求;简述本课题在国内(外)的发展概况及存在的问题;本设计的指导思想;阐述本设计应解决的主要问题。 5正文(1)设计方案论证:应说明设计原理并进行方案选择。应说明为什么要选择这个方案(包括各种方案的分析、比较);还应阐述所采用方案的特点(如采用了何种新技术、新措施、提高了什么性能等)。(2)设计及计算部分:这是设计说明书的重要组成部分,应详细写明设计结果及计算结果。(3)样机或试件的各种实验及测试情况:包括实验方法、线路及数据处理等。(4)方案的校验:说明所设计的系统是否满足各项性能指标的要求,能否达到预期效果。校验的方法可以是理论分析(即反推算),包括系统分析;也可以是实验测试及计算机的上机运算等。6结论概括说明本设计的情况和价值 ,分析其优点、特色,有何创新,性能达到何水平,并指出其中存在的问题和今后的改进方向。7谢辞简述自己通过本设计的体会,并对指导老师和协助完成设计的有关人员表示谢意。8参考文献应列出主要参考文献。9附录将各种篇幅较大的图纸、数据表格、计算机程序等作为附录附于说明书之后。二、毕业论文撰写的主要内容与基本要求1题目题目应该简短、明确,要有概括性,让人看后能大致了解文章的确切内容、专业的特点和学科的范畴。题目的字数要适当,一般不宜超过20字。字体为2中外文摘要及关键词摘要也称内容提要,应当以浓缩的形式概括研究课题的主要内容、方法和观点,以及取得的主要成果和结论,应反映整个论文的精华。中文摘要约300字左右为宜,同时要求写出250个实词左右的外文摘要。关键词3-5个。摘要应写得扼要、准确,一般在毕业论文全文完成后再写摘要。在写作中要注意以下几点:(1)用精练、概括的语言表达,每项内容均不宜展开论证。(2)要客观陈述,不宜加主观评价。(3)成果和结论性意见是摘要的重点内容,在文字上用量较多,以加深读者的印象。(4)要独立成文,选词用语要避免与全文尤其是前言和结论雷同。(5)既要写得简短扼要,又要行文活泼,在词语润色、表达方法和章法结构上要尽可能写得有文采,以唤起读者对全文的阅读的兴趣。3目录(必要时)论文编写完成后,为了醒目和便于读者阅读,可为论文编写一个目录。目录可分章节,每一章节之后应编写页码。4前言前言是全篇论文的开场白,它包括:(1)选题的缘由。(2)对本课题已有研究情况的评述。(3)说明所要解决的问题和采用的手段、方法。(4)概括成果及意义。作为摘要和前言,虽然所定的内容大体相同,但仍有很大的区别。区别主要在于:摘要一般要写得高度概括、简略,前言则可以稍微具体些;摘要的某些内容,如结论意见,可以作为笼统的表达,而前言中所有的内容则必须明确表达;摘要不写选题的缘由,前言则明确反映;在文字量上前言一般多于摘要。5正文正文是作者对自己研究工作的详细表述。它占全文的较多篇幅。主要内容包括研究工作的基本前提、假设和条件;模型的建立,实验方案的拟定;基本概念和理论基础;设计计算的主要方法和内容;实验方法、内容及其结果和意义的阐明;理论论证,理论在实际中的应用等等。根据课题的性质,论文正文允许包括上述部分内容。正文的写作要求:(1)理论分析部分应写明所作的假设及其合理性,所用的分析方法、计算方法、实验方法等哪些是别人用过的,哪些是自己改进的,哪些是自己创造的,以便指导教师审查和纠正。这部分所占篇幅不宜过多,应以简练、明了的文字概略表达。(2)课题研究的方法与手段分别用以下几种方法说明:a用实验方法研究课题,应具体说明实验用的装置、仪器、原材料的性能是否标准,并应对所有装置、仪器、原材料做出检验和标定。对实验的过程或操作方法,力求叙述得简明扼要,对人所共知的或细节性的内容不必详述。b用理论推导的手段和方法达到研究目的的,这方面内容一定要精心组织,做到概念准确,判断推理符合客观事物的发展规律,符合人们对客观事物的认识习惯与程序。换言之,要做到言之有序,言之有理,以论点为中枢,组织成完整而严谨的内容整体。c用调查研究的方法达到研究目的的,调查目标、对象、范围、时间、地点、调查的过程和方法等,这些内容与研究的最终结果有关系,但不是结果本身,所以,一定要简述。但对调查所提供的样本、数据、新的发现等则应详细说明,这是结论产生的依据。若写得抽象、简单、结论就立之不牢,分析就难以置信,写作中应特别予以重视。(3)结果与讨论是全文的心脏,一般要占较多篇幅,在写作时,应对研究成果精心筛选,把那些必要而充分的数据、现象、样品、认识等挑选出来,写进去,作为分析的依据,应尽量避免事无巨细,把所得的结果和盘托出。在对结果作定性和定量分析时,应说明数据的处理方法以及误差分析,说明现象出现的条件及其可观性,交代理论推导中认识的由来和发展,以便别人以此为依据进行核实验证,对结果进行分析后所得的结论和推论,也应说明其使用的条件与范围。恰当运用表和图作结果与分析,是科技论文通用的一种表达方式。6结论结论包括对整个研究工作进行归纳和综合而得出的总结;所得结果与已有结果的比较以及在本课题的研究中尚存在的问题;对进一步开展研究的见解与建议。它集中反映作者的研究成果,表达作者对所研究课题的见解和主张,是全文的思想精髓,是文章价值的体现。一般写得概括、篇幅较短。撰写时应注意下列事项:(1)结果要简单、明确。在措辞上应严密,容易被人领会。(2)结果应反映个人的研究工作,属于前人和他人已有过的结论可不提。(3)要实事求是地介绍自己研究的成果,切忌言过其实,在无充分把握时,应留有余地。因为对科学问题的探索是永无止境的。7注释如有引用他人成果的,一定要有注释。不管在论文的哪一部分,采用到前人的观点、方法、结论、成果时,都必须注明其来源。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论