




免费预览已结束,剩余14页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目 录1 前言21.1背景21.2研究现状22 电子商务中信息服务的特点32.1企业信息需求的新特点32.2信息服务的新特点43 电子商务中的数据挖掘技术43.1关联分析(association analysis)53.2数据分类(data classification)63.3聚类分析(clustering analysis)63.4序列模式挖掘(sequence pattern mining)74 电子商务中数据挖掘技术的应用 4.1企业电子商务中对信息服务挖掘利用的基本方案84.2 Our Mall方便购的关联规则分析网络营销策略105 总结155.1基于Web数据挖掘技术的电子商务模式兴起155.2总结16论电子商务中数据挖掘技术的应用1 前言1.1背景正在蓬勃发展的新经济对全球的影响将是全方位的,电子商务就是这场经济浪潮的典型代表。电子商务正以前所未有的力量冲击着人们千百年来形成的商务观念与模式,它直接作用于商务活动,间接作用于社会经济的各个方面,正在推动人类社会继农业革命、工业革命之后的第三次革命。随着Internet的普及,电子商务的兴起,正在改变着人们的商务理念,经销商和客户之间通过互联网进行交易,节省了大量的费用和时间。如何更快、更好的利用这一现代交易手段,缩短经销商和客户之间的距离,这是目前电子商务亟待解决的问题。信息过量几乎成为人人需要面对的问题。“如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率,变得十分重要”。尹科强,2004:数据挖掘技术在电子商务环境下的应用,新华出版社,第七期,第8版因此,数据挖掘技术应运而生,并且显示出越来越强大的生命力。如果能跟踪客户在Web上的浏览行为并进行模式分析,就能很好的解决这一问题。这正是目前Web数据挖掘研究的领域。在在线市场访问的每一个客户,都会在他的服务器上留下记录,通过对这些记录进行挖掘,如客户的访问行为、频度、内容、时间等,提取客户相关的知识,展开有针对性的电子商务行为。利用数据挖掘技术可以帮助商家了解客户以往的需求趋势,并预测未来,从而给商家带来巨大的利润。1.2研究现状在国内,数据挖掘技术被列为对工业产生深远影响的五大关键技术之首,投资焦点的十大新兴技术之一,与国外相比该技术的研究较晚,没有形成整体力量,大部分企业仍然处在报表阶段。非结构化数据的知识发现、聚类分析及Web数据挖掘的应用等都是国内未来发展的主流,但在国外企业整体力量雄厚,数据挖掘技术在电子商务领域应用广泛,对电子商务中该技术的各个功能研究年份较长,开展的研究项目也远远多于国内,国外大部分企业处在中端数据分析阶段,但有快速发展趋势,越来越多的企业开始利用高端的数据挖掘技术在电子商务中获得巨大的商业利益.2 电子商务中信息服务的特点2.1企业信息需求的新特点2.1.1 准确的客户分析与其他的商务模式相比,电子商务可以说是真正以顾客为导向的商务模式。Internet为企业和客户提供了便捷的通信途径,更重要的是,为客户提供了一种廉价而又快速的信息获取手段。在电子商务环境下,过去矗立在顾客面前的许多信息壁垒消失于无形,顾客信息的劣势地位得到了逆转,企业不再对顾客拥有绝对的信息优势。同时,由于高科技的支撑,顾客的需求得以完全呈现在企业面前,使企业为顾客提供大规模个性化服务第一次成为可能。这些,都意味着顾客已经真正成为整个电子商务的中心,每个企业都希望能够详细的了解自己的顾客。2.1.2 数据库分析在电子商务环境下,企业信息流的地位变得前所未有的重要,物流、资金流的变化都反映在信息流中,而信息流的广度、深度、数量也远大于以往。可以说,企业电子商务的正常运转在很大程度上反映了企业电子商务的状况。庞大的信息流数据一般是存储在各种数据库中的。这样,要对信息流进行分析,把握企业电子商务的状况,就离不开对数据库的分析。2.1.3 企业电子商务系统的建设与完善电子商务在企业中的实施是一项系统工程,它要求对企业的业务流程进行全面的改造。业务流程的改变同样会引起企业组织结构、管理决策等多方面的改变。在这种全面的改造中,企业必然会产生大量的信息需求。同时,电子商务系统不是一次就能建成的,需要不断地进行完善,从而能够真正做到面向顾客(包括组织内外的顾客)。2.1.4 更加需要结论而不是原始信息在传统环境下,企业由于获取信息的渠道较少,信息搜集有困难,因此往往要求信息服务商提供大量的原始信息。但在电子商务环境下,企业获取信息的能力得到极大的提高,企业的问题不是缺乏信息而是信息过剩,缺乏有效的手段来对信息进行分析。因此,在这种情况下,企业一般希望从信息服务商那里直接得到结论。面对电子商务的新特点以及企业新的信息需求,电子商务环境下的信息服务也不可避免的出现了一些新特点。2.2信息服务的新特点2.2.1 信息服务商与企业的关系更为密切电子商务的成功不能缺少有效的信息支持,企业对信息的依赖程度增强。为了保证企业能得到持续高效的决策信息支持,企业采取多种方式(例如战略同盟、业务外包)与信息服务商建立起紧密的联系,让信息服务商直接参与到企业的管理决策中来。可以说,信息服务商在某种程度上已经融入到了企业之中。2.2.2 信息服务的速度更快电子商务环境下市场瞬息万变,信息流动的速度极快。企业必须在极短的时间内对市场的变化做出反应。因此,对信息服务的速度要求甚至超过了准确性要求。信息服务商也必须提高自己的反应速度,避免服务结果过时。2.2.3 传统的分析技术已经不能满足需要面对电子商务活动产生的海量数据,以往的人脑分析和普通的计算机辅助技术(如数据库技术、计算机统计分析技术)显得力不从心。而且,过去的信息服务商更加擅长收集和整理信息而不是分析信息。面对新的情况,信息服务商也意识到必须采用新的技术才能够有效的处理电子商务活动中的海量数据,并从中得出有用的结论。对于信息服务商来说,可以采用的新技术中,知识发现技术(数据仓库、数据挖掘、文本挖掘等)是一个重要的组成部分,而目前数据挖掘技术在电子商务活动中更是得到了广泛应用。3 电子商务中的数据挖掘技术数据挖掘是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律性并进一步将之模型化的先进、有效的方法。简单地说,数据挖掘是从大量数据中提取或“挖掘”知识。该术语实际上有点用词不当。注意,从矿石或砂子挖掘黄金称作黄金挖掘,而不是砂石挖掘。这样,数据挖掘应当更正确地命为“从数据中挖掘知识”,不幸的是这有点长。 数据挖掘(Data Mining)和数据库知识发现(Knowledge Discovery in Database,KDD)是近年来随着数据库和人工智能技术的发展而出现的全新信息技术,同时也是计算机科学与技术,尤其是计算机网络的发展和普遍使用所提出的、迫切需要解决的重要课题。很多人将数据挖掘和KDD作为互换的术语来使用,其实它们是有区别的,KDD是一个综合的过程,包括实验记录、迭代求解、用户交互以及许多定制要求和决策设计等。而数据挖掘是指从数据中提取模式的过程,所以数据挖掘只是KDD中的一个具体但又关键的步骤。 数据挖掘工具能够对将来的趋势和行为进行预测,从而很好地支持人们的决策,比如,经过对公司整个数据库系统的分析,数据挖掘工具可以回答诸如“哪个客户对我们公司的邮件推销活动最有可能做出反应,为什么”等类似的问题。有些数据挖掘工具还能够解决一些很消耗人工时间的传统问题,因为它们能够快速地浏览整个数据库,找出一些专家们不易察觉的极有用的信息。数据挖掘技术在分析竞争对手方面能提供有效的帮助。下面讲述几种数据挖掘技术在电子商务活动中的应用。3.1关联分析(association analysis) 关联分析用于发现大量数据之间有趣的关联或相关关系,这些关系可以辅助很多商务决策的制定。实际上,关联分析回答了这样一个问题:“什么东西和什么东西之间存在着联系?”在电子商务中,对销售数据和客户数据进行关联分析的结果可以辅助一些商务活动的决策,例如分类设计、交叉营销和促销分析等;而对网站访问数据的分析则可以用来判断客户访问网站各文件之间的联系,从而改进站点的设计;对竞争环境和竞争对手的数据进行关联分析,则可以判断竞争对手的动向以及市场趋势。关联分析的一个应用:交叉营销。交叉营销是指向现有的客户提供新的产品和服务的营销过程。例如购买了婴儿奶粉的顾客很可能对其他的婴儿产品也感兴趣,这个道路很简单,但是只有找到非常精确的模型后,才可能从中获利。现假定有一家保险公司,希望对现有的客户进行交叉营销。首先,保险公司需要对自己客户的数据仓库(或者是数据库)进行关联分析,从关联分析的结果可以看出,哪些险种经常被客户同时购买。仅仅知道这一点是不够的,还需要分析同时购买这些险种的客户的特征,这样才能建立起比较完整的模型。比如说,父母为了自己的孩子同时购买教育险和寿险。最后一步是运用已经得到的模型对你的客户数据进行评分,依据评分的结果对客户进行符合其特点的交叉营销。3.2数据分类(data classification)数据分类将大量的数据按照一定的规则分成不同的特征群体,它是一个两步过程。第一步是建立一个模型,描述预定的数据类集或概念集,即制定分类标准;第二步是使用模型对数据进行分类。分类有着广泛的应用,在电子商务中,常用来进行信誉证实、客户细分和选择邮寄等,对网站的访问记录进行分类,可以知道每一类客户最喜欢访问的页面分别是什么,而对竞争对手的数据进行分类,则可以进行竞争对手识别。数据分类的一个应用:选择邮寄。通常销售商在向消费者邮寄各种资料时基本上没有进行区别,不管消费者是否对这些资料感兴趣,他都会得到这些资料。这样做的后果是增加了销售商的成本,降低了宣传效果,还很有可能引起消费者的反感。而选择邮寄则是对邮寄对象进行区别,只给真正对资料感兴趣的客户邮寄资料。假如有一家服装公司,在换季的时候需要邮寄新品信息和降价信息,这家公司有一个销售数据库,另外有一个邮寄清单数据库,描述了客户的基本属性,但是不知道客户是不是对这些信息感兴趣,这时需要对这些客户进行分类。首先是建立模型从销售数据库中随机抽取数据,组成训练数据库(用于建立模型)和评估数据库(用于评估模型)。建模时需要预定义类,以便进行数据分析。在这里预定义的类是“购买新品的客户”和 “购买降价品的客户”。当然,如果邮寄的量比较小,则可以更加精确的对类进行预定义,例如,“每年都购买新品的客户”和 “每年都购买降价品的客户”。对训练数据库按照预定义的类标准进行分析,就可以得出上述两类客户的特征,即模型。再使用评估数据库对模型进行评估,直到评估的准确率可以接受后,就可以开始分类。分类是按照模型对清单数据库中的数据进行分析,得出的结果就可以帮助公司确定需求向哪些客户邮寄什么样的资料。3.3聚类分析(clustering analysis)聚类是将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。与分类最大的不同是,分类一开始就预定义了类,对类的特征进行了一定程度上的描述;聚类过程一开始并没有固定的类标记,而是直接生成多个数据集合,然后再描述这些数据集合的特征。因此,聚类的算法更为复杂,其应用也比分类更为广泛。电子商务活动产生大量的底层数据,决策者无法直接从这些数据中得出有用的结论。而经过聚类处理后,可以给决策者提供基于这些底层数据之上的一个试图,使他们不至于迷失在数据的海洋中。例如,对顾客数据进行聚类分析,可以知道在这个行业中哪些企业取得了成功,而进一步分析则可以确定这些企业取得成功的原因是什么,等等。聚类分析的一个应用:客户保护。在物质产品空前丰富,市场竞争激烈的今天。每一个消费者在购买商品时都面临着极大的选择空间。对于一个企业来说,要想保持一个顾客对自己的产品和服务的忠诚是很困难的。然而,市场营销理论告诉我们,开发一个新客户的代价要远远大于保持一个就客户的代价,因此,保持原有客户的工作也越来越有价值。假设某个移动通信公司正处于客户大量转移(即用户从一个供应商转向另一个供应商,这在移动通信领域实际上是一种现实)的境地,业内的平均客户迁移率将是2.2%,即公司每年将损失大约27%的客户。这种损失对于公司来说是难以承受的,因为移动通信公司开发一名新的客户需要花费300美元或是更多,而且新客户的盈利能力不如离开的客户。这样,公司迫切需要了解什么样的客户流失了而且是什么因素导致了他们的流失。使用聚类分析技术来完成这一任务虽然十分复杂,但是却可以对用户情况进行深入的了解。对公司的客户数据库(包括现有的客户和已经转移的客户,其中的数据是一般的地理分布信息和客户基本信息,以及客户使用移动电话的情况)进行聚类分析,其结果是产生了多个细分的客户群,这些细分群有不同的迁移率,每个细分群有一些特定的客户特征定义,如年龄、职业、客户的合同类型、每月的通信量等。迁移率高的细分群告诉我们什么样的客户容易流失,再对他们进行详细分析,就可以知道流失的原因,然后采取相应的措施降低迁移率,保持现有的客户。3.4序列模式挖掘(sequence pattern mining) 序列模式挖掘是指挖掘相对时间或其他模式出现频率高的模式。这种模式通常表现为“一些事务紧接着另一些事务”。与前面3种技术所不同的是,前3种技术是将某一段时间内的数据作为一个整体进行分析,时间的先后并不是十分重要,而序列模式挖掘则是考察多个连续的时间段内数据之间的前后联系。相对来说,序列模式挖掘与关联规则挖掘的关系最为紧密,其很多算法都是以关联规则挖掘的算法为基础的。在电子商务中,序列模式挖掘可以用来分析消费者的 行为,改进站点的设计,对竞争对手的分析则可以了解对手的行动特点,从而预测对手的行动。例如,通过分析知道竞争对手每次兑现有产品降价后的15天到30天内就会推出新产品,就可以在对手再次降价后抢先推出自己的新产品,以抢占市场。 序列模式挖掘的一个应用:网站改进。电子商务网站是根据经验建立起来的,其站点组织结构不可能完全符合访问者的习惯,因而用户在访问网站时经常会觉得找不到自己想看的网页。一个网站的组织结构如果能够符合用户的访问习惯,就可以免去用户自身的许多劳动,从而吸引用户,所以必须分析用户的访问习惯。为了做到这一点,可以采用序列模式挖掘加上分类技术以得出不同类型用户的访问习惯。首先按对网站的 访问记录进行序列模式挖掘,得出多个不同的 序列模式,从中选出有代表性的模式(即采用这种模式的用户组够多)作为分类标准对用户信息进行分类,找出不同的 用户群及其偏爱的访问模式。对于大多数用户都采用模式,应该按照模式调整网站的整体结构,而对于其他模式,则可以采用个性化服务技术,针对不同的用户提供符合其访问模式的站点组织形式。当然,数据挖掘的实际实施过程远比上面所述的复杂。不可否认的是,数据挖掘在电子商务中的应用有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本,提高个性化服务水平。同时,还可以帮助企业识别其竞争对手,了解竞争对手的动态,及时对竞争对手的行动做出反应。我国虽然已经推行了多年的市场经济,但大多数企业的竞争水平还停留在一个较低的层次上,缺乏对客户和竞争对手的分析,市场开拓和营销手段极为有限。这也是很多企业陷入“价格战”这一怪圈的原因(价格战导致大量的企业利润率极低)。在电子商务环境下,顾客已经成为了一种稀缺资源,谁能够以较低的成本赢得顾客,谁就能在激烈的竞争中脱颖而出。传统的市场和营销手段显然是难以做到这一点的,而数据挖掘技术则能够实现这一目标。4 电子商务中数据挖掘技术的应用4.1企业电子商务中对信息服务挖掘利用的基本方案相对于企业,信息服务商在数据挖掘的应用方面有更大的优势:数据挖掘的应用需要多方面人才的共同配合,信息服务商在人才储备上是比较充分的;信息服务商的信息管理水平较高,为数据挖掘的应用奠定了良好的基础;信息服务商掌握了大量的信息源,可以提供全面的分析结果。另外,有信息服务上来提供数据挖掘应用需要较大的投入,而且一旦实施不成功,往往会给企业带来灾难性的后果,由信息服务商来提供这种服务,成功率更高,即使失败,企业也只是损失了一笔信息服务的费用。而信息服务商可以向多家企业提供这一服务,降低了成本同时也降低了风险。电子商务数据源信息服务商企业其他数据源服务商数据源企业信息部门战略决策部门数据挖掘竞争对手分析竞争策略调整企业战略调整网站优化企业电子商务系统市场、营销、研发部门选择邮寄个性化系统建设客户细分与保持交叉营销营销策略调整新产品开发图4-1 数据挖掘应用方案在应用方案中(如图4-1)谢新洲,2004:数据挖掘技术在电子商务环境下的应用,新华出版社,第七期,信息服务商对各种数据源综合管理,在此基础上运用数据挖掘技术进行分析,并将分析结果传送给企业的信息部门,企业信息部门对分析结果进一步处理后,发送给企业的信息部门,企业信息部门对分析结果进一步处理后,发送到企业的不同部门以及电子商务系统。同时,企业的其他部门对得到的分析结果进行处理后,从中得出一些战略性的分析结果,也可以为战略决策部门提供支持。这些结果可以应用到企业经营管理的多个领域中,并有效的职称电子商务系统的运营。当然 ,在实际实施中,应用领域可能更多。如果从信息流的角度来看整个应用方案,则可以得到如图4-2所示的结果。企业信息部门电子商务系统分析结果企业信息部门信息流反馈流决策流图4-2 应用方案信息流程图信息服务商战略决策部门从图4-2可以看出,应用方案有效地规范了企业的信息流,突出了信息部门在企业中的地位。此外,通过各种反馈途径,信息服务商和企业之间建立了紧密的联系,信息服务商也能够及时地按照企业的要求调整自己提供的服务结果。对于企业来说,该应用方案提供了多种基于数据挖掘的电子商务应用,企业可以按照自身的实际情况,向信息服务商定制需要的服务,将有限的资金投入到嘴需要的领域中。这同时也说明了该应用方案不仅适用于大型企业,也适用于中小型企业,中小型企业虽然资金有限,但信息需求也相对单一,仅仅选择应用方案中的少数几项应用服务并不需要大量的资金。4.2 Our Mall方便购的关联规则分析网络营销策略Our Mall方便购是一家以因特网为基础的电子商店,从台湾南部地区的校园开始,以学生、教职员为目标市场,推出包含食品、日常用品、家电用品、计算机接口设备、文具用品等等众多商品。消费者从网络上加入会员、订购产品,当天上午订购的商品可以在当天下午从设置在校园中的“取货中心”领取商品,现场取货现场付款。还会不定时推出促销商品、特价商品。Our Mall方便购以因特网的方便省时为号召,提供消费者坐在家里就可以购物,采取货到付款的方式,不满意一周内还可以退货。整个Our Mall方便购的系统流程主要分为两部分,一为消费者所接触的购物流程,包括注册登入、购物及结帐等;另一个是接受单订后的物流中心流程,包括订单的处理、配量作业和路线安排等直到货物送出依照数据挖掘的步骤,我们制定一套数据探勘计划,进行Our Mall方便购的消费性产品的分析。4.2.1定义问题及需求在网络畅行无阻的校园中,Our Mall方便购建立以学生为消费主轴的电子商务。由于是实验性质的网站,消费者的习性与适用商品与校园外的环境并不相同。因此,希望能够透过数据挖掘的技术,尝试性的了解商品间的关联,进一步了解消费者的习性。因此,数据挖掘的目的在于分析交易数据库中的产品被采购的消费关系,分析出经常被重复购买或一起购买的产品,并与网站的设计与促销活动的有效性作比对。4.2.2收集资料资料的来源有二:环境背境数据与交易数据。环境背境数据包括从Our Mall方便购内部所制定的目标市场、市场定位、物流管理、营销活动和数据库等相关数据。外部数据则是消费者实际浏览网站并购物的整个购物流程,所留在数据库中的与交易相关的数据。1环境背境数据目标市场:南区几所大专院校学生、教职员登录在Our Mall的学校、科系、年龄、地理位置等等。市场定位:零售食品、日常用品、家电用品、计算机接口设备、文具用品等商品数据。网页内容:网占有登入时会出现的热门商品及新品介绍,每项产品均有图标、规格、价钱的说明,每页产品约为六至八项。物流管理:网络下单后,接单部门透过物流管理系统进行信用审用、订单数据处理、商品库存等。再交由出货部门贴标、装箱,依客户路线配送出货。被订购的商品每日由物流中心统一向各校取货中心发送。营销活动:在校园内发送广告单,每期在DM上会推出特价商品,网页上会有“主厨推荐”、“每日e物”的产品介绍,在取货中心会不定期展示促销商品,接受顾客一定期限内的退货要求。2交易数据购物流程为:注册登入购物购物车结帐订单取货。这一连串过程中会出现的与订单相关的交易数据。消费者注册为会员后才有资格购买,选择产品后会先加入购物车当中,购物车会有小计及总计的购物金额。在送出结帐前,购物车会保留产品直到下次再登入购物。本案例中的电子商店所使用的是IBM Net.Commerce的电子商城系统,系统本身预设了非常多的数据表(共有210个数据表),实际与Our Mall有关的,有储存数据的数据表只有30个。本计划主题真正需要使用到的数据表,包括:产品数据表(PRODUCT)、购物数据表(SHIPTO)、订单数据表(ORDERS)、会员资料表(SHADDR)等等。4.2.3准备资料1选择需要的字段:Net.Commerce预设的数据库中有许多的数据表或字段是备而不用或不适用。举例来说,原先的购物数据表有17个字段,包括没有数据或数据挖掘时不需要的字段,例如产品的税率编码(STPCODE)和币值(STCPCUR)。将这些字段去除后只选择“购物表主键”“订单编号”、“购买者编号”、“产品编号”、“价格”、“交易状况”等6个字段。订单数据表选择前是17个字段,选择后只保留6个字段,产品数据表和会员数据表只参考其中某几个字段并不需要选择过滤。其余的数据表处理方式也是如此。2过滤记录:数据表中有些记录的值为空值,有些记录的值有错误。在顾客的数据表中常会有填错数据或假造的数据。例如未完成的交易在订单编号的字段会是空值,有些顾客不愿意填写真实E-mail、系别乱填等等。在分析的过程中必须辨明这些错误的记录予以消除或不列入分析。以购物数据表为例,在订单况状(STSTA)字段,订单的状况可以分为己经完成(C)、删除(X)、处理中(P),本计划仅将己经完成的订单过滤出来分析。最后过滤购物数据表的结果为:过滤空值:过滤前1295笔过滤后939笔去除未完成的交易:过滤前939笔过滤后738笔3字段的对应:为了方便记录及分类,在储存数据或分类的过程中会以数字或英文字母的编号等许多的方式来代表同一种数据。这些不同名称但相同作用的数据在分析时会造成误解,或分析时会造成解读的不便。例如产品的编号被广泛应用在数据表中,但光看编号无法直接知道产品名称,所以在数据挖掘前为产品的编号作一个对应就可以了解在编号的背后,产品的名称为何。4.2.4数据挖掘与规则分析当所有资料都准备好之后,就可以进行数据挖掘。在软硬件设备齐全的情况下,依据所要了解的关联而给与不同参数设定值,本案例将以订单及顾客二种观点作为关联法则的执行条件。针对“购物关联”为主要处理数据表,经过数据处理后的数据数为738笔。1实验一、以订单编号为执行条件(Transaction)、产品编号为分析项目(Item) 支持度及可信度的值:5 %, 25 %运算执行时间:6秒产生规则数:无这是没有结果的数据挖掘,只花了6秒钟就结束运算,且没有规则产生。这表示在支持度及可信度的设定上有问题,因此必须再重新考虑及设定。因为本案例是属于网络的零售百货业,所以产品之间关联的支持度不会太高,因此下个实验将会降低支持度的值。支持度及可信度的值:0 %, 25 %运算执行时间:15 sec产生规则数:2Transaction的数量:325Item的数量:254由于Transaction和Item的数量过于接近,表示区隔分类过细所以挖掘出的规则只有两条。分析规则表的第一条规则:68.4%的顾客购买“丽滋香草三明治”同时也会买“丽滋起司三明治”,而这条关联规则在订单中产生的机率是4%。在本案例中订单量只有325笔而产品却有254笔,这样的结果显示,因订单不够多,产品杂而多所以不容易发现其中的规则,产品之间的关联性不大。2实验二、以顾客编号为执行条件(Transaction)、产品编号为分析项目(Item) 支持度及可信度的值:5 %, 50 %运算执行时间:5 sec产生规则数:4Transaction的数量:183Item的数量:254实验二规则的最高支持度高达6.557%,可信度最低也有55.6%,Transaction数量明显减少,在183个区隔分类下,发掘消费者除了丽滋饼干外也喜欢品客洋芋片,分析产品的属性,发现两类产品都是零食,原味的品客还是较受欢迎由于实验二中支持度和可信度的值设定较高,为了避免遗漏其它重要规则,我们重设实验二的支持度和可信度,同样以顾客编号为执行条件(Transaction)和产品编号为分析项目(Item),放宽支持度和可信度,实验是否有更多规则产生。支持度及可信度的值:0 %, 25 %运算执行时间:9 sec产生规则数:6Transaction的数量:183Item的数量:254重新产生的规则和第一次实验的值相当接近,新规则的可信度未达50%。产品属性是零食、低价,在口味的选择上还是不变。结果更加强调顾客对这几项产品的喜爱,可以分析出消费者的喜好是低价的食品、特别是原味及起司和洋葱口味,对于品客的其它比萨或鸡汁口味,并不是顾客的最爱。3可视化规则呈现可视化的关联规则呈现(图表 Fayyad, U.M., Data Mining and Knowledge Discovery: Making Sense out of Data, IEEE Expert, Vol.11, No.5, October 2005,pp.20-25),目的是让使用者可以更容易的了解关联结果。图中的点(Nodes)代表的是产品项目,箭头联机(Links)是表示产品项目之间的关联。点的大小、颜色有不同的意义,点愈大颜色愈趋于暖色系,表示支持度愈高,反之异然。相对的,联机的粗细和颜色也有不同意义,联机愈粗、颜色愈趋于暖色系,表示关联的可信度愈高。实验中支持度的值是极为相近,所以点的大小差异不大,颜色则为绿色及黄色;右图实验一中丽滋饼干的关联高达60%以上所以联机是红而粗;相对的实验二中品客洋芋片的关联少于丽滋饼干,所以品客洋芋片之间的联机就较细,而颜色是蓝色及绿色。5 总结5.1基于Web数据挖掘技术的电子商务模式兴起5.1.1 传统电子商务模型 在传统的电子商务结构模型(如图5-1所示)中移动设备和PC客户端通过互联网与Web应用服务器通信,应用服务器与后台的数据库服务器进行信息交流。该应用系统通常工作在分布的环境中。移动设备Internet客户端应用服务器数据库服务器图5-1传统电子商务结构模型 应用服务器为应用业务提供了一个运行环境。在这个运行环境中,各层应用和商业服务分离为各种组件,这些组件通过网络相互通信。应用软件在Web应用服务器及其内嵌的JVM(Java Virtual Machine,Java虚拟机)中运行。这些服务器的组件利用网络基础架构提供的目录和安全服务,通过HTTP或IIOP(Internet Inter-ORB Protocol)与客户端和其他组件通信。5.1.2 基于数据挖掘技术的电子商务模型 基于数据挖掘技术的电子商务模型(如图5-2所示)除了包括传统电子商务模型中的基本构件外,添加了知识库服务器。应用服务器除了和数据库服务器交流外,也可以和知识库服务器进行信息交流,例如应用服务器向知识库服务器提出数据挖掘请求后,知识库服务器通过数据挖掘引擎,对数据库进行数据挖掘处理,结果返回给应用服务器。移动设备Internet客户端Web应用服务器知识库服务器数据挖掘引擎数据库服务器图5-2 基于Web挖掘的电子商务模型Web挖掘是Internet技术和数据挖掘技术的结合,它对Web网站上电子商务过程中产生的数据进行挖掘、发现知识,有利于信息的准确检索、个性化的信息服务、改进门户站点的设计、制定针对性的销售策略、构建智能化Web站点,进而提高网站的声誉和效益。Web挖掘是电子商务营销创新的重要技术手段,对电子商务企业在激烈的市场竞争中获得生存和发展具有重要的作用。5.2总结对于给定的数据库,数据挖掘技术能够自动趋势预测、自动探测以前未发现的模式、还可以让现在有的软件和硬件更加自动化,并且在升级的或者新开发的平台上执行,从而产生巨大的商业利润。全面集成了客户、供应者以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025专业产后恢复中心个性化营养食谱定制合同
- 2025工程咨询合同范本专业版
- 2025年生态农业科技园招商合作协议:绿色金融扶持项目合同
- 2025年专业保险代理居间合同附带财务风险评估与管理服务
- 2025年度科研机构知识产权战略规划与实施合同
- 2025年全球视野拓展国际研学旅行服务合同
- 2025年度城市更新项目公共租赁住房购置专项采购合同
- 2025年度银行间市场利率互换交易合同样本
- 2025年大型光伏发电项目光伏板安装与后期维护服务合同
- 2025年连锁美容品牌店美容师服务合同样本
- 2025-2026学年人教版(2024)小学数学三年级上册(全册)教学设计(附目录P296)
- 离婚协议书下载电子版完整离婚协议书下载
- 《Photoshop图像处理》课件-第一讲 认识PS
- 新媒体运营全套PPT完整教学课件
- 出境竹木草制品自检自控计划书(2021年报海关)
- 压力容器材料
- 招标投标法9个课件
- 100个最具争议的涉税经典稽查案例深度解析1增值税退税
- 高等数学上册ppt课件完整版
- 网店美工与视觉设计全书ppt完整版课件最全电子教案正本书教学教程
- 胸部检查(二)肺与胸膜检查
评论
0/150
提交评论