电子商务中数据挖掘技术的应用研究_第1页
电子商务中数据挖掘技术的应用研究_第2页
电子商务中数据挖掘技术的应用研究_第3页
电子商务中数据挖掘技术的应用研究_第4页
电子商务中数据挖掘技术的应用研究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据库与信息管理本栏目责任编辑:闻翔军Computer Knowledge and Technology 电脑知识与技术第6卷第9期(2010年3月电子商务中数据挖掘技术的应用研究孙亦博(洛阳师范学院信息技术学院,河南洛阳471022摘要:随着电子商务的普及和数据挖掘技术的发展,将数据挖掘技术应用到电子商务中可以解决电子商务中数据量庞大的问题,从而获得真正有价值的信息。文章简要的介绍了电子商务以及数据挖掘的概念,并针对电子商务中所使用到的分类、聚类分析、关联规则挖掘、序列模式分析等主要数据挖掘技术进行了详细的分析,这些数据挖掘技术的使用可以帮助企业节省开支,细分市场,规划网站以及制定合理的营销

2、策略,从而促使电子商务能更好、更快的进行。关键词:电子商务;数据挖掘;聚类分析;关联规则挖掘中图分类号:TP274文献标识码:A 文章编号:1009-3044(201009-2059-02Application of Data Mining Technique in E-commerceSUN Yi-bo(Institute of Information Technology,Luoyang Normal University,Luoyang 471022,ChinaAbstract:With the wide use of E-commerce and the development of

3、data mining technique,the application of data mining technique in E-commerce can solve the problem of large number of data in it,and dealer can also get the truly worthy information.The issue discusses the concept of E-commerce and data mining and it also makes particular description of data mining

4、technique,for example,classification,clustering,mining of association rules and mining of sequence mode.This technique can help the enterprise save expenditure,segment market,plan website,establish reasonable marketing strategy,and then the E-commerce develops faster and better.Key words:E-commerce;

5、data mining;clustering;mining of association rules随着Internet 的普及,电子商务得到了前所未有的发展,经销商和客户之间通过互联网进行交易,节省了大量的费用和时间。但是在电子商务中充斥着大量的数据,如何从这些大量的数据中挖掘出真正有价值的信息,帮助企业经销商制定更好的营销策略是电子商务急需解决的问题。数据挖掘,又称数据库中的知识发现(Knowledge Discovery in Database ,KDD,也就是从大量的数据中挖掘出有用信息的一种技术。利用数据挖掘技术可以使经销商从大量的数据中挖掘出有用的信息帮助决策,从而在市场竞争中获得

6、优势地位。1电子商务概述电子商务指交易当事人或参与人利用现代信息技术和计算机网络(主要是因特网所进行的各类商业活动,包括货物贸易、服务贸易和知识产权贸易。“电子商务”中所包括的“现代信息技术”应涵盖各种使用电子技术为基础的通信方式;“商务”指不论是契约型还是非契约型的一切商务性质的关系所引起的种种事项。如果将“现代信息技术”看作一个子集,“商务”看作另一个子集,电子商务所涵盖的范围应当是这两个子集所形成的交集,即“电子商务”标题之下可能广泛涉及的因特网、内部网和电子数据交换在贸易方面的各种用途。电子商务与传统商务相比有以下优点:1电子商务将传统的商务流程数字化、电子化,让传统的商务流程转化为电

7、子流、信息流,突破了时间空间的局限,大大提高了商业运作的效率。2电子商务简化了企业与企业,企业与个人之间的流通环节,最大限度地降低了流通成本,能有效地提高企业在现代商业活动中的竞争力。3电子商务是基于互联网的一种商务活动,互联网本身具有开放性全球性特点,电子商务可为企业及个人提供丰富的信息资源,为企业创造更多商业机会。4电子商务对大型企业和中小企业都有利,因为大中型企业需要买卖交易活动多,实现电子商务能有效地进行管理和提高效率,对小企业同样有利,因为电子商务可以使企业以相近的成本进行网上交易,这样使中小企业可能拥有和大企业一样的流通渠道和信息资源,极大提高了中小企业的竞争力。5电子商务将大部分

8、商务活动搬到网上进行,企业可以实行无纸化办公节省了开支。2数据挖掘技术数据挖掘(Data Mining ,DM技术是随着计算机的广泛应用和数据的大量积累而发展起来的。数据挖掘是从大量的数据中提取或“挖掘”知识,即发现其中隐含的,未知的,有意义的信息的过程,它又被称为“数据库中知识发现”(KDD,也有人把数据挖掘视为数据库中知识发现的一个基本步骤,知识发现过程由以下步骤组成:1数据清理;2数据集成;3数据选择;4数据变换;5数据挖掘;6模式评估;7知识表示。从商业的角度定义,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取

9、辅助商业决策的关键性数据。利用功能强大的数据挖掘技术,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。数据挖掘与传统的数据分析的不同是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和实用3个特征。3数据挖掘在电子商务中的作用数据挖掘技术之所以可以服务于电子商务,是因为它能够挖掘出活动过程中的潜在信息以指导电子商务活动。在电子商务中收稿日期:2010-02-26作者简介:孙亦博(1981-,女,河南洛阳人,洛阳师范学院信息技术学院,助教,计算机应用硕士,主要研究方向为图形图像。ISSN 1009-3044Computer Knowle

10、dge and TechnologyComputer Knowledge and Technology电脑知识与技术第6卷第9期(2010年3月的作用有7个方面:1挖掘客户活动顾虑,针对性的在电子商务平台下提供“个性化”的服务。2可以在浏览电子商务网站的访问者中挖掘出潜在的客户。3通过电子商务访问者的活动信息的挖掘,可以更加深入的了解客户需求。4通过挖掘网上顾客的购买行为,可以帮助制定合理的产品策略和定价策略。5通过对商品访问情况和销售情况进行挖掘,可以帮助制定产品营销策略,优化促销活动。6优化电子商务网站的信息导航,方便客户浏览。7通过客户在网络上浏览时的拥塞记录发现网站的性能瓶颈,从而提高

11、网站的稳定性,保证电子商务购物快速进行。4电子商务中数据挖掘的技术与方法电子商务中的数据挖掘过程一般包括3个主要的阶段:数据准备、数据挖掘、结果解释和评价。1数据准备又可分为数据选取和数据预处理两个步骤。数据选取的目的是确定发现任务的操作对象。即目标数据,是根据用户的需要从原始数据库中抽取的一组数据。数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换以及对数据降维。2数据挖掘阶段首先要确定数据挖掘的目标和挖掘的知识类型。确定挖掘任务后,根据挖掘的知识类型选择合适的挖掘算法,最后实施数据挖掘操作,运用选定的挖掘算法从数据库中抽取所需的知识。3结果的解释和评价。数据挖掘阶

12、段发现的知识,经过评估,可能存在冗余或无关的知识,这时需要将其剔除,也有可能知识不满足用户的需求,需要重复上述挖掘过程重新进行挖掘。另外,由于数据挖掘最终要面临用户,因此,还需要对所挖掘的知识进行解释,以一种用户易于理解的方式供用户所使用。数据挖掘按照其挖掘任务主要包括分类和预测、聚类分析、关联规则挖掘,回归发现和序列模式发现等技术。在选择某种数据挖掘技术之前,首先要将需要解决的问题转化成正确的数据挖掘任务,然后根据挖掘的任务来选择使用哪些数据挖掘技术。在电子商务活动中,主要使用下面的一些数据挖掘技术。4.1分类分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是

13、通过分类模型或分类函数,将数据库中的数据项映射到某个给定的类别。分类的主要方法有基于决策树模型的数据分类,贝叶斯分类算法,ID3算法和基于BP神经网络算法等。假定现在我们有一个描述顾客属性的数据库,包括他们的姓名、年龄、收入、职业等,我们可以按照他们是否购买某种商品(例如,计算机来进行分类。如果现在有新的顾客添加到数据库中,我想将新计算机的销售信息通知顾客,若将促销材料分发给数据库中的每个新顾客,如此可能会导致耗费较多的精力和物力。而若我们只给那些可能购买新计算机的顾客分发材料,可以在较大的程度上节省成本。为此,可以构造和使用分类模型。分类方法的特点是通过对示例数据库中的数据进行分析,已经建立

14、了一个分类模型,然后利用分类模型对数据库中的其它记录进行分类。4.2聚类分析聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。聚类分析的方法是数据挖掘领域最为常见的技术之一。常用的聚类分析方法有:分割聚类方法,层次聚类方法,基于密度的聚类方法和高维稀疏聚类算法等。聚类分析方法与分类方法的不同之处是聚类事先对数据集的分布没有任何的了解。因此在聚集之后要有一个对业务很熟悉的人来解释这样聚集的意义。很多情况下一次聚集你得到的分类对你的业务来说可能并不好,这时你需要删除或增加变量以影响分类的方式,经过几次反复之后才

15、能最终得到一个理想的结果。聚类分析方法在电子商务中的使用也极其广泛。其中一个典型的应用是帮助市场分析人员从客户基本库中发现不同的客户群,并且用购买模式来刻画不同客户群的特征。通过对聚类的客户特征的提取,把客户群分成更细的市场,提供针对性的服务。4.3关联规则挖掘关联规则是描述数据库中数据项之间所存在关系的规则,即根据一个事物中的某些项的出现可导出另一些项在同一事物中也出现,即隐藏在数据间的关联或相互关系,比如在一次购买活动中所买不同商品的相关性。在电子商务中,从大量商务事物记录中发现有趣的关联关系,可以帮助许多商务决策的制定。关联规则挖掘最初也是最典型的形式是购物篮分析。它通过发现顾客放入其购

16、物篮中不同商品之间联系,分析顾客的购买习惯。例如,在同一次去超级市场,如果顾客购买牛奶,他也购买面包(包括购买什么类型的面包的可能性有多大?这些信息可以帮助零售商有选择地经销和安排货架,引导销售。例如,将牛奶和面包尽可能放近一些,可以进一步刺激一次去商店同时购买这些商品。在电子商务中,由于Web服务器的日志文件记录了用户的访问记录,通过这些记录利用关联规则挖掘网上顾客购买产品的相关度,对某些品牌的喜好和忠诚,价格接受范围,以及包装要求等,挖掘的结果可以用来帮助管理者进行网站规划、确定商品的种类、价格和新产品的投入。4.4序列模式分析序列模式分析和关联规则挖掘相似,但侧重点在分析数据间的前后序列关系。它能发现数据库中形如在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序列A-B-C出现的频度较高的信息。序列模式分析的一个例子是“九个月以前购买奔腾PC的客户很可能在一个月内订购新的CPU芯片”。5结束语电子商务过程中的各种信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论