数据挖掘技术在电子商务中的应用研究_第1页
数据挖掘技术在电子商务中的应用研究_第2页
数据挖掘技术在电子商务中的应用研究_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘技术在电了商务中的丿应用研究作者:杨青杰胡明霞发布时间:060牛27摘耍电子商务在现代商务活动中的正变得日趋重要,而商务 数据的处理则凸显出数据挖掘的重要。木文讨论了数据挖掘的主要方法,具体阐 述了数据挖掘技术在电子商务中的作用及应用。关键词数据挖掘电子商务数据库一、概述数据挖掘(data mining )起源于数据库中的知识发现(knowledge discoverin database, kdd),是指从大型数据库或数据仓库小提取隐含的、 未知的、非平凡且最终可理解的及有潜在应用价值的信息或模式。数据挖掘技术 是计算机技术发展的热点z-o通过对丿力史积累的大量数据的冇效挖掘,可以发

2、 现隐藏的规律或模式,为决策提供支持,而这些规律或模式是不能够依靠简单的 数据查询得到,或者是不能在可接受的吋间内得到。这些规律或模式可以进一步 在专业人员的识别下成为知识,并可以应用到以客户为中心的企业决策分析和管 理的各个不同领域和阶段。电了商务(ecommerce)是以指利用电了数据交换(日ectronic data interchange, edi)、电子邮件(email)、电子资金转账(bectronic funds transfer, eft)和internet等主要技术在个人、企业和国家之间进行无纸化的 信息交换,包括商品信息及其订购信息、资金信息及其支付信息、安全及其认证 信息

3、等,即以现代信息技术为手段,以经济效益为中心的现代化商业运转模式。 其最终目标是实现商务活动的网络化、自动化与智能化。随着internet的迅速发展,电子商务的应用不断深入。在电子商务应用系 统屮,相关的用户数据日益增多,数据挖掘技术具有从大量复杂数据屮发现特定 规律的能力。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选 择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。二、数据挖掘的主要方法数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和 技术。比较典型的数据挖掘方法有分类、关联规则分析、聚类分析和孤立点分析 等。1 分类。分类是找出一个类别的

4、概念描述,它代表了这类数据的整体信息, 即该类的内涵描述,一般用规则或决策树模式表示。实际上就是通过分析示例数 据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则, 然后用这个分类规则对其他数据库屮的记录进行分类。2关联规则分析。关联规则分析用于发现关联规则。若两个或多个数据项的 取值重复出现月概率很高时,它就存在着某种关联,可以建立起这些数据项的关 联规则,一般用“支持度”和“置信度”两个闽值来淘汰那些无用的关联规则。 关联规则分析能发现数据库中诸如“90%的顾客在一次购买活动中购买商品a 的同时购买商品b” z类的特征。3. 聚类分析。聚类分析的对象是一组未分类记录,并且

5、这些记录应分成儿类 事先也不知道。聚类就是通过分析数据库屮的记录数据,根据一定的分类规则, 合理地划分记录集合,确定毎个记录所在类别。它所采用的分类规则是由聚类分 析工具决定的。采用不同的聚类方法,对于相同的记录集合可能有不同的划分结 果。4. 孤立点分析。数据库中的数据常有一些异常记录,这些记录称为孤立点, 常常包括很多潜在的知识,如分类屮的反常实例、不满足规则的特例、观测结果 与模型预测值的偏差、量值随时间的变化等。孤立点分析基本方法是寻找观测结 果与参照之间的差别。作者:杨青杰胡明霞发布时间:060牛27三、据据挖掘在的应用数据挖掘的应用十分广泛,如银行、电信、保险、交通、零售(如超级市

6、场) 等领域。数据挖掘所能解决的典型商业问题包描数据库营销(database marketing )、客户群体划分(customer segmentation & classification)、背景分析(profile analysis)> 交叉销售(cross-selling)等市 场分析行为,以及客户流失性分析(churn analysis)>客户信用记分(credit scoring)和欺诈发现(fraud detection)等。分类的目的是构造一个分类函数或分类模型,通常称作分类器。分类器的构 造方法通常由统计方法、机器学习方法、神经网络方法等。在金融领

7、域,管理者 可以通过对客户偿还能力以及信用的分析,进行分类,评出等级,减少放贷的盲 口性,提高资金的使用效率。在零售业,数据挖掘可有助丁识别顾客购买行为,发现顾客购买模式和趋势, 改进服务质量,取得更好的顾客保持力和满意程度,捉高货品销量比率,设计更 好的货品运输与分销策略,减少商业成本。电信、计算机网络、因特网和各种其它方式的通信和计算的融合是口前的大 势所趋。利用数据挖掘技术來帮助理解商业行为、确定电信模式、捕捉盗用行为、 更好的利用资源和提高服务质量是非常有必要的,通过挖掘进行盗用模式分析和 异常模式识别,从而可尽早发现盗用,为公司减少损失。数据挖掘是一个非常复杂的过程。每一种数据挖掘技

8、术方法都有其自身的特 点和实现步骤。每种数据挖掘的技术方法对输入/输出数据形式的要求、结构、 参数设置、训练、测试和模型评价方式各自冇不同的要求,算法应用领域的含义 和能力也存在茅异。数据挖掘过程一般分为定义问题、准备数据、实施挖掘、评 价与表示等几个阶段。数据挖掘过程的这几个阶段都需要人的参与指导。四、结束语数据挖掘是指按企业既定业务口标,对大量的金业数据进行探索和分析,揭 示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进冇效的方法。 电了商务是现代信息技术发展的必然结果,也是未來商业运作模式的必然选择。 企业数据量日益庞大,其中真正有价值的信息却很少,利用数据挖掘技术,从大 量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,发挥企业 的独特优

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论