




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘技术在电子商务推荐中的应用 摘要:随着互联网的普及应用和现代电子商务的迅猛发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。一个完善的电子商务系统不应当只有在线交易功能,而且应该能够通过商业智能分析等技术为商业运作提供辅助支持,尤其在这样一个信息爆炸的时代。如今电子商务系统累积的大量信息数据,企业迫切希望通过对这些信息的有效组织利用,能够从中获取有利于商业运作、提高竞争力的信息。这种需求推动了用于电子商务的数据挖掘技术研究的深入。 关键词:数据挖掘技术;电子商务;应用 中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)27-
2、6588-02 Data Mining Technology in the Electronic Commerce Recommendation Applications XU Xian-wen, ZHENG Sha-jun (Fuzhou University College of Mathematics and Computer Science, Fuzhou , China) Abstract: With the popularization of Internet application and the rapid development of electronic commerce,
3、 electronic commerce recommendation system has gradually become the IT technology is an important research content, has got more and more attention of researchers. A perfect electronic commerce system should not only on-line transaction function, but also should be able to adopt commercial intellige
4、nce analysis technology for commercial operation to provide support, especially in such an age of information explosion. Nowadays electronic commerce system accumulated a large amount of data, the enterprise wants through to these information is effective use of tissue, to be able to gain favor busi
5、ness operation, to improve the competitiveness of the information. The demand for the electronic commerce data mining technology research. Key words: data mining; electronic commerce; application 1 数据挖掘技术 近年来,数据挖掘技术引起了信息产业界和整个社会的极大关注,其主要原因是存在可以广泛使用的数据,并且迫切需要将这些数据转换成有用的信息和知识。数据挖掘是一个利用各种分析工具在海量数据中发现模型
6、和数据间的关系过程。使用这些模型和关系可以进行预测,它帮助决策者寻找数据间潜在的关联,发现被忽略的因素,是解决当今时代所面临的数据爆炸而信息匮乏的问题的一种有效方法。 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。商业角度的定义:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据,是一类深层次的数据分析方法。数据挖掘是一门广义的交叉学科,它在金融、保险、电信、大型超市等积累有大量数据的电
7、子商务行业有着广泛的应用,如信用分析、风险分析、欺诈检验、用户聚类分析、消费者习惯分析等。 2 电子商务推荐系统 电子商务推荐系统(Personalized Recommend Systems for E-Commerce)的正式定义由 Resnick & Varian 在 1997 年给出:“电子商务推荐系统是利用电子商务网站向用户提供产品信息和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物过程的系统”。 电子商务推荐系统如同“采购助手”,根据用户的兴趣爱好,向用户提供商品推荐,帮助用户在尽量短的时间找到所需商品,满足其个性化的需求,从而顺利完成购买过程。电子商务推荐系
8、统不仅能为用户提供个性化的推荐服务,而且能给电子商务网站带来丰厚的商业利益。主要体现在以下几个方面: 1) 将电子商务系统的浏览者转变为购买者。已有明确购物目标的客户也许会通过搜索功能找到自己需要的商品,但对于大多数的冲浪者和模糊的购买者,很难有耐心逐项查找是否有自己感兴趣的东西,如果这个时候推荐系统能够有针对性地向其提供合适的商品推荐,往往可以将一个浏览者变为购买者。 2) 促进销售。电子商务推荐系统在用户购买过程中向用户推荐其它商品,用户能够从推荐商品中购买自己确实需要但又没想到的商品,从而有效提高销售量。比如向购买面包和黄油的顾客推荐牛奶,从而增加商品的销售,提高销售利润。 3)提高用户
9、的满意度和忠诚度。与传统的商务模式相比,电子商务推荐系统分析用户的购买行为习惯,根据用户需求向用户提供有价值的商品推荐,用户容易的购买到自己需要的商品,那么用户会再次访问并推荐给其他人。 3 电子商务推荐中的数据挖掘技术 数据挖掘按照其挖掘任务主要包括关联规则挖掘、聚类分析、分类和预测、回归发现和序列模式发现等技术。在选择某种数据挖掘技术之前,首先要将需要解决的问题转化成正确的数据挖掘任务,然后根据挖掘的任务来选择使用哪些数据挖掘技术。 在电子商务推荐活动中,主要使用下面的一些数据挖掘技术。 1) 关联规则(Association Rule):关联规则的挖掘就是为了在交易数据库中发现两个或两个
10、以上的商品(项)之间的有意义关联或相关联系,从而描述了一个事物中某些属性同时出现的规律和模式。关联规则挖掘的典型例子是购物篮分析或销售历史记录分析,其中的一个例子就是“90%的客户在购买面包的同时也会购买牛奶”,其意义就是顾客在购买某些商品的时候有多大可能会同时购买另外一些东西。显然,这种关联规则反映了顾客的购买习惯。如果商家能够充分利用这些购买习惯,就可以增加商品的销售,提高销售利润。 2) 聚类分析(Clustering):聚类分析是将数据点集合分成若干类或簇,使得每个簇中的数据点之间最大程度地相似,而不同簇中的数据点最大程度地不同,从而发现数据集中有效的、新颖的、可以理解的数据模式分布。
11、在电子商务数据挖掘应用中包含页聚类和用户聚类。页聚类是将内容相关的页面归在一个网页组,常用于网上搜索引擎及提供上网帮助。用户聚类是将具有相似喜好特性的用户归在一起,从而动态地为用户定制观看的内容或提供浏览建议。聚类分析可以方便用户查询和浏览,增强广告的作用,促进网上销售和提高用户忠诚度等。 3) 分类和预测(Classification and Predication):分分类是把数据集中的数据项映射到某个给定的类上。它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。它的特点是通过对示例数据库中的数据进行挖掘,建立了一个分类模型,然后利用分类模型对数据库中的其它记录进行分类。预
12、测是利用历史数据找出变化规律,建立模型,并用此模型来预测未来数据的种类,特征等。尽管预测可以涉及数据值预测和类标记预测,但通常预测仅限于数据值预测,并因此不同于分类。 4) 演化分析(Evolution Analysis):演化分析描述事件或对象行为随时间变化的对象的规律或趋势,并以此来建立模型。这种分析包括时间序列数据分析、序列或周期模式匹配、基于类似性的数据分析。它的侧重点在于分析数据间的前后或因果关系。在电子商务数据挖掘中,应用序列模式分析技术能发现数据库中形如“在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品 C,即序列ABC出现的频度较高”之类的知识,这将会有助于企业的营
13、销决策。 4 电子商务推荐工作流程 虽然电子商务推荐系统的种类很多,所采用的推荐技术也不尽相同,但各种推荐系统的工作流程基本相同,主要包括数据采集、数据预处理、形成推荐和结果显示等环节。电子商务推荐系统的一般工作流程如下: 1) 数据采集:数据采集方式主要有两种类型:显式采集和隐式采集。显式采集指推荐系统需要用户显式地输入形成推荐所需要的信息,包括用户信息和对商品的评价等;隐式采集是指推荐系统根据电子商务系统在用户的购物过程中自动记录的信息形成推荐,比如用户浏览或者购买了哪些商品,以此来分析用户的行为特性,不需要用户输入任何信息。 2) 数据预处理:数据预处理是对数据进行清洗,解决数据中的缺值
14、、冗余、数据值的不一致等问题,以供数据挖掘阶段使用。数据预处理有多种方法,包括:数据清理,数据集成,数据变换,数据归约等。这些数据处理技术在数据挖掘之前使用,大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间。 3) 形成推荐:这个阶段进行实际的挖掘操作。选择合适的算法进行挖掘,从而从海量的数据中得出有效的、新颖的、潜在的、有用的及最终可以理解的信息和知识。电子商务数据挖掘常用关联规则、序列模式、分类和聚类技术。 4) 结果显示:推荐结果形成后,接下来的任务是如何把推荐结果呈现给用户。不同的推荐结果显示时机和方式,往往可以起到不同的推荐效果。 5 结束语 采用数据挖掘技术,将电子商务中丰富的数据源信息进行有效组织利用,对电子商务的具有巨大的应用价值,但它在运用过程中出现的问题也亟待人们去解决。相信随着数据挖掘算法的不断发展和成熟,数据挖掘一定会有更加广阔的应用前景。 参考文献: 1 刘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GFRP筋-重晶石防辐射混凝土粘结性能试验研究
- 关汉卿《救风尘》的电视剧改编研究
- 创客大赛培训
- 儿童肺炎合并心衰补液诊疗要点
- 肺患者健康宣教
- 家庭科学教育实施策略
- 颐和园介绍课件
- 健康传播常用方法
- 小班培训诈骗案例分享
- 预防要先行班会课件
- 中国移动公开竞聘考试题库(含答案)
- DLT 572-2021 电力变压器运行规程
- HJ 636-2012 水质 总氮的测定 碱性过硫酸钾消解紫外分光光度法
- 成都市2022级(2025届)高中毕业班摸底测试(零诊)数学试卷(含答案)
- 社会主义核心价值观融入幼儿园班级管理课程教学探索
- 《公平竞争审查条例》微课
- 四年级下册混合计算400题及答案
- 餐厅值班管理培训
- OQC出货检验技能培训
- 旅游产业行业分析
- 2024年四川成都市第八人民医院人员招聘13人历年高频考题难、易错点模拟试题(共500题)附带答案详解
评论
0/150
提交评论