




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本科毕业论文 论文题目: 数据挖掘技术在电子商务中的应用 学生姓名: 薛云霞 学号: 200602410089 专业: 信息管理与信息系统 指导教师: 曲建华 学 院: 管理与经济学院 1 2010 年 5 月 6 日 毕业论文(设计)内容介绍 论文(设计) 题 目 数据挖掘技术在电子商务中的应用 选题时间2009 年 12 月完成时间2010 年 5 月 论文(设计) 字数 12,400 关 键 词数据挖掘技术;电子商务;客户关系管理 论文(设计)题目的来源、理论和实践意义: 题目来源:导师指导下自选题目 理论和实践意义:随着网络的普及和电子商务网站的发展,电子商务已经作为一种信息时 代国际通行的商务模式,其深入发展引发了自工业革命经济领域一场最广泛、最深刻的变 革。电子商务网站的推广和普及已经成为中国企业提高核心竞争力的必然要求。由于Web 提供的信息是繁琐的,并且有很多无用的信息,所以这就需要人们必须使用一种技术来提 取有用的信息为商家的决策提供服务。数据挖掘技术是从大量的数据中提取蕴涵的、未知 的、有潜在使用价值的信息和知识从而为市场决策提供服务。所以随着Internet 技术和数据 库技术的飞速发展,以网络为载体、利用数字化电子方式开展的商务活动逐渐成为Web数 据挖掘的一个重要应用方向。因此,本文简单介绍了电子商务和数据挖掘技术的基本概念, 分析了电子商务发展的基本现状,并主要介绍了数据挖掘技术在电子商务中应用和存在的 问题,对我们企业在电子商务中应用数据挖掘技术具有重要的理论和实践意义。 论文(设计)的主要内容及创新点: 主要内容:随着 Internet 和电子商务网站的飞速发展,Web 已经成为人们获取信息的一个 重要途径。如何从这些海量的数据中找到有用的数据,如何发现用户的兴趣,为客户提供 个性化的服务成为目前电子商务网站发展的关键。数据挖掘技术正是在这种背景下和电子 商务结合在一起。本文简单介绍了电子商务和数据挖掘技术的基本概念,并主要介绍了数 据挖掘技术在电子商务中应用和存在的问题,并提出了一些对策。 创新点:本文主要介绍了数据挖掘技术在电子商务中的应用,并调查研究了数据挖掘技术 在电子商务中应用的现状,发现了一些问题,并提出了一些解决方法。 附:论文(设计)本人签名: 2010 年 5 月 10 日 目 录 中文摘要.1 英文摘要.1 第 1 章 引言.2 第 2 章 目前电子商务的现状.2 2.1 电子商务的概述.2 2.2 中国电子商务的发展状况.3 第 3 章 数据挖掘技术.5 3.1 数据挖掘的定义.5 3.2 数据挖掘的功能.5 3.3 数据挖掘的方法.6 第 4 章 数据挖掘技术在电子商务中的应用.7 4.1 数据挖掘技术在电子商务中应用的可行性分析.7 4.2 电子商务中的数据挖掘过程.8 4.3 数据挖掘技术在电子商务中的应用.9 4.4 电子商务中数据挖掘应用的现状和解决方法.13 4.5 数据挖掘技术在电子商务中应用的前景.14 第 5 章 结语.14 参考文献.15 数据挖掘技术在电子商务中的应用数据挖掘技术在电子商务中的应用 薛云霞 摘要:摘要:随着 Internet 和电子商务的发展,网上购物已经成为我们生活中不可或缺的 一部分。Web 积累了海量的数据,如何把这些海量的数据转化为有用的数据,如何了 解顾客的兴趣和爱好,为顾客提供个性化的服务成为目前电子商务发展的关键问题。 数据挖掘技术应用于电子商务中正是在这种背景下产生的。数据挖掘技术是从大量的 数据中提取蕴涵的、未知的、有潜在使用价值的信息和知识,它为市场分析和决策提 供了依据。本文简单介绍了电子商务的基本概念及其电子商务的应用现状,然后介绍 了数据挖掘技术的基本概念;接着主要对数据挖掘技术在电子商务中的应用进行了研 究,指出了实际应用中存在的一些问题,并提出了解决方法。 关键词:数据挖掘技术,电子商务,客户关系管理关键词:数据挖掘技术,电子商务,客户关系管理 中图分类号:TP393 The Application of Data Mining in the Electronic Commerce Xue yunxia Abstract:With the development of Internet and E-commerce ,shopping-online has become a necessary part of our everyday life.With the development of Internet,Web provides abundant data resources.The key problem to the development of E-commerce is how to make use of E-commerce information and how to find out the interest of customers ,providing pernonalized service for customers .The application of data mining in the E- commerce comes into being in the backgrounds. Data mining is a technique ,which can extract implicit ,undiscovered, potential,useful information and knowledge and which can help the market to analyse and make decisions. This paper simply discusses some basic cocepet about E-commerce and data mining ,and the application actuality of E-commerce. This paper is mainly focused on application of data mining in Elecotronic Commerce,and finds out some problems and simply puts forward some solutions to these problems. Key words:Data mining technique,E-commerce,Customer Relationship Management 第第 1 章章 引言引言 电子商务的发展已经成为一种必然趋势。为客户提供个性化的服务是目前电子商 务研究领域的重点和难点。随着 Internet 的飞速发展和普及,公司建立自己的电子商 务网站已经成为一种必然趋势。新的商业环境给企业带来很多商业机会,同时也带来 了很多的挑战。电子商务网站从“以站点为中心”向“以用户为中心”成为一种必然。 如何对信息进行有效地组织和利用,如何给客户以个性化的界面,开展有针对性的电 子商务服务成为电子商务迫切要解决的问题。数据挖掘技术就是在这种网络时代和商 业背景下产生的。 数据挖掘技术就是将经典的统计学方法、现代的智能化算法同数据库技术结合起 来,从海量的数据中发现新的规律和新的知识的一种技术1。本文就是运用数据挖掘 技术中的关键技术关联分析、聚类分析等来解决电子商务的关键问题。 本文遵循着基础与铺垫、可行性论证、突出重点这样循序渐进的过程展开论述, 旨在介绍数据挖掘技术在电子商务中的应用。 第第 2 章章 目前电子商务的现状目前电子商务的现状 由于传统商务活动大部分依靠面对面及书面文档传递为主,使传统商务具有信息 不完善、耗费时间长、花费高、库存和产品的积压、生产周期长、客户服务有限等局 限性。并且随着网络的发展,电子商务表现了它的优越性,得到了迅速发展2。但在 发展的同时,也面临着很多问题。 2.1 电子商务的概述电子商务的概述 2.1.1 电子商务的定义电子商务的定义 电子商务,英文是 Electronic Commerce,简称 EC。所谓电子商务,就是在网上 开展商务活动。电子商务通常是指是在全球各地广泛的商业贸易活动中,在因特网开 放的网络环境下,基于浏览器/服务器应用方式,买卖双方不见面地进行各种商贸活 动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、 交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式3。 2.1.2 电子商务的分类电子商务的分类 电子商务按照主体可以分为三类:B2C、B2B、C2C4。 1、B2C:企业与个人交易的平台。应该说是企业做为卖家,个人做为买家的平 台,就是企业做好商品推广的网站。比如当当书店。 2、B2B:企业与企业交易的平台。比如阿里巴巴。 3、C2C:个人与个人交易的平台。比如淘宝,易趣。 2.1.3 电子商务的优势电子商务的优势 电子商务带来的不仅是一种技术变革,它还带来了一种通过技术的辅助、引导、 支持来实现的商业活动本身发生的根本性的革命。它不仅改变交易的方式,还更新了 人们的消费观念和生活方式,改变了人与人之间的关系。具体有以下几个优点: 1、交易可以跨越时空。交易双方可以在世界的任何一个地方,交易可以在任何 时间进行,打破了传统电子商务活动时间和空间的约束。 2、交易的方便性。消费者真正能够足不出户,就可货比三家,同时能够以一种 轻松自由的自我服务的方式来完成交易。通过互联网,商家之间可以直接交流,谈判, 签合同,消费者也可以把自己的反馈建议反映到企业或商家的网站,而企业或者商家 则要根据消费者的反馈及时调查产品种类及服务品质,做到良性互动。 3、交易的成本大大降低。电子商务使供应链缩短,各方面管理成本的大幅度降 低。 4、电子商务所具有的开放性和全球性的特点,为企业创造了更多的贸易机会。 2.2 中国电子商务的发展状况中国电子商务的发展状况 2.2.1 中国电子商务发展的情况中国电子商务发展的情况 随着中国总体经济的强势增长和 Internet 的发展,中国的电子商务市场发展很迅 速。中国电子商务市场中,B2B 电子商务是最重要的一部分。根据艾瑞咨询统计数据 显示,09 年中国企业通过电子商务交易规模占整体交易规模(线上和线下交易规模) 的比例达到 11.3%,稳中有升5。根据艾瑞咨询调查显示,在全球经济危机下,使用 电子商务的线上中小企业的存活率要高出传统线下企业 5 倍,所以金融危机让更多的 中小企业认识到电子商务的优势,电子商务平台能够给中小企业提供更有效的推广方 式,降低推广成本5。因此,B2B 电子商务交易规模所占比例得到提高,提高的部分 主要来自于两方面,一方面,利用电子商务平台获取信息的中小企业的数量在上升; 另一方面,部分原有利用电子商务平台的中小企业,其线上交易量在增长。2007 年- 2013 年中国 B2B 电子商务交易规模,如图(1): 2007 年-2013 年中国 B2B 电子商务交易规模 图(1) 当前中国电子商务发展具有网络基础设施发展迅速,应用环境逐步完善;电子商 务教育和培训发展较快;越来越多的企业认知电子商务,并开始起步应用较好,开始 发挥作用。 2.2.2 中国电子商务应用中面临的挑战中国电子商务应用中面临的挑战 1、Web 站点对客户来说,基本上还是一个“哑终端” 。 虽然 Web 站点的软硬 件设施已得到了广泛的重视,保证了 Web 站点拥有良好的运行性能,但是客户却对 Web 站点的信息很不熟悉,对商家来讲仅是一条 24 小时不停运转的电子交易输入通 道。 2、随着电子商务网站规模日渐扩大,其庞大数据量和复杂的站点结构,往往使 客户手足无措,无法顺利找到自己需要的商品或信息。商家和卖家在商品属性上无法 达成共识,使买家无法找到自己想要的商品。尽管商家提供了很多的方式供买家查询 商品的属性,但是商品的属性往往是由商家定义的,买家和商家对商品属性的认识是 不相同的,因此买家往往会找不到自己所需要的商品6。 总体来说,中国的电子商务发展很迅速,发展势头良好。但是由于起步晚,基础 差,所以和发达国家的差距还很大。但是企业建立电子商务网站已经成为一种必然趋 势,如何从冗余的、不准确的数据中发现有用的信息和知识,了解顾客的爱好和价值 取向,为用户提供个性化的服务已经成为各个企业面临的关键问题。 第第 3 章章 数据挖掘技术数据挖掘技术 3.1 数据挖掘的定义数据挖掘的定义 数据挖掘,英文是 Data Mining,简称 DM。所谓数据挖掘是从大量数据中提取有 效的、未知的、易于理解的、有依据的信息,并据此做出商务决策的过程7。数据挖 掘从本质上说是一种新的商业信息处理技术。数据挖掘技术把人们对数据的应用,从 低层次的联机查询操作,提高到决策支持、分析预测等更高级应用上8。 3.2 数据挖掘的功能数据挖掘的功能 1、预测分析。预测分析是分析现有的数据集并以此发现数据的重要特征,并据 此对未来数据进行判定或预测。预测分析可以分为值预测和分类预测两种方法。值预 测是利用一些已知变量的值来预测其他变量的值(如回归分析) ;或者利用某个变量 的过去值来预测其未来值(如时间序列分析) 。分类预测的目的在于发现每一类的属 性特征。例如,如果将信用卡用户的信用等级作为类标签,银行管理人员希望分类模 型能够挖掘出每种信用等级的用户特征,一个可能的结论是:年龄在 30-40 岁之间、 收入在 8000 元以上、住在街区的用户信用等级为优1。依据这些分类特征,管 理人员可以对申办信用卡的用户做出信用等级的初始判断,以辅助决策。决策树和人 工神经网络是构建分类模型的常用技术。 2、关联分析。关联分析用于发现数据项之间的关联规则,定义:若 X、Y 为项 目集,且 XY=,则:蕴涵式 X=Y 成为关联规则9;关联规则就是从给定的数据 集中搜索数据项之间所存在的有价值的关联。比如,一家卖电子商品的商店,发现买 计算机的顾客 80%也会买系统软件。这就说明计算机和系统软件之间有着某种关联。 3、聚类分析。聚类分析的目的就是把相似的对象归为类,研究的主要内容是度 量相似性以及构造聚类的具体方法。聚类模型使用无指导学习来发现数据集中的同构 成分,产生数目不定的、含有相似数据的数据子集。例如,企业可以根据客户交易历 史,进行客户聚类,发现高价值用户,并据此加强客户关系管理。 4、分类分析。分类分析用于找出一个类别的概念描述,这个概念描述代表了这 类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。 5、偏离检测。偏离检测通过应用统计方法和可视化技术来发现数据集中的孤立 点,从而发现与期望或规范相背离的异常事件。 3.3 数据挖掘的数据挖掘的方法方法 数据挖掘有很多方法,包括关联规则方法、聚类分析方法、人工神经网络方法、 遗传算法、粗糙集方法、决策树方法、统计方法、可视化技术等。下面就上述八种方 法解释如下: 1、关联规则方法:关联规则,是在数据挖掘中最先使用的最基本的技术。关联 规则是从大量的数据中提取或“挖掘”出有用的知识,它能对过去的数据进行查询和 遍历,找出过去数据之间的潜在联系,从而促进信息的显化10。 2、聚类分析方法:聚类分析是一种经典的统计学方法,它同数据库技术结合形 成了现代数据挖掘的常用技术之一。聚类分析就是从给定的数据集中搜索数据对象之 间所存在的有价值的联系,一个聚类中的所有对象常常被当作一个对象来进行处理或 分析11。在商业上,聚类分析可以帮助市场人员发现顾客群中所存在的不同特征的组 群,并可以利用购买模式来描述这些具有不同特征的顾客组群。 3、人工神经网络方法:人工神经网络和遗传算法,都是仿生研究方法,或仿生 算法。它们通过模拟生物学的某些功能,创造一些优化算法,寻找世界的规律。人工 神经网络在结构上仿照生物学的神经网络,构造一个简化的只有输入层、输出层和隐 含的中间层的含有非线性特征的网络。优点是对噪声数据有较好的适应能力,并且对 未知数据也具有较好的预测分类能力。但是人工神经网络分类方法获取的模式隐含在 网络结构中,而不是显式的表达为规则,不容易被人们理解和解释。而且还需要多次 扫描训练数据,网格的训练时间较长。 4、遗传算法方法:简称 GA,主要借用了生物进化中“适者生存”规律。其模拟 生物的进化和遗传,借助选择、交叉和变异操作,使得要解决的问题从初始解逐步接 近最优解,解决了许多全局优化问题。 5、粗糙集算法:可以用于分类问题,以帮助发现不准确或噪声数据中所存在的 结构关系,是现在数据挖掘中最有力的工具。但它只能处理离散量,连续量必须首先 进行离散化后方可使用。利用粗糙集可以近似或粗略的定义集合(类别) 。对于一个 集合的粗糙集定义是通过两个集合,一个上近似集合和下近似集合来描述。上近似集 合包含那些肯定不属于它的数据样本,下近似集合包含那些肯定无疑是属于它的数据 样本。 6、决策树方法:决策树方法是利用信息论中的信息增益寻找数据库中具有最大 信息量的属性字段,从而建立决策树的一个结点,再根据该属性字段的不同取值建立 树的分支,最后在每个分支子集中再重复建立树的下层结点和分支的过程。具有速度 较快、较易转化成简单且容易理解的分类规则、较易转换成数据库查询语句等优点。 7、统计学:旨在从抽样分析中提取未知的数学模型,在数据挖掘中常常会涉及 一定的统计过程,如数据抽样和建模、判断假设以及误差控制等。 8、可视化技术:采用直观的图形方式将信息模式、数据的关联及趋势呈现给用 户,以便用户交互的分析数据关系。 第第 4 章章 数据挖掘技术在电子商务中的应用数据挖掘技术在电子商务中的应用 4.1 数据挖掘技术在电子商务中应用的可行性分析数据挖掘技术在电子商务中应用的可行性分析 4.1.1 数据挖掘技术在电子商务中应用的必要性数据挖掘技术在电子商务中应用的必要性 随着 Internet 和企业信息化的发展,企业建立自己的电子商务网站已经成为一种 发展趋势。而 Web 产生了海量的数据,这些数据中含有很多冗余的、不准确的数据。 如何对这些的数据进行有效的组织利用,从而发现客户的兴趣和价值取向,加强网站 架构,为客户提供个性化的服务,是电子商务网站必须要解决的问题。而数据挖掘技 术是从大量的数据中找出蕴藏的、有价值的数据,运用数据挖掘中的关联分析、聚类 分析等可以发现潜在用户、预测用户的行为,为企业做市场分析和决策提供依据。 4.1.2 数据挖掘技术在电子商务中应用的可行性数据挖掘技术在电子商务中应用的可行性 数据挖掘从技术上看,它直接服务于数据分析工作的;在本质上说是一种新的商 业信息处理技术。它通过对数据进行微观、中观乃至宏观的统计、分析预测、综合和 推理,发现数据间的关联性、未来趋势以及一般性的概括知识等,这些知识性的信息 可以用来指导高级商务活动;从商业角度看,数据挖掘就是按照企业的既定业务目标, 对大量的企业数据进行深层次分析以揭示隐藏的、未知的规律并将其模型化,从而支 持商业决策活动。 企业利用搜索引擎技术,通过 ETL (数据抽取转换装载)工具进行数据整 合,借助数据挖掘技术,对电子商务交易数据进行深入的分析,从而为正确的电子商 务应用决策提供强有力的支持和可靠的保证。数据挖掘技术不仅帮助卖家更深入的了 解买家的需求、购买力以及购物行为特征,挖掘潜在的买家,而且有助于买家更好的 了解商品,为买家提供便利的交易方式和广泛的选择。对于买家和卖家都具有一定的 实用价值和现实意义。 4.2 电子商务中的数据挖掘过程电子商务中的数据挖掘过程 数据挖掘分为四个阶段:元数据收集、数据预处理、模式发现和模式分析12。 1、元数据收集:在 Web 使用挖掘中,数据最直接的来源是 Web 服务器。客户 访问服务器就会在服务器上产生相应的服务器数据,这些数据可以分为日志文件和查 询数据。日志文件记录用户的访问信息,查询数据是用户在查询自己需要的信息时在 服务器端产生的记录。 2、数据的预处理:服务器上的数据一般都是模糊的、冗余的、不完全的,要想 得到简洁、准确的数据必须经过数据的预处理过程。预处理主要对用户访问日志进行 数据清洗、用户的唯一性识别、用户的会话识别、完善访问路径和事务识别等处理。 (1)数据清洗:目的是从服务器日志文件中消除不相干的项,缩小被挖掘数据 对象的范围。 (2)用户的唯一性识别:可以通过分析用户方的日志文件和采用 catch busting 技术,并借助其他一些信息来实现,例如 IP 地址。另外可以参考网络站点的拓扑结 构信息。 (3)用户的会话识别:目的是将每个用户的访问信息划分为若干个独立的会话 进程,最简单方法是采用超时估计,即当页面之间的请求时间间隔超过了规定的时间 范围,就可以认为用户已经开始进行一次新的会话。 (4)完善访问路径:如果一个页面请求信息与该用户上次请求的页面没有直接 的链接关系,可以查看参考日志文件来决定这个页面来自哪个页面的链接。 (5)事务识别:目的是依据数据挖掘任务的需求将事务进行分割或合并处理, 使其适合于数据挖掘需求的分析。 3、模式发现:模式发现阶段就是利用挖掘算法挖掘出有效地、新颖的、潜在的、 有用的及最终可以理解的信息和知识。其中应用于 Web 使用挖掘的技术有路径分析、 关联规则的发现、序列模式的发现、分类聚类技术。 (1)路径分析:通过对网站结构图和用户的访问信息分析可以得出路径图,通 过路径图可以判定一个 Web 站点中最频繁访问的路径,例如通过路径分析可以得出: 70%的客户在浏览 4 个或更少的页面后离开了。 (2)关联规则的发现:找到客户访问网站上各种文件之间的相互关联13。例如: 50%的用户访问 Web 页面 A 公司的 B 产品时,也访问了 A 公司的 D 产品。 (3)序列模式的发现:目的是在时间戳有序的事务集中,找到那些“一些项跟 随另一个项”内部事务模式。如:在 A 公司 B 产品上进行在线订购的顾客中哟 70% 的在一个月内也在 A 公司的 C 产品上下过订单。 (4)分类和聚类技术:分类技术可以从个人信息或共同的访问模式中得出访问 某一服务器文件的用户特征。分类技术可以通过决策树方法、贝叶斯分类法来实现。 聚类分析可以从 Web 访问信息数据中聚类出相似特性的客户,可实现自动给一个特 定的顾客聚类发送销售邮件,为一个顾客聚类动态的改变一个特殊的站点。 4、模式分析:模式分析主要是为了从模式发现算法找到的模式集合中筛选出有 趣的模式。模式分析的形式可以像 SQL 那样知识查询机制,也可以把 Web 使用数据 装入数据仓库,以便执行联机分析处理操作。 4.3 数据挖掘技术在电子商务中的应用数据挖掘技术在电子商务中的应用 数据挖掘技术在电子商务中的应用越来越普遍,也越来越受到电子商务管理者的 重视。目前 Web 数据挖掘技术在电子商务中的应用主要体现在以下四个领域。 4.3.1 数据挖掘在网站设计、管理中的应用数据挖掘在网站设计、管理中的应用 数据挖掘技术在网站设计、管理中的应用主要体现在以下五个方面: 1、网站设计中的数据挖掘 在网站建设中,使用数据挖掘技术,通过对网站内容的挖掘,可有效地组织网站 信息。例如采用自动归类技术实现网站信息的层次性组织; 分析用户的Web 访问行 为,可为用户提供智能化个性化服务14。比如,可根据客户的访问兴趣、访问频度、 访问时间,动态地调整页面结构, 迎合每个客户的浏览兴趣。另外,网站还可以根据 实际用户的浏览情况,挖掘用户的兴趣点,定期为用户推送相关信息,以及调整网站 中网页的链接结构和内容,为用户提供个人的定制服务。 2、改进站点设计 对 Web 站点的链接结构的优化可从三方面来考虑: (1)对 WebLog 的挖掘,发现用户访问页面的相关性,从而对密切联系的网页 之间增加链接,方便用户使用。 (2)利用路径分析技术判定在一个 Web 站点中最频繁的访问路径,可以考虑把 重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力, 提高销售量。 (3)通过对WebLog的挖掘,发现用户的期望位置。如果在期望位置的访问频率 高于对实际位置的访问频率,可考虑在期望位置和实际位置之间建立导航链接,从而 实现对Web站点结构的优化。 3、序列模式发现 发现序列模式便于电子商务的组织者预测客户的行为,为客户提供个性化的服务。 使用序列模式分析挖掘Web日志,可以发现客户的访问序列模式,预测出客户未来的 访问模式,有的方矢地进行在线推荐或安排广告等营销活动。采用关联规则技术,找 出具有一定支持度和置信度的相关联的物品,并且针对客户的动态变化来调整网站的 结构,可以使客户直接访问关联商品的链接信息。 3、在电子邮件管理中的应用 在电子商务中,现实的和潜在的客户往往采用电子邮件咨询电子商务企业商品的 性能、价格、安装使用、维护等各种问题。此时,电子商务企业就需要对所接收到的 各种电子邮件进行准确、快速的分类。基于数据挖掘的电子邮件过滤、筛选和分类技 术则可以从大量的邮件清除垃圾邮件,将有用的客户邮件正确地分发到相应的部门进 行及时处理。 4、在搜索引擎中的应用 网络用户经常使用搜索引擎在网站中搜索自己所希望的商品,有的用户希望利用 搜索引擎在整个网络上搜索自己所关心的商品,并希望对这些商品的价格、质量、性 能、售后服务进行比较。此时就需要利用搜索引擎进行Web数据挖掘。例如,通过对 网页的聚类、分类,实现网络信息的分类浏览与检索,以找到同样类型的商品;通过 用户所使用的提问式历史记录的分析,可以有效地进行提问扩展,提高用户的检索效 果;运用网络内容挖掘技术改进关键词加权算法,可以提高网络信息的标引准确度, 改善检索效果。 4.3.2 数据挖掘技术在客户关系管理中的应用数据挖掘技术在客户关系管理中的应用 客户关系管理(Customer Relationship Management,CRM) ,简单的说,就是对 客户关系进行管理的一种思想和技术,换句话说,客户关系管理是一种“以客户为中 心”的经营理念,它借助于信息技术在企业的市场、销售、技术支持、客户服务等各 个环节的应用,以改善和增进企业与客户的关系,实现以更优质、更快捷、更富个性 化的服务保持和吸引更多客户的目标,并通过全面优化面向客户的业务流程使保留老 客户和获取新客户的成本达到最低化,最终使企业的市场适应能力和竞争实力有一个 质的提高15。 数据挖掘可以应用在客户群体分类分析、客户效益分类分析和预测、客户背景分 析、客户满意度分析、交叉销售、客户信用分析、客户流失分析、客户的获得与保持 等方面16。主要应用在以下六个方面: 1、客户的群体分类分析 通过对电子商务系统收集的交易数据进行聚类分析,对具有相似浏览行为或客户 指标的客户进行分组,找出分组客户的共同特征,从而确定不同类型客户的行为模式。 这样可以帮助电子商务的组织者更好地了解自己的客户,向客户提供更适合客户的服 务。例如:有一些客户都花了一些时间浏览“森马服饰”页面,经过分析这些客户被 聚为一类。商家可以针对该群体的需求,为他们尽可能的发送广告,或者及时的调整 页面及页面内容,满足客户的需求。 2、客户的效益分类分析和预测 客户的利润回报分析是客户效益分类分析和预测的关键。客户利润回报预测是最 令人向往的预测类型,也是客户关系管理应用能否替企业实现长期ROI的一个重要环 节。通过聚类技术和分类技术可以发现那些客户是中重要的,那些客户是不重要的, 对给企业带来利润的客户我们要对他好点,比如赠送礼物,多打折扣等。 3、客户满意度分析 客户满意度是对某项产品或服务的消费经验的总体评价,是客户通过对一个产品 或服务的可感知的效果与其期望值相比较后,所形成的愉悦或失望的感觉状态,是衡 量企业经营质量水平的一种方式。它是客户经过长期沉淀而形成的情感诉求,也是客 户在历次交易活动中状态的积累。 分析客户对企业产品和服务的满意度,可以帮助企业了解客户的想法、需求和期 望,发现企业在产品、服务和管理上的不足,为企业改善经营策略、提高客户忠诚度 指明方向。通过自定义的定量的度量标准和公式,并根据时间和其他参数,利用数据 挖掘技术和企业的数据库中关于客户购买、维修、反馈意见、建议、投诉等信息,可 对客户的满意度进行分析,找出客户不满意的原因并制定相应的策略,提高客户忠诚 度,增加企业的利润17。 4、交叉销售 交叉销售是建立在 Win-Win 原则上的,对客户来讲,要得到更多更好满足并需 求的服务并从中受益,对企业来讲,也会因销售额的增长而获益。数据挖掘可以帮助 企业分析出最优的、合理的销售匹配。 5、客户的获得与保留 通过 Web 数据挖掘可以对潜在客户信息进行聚类和分类的分析,再用模式分析 预测那些可能成为新客户,以帮助市场销售人员找到正确的营销对象。Web 数据挖掘 还可以解释客户的行为习惯,发现在不同情况下有相似行为的新客户,帮助商家识别 潜在的客户群,采用积极的营销策略,不断挖掘新客户,提高市场占有率。 通过 Web 数据挖掘,可发现不同的客户群在网站上购买不同的商品,那些客户 可能正在流失,那些客户是网站的忠诚客户,那些是赢利客户。针对不同的客户,进 行个性化的营销,使他们都成为电子商务企业的忠诚的老客户。 6、客户信用分析 数据挖掘技术可以为企业提供客户信用分析,如可以为保险索赔、移动电话呼叫、 信用卡购买等易于发生欺诈的行业建立模型。 4.3.3 数据挖掘技术在网络营销中的应用数据挖掘技术在网络营销中的应用 网络营销是指利用 Internet 技术,最大限度地满足客户需求,以达到开拓市场、 增 盈利目标的经营过程。它从传统营销的以产品销售为中心的“4P” (Product,Price, Place,Promotion)转向以满足客户需求为中心的“4C” (Customer,Cost,Convenienee, Communication)。数据挖掘在提高营销的有效性、交叉营销等方面有着广泛的应用。 1、进行有针对性的营销,提高营销的有效性 数据挖掘技术可以通过分析客户点击流等信息,挖掘出客户的行为动机,分析出 用户所处的阶段,以帮助电子商务管理者针对用户所处的阶段提供不同的营销策略, 向用户进行有针对性的信息反馈和广告发送;数据挖掘技术还可以对市场、客户数据 进行恰当的分类挖掘,从而分析出各个层次的细分市场,为电子商务企业定位于自己 的目标市场提供可靠的依据。 2、交叉营销 交叉营销就是指通过与客户交流,向现有的客户提供新的产品和服务的营销过程。 企业与其客户之间的商业关系是一种持续的不断发展的关系,通过不断地相互接触和 交流,客户得到了更好更贴切的服务质量,企业则因为增加了销售量而获利。基于客 户已经购买的商品,推荐客户购买一些相关的商品,建立忠诚度。客户往往愿意到那 些最能满足自己需求的网站购物。 4.3.4 数据挖掘技术在网络广告中的应用数据挖掘技术在网络广告中的应用 企业可以利用数据挖掘技术分析网络广告的有效性、正确的的关联匹配关系和精 准发送信息情况等。目的在于提高网络广告的投放率和网络广告的投资回报率 (ROI)。 1、网络广告的有效性分析 网络广告与电视广告、报纸广告等传统媒体广告具有很大的不同,电子商务企业 需要根据网络广告的特点,采用数据挖掘技术对网络广告的布局、投放进行挖掘分析, 以获得更好的广告效果。利用数据挖掘技术可以对各种广告进行分类,了解其点击率、 分析广告在点击以后的商品销售情况,以判断广告的实际有效性。 2、网络广告的关联匹配 网络广告的的关联匹配是“数据挖掘”和网络广告的结合体。关联匹配广告的实 现不仅需要了解网络访问者的习惯,而且还需要使用关联规则对网络广告设计进行分 析,以确定哪些广告的链接效果更好,可以使访问者能够更容易受到网络广告的影响 去购买企业的商品。 3、网络广告的精准发送 精准广告发送需要依托网络搜索技术和所积累的庞大的网络访问者行为数据仓库, 对网络浏览者的上网行为进行个性化的数据挖掘分析,按电子商务企业的广告需求锁 定目标受众,进行一对一传播,向细分人群分类发送他们各自感兴趣的个性化商品信 息,实现网络广告的精准投放。为此,电子商务企业需要利用数据挖掘系统对网络访 问者的 IP 地址进行分析跟踪,并利用特征关键词对用户进行分类挖掘,同时与广告 产品的特征进行关联、匹配和排序分析,实现有针对性的网络访问者群体的精准投放。 4.4 电子商务中数据挖掘应用的现状电子商务中数据挖掘应用的现状和解决方法和解决方法 数据挖掘技术应用于电子商务中取得了一定成果,通过对服务器数据运用聚类分 类分析、关联规则的分析等技术可以为商家做出个性化的营销策略提供依据,提高系 统的效率,节省客户的时间,为客户提供个性化的服务。但是由于我国的网络设施还 不健全,在电子商务中应用数据挖掘技术要花费大量的人力物力,所以在我国数据挖 掘技术应用于电子商务中的力度和广度并不是很理想。即便是应用了数据挖掘技术, 效果也不是很理想。下面是数据挖掘技术实施中存在的问题和一些解决方法。 1、由于数据挖掘是有数据驱动的,而且不易管理,因此数挖掘很容易遇到数据 质量的问题。由于数据库都是动态的、有错误而且不完整,冗余和稀疏并存,当然也 就是巨大的。因此在使用恰当的数据挖掘功能和技术的同时,必须小心地分析异常情 况,不能将异常情况所造成的结果作为普遍的模式加以应用。 2、数据可视化工具的缺乏。数据可视化是一种帮助数据挖掘人员了解数据、获 取知识的有力工具。但是在数据挖掘中遇到的数据大多是一些复杂的海量数据,要将 其可视化,必须要有复杂的数据可视化工具支持。数据可视化是一种新兴的技术,它 可以提高分析员分析数据、获取知识的能力,尤其是在数据维数较低的时候,其效果 更加明显。 3、许多数据挖掘技术由于极大数据库的存储量过大而出现很多应用问题。例如, 过大的查询数据量会对一些特定技术造成困难15。为此可以使用数据抽取技术从击打 数库中抽取数据,生成一个数据挖掘数据库,数据挖掘技术就可以在此数据挖掘数据 库中应用,而不是在数据仓库中应用。 4、成本高,要求管理层必须要有很高的战略眼光。为满足许多数据发现系统的 计算要求,需要在硬件、操作系统软件上采用并行技术。这些性能要求将大大增加数 据挖掘的成本。针对这一情况,企业领导必须提高认识,为电子商务中应用数据挖掘 技术提供可靠的物力和财力支撑。 5、商业分析员的技能和素质较差。商业分析员需要丰富的业务知识,并具有极 强的调查能力,同时还有创造力。创造性允许商业分析员实验各种数据挖掘技术,一 边发现大量潜在的模式和关系。然后分析并了解它,最后生成预测模型并按永和容易 理解的方式发布。所以,企业必须对商业分析员进行综合培训,提高分析问题的能力。 4.5 数据挖掘技术在电子商务中应用的前景数据挖掘技术在电子商务中应用的前景 随着计算机硬件和软件的并行发展,数据挖掘技术在电子商务中的应用会越来越 广泛。在激烈的市场竞争环境下,能否运用好数据挖掘技术,是电子商务网站能否成 功的关键所在。数据挖掘技术在电子商务中的关键性以被越来越多的企业所认同。毫 无疑问,数据挖掘技术在电子商务时代会得到更大的发展。 第第 5 章章 结语结语 随着网络的发展和信息化时代的到来,Web产生了海量的数据,如何有效的组织 和利用这些数据,建设个性化网站,为用户提供个性化的服务是电子商务网站建设的 重点。数据挖掘技术在电子商务中表现了它极大的优越性。本文只是粗浅的介绍了它 在电子商务中的应用。随着人们认识的增加和数据挖掘技术的完善,数据挖掘技术在 电子商务中的应用会更加的广泛。 参考文献参考文献 1 刘鲁. 信息系统:原理、方法与应用M.北京:高等教育出版社,2006. 2 邵兵家. 电子商务概论M. 北京:高等教育出版社,2006. 3 4 5 www.iR. 6 夏小云. C2C 电子商务数据挖掘的研究及应用C. 江西理工大学 2007. 7 牛红慧,金显华. Web 数据挖掘技术在电子商务中的应用J .濮阳职业技术学院学报, 2006(3). 8 毛国君,段立娟,王实,石云. 数据挖掘原理与算法M. 北京:清华大学出版,2005(1). 9 刘菲,李玲. 数据挖掘技术在客户关系管理中的应用研究J. 产业与科技论坛,2009(8). 10 朱明数据挖掘2002:129-130 11 王核成,许水龙管理人员的综合测评方法研究J华东经济管理,2001(2):40-41 12 张璐. 数据挖掘在电子商务中的应用J. 电脑知识与科技,2005(12). 13 丁燕华. 关联规则挖掘在电子商务中的应用研究J. 现代商业,2009(10). 14 张建宏. 电子商务网站的数据挖掘J . 湖州职业技术学院学报,2005(1). 15 姚国章. 电子商务与企业管理M.北京:北京大学出版社,2002. 16 张文宇,贾嵘 . 数据挖掘与粗糙集方法 M . 西安:西安电子科技大学出版社, 2006(1). 17 ZJAlexBerson 著,赘扩奇等译,构建面向 cRM 的数据挖掘应用,北京:人民邮电出版社, 2001.96-110. 指导教师意见指导教师意见 (包括选题的意义,资料收集或实验方法、数据处理等方面的能力,论证或实验是否合理, 主要观点或结果是否正确,有何独到的见解或新的方法,基础理论、专业知识的掌握程度 及写作水平等,并就该论文是否达到本科毕业论文水平做出评价) 薛云霞同学的选题为“数据挖掘技术在电子商务中的应用” ,数据挖掘技术是电子商务 领域热点问题,选题具有明显的应用价值。 该同学在论文撰写过程中,运用了文献调研、理论分析、事例比较等方法对研究主体 进行了概括总结和归纳分析,同时也采取了引证、例证的方法,分析了数据挖掘技术在电 子商务中的应用,并对其进行系统分析,系统全面地阐述论题,对今后我国企业在电子商 务中运用数据挖掘技术提供一定的参考,更好在电子商务网站中运用数据挖掘技术。 该论文观点明确,论据丰富,条理清晰,结构严谨,语言通顺,专业知识运用得当, 体现出较高的专业素养及较好的写作水平,达到了本科生毕业论文的要求。 作者的主要观点正确,分析比较透彻,结构合理,对策建议有可操作性。 论文条理清楚,论述充分,文字通顺,层次
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中秋节优美作文600字9篇
- 2025合同解除协议书范本
- 《世界文化史教学课程》
- 特色民俗保护责任承诺书(6篇)
- 叙事作文拉肚子350字(7篇)
- 2025智能沼气净化系统供需合同
- 企业市场调研数据分析标准化工具
- 一节生动的课堂记叙文4篇
- 客户信息收集与分析报告模板客户关系管理
- 企业财务管理内控流程标准
- 部编版一年级语文上册全册教案
- 离婚协议书2个儿子的模板
- 北京市《配电室安全管理规范》(DB11T 527-2021)地方标准
- 人工智能训练师理论知识考核要素细目表二级
- 2024工程招投标与合同管理复习题
- 《第14课 算法的验证》参考课件1
- 食品安全管理制度图
- 入职申请登记表(模板)
- GB/T 43698-2024网络安全技术软件供应链安全要求
- Politeness Principle第九课礼貌原则
- 婴幼儿心理学
评论
0/150
提交评论