



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘与电子商务随着网络技术和数据库技术的成熟, 传统商务正经历一次重 大变革, 向电子商务全速挺进。 如何对网络上大量的信息进行有 效组织利用, 帮助海量数据的拥有者们找出真正有价值的信息和 知识,以指导他们的商业决策行为, 成为电子商务经营者关注的 问题。数据挖掘技术作为电子商务的重要应用技术之一, 将为正 确的商业决策提供强有力的支持和可靠的保证, 是电子商务不可 缺少的重要工具。一、数据挖掘概述及方法确切地说,数据挖掘( Data Mining ),又称数据库中的知 识发现,是指从大型数据库或数据仓库中提取隐含的、未知的、 非平凡的及有潜在应用价值的信息或模式。 它融合了数据库、 人
2、 工智能、机器学习、统计学等多个领域的理论和技术。比较典型 的数据挖掘方法有关联分析、序列模式分析、分类分析、聚类分 析等。它们可以应用到以客户为中心的企业决策分析和管理的各 个不同领域和阶段。1、关联分析关联分析, 即利用关联规则进行数据挖掘。 关联分析的目的 是挖掘隐藏在数据间的相互关系, 它能发现数据库中形如哪种产 品最受欢迎、原因是什么、有多少回头客、哪些客户是最赚钱的 客户、售后服务有哪些问题等知识。2、序列模式分析序列模式分析和关联分析相似, 但侧重点在于分析数据间的 前后序列关系。 它能发现数据库中形如“在某一段时间内, 顾客 购买商品A,接着购买商品B,而后购买商品C,即序列
3、24C 出现的频度较高”之类的知识, 序列模式分析描述的问题是: 在 给定交易序列数据库中, 每个序列是按照交易时间排列的一组交 易集,挖掘序列函数作用在这个交易序列数据库上, 返回该数据 库中出现的高频序列。3、分类分析 设有一个数据库和一组具有不同特征的类别(标记),该数 据库中的每一个记录都赋予一个类别的标记, 这样的数据库称为 示例数据库或训练集。 分类分析就是通过分析示例数据库中的数 据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规 则,然后用这个分类规则对其他数据库中的记录进行分类。4、聚类分析聚类分析输入的是一组未分类记录, 并且这些记录应分成几 类事先也不知道, 通过分
4、析数据库中的记录数据, 根据一定的分 类规则,合理地划分记录集合,确定每个记录所在类别。它所采 用的分类规则是由聚类分析工具决定的。采用不同的聚类方法, 对于相同的记录集合可能有不同的划分结果。二、据据挖掘在电子商务中的应用 数据挖掘能发现电子商务客户的的共性和个性的知识、 必然 和偶然的知识、独立和关联的知识、现实和预测的知识等,所有 这些知识经过分析,能对客户的消费行为如心理、能力、动机、 需求、潜能等做出统计和正确地分析,为管理者提供决策依据。 具体应用如下:1、分类与预测方法在电子商务中的应用。分类发现就是给 出识别一个特殊群体的公共属性的描述, 这个描述可以用来分类 新的项。 分类的
5、目的是通过构造分类模型或分类器, 把数据库中 的数据项映射到给定类别中的某一个, 以便用于预测; 也就是利 用历史数据记录自动推导出对给定数据的推广描述, 从而能对未 来数据进行预测,进行适合某一类客户的商务活动。2、聚类方法在电子商务中的应用。聚类是把一组个体按照 相似性原则归成若干类别。 对电子商务来说, 客户聚类可以对市 场细分理论提供有力的支持。 市场细分的目的是使得属于同一类 别的个体之间的距离尽可能小, 而不同类别的个体之间的距离尽 可能大, 通过对聚类的客户特征的提取, 电子商务网站可以为客 户提供个性化的服务。3、数据抽取方法在电子商务中的应用。数据抽取的目的是 对数据进行浓缩
6、, 给出它的紧凑描述, 更主要的是它从数据泛化 的角度来讨论数据总结。 数据泛化是一种把最原始、 最基本的信 息数据从低层次抽象到高层次上的过程。 可采用多维数据分析方 法和面向属性的归纳方法。 在电子商务活动中, 采用维数据分析 方法进行数据抽取,他针对的是电子商务活动中的客户数据仓 库。在数据分析中经常要用到诸如求和、总计、平均、最大、最 小等汇集操作, 这类操作的计算量特别大, 可把汇集操作结果预 先计算并存储起来,以便用于决策支持系统使用。4、关联规则在电子商务中的应用。管理部门可以收集存储 大量的售货数据和客户资料, 对这些历史数据进行分析并发现关 联规则。如分析网上顾客的购买行为,
7、帮助管理者规划市场,确 定商品的种类、价格、质量等。通常关联规则有两种:有意义的 关联规则和泛化关联规则, 有意义的关联规则, 即满足最小支持 度和最小可信度的规则。 最小支持度, 它表示一组对象在统计意 义上的需满足的最低程度, 如电子商务活动中的客户数量、 客户 消费能力、消费方式等。 后者即用户规定的关联规则的最低可靠 度。第二是泛化规则,这种规则更实用,因为研究对象存在一种 层次关系,如面包、蛋糕属西点类,而西点又属于食品类,有了 层次关系后,可以帮助发现更多的有意义的规则。三、结束语 电子商务是现代信息技术发展的必然结果,数据挖掘高度 自动化地对电子商务中的大量信息进行分析和推理, 从中挖掘出 潜在的模式,预测客户行为,帮助企业的决策者调整市场策略, 减少风险,做出正确的决策,是未来商业运作模式的必然选择。 电子商务的Web数据挖掘能发现大量数据背后隐藏的知识,指导商
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 液晶显示器件彩膜制造工测试考核试卷及答案
- 化学浆料处理方法流程考核试卷及答案
- 金属焊接接缝密封工艺考核试卷及答案
- 塑胶场地紫外线防护施工技术规范考核试卷及答案
- 古建琉璃工综合考核试卷及答案
- 茶叶采摘机操作工数字化技能考核试卷及答案
- 河北省石家庄精英新华学校2025-2026学年上册七年级开学数学试卷(含部分答案)
- 医院技术面试题目及答案
- 三端集成稳压器等多领域知识测试卷
- 2025-2026学年赣美版(2024)小学美术三年级上册《团花剪纸》教学设计
- 2025年工地安全员培训考试试题及答案
- 文明有礼+课件-2025-2026学年统编版道德与法治八年级上册
- 供水设备运行维护与保养技术方案
- 木雕工艺课件
- 2025年2个清单28个问题查摆整改措施
- 摩擦力影响因素实验报告范本
- 教育系统应急知识培训课件
- 基坑防护课件
- 2025年黑龙江省龙东地区中考英语真题含答案
- 医疗器械生产质量管理规范2025版
- 学堂在线 军事理论 章节测试答案
评论
0/150
提交评论