用Excel2007实现尿布与啤酒与数据挖掘技术_第1页
用Excel2007实现尿布与啤酒与数据挖掘技术_第2页
用Excel2007实现尿布与啤酒与数据挖掘技术_第3页
用Excel2007实现尿布与啤酒与数据挖掘技术_第4页
用Excel2007实现尿布与啤酒与数据挖掘技术_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/3,版权:张洁,1,“尿布和啤酒”和数据挖掘技术,Name:张洁部门:计算机科学技术移动:1353127786 tel:020-8220,故事,2020/7/3, copyright:jean,3,Wal Mart是世界上最大的商业零售连锁沃尔玛,总部位于美国阿肯色州,拥有世界上最大的数据仓库系统。沃尔玛里为了准确了解卖场内顾客的购买习惯,将顾客的购物行为分析成购物篮子,想知道顾客经常一起购买的商品是什么样的。沃尔玛数据仓库集中了各商店详细的原始交易数据。基于这些原始交易数据,沃尔玛利用NCR数据挖掘工具分析和挖掘这些数据。意外的发现是“和尿布一起购买最多的商品是啤酒!”,故事,

2、2020/7/3, copyright:章节,4,这是数据挖掘技术分析历史数据的结果,反映了数据的固有规律。那么这个结果符合现实吗?有用的知识分子吗?有利用价值吗?分析,2020/7/3, copyright:张杰,5,沃尔玛派市场调查人员和分析师调查和分析此数据挖掘结果。经过大量的实际调查和分析,揭示了隐藏在“尿布和啤酒”后面的美国人的一种行为方式。在美国,一些年轻的父亲下班后经常去超市买尿布,而他们中的百分之30到40同时为自己买一些啤酒。因为美国夫人们经常嘱咐丈夫下班后给孩子买尿布,买尿布后很容易找回了丈夫喜欢的啤酒。分析,2020/7/3, copyright:janges,6,有很多

3、机会和啤酒一起买尿布,所以沃尔玛在一家卖场里把尿布和啤酒放在一起。结果尿布和啤酒的销售增加了。分析,2020/7/3, copyright:张杰斯,7,一般事故,尿布与啤酒风马牛不相符。如果没有通过数据挖掘技术挖掘大量交易数据,沃尔玛就不会发现这些数据本质上是有价值的法则。为什么沃尔玛会发现尿布和啤酒之间的关系?这是通过详细分析超市一年多来交易的原始数据,发现了这个神奇的组合。分析、2020/7/3、 copyright: Zhang Jie,8、数据挖掘是在大量数据中查找规则的技术,主要包括数据准备、规则搜索和规则表示三个阶段。但是,在具体实施数据挖掘应用程序时,还需要进一步评估结果。这是因

4、为数据算法找到了数据的规律,其中一些对人们感兴趣很有用,有些不感兴趣,可能没用。这需要评估发现的规律。例:“和尿布一起购买最多的商品是啤酒”的法则有用吗?为此,市场调查和评估工程师必须根据实际情况做出评估判断。这是手动步骤,还很难自动化。数据挖掘是什么技术,2020/7/3,版权:章节,9,数据挖掘分为说明性和可预测两类。描述性数据挖掘提供对数据的一般规则预测数据挖掘,从而生成对数据的预测。数据挖掘分类,2020/7/3, copyright:章节,10,关联:查找数据项之间感兴趣的关联。例:通过分析交易资料,可以找出“86%买啤酒的人也买尿布的“啤酒”和“尿布”的关联规则。数据挖掘的主要内容

5、,2020/7/3, copyright:jeass,11,进化分析:描述时间序列数据的规则或趋势,并对其建模。包括时间序列趋势分析、周期模式匹配等。例如:通过交易数据的进化分析,可以获得“89%情况股票x上升一周左右后股票y价”的序列知识。,数据挖掘的主要内容,2020/7/3, copyright:章节,12,群集分析:最大限度地提高类中的相似性,根据类之间的相似性最小化原则对数据对象进行群集或分组,生成的每个群集(群集)可以视为用明确或隐含的方法描述的数据对象类。我们常说的是把人分成小组。数据挖掘的主要内容,2020/7/3, copyright: Zhang Jie,13,分类分析:使

6、用模型描述和区分数据类的模型(可能是显式或隐式的),以便预测给定数据所属的数据类。例如:信用卡公司可以将持卡人的信誉分为良好、正常、不良等三类。分类分析通过这种数据类的分析,提出了“信誉好的持卡人年销售额在30000元至50000元之间,年龄在30至45岁之间,居住面积在90M2左右的人”的名牌。这样,就可以根据他的特性对新持卡人进行信任预测。数据挖掘的主要内容,2020/7/3, copyright:janges,14,异常分析:一个数据集包含具有与通常称为“异常”的数据不同的行为和模式的特定数据。对“异常”数据的分析称为“异常分析”。广泛应用于欺诈筛选、网络入侵检测等领域。数据挖掘的主要内

7、容,2020/7/3,版权:jeass,15,数据挖掘应用领域非常广泛。首先,应用程序可以用于所有行业从数据积累的领域银行、证券、通信等,一直到应用程序。如果数据积累足够,则需要数据挖掘技术。数据挖掘技术的应用前景,2020/7/3,版权:Jess,16,数据挖掘技术将长期用于社会,随着信息工作的深入,计算机上积累的数据越来越多,人们将越来越关注这种信息挖掘的利用,因此对数据挖掘技术的需求也越来越大。当然,数据挖掘技术本身在不断发展,这项技术将长期使用。数据挖掘技术应用前景,2020/7/3, copyright:章节,17,数据挖掘技术应用前景,2020/7/3, copyright:章节,18, 26,Associate表中的部分数据, copyright:张jet,27,购物车分析窗口, 2020/7/3, copyright:张jes,28,购物车分析窗口选定商品的销售情况:指明包含选定项目的事务处理数量。有1782笔交易,包括与Mountain Tire Tube相关联的销售。说明多少交易也包含建议的料号。有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论