数据挖掘(第2版) 第6章 关联规则习题答案_第1页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章关联规则习题1.给出一个小例子表明强关联规则中的项实际上可能是负相关的。答案:一个关联规则同时满足最小支持度和最小置信度,我们称之为强关联规则。但是,强关联规则中的项有时存在负相关关系。如下例所示:假设最小支持度为40%,最小置信度为60%。A->B是一个强关联规则,因为其满足最小支持度65/150=43.3%且满足最小置信度65/100=61.9%。然而,A和B之间的提升度为lift(A->B)=0.433/(0.700×0.667)=0.928<1,故A和B之间的出现是负相关的。2.讨论题略,3.考虑下面的频繁3项集的集合:{1,2,3}、{1,2,4}、{1,2,5}、{1,3,4}、{1,3,5}、{2,3,4}、{2,3,5}、{3,4,5},假定数据集中只有5个项,列出Apriori算法的候选产生过程得到的所有候选4项集,以及剪枝后剩下的所有候选4项集。答案:所有候选4项集为:{1,2,3,4},{1,2,3,5},{1,2,4,5},{1,3,4,5},{1,2,3,5},{2,3,4,5}。剪枝后剩下的所有候选4项集为:{1,2,3,4},{1,2,3,5},{1,3,4,5},{1,2,3,5},{2,3,4,5}。其中侯选4项集{1,2,4,5}被剪枝的原因是,其子集{2,4,5}不是频繁3项集。4.下表为某超市事务数据,其中hotdog表示含热狗的事务,hotdog表示不包含热狗的事务,hamburger表示包含汉堡包的事务,hamburger表示不包含汉堡包的事务。假设最小支持度阈值minsup=20%,最小置信度阈值mincon=70%,试问热狗和汉堡包的关联性如何?答案:由于支持度为2000/5000=40%,置信度为2000/3000=66.7%。因此,该关联规则不是强关联规则。同时,提升度lift(hotdog->hamburger

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论