《数据挖掘》练习习题(第6章)_第1页
《数据挖掘》练习习题(第6章)_第2页
《数据挖掘》练习习题(第6章)_第3页
《数据挖掘》练习习题(第6章)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、填空题1、关联规则挖掘的目的是 。2、在下列事务数据集中TID项集1面包,牛奶2面包,尿布,啤酒,鸡蛋3牛奶,尿布,啤酒,可乐4面包,牛奶,尿布,啤酒5面包,牛奶,尿布,可乐项集啤酒,尿布,牛奶的支持数为 ,支持度为 。3、在第2题的事务数据集中,如果将最小支持数定为3,则数据集中的频繁项集有 。4、在第2题的事务数据集中,规则牛奶,尿布啤酒的支持度为 ,置信度为 。5、满足最小支持度和最小信任度的关联规则称为 。6、给定一个事务数据库,关联规则挖掘间题就是通过用户指定的 和 来寻找强关联规则的过程。7、关联规则挖掘问题可以划分成 和 两个子问题。8、可以降低产生频繁项集的计算复杂度两种方

2、法为: 和 。9、候选集产生的方法有: 、 和 。10、Apriori算法有两个致命的性能瓶颈。它们分别是:(1) (2) 二、多项选择题1、设有项目集是的一个子集,则下列结论中成立的是( )A、如果如果频繁项目集,则也是频繁项目集;B、如果如果频繁项目集,则也是频繁项目集;C、如果如果非频繁项目集,则也是非频繁项目集;C、如果如果非频繁项目集,则也是非频繁项目集;E、如果如果频繁项目集,则可能是频繁项目集也可能是非频繁项目集。 2、设3-项集是频繁项目集,则下列1-项集和2-项集中,( )是频繁项目集。A、B、C、D、E、 3、设事务数据库具有项集,已知不是强关联规则时,则下列关联规则中,(

3、 )一定不是强关联规则。A、B、C、D、E、4、设事务数据库具有项集,已知不是强关联规则时,则下列关联规则中,( )一定不是强关联规则。A、B、C、D、E、 5、假设关联规则具有低可置信度,则在关联规则生成算法中,规则( )应该被丢弃(剪枝)。A、 B、C、 D、 E、三、问答题1、进行关联分析时,需要处理的两个关键问题是什么2、将下列事务数据库的用二元形式表示TID项集1面包,牛奶2面包,尿布,啤酒,鸡蛋3牛奶,尿布,啤酒,可乐4面包,牛奶,尿布,啤酒5面包,牛奶,尿布,可乐四、求解题1、设有如下事务数据库:TIDItemset1A,B,C,D2B,C,D3A,B,C,E4B,D,E5A,B

4、,C,D(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。2、考虑下表中购物篮事务数据集。顾客ID购买项1a,d,e1a,b,c,e2a,b,d,e2a,c,d,e3b,c,e3b,d,e4c,d4a,b,c5a,d,e5a,b,e(1)设minsupport=40%,利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。3、考虑下表中显示的购物篮事务。事务ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干(1)设minsupport=40%,利用Apriori算法求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论