


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘考试题目关联分析一、10 个选择1. 以下属于关联分析的是( )A CPU性能预测B购物篮分析C自动判断鸢尾花类别D股票趋势建模2. 维克托 ?迈尔 -舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调 了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙, 与此同时, 我们 更应该注重数据中的相关关系, 而不是因果关系。 其中, 数据之间的相关关系可以通过以下哪个算法直接挖掘()A K-meansBBayes NetworkCDApriori3. 置信度 (confidence)是衡量兴趣度度量()的指标。A简洁性B确定性C实用性D新颖性算法的加速过程依赖于以
2、下哪个策略( )A抽样B剪枝C缓冲D并行5. 以下哪个会降低 Apriori 算法的挖掘效率( )A支持度阈值增大B项数减少C事务数减少D减小硬盘读写速率算法使用到以下哪些东东( )A格结构、有向无环图B二叉树、哈希树C格结构、哈希树D多叉树、有向无环图7. 非频繁模式( )A其置信度小于阈值B令人不感兴趣C包含负模式和负相关模式D对异常数据项敏感) 注:分别以 1、2、3 代表之 8. 对频繁项集、频繁闭项集、极大频繁项集的关系描述正确的是(B2 可以还原出无损的 1D2与 1是完全等价的)B查找D剪枝)B WekaD KnimeA3 可以还原出无损的 1C3与 2 是完全等价的 tree
3、在 Apriori 算法中所起的作用是A存储数据C加速查找10. 以下不属于数据挖掘软件的是(A SPSS ModelerC Apache Spark二、10 个填空1. 关联分析中表示关联关系的方法主要有: 和 。2. 关联规则的评价度量主要有:和。3. 关联规则挖掘的算法主要有:和。4. 购物篮分析中,数据是以的形式呈现。5. 一个项集满足最小支持度,我们称之为 。6. 一个关联规则同时满足最小支持度和最小置信度,我们称之为 。7. 在回归与相关分析中,因变量值随自变量值的增大(减小)而减小(增大)的现象叫 做。8. 极大频繁项集不能无损还原出频繁项集,是因为它不包含频繁项集的 信息。9.
4、 经典的 Apriori 算法是逐层扫描的,也就是说它是 (选:深度 /宽度)优先的。10. 数据挖掘大概步骤包括:输入数据 预处理 挖掘 后处理 输出知识。其中,输出的 知识可以有很多种表示形式, 两种极端的形式是: 内部结构难以被理解的黑匣子, 比如说 人工神经网络训练得出的网络; 模式结构清晰的匣子, 这种结构容易被人理解, 比如说决 策树产生的树。那么,关联分析中输出的知识的表示形式主要是 (选: 黑匣子 /清晰结构 ) 。三、10 个判断( )1. 啤酒与尿布的故事是聚类分析的典型实例。( )算法是一种典型的关联规则挖掘算法。( )3. 支持度是衡量关联规则重要性的一个指标。( )4
5、. 可信度是对关联规则的准确度的衡量。( )5.给定关联规则 A B,意味着:若 A发生, B也会发生。( )6. 频繁闭项集可用来无损压缩频繁项集。( )7. 关联规则可以用枚举的方法产生。( )算法产生的关联规则总是确定的。( )9. 不满足给定评价度量的关联规则是无趣的。( )10. 对于项集来说,置信度没有意义。四、5个简答1. 简述关联规则产生的两个基本步骤。算法是从事务数据库中挖掘布尔关联规则的常用算法,该算法利用频繁项集性质的先验知 识,从候选项集中找到频繁项集。请简述 Apriori 算法的基本原理。3. 简述 Apriori 算法的优点和缺点。4. 针对 Apriori 算法
6、的缺点,可以做哪些方面的改进?5. 强关联规则一定是有趣的吗?为什么?数据挖掘考试题目 +参考答案、 10 个选择1. 以下属于关联分析的是(B )ACPU性能预测B购物篮分析C自动判断鸢尾花类别D股票趋势建模2. 维克托 ?迈尔 -舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调 了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙, 与此同时, 我们 更应该注重数据中的相关关系, 而不是因果关系。 其中, 数据之间的相关关系可以通过以下 哪个算法直接挖掘( D )A其置信度小于阈值B令人不感兴趣A K-meansB Bayes NetworkCD Apriori3
7、. 置信度 (confidence) 是衡量兴趣度度量( B )的指标。A简洁性B确定性C实用性D新颖性算法的加速过程依赖于以下哪个策略( B )A抽样B剪枝C缓冲D并行5. 以下哪个会降低 Apriori算法的挖掘效率( D )A支持度阈值增大B项数减少C事务数减少D减小硬盘读写速率算法使用到以下哪些东东(C )A格结构、有向无环图B二叉树、哈希树C格结构、哈希树D多叉树、有向无环图7. 非频繁模式( D )C包含负模式和负相关模式D对异常数据项敏感8.对频繁项集、频繁闭项集、极大频繁项集的关系描述正确的是( B ) 注:分别以 1、 2、3代表之 A 3可以还原出无损的 1B2 可以还原出
8、无损的 1C3与 2是完全等价的D2与 1是完全等价的tree 在 Apriori 算法中所起的作用是( C )A存储数据B查找C加速查找D剪枝10. 以下不属于数据挖掘软件的是( C )A SPSS ModelerB WekaC Apache SparkD Knime二、10 个填空1. 关联分析中表示关联关系的方法主要有: 项集 和 关联规则 。2. 关联规则的评价度量主要有: 支持度 和 置信度 。3. 关联规则挖掘的算法主要有: Apriori 和 FP-Growth 。4. 购物篮分析中,数据是以 不对称二元变量 的形式呈现。5. 一个项集满足最小支持度,我们称之为 频繁项集 。6.
9、 一个关联规则同时满足最小支持度和最小置信度,我们称之为 强规则 。7. 在回归与相关分析中, 因变量值随自变量值的增大 (减小)而减小(增大)的现象叫做 负 相关 。8. 极大频繁项集不能无损还原出频繁项集,是因为它不包含频繁项集的 支持度 信息。9. 经典的 Apriori 算法是逐层扫描的,也就是说它是 宽度 ( 选:深度/ 宽度)优先的。10. 数据挖掘大概步骤包括:输入数据 预处理 挖掘 后处理 输出知识。其中,输出的 知识可以有很多种表示形式, 两种极端的形式是: 内部结构难以被理解的黑匣子, 比如说 人工神经网络训练得出的网络; 模式结构清晰的匣子, 这种结构容易被人理解, 比如
10、说决 策树产生的树。 那么,关联分析中输出的知识的表示形式主要是 清晰结构 ( 选:黑匣子 /清晰结构 ) 。三、10 个判断( ? )1. 啤酒与尿布的故事是聚类分析的典型实例。( ? )算法是一种典型的关联规则挖掘算法。( ? )3. 支持度是衡量关联规则重要性的一个指标。( ? )4. 可信度是对关联规则的准确度的衡量。( ? ) 5.给定关联规则 A B,意味着:若 A发生, B也会发生。( ? )6. 频繁闭项集可用来无损压缩频繁项集。( ? )7. 关联规则可以用枚举的方法产生。( ? )算法产生的关联规则总是确定的。( ? )9. 不满足给定评价度量的关联规则是无趣的。( ? )
11、10. 对于项集来说,置信度没有意义。四、5个简答1. 简述关联规则产生的两个基本步骤。答:关联规则产生的两个基本步骤为: 根据给定的支持度从项集中产生频繁项集; 根据 给定的置信度从频繁项集中产生关联规则。算法是从事务数据库中挖掘布尔关联规则的常用算法,该算法利用频繁项集性质的先验知 识,从候选项集中找到频繁项集。请简述 Apriori 算法的基本原理。 答:关联规则的产生并不依赖于 Apriori 算法, Apriori 算法用来加速规则的产生过程。 Apriori 算法的加速过程依赖于这样一个先验原理:“频繁项集的子集是频繁的”。3. 简述 Apriori 算法的优点和缺点。答: Apriori 算法的优点:结构简单、易于理解。Apriori 算法的缺点:产生大量的候选项集, I/O 开销较大。4. 针对 Apriori 算法的缺点,可以做哪些方面的改进?I/O 开销较大。由此,可以答: Apriori 算法的缺点主要是产
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 仓储物流配送合同规范
- 纺织技术创新思路试题及答案
- 纺织行业新兴市场的开发与设计趋势探讨试题及答案
- 2025黑龙江大兴安岭林业集团公司招聘扑火队设备操作员73人笔试参考题库附带答案详解
- 2025福建泉州市仙公山风景名胜区有限公司招聘7人笔试参考题库附带答案详解
- 2025年驻马店全域矿业开发有限公司招聘27人笔试参考题库附带答案详解
- 2025年山东省科创集团有限公司权属企业招聘12人笔试参考题库附带答案详解
- 哈尔滨委托协议翻译电话
- 艺术类期末试题及答案
- 分布式光伏发电项目可行性分析与发展前景
- 《电缆状态监测》课件
- 青梅绿茶测试题及答案
- GA 1812.2-2024银行系统反恐怖防范要求第2部分:数据中心
- 2025至2030中国智慧消防行业发展状况及未来前景研究报告
- 联锁系统设备调试施工作业指导书
- 热网工程施工组织设计方案
- 乡村振兴智慧农业项目计划书
- 2025年上半年黑龙江牡丹江市“市委书记进校园”活动暨“雪城优才”企事业单位人才招聘1324人重点基础提升(共500题)附带答案详解
- 2024年陕西高中学业水平合格性考试生物试卷真题(含答案)
- 国家职业技术技能标准 6-31-01-03 电工 人社厅发2018145号
- 2024《整治形式主义为基层减负若干规定》全文课件
评论
0/150
提交评论