在线网课知慧《数据挖掘(山盟-青岛大学)》单元测试考核答案_第1页
在线网课知慧《数据挖掘(山盟-青岛大学)》单元测试考核答案_第2页
在线网课知慧《数据挖掘(山盟-青岛大学)》单元测试考核答案_第3页
在线网课知慧《数据挖掘(山盟-青岛大学)》单元测试考核答案_第4页
在线网课知慧《数据挖掘(山盟-青岛大学)》单元测试考核答案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章单元测试1.【多选题】正确答案:ABCD数据挖掘就是从大量的、()数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。()。A.不完全的B.随机的C.模糊的D.有噪声的2.【多选题】正确答案:BC互联网本身具有()的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。()。A.共享B.数字化C.互动性D.快速性3.【多选题】正确答案:ABCDKDD和数据挖掘可以应用在很多领域中,它们具有如下一些公共特征:()。A.数据利用非常不足B.最终用户专门知识缺乏C.海量数据集D.在开发知识发现系统时,领域专家对该领域的熟悉程度至关重要4.【多选题】正确答案:ABCD大数据的特征有()。A.ValueB.VolumeC.VelocityD.Variety5.【多选题】正确答案:BCD从宏观上看,数据挖掘过程主要由三个部分组成,即()。A.数据收集B.数据整理C.结果的解释评估D.数据挖掘第二章单元测试1.【多选题】正确答案:ACD不完整数据的成因有()。A.人为/硬件/软件问题B.其他C.数据收集的时候就缺乏合适的值D.数据收集时和数据分析时的不同考虑因素2.【多选题】正确答案:ABCD处理空缺值的主要方法有()。A.忽略元组B.使用属性的平均值填补空缺值。C.使用与给定元组属同一类的所有样本的平均值。D.使用一个全局常量填补空缺值3.【多选题】正确答案:ABCD给定一个数值属性,怎样才能平滑数据,去掉噪声?()。A.回归B.分箱(binning)C.计算机和人工检查结合D.聚类4.【多选题】正确答案:ABD数据集成时需解决的三个基本问题为()。A.数据集成过程中数值冲突的检测与处理B.冗余问题C.降维D.模式集成的过程中涉及到的实体识别问题5.【多选题】正确答案:ABCD常用的数据转换方法有()。A.聚集B.平滑C.属性构造D.数据概化第三章单元测试1【单选题】(2分)下列哪个算法不属于层次聚类算法?()。A.AgnesB.K-meansC.CURED.BIRCH2【单选题】(2分)下列哪个算法属于层次聚类算法?()。A.PAMB.DIANAC.K-modesD.DBSCAN3【单选题】(2分)下列哪个算法属于密度聚类算法?()。A.DBSCANB.PAMC.DIANAD.K-modes4【单选题】(2分)聚类分析中,通常使用()来衡量两个对象之间的相异度。()。A.大小B.位置C.比较D.距离5【单选题】(2分)下列哪个选项不是DBSCAN算法的缺点?()。A.如果样本集的密度不均匀、簇间距离相差很大时,聚类质量较差B.对用户定义的密度参数是敏感的C.能够识别出噪声点D.不能很好反映高维数据第四章单元测试1.【多选题】正确答案:BCD下列哪些是分类算法?()。A.DIANAB.C4.5C.ID3D.KNN2.【多选题】正确答案:ABD下列哪些是决策树分类算法?()。A.ID3B.C4.5C.KNND.CART3.【多选题】正确答案:ABCD贝叶斯分类方法都有:()。A.GBNB.TANC.BAND.NBC4.【多选题】正确答案:AD分类分析的两个阶段分别为:()。A.学习阶段B.使用阶段C.归纳阶段D.分类阶段5.【多选题】正确答案:BD朴素贝叶斯分类器对()数据具有较好的分类效果()。A.离散数据B.完全独立的数据C.连续数据D.函数依赖的数据第五章单元测试1【单选题】(2分)关联规则挖掘最为著名的是Agrawal等人提出的()及其改进算法。()A.AprioriB.NBCC.PAMD.ID32【单选题】(2分)()是对关联规则重要性的衡量,反映关联是否是普遍存在的规律。()A.最大值B.置信度C.最小值D.支持度3【单选题】(2分)()是对关联规则准确度的衡量,度量关联规则的强度。()A.最小值B.置信度C.最大值D.支持度4【单选题】(2分)给定全局项集I和交易数据集D,对于I的非空项集I1,若其支持度()最小支持度阈值min_sup,则称I1为频繁项集。()A.大于B.等于C.小于或等于D.大于或等于5【单选题】(2分)如果购买铁锤的顾客中有70%的人购买了铁钉,那么置信度是()。A.50%B.无法计算C.100%D.70%第六章单元测试1.【多选题】正确答案:ABCD序列模式挖掘经典算法有:()。A.AprioriAllB.PrefixSpanC.GSPD.AprioriSome2.【多选题】正确答案:BCAprioriSome算法可以看作是AprioriAll算法的改进,具体过程分为两个阶段:()。A.分裂B.前推阶段C.回溯阶段D.凝聚3.【多选题】正确答案:ABCDAprioriAll算法存在的问题()。A.需要对数据库进行多次扫描B.很难找到长序列模式C.在转换阶段产生巨大的开销D.容易生成大量的候选项集4.【多选题】正确答案:ACDAprioriSome算法的优缺点()。A.AprioriSome会产生比较多的候选,可能在回溯阶段前就占满内存。B.适用于任何数据集C.对于较低的支持度,数据集中有较长的大序列的情况下,采用AprioriSome比较好。D.AprioriSome跳跃式计算候选,会在某种程度上减少遍历数据集次数5.【多选题】正确答案:ABCGSP算法存在的问题()。A.当序列数据集比较大时,容易生成庞大的候选序列B.对长序列模式的处理效率比较低C.需要对序列数据集进行多次扫描D.只适用于小规模数据集第七章单元测试1【判断题】数据挖掘是面向应用的。()A.对B.错2【判断题】数据挖掘技术可以应用于大数据分析。()A.对B.错3【判断题】数据挖掘是在没有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论