大学数据挖掘期末考试题【范本模板】_第1页
大学数据挖掘期末考试题【范本模板】_第2页
大学数据挖掘期末考试题【范本模板】_第3页
大学数据挖掘期末考试题【范本模板】_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

:号学:名姓班级业专院。学题试院试学考学末科期息期信学与季学春数年学4102—3102

-数据挖掘试卷3.数据挖掘的经典事例“啤酒与尿布试验”最主若是应用了()数据挖掘方法。--A分类B展望C关系规则解析D聚类-课程代码:C0204413课程:数据挖掘A卷--4.关于K均值和DBSCAN的比较,以下说法不正确的选项是()------一二三四五六七八九十总成绩复核A。K均值抛弃被它鉴别为噪声的对象,而DBSCAN一般聚类全部对象。-题目-----B。K均值使用簇的基于原型的观点,DBSCAN使用基于密度的观点。-得分-----C。K均值很难办理非球形的簇和不同样大小的簇,DBSCAN能够办理不同样大小和不同样形状的簇-阅卷教师-----D。K均值能够发现不是显然分其他簇,即便簇有重叠也能够发现,但是DBSCAN会合并有重叠的簇-线--5。以下关于Ward’sMethod说法错误的选项是:()一、判断题(每题1分,10分)-----A。对噪声点和离群点敏感度比较小-1.从点作为个体簇开始,每一步合并两个最凑近的簇,这是一种分裂的层次聚类方法。()--B.善于办理球状的簇--2.数据挖掘的目标不在于数据收集策略,而在于对已经存在的数据进行模式的挖掘.()----C.关于Ward方法,两个簇的周边度定义为两个簇合并时致使的平方偏差--3.在聚类解析中间,簇内的相似性越大,簇间的差别越大,聚类的收效就越差。()----D。当两个点之间的周边度取它们之间距离的平方时,Ward方法与组平均特别相似--4.当两个点之间的周边度取它们之间距离的平方时,Ward方法与组平均特别相似。()----6.以下关于层次聚类存在的问题说法正确的选项是:()--5.DBSCAN是相抗衡噪声的,而且能够办理任意形状和大小的簇。()---A.拥有全局优化目标函数封6.属性的性质不用与用来胸襟他的值的性质同样。()---B.GroupAverage善于办理球状的簇-7.全链对噪声点和离群点很敏感。()---C.能够办理不同样大小簇的能力8.关于非对称的属性,只有非零值才是重要的。()----D.Max对噪声点和离群点很敏感--9.K均值能够很好的办理不同样密度的数据。()----7.以下关于凝聚层次聚类的说法中,说法错误的事:()--10.单链技术善于办理椭圆形状的簇。()----A。一旦两个簇合并,该操作就不能够撤掉---二、选择题(每题2分,30分)---B.算法的停止条件是仅剩下一个簇---1.当不知道数据所带标签时,能够使用哪一种技术促使带同类标签的数据与带其余标签的数据相分密2-C。空间复杂度为Om--离?()-----D。拥有全局优化目标函数A。分类B。聚类C。关系解析D.主成分解析----2。()将两个簇的周边度定义为不同样簇的全部点对周边度的平均值,它是一种凝聚层次聚类技8。规则{牛奶,尿布}→{啤酒}的支持度和置信度分别为:()------术。------A.MIN(单链)B。MAX(全链)C.组平均D。Ward方法-----第-1-页共3页----TID项集{面包,牛奶}{面包,尿布,啤酒,鸡蛋}{牛奶,尿布,啤酒,可乐}{面包,牛奶,尿布,啤酒}{面包,牛奶,尿布,可乐}A.0。4,0.4B。0。67,0.67C。0.4,0.67D。0。67,0.49.以下()是属于分裂层次聚类的方法。A.MinB.MaxC。GroupAverageD.MST10。对以下列图数据进行凝聚聚类操作,簇间相似度使用MAX计算,第二步是哪两个簇合并:()A.在{3}和{l,2}合并B。{3}和{4,5}合并C。{2,3}和{4,5}合并D.{2,3}和{4,5}形成簇和{3}合并11.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )A.频频模式挖掘B。分类和展望C。数据预办理D.数据流挖掘12.决策树中不包括一下哪一种结点()A,根结点(rootnode)B,内部结点(internalnode)C,外面结点(externalnode)D,叶结点(leafnode)

A、分类和聚类都是有指导的学习B、分类和聚类都是无指导的学习C、分类是有指导的学习,聚类是无指导的学习D、分类是无指导的学习,聚类是有指导的学习15.下边购物篮能够提取的3—项集的最大数目是多少()ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油啤酒,饼干A。1B。2C。3D4三、简答题(每题8分,40分)1。何谓数据挖掘?它有哪些方面的功能?2。简述数据预办理方法和内容。建立一个模型,经过这个模型依据已知的变量值来展望其余某个变量值属于数据挖掘的哪一类任务?( )A.依据内容检索B.建模描述C.展望建模D。搜寻模式和规则3.何谓聚类?它与分类有什么异同?14。以下哪个描述是正确的?()第-2-页共3页什么是决策树?怎样用决策树进行分类?5。简述ID3算法的基本思想及其主算法的基本步骤

P50.340。130.280。290.000.39P60。230。250.110.220。390。002。假设数据挖掘的任务是将以下的8个点(用(x,y)代表地址)聚类为3个类:X1(2,10)、X2(2,5)、X3(8,4)、X4(5,8)、X5(7,5)、X6(6,4)、X7(1,2)、X8(4,9),距离选择欧几里德距离。假设初始选择X1(2,10)、X4(5,8)、X7(1,2)为每个聚类的中心,请用K—means算法来计算:四、算法题(每题10分,20分)1。由以下列图已给出的距离矩阵,将Max用于6个点样本数据集,画出层次聚类的树状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论