付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、页»内数据挖掘考试题一-选择题A当不知道数据所带标签时,可以便用哪种技术促使带同类标签的数据与带尖他标签的数据柑分离? <)"分类 M聚类 幺关联分析 Q主成分分析纟(丿将两个簇的邻近度泄义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次 聚类技术。"初加单链/空刎F全链丿 E,组平均 O刘方法M数据挖掘的经典案例“啤酒与尿布试验"最主要是应用口丿数据挖掘方法。彳分类参预测0关联规则分析 Q聚类G关于均值和咖0*%的比较,以下说法不正确的是()均值丢弃被它识别为噪声的对象,而般聚类所有对象。均值使用簇的基于原型的概念,NS&©使
2、用基于密度的概念。均值很难处理非球形的簇和不同大小的簇&席可以处理不同大小和不同形状的簇Q冬均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是会合并 有重叠的簇5下列关于说法错误的是,("对噪声点和离群点敏感度比较小名擅长处理球状的簇忆对于M方法,两个簇的邻近度定义为两个簇合并时导致的平方误差2>当两个点之间的邻近度取它们之间距离的平方时,初诃方法与组平均非常相似6下列关于层次聚类存在的问题说法正确的是:!"具有全局优化目标函数£知屜丼擅长处理球状的簇忆可以处理不同大小簇的能力O加U对噪声点和离群点很敏感7下列关于凝聚层次聚类的说法中,说法错
3、误的事:(f"一旦两个簇合并,该操作就不能撤销g算法的终止条件是仅剩下一个簇0空间复杂度为0()Q具有全局优化目标函数£规则牛奶,尿布-啤洒的支持度和宜信度分别为:(77Z>项集t面包,牛奶S面包,尿布,啤洒,鸡蛋2件奶,尿布,啤洒,可乐4而包,牛奶,尿布,啤酒5而包,牛奶,尿布,可乐4 0.4.0.4£ 0.67.0.670.4.0.67 O 0.67.0.4乡卜列(丿是属于分裂层次聚类的方法。矽对下图数据进行凝聚聚类操作.簇间柑似度使用也r讣算,第二步是哪两个簇合并:111213141511 LI3 I4 I5面1.000.700.600.501.000
4、.900.100.650.200.100.701.000.400.300.650.600.401.000.800.200.500.300.801.00"在印和C可合并 g 3和#习合并 么0习和«习合并0 纟印和F习形成簇和印合并二填空题:/.属性包括的四种类型:是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。M基本凝聚层次聚类算法空间复杂度,时间复杂度 ,如果某个簇到苴他所有 簇的距离存放在一个有序表或堆中,层次聚类所需要的时间复杂度将为4.聚类中,定义簇间的相似度的方法有(写出四个):5层次聚类技术是第二类重要的聚类方法。两种层次聚类的基本方法:£组平均
5、是一种界于之间的折中方法。Z相似度矩阵可以用相识度表示还可以用表示。f全链在处理大小不同的簇时,可能便破裂,并且偏好彳单链技术擅长于处理,但对 和 很敏感。页»内矽聚类分析可以看做是一种的分类。(有监督、无监督)三.判断题A从点作为个体簇开始每一步合并两个最接近的簇,这是一种分裂的层次聚类 方法。()数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。(在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。当两个点之间的邻近度取它们之间距离的平方时,奴“/方法与组平均非常相似。(咖是相对抗噪声的,并且能够处理任意形状和大小的簇。() 属性的性质不必与
6、用来度量他的值的性质相同。() 全链对噪声点和离群点很敏感() 对于非对称的属性,只有非零值才是重要的。()均值可以很好的处理不同密度的数据。()to.单链技术擅长处理椭圆形状的簇。()四.综合题/何为层次聚类?它用哪两种图表示?2.两种层次聚类的基本方法?两种方法的过义?M分别写出牝、和组平均的优缺点?G写出基本凝聚层次聚类的算法?5山下图己给出的距离矩阵,将U用于6个点样本数据集,画出层次聚类的树状图?P/P2p sQ4QSp6QIa00a24a22037a34a2SP2a saa00a taa20013a ssP3a22a taaGOa ts028a/a37a20a tsa00a29a2
7、25a34a fSa28a29a00a 歹乡P6a23a ssa naaa00考试题+答案一-选择题力当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带苴他标签的 数据相分离?馆)"分类 g聚类 0关联分析 Q主成分分析纟(0)将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层 次聚类技术.二初加单链丿丫全链丿 0,组平均方法金数据挖掘的经典案例“啤洒与尿布试验”最主要是应用了0丿数据挖掘方法。彳分类名预测 0关联规则分析2>聚类G关于均值和的比较,以下说法不正确的是(刖均值丢弃被它识别为噪声的对象,而少殆&疏般聚类所有对彖。均值使用簇的
8、基于原型的概念,使用基于密度的概念。均值很难处理非球形的簇和不同大小的簇,少©可以处理不同大小和不同形状的簇2>冬均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是。菇会合并有重叠的簇5下列关于讹1皿农说法错误的是:(0)彳对噪声点和离群点敏感度比较小M擅长处理球状的簇幺对于M方法,两个簇的邻近度定义为两个簇合并时导致的平方误差0当两个点之间的邻近度取它们之间距离的平方时,方法与组平均非常相似7下列关于层次聚类存在的问题说法正确的是:(勿"具有全局优化目标函数g创擅长处理球状的簇忆可以处理不同大小簇的能力对噪声点和离群点很敏感7下列关于凝聚层次聚类的说法中,说
9、法错误的事:(2?)"一y两个簇合并,该操作就不能撤销M算法的终止条件是仅剩下一个簇/空间复杂度为o(r)©具有全局优化目标函数£规则牛奶,尿布-啤洒的支持度和置信度分别为:(©TTP项集/面包,牛奶£面包,尿布啤洒,鸡蛋3牛奶,尿布,啤洒,可乐4面包,牛奶,尿布,啤酒5面包,牛奶,尿布,可乐40404?067O67 g06700.6704彳卜列(R是属于分裂层次聚类的方法。砂对下图数据进行凝聚聚类操作簇间相似度使用以讣算,第二步是哪两个簇合并:(?)111213141511 L131415莎1.000.700.600.501.000.900.
10、100.650.200.100.701.000.400.300.650.600.401.000.800.200.500.300.801.00"在*和e可合并 M 3和#习合并 么0习和«习合并a 纟印和“,习形成簇和印合并二填空题:t属性包括的四种类型:标称、序数、区间.比率。纟组平均是两个簇的邻近度泄义为不同簇的所有点对邻近度的平均值。M基本凝聚层次聚类算法空间复杂度0防),时间复杂度O0刊,如果某个簇到其他 所有簇的距离存放在一个有序表或堆中,层次聚类所需要的时间复杂度将为0(nr logW)。4聚类中,定义簇间的相似度的方法有(写出四个):如 (单链)、牝以(全链、
11、组平均、方法。5层次聚类技术是第二类重要的聚类方法。两种层次聚类的基本方法:凝聚层次聚类、分裂层次聚类。6 组平均是一种界于和丄產之间的折中方法。7.相似度矩阵可以用相识度表示还可以用表示。f全链在处理大小不同的簇时,可能使大的簇 破裂,并且偏好球形9.单链技术擅长于处理_非椭鬪形状的簇,但对噪声点 和离群点 很敏感。O聚类分析可以看做是一种尢监鳖的分类。(有监督、无监督)三.判断题A从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。(X)纟数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。M在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的
12、效果就越差。(X )4、当两个点之间的邻近度取它们之间距离的平方时,M方法与组平均非常相似。(7)56SG皿是相对抗噪声的,并且能够处理任意形状和大小的簇。(7)6.属性的性质不必与用来度量他的值的性质柑同。(V )Z全链对噪声点和离群点很敏感。(X )y对于非对称的属性,只有非零值才是重要的。Z)彳冬均值可以很好的处理不同密度的数据。(X)矽单链技术擅长处理椭圆形状的簇。(X )四-综合题/何为层次聚类?它用哪两种图表示?层次聚类为嵌套簇的聚集,组成一棵层次数.两种主要图的表示:树状图和嵌套簇图。2两种层次聚类的基本方法?两种方法的世义?凝聚层次聚类和分裂层次聚类凝聚的:从点作为个体簇开始,
13、每一步合并两个垠接近的簇。分裂的:从包含所有点的某个簇开始每一步分裂一个簇宜到仅剩F单点簇。金分别写出沁、*和组平均的优缺点?怎义方式优点缺点能处理非椭圆形状对噪声和离群点很敏感%*对噪声点和离群点敏感度较小2'勺处理簇大小不同时,较大的綾容易破 裂纟偏好处理球状的簇组平均对噪声点和离群点敏感度较小偏好处理球状的簇G写出基本凝聚层次聚类的算法?算法步骤:Gil算邻近度矩阵(3!合并最邻近的两个簇更新邻近度矩阵,以反映新的簇与原來的簇Z间的邻近度5山下图己给出的距离矩阵,将U用于6个点样本数据集,画出层次聚类的树状图?P/P2p3Q4QSP6Qla00aa22a37a34aS3p2a24
14、a00a14a20a fSa sse3a22a(4a00a fSa28a iteaa37a20a tsaGOa29a22p sa34ai3028a 科08a 弓乡p6a23aS50 /a220 彭aGOARM和最近所以为结合,;z茗和砂较近,所以右结合,现在是36、25、Z近(6 4/ = 3如(S4如(64)=曲讹U5O22)=022 少3( M 62 珂/ = iMU(為(S 2h d远(6 2) dut(3.5i. dit(6.Si) =g(o fa. a 25 a 两 o沏=q 影环(& 6f、)=收认偸认SI、如6 小=30 盈 a 2引=0 23所以MS和结合。现在还剩06“、0习和«Q皿(C 6 “,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一站式智能全屋定制项目可行性研究报告模板立项申批备案
- 2025北京一七一中高三(上)期中数学试题及答案
- 渡槽吊装专项施工方案
- 正规安全培训管理服务
- 平行线的性质(教学课件)2025-2026学年北师大版七年级数学下册
- 老年营养不良评估与饮食护理专项考核试题及答案解析
- 2026 三年级下册《英语学习兴趣激发》课件
- 医院护士采购管理制度
- 医院精神科工作制度
- 十堰安全生产六项制度
- 辽宁职称聘任管理办法
- 2025年中考化学复习:流程图题(含答案解析)
- 雷诺科雷嘉汽车说明书
- 2025年广东省汕头市澄海区中考一模语文试题(解析版)
- 【醋酸乙烯合成反应器的能量衡算计算过程案例(论文)】
- 陕西就业协议书范本
- IATF16949质量管理体系-领导层培训课件
- IEC 62368-1标准解读-中文
- 大学生《思想道德与法治》考试复习题及答案
- 北京师范大学出版集团职业教育分社招聘笔试真题2023
- 高空作业安全专项施工方案完整版
评论
0/150
提交评论