下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上数据挖掘考试题目聚类一 、填空题1、密度的基于中心的方法使得我们可以将点分类为:_、_ 、_。2、DBSCAN算法在最坏的情况下,时间复杂度是_、空间复杂度是_。3、DBSCAN算法的优点是_、_。4、DBSCAN算法的缺点是处理_、_的数据效果不好。5、DBSCAN算法的参数有:_、_。6、簇的有效性的非监督度量常常可以分为两类:_、_,它常采用的指标为_。7、簇的有效性的监督度量通常称为_,它度量簇标号与外部提供的标号的匹配程度主要借助_。8、在相似度矩阵评价的聚类中,如果有明显分离的簇,则相似度矩阵应当粗略地是_。9、DBSCAN算法的参数确定的基本方法是观察_
2、的特性。10、不引用附加的信息,评估聚类分析结果对数据拟合情况属于_技术。答案:1、 核心点 边界点 噪声点2、 O(n2) O(n)3、 耐噪声 能够处理任意大小和形状的簇4、 高维数据 变密度的5、 EPS MinPts6、 簇的凝聚性 簇的分离性 均方差(SSE)7、 外部指标 监督指标的熵8、 块对角的9、 点到它的第K个最近邻的距离(K-距离)10、非监督二、选择题1、DBSCAN算法的过程是(B)。 删除噪声点。 每组连通的核心点形成一个簇。 将所有点标记为核心点、边界点和噪声点。 将每个边界点指派到一个与之关联的核心点的簇中。 为距离在Eps之内的所有核心点之间赋予一条边。A:B
3、:C:D:2、如果有m个点,DBSCAN在最坏的情况下的时间复杂度度为(C)。A O(m) B O(mlogm) C O(m2) D O(logm)3、在基本DBSCAN的参数选择方法中,点到它的K个最近邻的距离中的K选作为哪一个参数(B)。A Eps B MinPts C 质心 D 边界4、当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时,如果设置的K的值太大,则小簇(尺寸小于K的簇)可能会被标记为(A)。A 噪声 B 核心簇 C 边界簇 D以上都不对5、如果处理以下形状的数据时,适宜采用DBSCAN的是(B)A 球形 B SS形 C 椭球形 D 方形6、DBSCAN之所以难
4、以有效处理高维数据,其主要原因是(D)A 数据的形状太复杂 B 簇的大小未知 C 噪声点过多 D 开销过大7、簇评估能够做到(D)确定数据集的聚类趋势。确定正确的簇个数。比较两个簇集,确定那个更好。不引用附加信息,评估聚类分析结果对数据拟合情况A B C D8、如果不考虑外部信息,聚类结构的有良性度量应当采用(A)。A 均方差 B 方差 C 中位数 D 均值9、比较不同的聚类或簇时,通常采用相对的簇评估度量,相对的簇评估以()来评价不同的聚类或簇。A SSE或熵 B 簇的大小 C 簇的形状 D 簇的密度10、对于DBSCAN,参数Eps固定,当MinPts取值较大时,会导致(B)A 能很好的区
5、分各类簇B 只有高密度的点的聚集区划为簇,其余划为噪声C 低密度的点的聚集区划为簇,其余的划为噪声D 无影响三、判断题1、DBSCAN的参数Eps固定时,MinPts的值越大越好。(错)2、DBSCAN会把所有点划分到各自的簇中。(错)3、在所有核心点的Eps半径邻域内的点数都不少于MinPts阈值。(对)4、SSE在无监督的簇评估中能起到很好的作用。(对)5、在通过相似度矩阵评估簇时,如果相似度矩阵是块对角的,说明具有明显分离的簇(对)。6、DBSCAN能够很好的区分原始数据的形状,但受限于用户指定的参数。(对)7、判断簇的个数不属于簇评估。(错)8、在做聚类时,DBSCAN会删掉它认为是噪
6、声点的数据点。(对)9、DBSCAN的空间复杂度始终都是O(m)。(对)10、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。(对)四、简答题1、描述DBSCAN的算法过程。将所有点标记为核心点、边界点和噪声点。删除噪声点。为距离在Eps之内的所有核心点之间赋予一条边。每组连通的核心点形成一个簇。将每个边界点指派到一个与之关联的核心点的簇中。2、简答DBSCAN的优点与不足。答,优点:DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇,缺点:当簇的密度变化过大时,DBSCAN就很难敏感的发现数据集中的簇。同时, DBSCAN在处理高维数据时,会有很大的开销。3、简述DBSCAN算法的核心思想。DBSCAN算法的核心思想是一个簇中除了边界点,每个点在给定的半径Eps内必须包含不少于PinPts个数据点,这样的点称为核心点。4、确定DBSCAN参数的基本的方法是什么。答:观察点到它的K个最近邻的距离的特性。对于某个K,计算所有点的K距离,以递增的次序排序,绘制排序后的值。在图中找到曲线拐点,拐点处的函数值为Eps半
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026浙江地信科技集团有限公司招聘22人备考题库及答案详解(夺冠系列)
- 2026浙江温州行前农贸市场有限公司招聘1人备考题库含答案详解(综合题)
- 2026安徽黄山歙州农文旅发展集团有限公司招聘编制外人员1人备考题库附答案详解
- 2026贵州省社会科学院高层次人才引进4人备考题库附答案详解(综合题)
- 2026上海奉贤区机关事业单位编外人员招聘(公安岗位)5人备考题库含答案详解(研优卷)
- 2026浙江武义文旅资源运营发展有限公司招聘3人备考题库及一套答案详解
- 2026云南昆明医科大学第一附属医院招聘项目制科研助理人员(第一批次)5人备考题库附答案详解(研优卷)
- 2026四川眉山天府新区考核上半年招聘事业单位工作人员5人备考题库附答案详解(轻巧夺冠)
- 2026贵州安顺环球英语学校招聘22人备考题库及一套答案详解
- 2026河北武汉市第二十六中学招聘高中教师6人备考题库及答案详解(基础+提升)
- 浙江中考数学三年(2023-2025)真题分类汇编:专题08几何压轴(原卷版)
- 员工防溺水安全知识培训课件
- 收费站特情管理培训课件
- GB/T 20644.1-2025特殊环境条件选用导则第1部分:金属表面防护
- 2025年养老护理员(初级)职业技能考核试题及答案
- 油田火灾爆炸培训课件
- 2025年普通内科副高真题解析含答案
- (高清版)DB42∕T 2016-2023 《土工格栅加筋土路基设计与施工技术规范》
- 沪教版(2024)中考化学一轮复习:九年级上、下册知识点考点提纲汇编
- CJ/T 225-2011埋地排水用钢带增强聚乙烯(PE)螺旋波纹管
- T/CBMCA 017-2021建筑用覆膜钢板
评论
0/150
提交评论