版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚类分析和判别分析练习题一、选择题.需要在聚类分析中保序的聚类分析是()。A.两步聚类B.有序聚类C.系统聚类D.k-均值聚类.在系统聚类中标是()。A.组内离差平方和除以组间离差平方和B.组间离差平方和除以组内离差平方和C.组间离差平方和除以总离差平方和D.组问均方除以总均方。.系统聚类的单调性是指()。A.每步并类的距离是单调增的B.每步并类的距离是单调减的C.聚类的类数越来越少D.系统聚类R2会越来越小4.以下的系统聚类方法中,哪种系统聚类直接利用了组内的离差平方和。()A.最长距离法B.组间平均连接法C.组内平均连接法D.WARD 法 TOC o 1-5 h z 5.以下系统聚类方法中
2、所用的相似性的度量,哪种最不稳健()。Pp X X-p ,A. % Xjk)2B. C - C.工_R,d. (xi -x)尔(招-x-)kmkm d . XjkkmP(xik - xjk ) k W/ Xik -XjkZ kmd Xjk.以下系统聚类方法中所用的相似性的度量,哪种考虑了变量间的相关性(C. ” (, Xik./Xjk) D. (xi -xj) (xi -xj)kW.以下统计量,可以用来刻画分为几类的合理性统计量为()?A.可决系数或判定系数R2W-Pg B.PgW.PG /(G-1)C.PG/(n-G)D.(W-Pg).以下关于聚类分析的陈述,哪些是正确的()A.进行聚类分析
3、的统计数据有关于类的变量B.进行聚类分析的变量应该进行标准化处理C.不同的类间距离会产生不同的递推公式D.递推公式有利于运算速度的提高。D(3)的信息需要D (2)提供。.判别分析和聚类分析所要求统计数据的不同是()A.判别分析没有刻画类的变量,聚类分析有该变量B.聚类分析没有刻画类的变量,判别分析有该变量C.分析的变量在不同的样品上要有差异D.要选择与研究目的有关的变量.距离判别法所用的距离是()A.马氏距离 B.欧氏距离C.绝对值距离D.欧氏平方距离.在一些条件同时满足的场合,距离判别和贝叶斯判别等价,是以下哪些条件。( )A.正态分布假定B.等协方差矩阵假定C.均值相等假定D.先验概率相
4、等假定.常用逐步判别分析选择不了的标准是()A统计量越小变量的判别贡献更大A统计量越大变量的判别贡献更大C.判定系数越小变量的判别贡献更大D.判定系数越大变量的判别贡献更大二、填空题1、聚类分析是建立一种分类方法,它将一批样本或变量按照它们在性质上的 进行科 学的分类。. Q型聚类法是按 进行聚类,R型聚类法是按 进行聚类。. Q型聚类相似程度指标常见是 . ,而R型聚类相似程度指标通常采用。.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间可同度量的目的。常用的无量纲化方法有以下几种:.六种Q型聚类方法分别为 6.判别分析是要解决在研究对象已知 中哪一类的
5、多元统计方法。的情况下,确定新的观测数据属于已知类别.用判别分析方法处理问题时,通常以 作为衡量新样本点与各已知组别接近程度的指标。.进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有.类内样本点接近,类间样本点疏远的性质,可以通过 与 的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越,分类效果越。.最大的错判概率为 ,这时两个总体的均值向量的关系是 。.两个点x和y是从同一个总体中抽出的样本,二者的马氏距离可以表达为 。三、总结系统聚类有哪些方法?他们的 D (0)可以如何定义,其各种方法的递推公式式什么。证明类平均法的递推公
6、式是22D2(J,M)nKD2(J,K) nLD2(J,L)6 nL四、系统聚类类别的确定有哪些方法或指标?五、如果在系统聚类时,某步产生了如下的两个小类92, 3, 4 ,(3,4, 5),(3, 5,8)4, 4 ,(6,4,5)如果用离差平方和法聚类,两个小类的距离是多少。六、简述系统聚类法的基本思想及主要步骤。六、简述快速聚类的基本思想及主要步骤。七、某地区将农村经济类型分为三类:G1较富裕类型,G2中等类型,G3 较贫困类型。每种类型以五个指标为依据:x1 = 土地生产率=农村社会总产值/总土地面积(百元/每亩),x2=劳动生产率=农村社会总产值/农村劳动力(百元/每个劳动力),*3
7、=人均收入=农村经济纯收入/农业人口(百元/每人),x4=费用水 平=总费用/总收入,x5=农村工业比重 =农村工业产值/农村社会总产值。每种类型分别有容量为n1二5,n2=8,n3=4的样本(每个个体以县为单位),其数据如下:12345678G1(较X13.853.514.125.013.67富裕)X26.755.734.454.685.84X34.794.013.683.644.27X40.850.810.890.780.87X50.590.600.480.530.64G2(中X13.613.654.112.983.212.873.354.00等)X24.053.744.133.693.5
8、53.783.814.27X32.652.863.152.903.132.602.712.97X40.900.910.930.890.880.940.950.90X50.450.430.410.410.480.390.380.44G3(较X13.233.032.542.11贫困)X24.083.213.502.98X31.852.031.511.07X40.960.940.970.99X50.380.250.340.21(1)试以x3,x5为变量,建立三个类别的判别函数(2)试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数八、设两个二维总体有公共协方差,从二总体中分别抽取了容量为9
9、和8的样本,其数据如下:123456789G1X120.228.524.626.529.036.736.027.625.0X214.28.414.815.211.99.618.09.516.0G2X121.623.217.814.411.018.915.416.1X27.54.59.27.25.56.38.07.8采用马氏距离判别法则确定点(23.1 , 9.2)属于哪一类。九、以下数据是20种啤酒的相关数据,进行聚类分析。名称热量钠含量酒精价格Budweise144.0019.004.70.43Schlitz181.0019.004.90.43Ionenbra157.0015.004.90.48Kronenso170.007.005.20.73Heineken152.0011.005.00.77Old-miln145.0023.004.60.26Aucsberg175.0024.005.50.40Strchs-b149.0027.004.70.42Miller-l99.0010.004.30.43Sudeiser113.006.003.70.44Coors140.0016.004.60.44Coorslic102.0015.004.10.46Michelos135.0011.004.20.50Secrs150.0019.004.70.76Kkirin149.006.005
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 染色体微重复综合征的临床表型异质性
- 脊髓损伤神经源性膀胱患者间歇导尿管理
- 患者责任制整体护理模式排班方法
- 脑出血的颅内压监测
- 肺癌术后预防压疮的护理措施
- 2026年广东省江门市蓬江区初中毕业生学业水平调研测试化学试卷(含答案)
- 医学26年:生物制剂临床应用 查房课件
- 第14课 网络支付新时代说课稿2025年小学信息技术(信息科技)第2册鲁教版
- 初中生2025情绪管理主题班会说课稿
- 上海工程技术大学《安全法学》2025-2026学年第一学期期末试卷(A卷)
- DL 5068-2014 发电厂化学设计规范
- 小学数学1-6年级公式大全(打印版)
- 智能制造概论
- 单元写作任务 统编版高中语文必修下册
- MOOC 中医与辨证-暨南大学 中国大学慕课答案
- 《风电场工程规划报告编制规程》(NB-T 31098-2016)
- 国家开放大学《Python语言基础》实验1:Python 基础环境熟悉参考答案
- 食品安全培训之外卖业
- 安全可控过程层以太网交换机屏技术规范书
- 初高中数学课标比较与分析
- 护士在不同生命阶段的护理需求
评论
0/150
提交评论