多元统计分析期末考试考点整理_第1页
多元统计分析期末考试考点整理_第2页
多元统计分析期末考试考点整理_第3页
多元统计分析期末考试考点整理_第4页
多元统计分析期末考试考点整理_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、二名词解释 1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理 论和方法,是一元统计学的推广 2、聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方 法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。 使类内对象的同质性最大化和类间对象的异质性最大化 3、随机变量: 是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随 机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向 量。类似地,所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量:多元统计研究的是多指标问题

2、 ,为了了解总体的特征,通过对总体抽样得到代表 总体的样本,但因为信息是分散在每个样本上的 ,就需要对样本进行加工,把样本的信息浓缩 到不包含未知量的样本函数中,这个函数称为统计量 二、计算题 16 V 2 设乂 =沪訂弘3,功其中以=6刀辽=-*4-1 2 T 试判断可+盹与5 一門是否独立? I河J 解: X 71 -心;心丹7 +细贝 IU -6 -16? 三1620 -16 2040 2 10-6-1 沪 阪划的联合分市为场( 1 7 -0 Id 20 ) -3, 厂2040丿 故不独立- 2.对某地区农村的6名2周羽男婴的身高,胸围,上半臂围进行测量 得相关救摒如下,根据以往资料”该

3、地区城市2同岁男婴的这三个指标的 坟值压= 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中, 以便对待判假设做出决策 (拒绝或接受)。 2、简述一下聚类分析的思想 答:聚类分析的基本思想, 是根据一批样品的多个观测指标,具体地找出一些能够度量样品 或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指 标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕 3、多元统计分析的内容和方法 答:1、简化数据结构,将具有错综复杂关系的多个

4、变量综合成数量较少且互不相关的变量, 使研究问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析 等 2、分类与判别,对所考察的变量按相似程度进行分类。 (1)聚类分析:根据分析样本的各研 究变量,将性质相似的样本归为一类的方法。 (2)判别分析:判别样本应属何种类型的统计 方法。 4、系统聚类法基本原理和步骤 答: 1)先计算n个样本两两间的距离 2)构造n个类,每个类只包含一个样本 3)合并距离最近的两类为一新类 4)计算新类与当前各类的距离 5)类的个数是否等于 1,如果不等于回到 3在做 6)画出聚类图 7)决定分类个数和类 5、聚类分析的类型有: 答: (1

5、)对样本分类,称为 Q型聚类分析 (2)对变量分类,称为 R型聚类分析# Q 型聚类是对样本进行聚类,它使具有相似性特征 的样本聚集在一起,使差异性大的样本分离开来。#R型聚类是对变量进行聚类,它使具有 相似性的变量聚集在一起,差异性大的变量分离开来,可在相似变量中选择少数具有代表性 的变量参与其他分析,实现减少变量个数,达到变量降维的目的。 6、简述欧氏距离与马氏距离的区别和联系。 4.1简述欧氏距离与马氏距离时区别和联系. 答=设p维空闾射中的两悬1=的血“ XJ 和YPYr-YP D则欧氏距离为 欧氏距离的局隈有在鲂元数据分析中,其度董不合理.会受到买际间题 中童纲的覚响. 设X,T是来

6、自均值向重为|J,协方差为z的总体G中的卩维样本.则马氏距离沟 1 1 DtK, Y)= X-Y ; Z X-Y 当広 二【即单位阵时陰 Y)=X-Y X-Y = =YJ-即欧氏距离 因此,在一定程度上,欧氏距离是马氏距离的特殊情况,马氏距离是欧氏厲的推广. 7、试述系统聚类的基本思想。 答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类, 过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 8对样品和变量进行聚类分析时所构造的统计量分别是什么?简要说明为什么这样构 造? 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作 p维空

7、间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为 q取不同他,分尚? (1) 絶汨跆禽(1)巧-V |疋議-乂話 (3) 欧氏距离(u 令(2) =(乂 3 1/2 切出雪夫跖离(叼=沖)日卩8=J - ()马氏距离 (三)里时巨离 心M-xp 我们更多地要了辭变虽的变化趋勢或变化向.因此用相呆性进行衝昼“ 対变星的相说性. 捋变壘書ftp维空间的向远.一股用 )夹用余弦h上 (-)柜董系数 CO E 0 -丘“-和” 9、在进行系统聚类时,选择距离公式应遵循哪些原则? 答:(1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的 空间距离概念。马氏距离有消除

8、量纲影响的作用。 (2 )要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析 之前已经对变量作了标准化处理,则通常就可采用欧氏距离。 (3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带 有一定主观性的问题, 我们应根据研究对象的特点不同做出具体分折。 实际中,聚类分析前 不妨试探性地多选择几个距离公式分别进行聚类, 然后对聚类分析的结果进行对比分析, 以 确定最合适的距离测度方法。 10、欧式距离的优点缺点 EC式距筈(Eurlii距盟) 对建仇-诃严 优点:几何意义明确,简单,容易掌握,由于中学数学就已初步接触,数学知识不多的人也 可以把握它的基本含义。 缺点:从统计学的角度看,使用欧式距离要求一个向量的n个分量不相关,且具有相当的方 差,或者说各个坐标对欧式距离的贡献同等且变差大小相同,此时使用欧式距离才合适,且 效果良好,否则就不能如实反映情况且容易导致错误的结论。因此需要对坐标加权,化为统 计距离 11、模糊聚类分析的实质和基本原理 答:模糊聚类分析的实质就是根据研究对象本身的属性而构造模糊矩阵,在此基础上根据一 定的隶属度来确定其分类关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论