




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、二名词解释1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量多指标问题的理论和方法,是一元统计学的推广2、聚类分析:是根据“物以类聚的道理,对样品或指标进行分类的一种多元统计分析方法.将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强.使类内对象的同质性最大化和类间对象的异质性最大化3、随机变量:是指变量的值无法预先确定仅以一定的可能性概率取值的量.它是由于随机而获得的非确定值,是概率中的一个根本概念.即每个分量都是随机变量的向量为随机向量.类似地,所有元素都是随机变量的矩阵称为随机矩阵.4、统计量:多元统计研究的是多指标问题,为了了解总体的特征,通过对总
2、体抽样得到代表总体的样本,但由于信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量、计算题八16-42k设H=花一?是否独立?其中启=1Q纣眉=-44-1试判断叼+2吟与解:e1-1V16-42yc100-4A一I|1102J"-1-ro2J"10-6-15-61a2U-162040按用片的联合分帚再II10"16-6Iti20-1G20)故不独立口2.对某地区农村的百名2周宙男翌的身高、胸圉、上半骨圉进行测虽,得相关数据如下根据汶往资料,该地区城市2周岁男婴的速三个指标的均值血二(90Q乩16庆现欲在多
3、元正态性的假定下检验该地区农村男娶是否与城市男婴有相同的均值?伽井中乂=60.2xA)-1=(115.6924)-1厂43107-14.62108.946八1-14.62103.172-373760、8.9464-37376035.S936J=0.01,(3,2)=99.2,03)=293隔-4)=16.7)答:2、假设检验问题:比、#=险用'/H地r-8.o>经计算可得:X-AA223107-14.6210E9464ST1=(23J3848)-1-14.6210894643.172-373760-37.376035.5936构造检验统计量:尸邙勺(丢-冏)/-(巫-角)=6x7
4、0.0741=420.445由题目热(3,)=295由是ai=aw3,3)A147.5所以在显著性水平ff=0.01下,拒绝原设尽即认为农村和城市的2周岁男婴上述三个指标的均值有显著性差异(2PP尸4、设盂=(耳兀.昂工/M(XE),协方差阵龙1P"1QPP(1)试从匚由发求X的第一总体主成分;(2)试|可当取多大时才链史饕主成分册贡萧率达阳滋以上答:A1-P- PA1- P-P- P-P-PP=0得特征根*A=l+3p,-PZ-l对二养y=人=1p得人所对应的单位特征向量为匚1*22故得第一主成分一+尚寸冷禺+*血2第一个主成分的责献率为=1八95%雄+2入+川40.95x4-1-
5、3-禹0933题型三解做题1、简述多元统计分析中协差阵检验的步骤答:第一,提出待检验的假设和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否认域;第四,根据样本观测值计算出统计量的值,看是否落入否认域中,以便对待判假设做出决策拒绝或接受.2、简述一下聚类分析的思想答:聚类分析的根本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类.把相似的样品或指标归为一类,把不相似的归为其他类.直到把所有的样品或指标聚合完毕3、多元统计分析的内容和方法答:1、简化数据结构,
6、将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多.1主成分分析2因子分析3对应分析等2、分类与判别,对所考察的变量按相似程度进行分类.1聚类分析:根据分析样本的各研究变量,将性质相似的样本归为一类的方法.2判别分析:判别样本应属何种类型的统计方法.4、系统聚类法根本原理和步骤答:1先计算n个样本两两间的距离2) 构造n个类,每个类只包含一个样本3) 合并距离最近的两类为一新类4) 计算新类与当前各类的距离5) 类的个数是否等于1,如果不等于回到3在做6) 画出聚类图7) 决定分类个数和类5、聚类分析的类型有:答:(1)对样本分类,称为Q型聚类分
7、析(2)对变量分类,称为R型聚类分析#Q型聚类是对样本进行聚类,它使具有相似性特征的样本聚集在一起,使差异性大的样本别离开来.#R型聚类是对变量进行聚类,它使具有相似性的变量聚集在一起,差异性大的变量别离开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数,到达变量降维的目的.6、简述欧氏距离与马氏距离的区别和联系.4a简述欧氏距离与马氏距离的区别和联系.答I设P锥空闾RP中的两点X二(XpX2"Xp);和Y=YpYr-Yp3那么欧氏距18次欧氏距离的局限肓在多元数据分忻中,其度重不合理-会受到粥间题中曩冈的毙响.设是来自均值向璧为(J,协方差为知勺总体G中的p
8、维样本.那么马氏K巨离为11DaT)=X-YLX-Yn当迟=【即单位阵时小HY)=xY'X丫=二(&丫=Yj)W欧氏距离.因此,在一定程度上,欧氏E巨离是马氏距离的特殊情况.马氏距离是欧氏距离的推广.7 、试述系统聚类的根本思想.答:系统聚类的根本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到适宜的类中.8 对样品和变量进行聚类分析时所构造的统计量分别是什么?简要说明为什么这样构造?答:对样品进行聚类分析时,用距离来测定样品之间的相似程度.由于我们把n个样本看作p维空间的n个点.点之间的距离即可代表样品间的相似度.常用
9、的距离为(-)明氏距离;=d血心严1q取不同值,分次护(1) 绝对距离(*-巧工)=X口迄-摩/Jt-14(2) 欧氏距离一)=(£鹰祇一兀严(3) 切比雪夫距禽幽g)%(Q=出警惯St-X金1?一才jr工、/*-(-)马氏距禽八prX*十区“*K".*.JfrfK(二)兰氏距离壳=(卷-Xj)八-1(Xi-xp对变璧的拒似性,我们更多地要了解变堡的变化趋势或变化方向,因此用相关性进行W0舟变量看作p维空间的向量,一般用PV不/GOM比ViiI(-)相关系数(Jl4X)1X.-X)一>F|>Jt11M9、在进行系统聚类时,选择距离公式应遵循哪些原那么答:(1)要
10、考虑所选择的距离公式在实际应用中有明确的意义.如欧氏距离就有非常明确的空间距离概念.马氏距离有消除量纲影响的作用.(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法.如在进行聚类分析之前已经对变量作了标准化处理,那么通常就可采用欧氏距离.(3)要考虑研究对象的特点和计算量的大小.样品间距离公式的选择是一个比拟复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折.实际中,聚类分析前不妨试探性地多项选择择几个距离公式分别进行聚类,然后对聚类分析的结果进行比照分析,以确定最适宜的距离测度方法.10、欧式距离的优点缺点欧式距离(Euclid距离)m优点:几何意义明确,简单,容易掌握,由于中学数学就已初步接触,数学知识不多的人也可以把握它的根本含义.缺点:从统计学的角度看,使用欧式距离要求一个向量的n个分量不相关,且具有相当的方差,或者说各个坐标对欧式距离的奉献同等且变差大小相同,此时使用欧式距离才适宜,且效果良好,否那么就不能如实反映情况且容易导致错误的结论.因此需要对坐标加权,化为统计距离11、 模糊聚类分析的实质和根本原理答:模糊聚类分析的实质就是根
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行政管理中的流程优化案例研究试题及答案
- 行政管理的法治思维试题及答案
- 行政管理中的决策支持系统试题及答案
- 行政管理议题研究试题及答案
- 2025正规的合租房屋租赁合同样本
- 2025快餐店临时工雇佣合同
- 建筑工程现场安全管理的新方法试题及答案
- 行政管理自考实务问题试题及答案
- 2025设备产品买卖合同模板
- 2025企业茶叶收购管理经营承包合同模板
- 2025年河北省秦皇岛市海港区中考一模数学试卷(原卷版+解析版)
- 2025年注册测绘师考试测绘地理信息数据处理与应用试题
- 二手车货车合同协议书
- 测井试题及答案完整版
- 外贸英语词汇
- 中级出版专业技术人员职业资格2025年笔试题库附答案
- 江苏南通2025年公开招聘农村(村务)工作者笔试题带答案分析
- 东南地区周代冶金考古研究新进展
- 2025年浙江省衢州市中考一模英语试题(原卷版+解析版)
- 中南大学毕业答辩学术论文模板
- 专利代缴年费合同协议
评论
0/150
提交评论