下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、填空题(30分):1、多元正态分布检验用到的三大分布为、、o2、假设X〜N°(出工),那么AX+d〜o(服从什么分布)3、常用的聚类方法有、动态聚类、等。4、我们将变量的类型按照尺度可分为、、三类。5、统计距离公式为。6、相似系数一般有、两种测度。7、常用的多元数据图表示法有、...、。二、计算证明题(30分):1、设抽取5个样本,每个样本只检测一个指标,他们是13,14,15.5,19,21o试用最短距离法对5个样本进行分类并画出谱系图。719112、试验证函数/(*#"+6七+尸々,其中。<2,。53为随机向量X=(X],X2,X3)'的密度函数。113、证明。n<X,By)=C°v(X,y)E。15《多元统计分析》简答题1、试简单比拟一元正态总体单样本均值检验和多元正态总体均值检验。(方差或协差阵未知时,应包括所用到的统计量,有何联系等内容)34元正态总体样本均值的检验(方差未知时):1〃—(3.2)(3.2)(3.2)(3.3)当。2未知时,用§2=——£(X,.-反了作为拼的估计量,用统寸量:(3.2)(3.3)S来做检验。当假设成立时,统计量f服从自由度为的r分布,从而否认域为11\>勿/2(〃—1),L/2(〃—1)为自由度为〃—1的♦分布上的a/2分位点。这里我们应该注意到,(3.3)式可以表示为t2=■.丁)2=n(X-〃)'(S2)T(X-/z)(3.4)s对于多元变量而言,可以将/分布推广为下面将要介绍的HotellingT2分布。
多元正态总体均值检验:(二)协差阵E未知时均值向量的检验“0:卜=%(人为向量)HxzN。人假设”0成立,检验统计量为(3.7)(3.7)(3.7)(〃一1)一P+12xT〜F(p,n_p)(3.7)其中,72=(〃_1)[6(又一%)ST册(又_4)]给定检验水平给定检验水平a,查歹分布表,使P给定检验水平a,查歹分布表,使Pfa确定出临界值尸°,再用样本值计算出72,假设〃—PT?>给定检验水平a,查歹分布表,使Pfa那么否认“0,否那么接受“0。2、简单描述一下欧氏距离、统计距离和马氏距离的定义并比拟他们的优缺点。64欧氏距离:4(2)=苗/一¥」严i=l优缺点:要求一个向量的n个分量是不相关的并且具有相同的方差或者说各坐标对欧氏距离的同等的并且变差大小也是相同的这是使用欧氏距离才合适效果也最好,否那么就可能不能反映真实情况甚至导致错误结论。明氏距离%(q)=0国比一X/J产Ar=l明氏的缺点:(1)量纲对距离的影响。(2)指标的相关性的影响。一般,要求指标是不相关的,并且方差相同。(注:为了矫正方差,提出统计距离。)统计距离:d(P,Q)=g-y"+区-丫2)2+.・・+(470)VS]]s22Spp马氏距离:设我与X/是来自均值向量为〃,协方差为E=(>0)的总体G中的0维样品,那么两个样品间的马氏距离为d,M)=(X「XjH(X「Xj)优缺点:既排除了各指标之间相关性的干扰而且还不受个指标量纲的影响;将原数据做一线性交换后马氏距离仍不变。1、试比拟因子分析中因子载荷、变量共同度、公共因子的方差贡献的意义。答:(1)/钻二4/(载荷矩阵中第i行,第j列的元素)反映了第i个变量与第j个公共因子的相关重要性。绝对值越大,相关的密切程度越高(2)所有的公共因子和特殊因子对变量X,的贡献为I。如果非jT常靠近1,。;非常小,那么因子分析的效果好,从原变量空间到公共因子空间的转化性质好(3)因子载荷矩阵中各列元素的平方和Sj称为产/(/=1,・・・,力)对所有的X1的方差贡献和。衡量;的相对重要性。2、简述逐步判别法的基本思想。答:采用“有进有出”的算法,逐步引入变量,每次引入一个变量进入判别式,那么同时考虑在较早引入判别式的某些作用不显著的变量剔除出去3、简述主成分分析模型和基本步骤。(1)假设我们所讨论的实际问题中,有P个指标,我们把这P个指标看作P个随机变量,记为XI,X2,…,Xp,主成分分析就是要把这P个指标的问题,转变为讨论P个指标的线性组合的问题,而这些新的指标Fl,F2,Fk(kWp),按照保存主要信息量的原那么充分反映原指标的信息,并且相互独立(2)第一步:由X的协方差阵2x,求出其特征根,即解方程工-21|二0可得特征根A-A-,,,-°第二步:求出分别所对应的特征向量UI,U2,Up,Uj=(%,,k,…,uj第三步:计算累积贡献率,给出恰当的主成分个数。耳=U;X,i=l,2,…,k[k<p)第四步:写出各主成分,计算所选出的k个主成分的得分。对各主成分进行解释。4、简述几种判别分析的分类标准及其分类。判别组数:两组判别和多组判别数学模型:线性判别和非线性判别所处理变量:逐步判别和序贯判别判别准那么:马氏距离准那么、Fisher准那么、平均损失最小准那么、最小平方准那么、最大似然准那么、最大概率准那么等不同方法:距离判别法、Fisher判别法、Bayes判别法、逐步判别法等5、判别分析中为什么要进行样本间均值的检验?答:从下列图可以看出,如果X来自G1,但却落入D2,被判为属G2,错判的概率为图中阴影的面积,记为P(2/1),类似有P(1/2),显然P(2/l)二P(l/2),当两总体靠得很近,那么无论用何种方法,错判概率都很大,只有当两总体的均值显著差异时,作判别分析才有意义6、简要分析主成分分析和因子分析的异同?答:主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。7、简述因子分析的主要步骤。(1)选择分析的变量(2)计算所选原始变量的相关系数矩阵(3)提取公共因子(4)因子旋转(5)计算因子得分8、简述Fisher判别法的基本思想答:从两个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个判别函数或称判别式。其中系数确定的原那么是使两组间的区别最大,而使每个组内部的离差最小。对于一个新的样品,将它的P个指标值代人判别式中求出y值,然后与判别临界值(或称分界点(后面给出)进行比拟,就可以判别它应属于哪一个总体。在两个总体先验概率相等的假设下,判别临界值一般取:最后,用统计量来检验判别效果,假设那么认为判别有效,否那么判别无效。以上描述的是两总体判别,至于多总体判别方法那么需要加以扩展。9、简述Bayes判别法的基本思想假定对所研究的对象有一定的认识,即假设个总体中,第个总体的先验概率为,概率密度函数为。利用bayes公式计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某石油公司油气输送安全细则
- 儿童心脏科普教育
- 麻纺厂仓储物流操作制度
- 慢性肾病保健方案
- 坚定理想信念践行中国精神
- 餐饮成本管理培训课件
- 2026年老年营养支持培训试题(附答案)
- 精神科专科护士总结汇报
- 2026广东河源市消防救援支队第一批政府专职消防员招聘127人备考题库附完整答案详解【易错题】
- 2026福州产发园区运营管理有限公司项目运营合同制用工招聘3人备考题库带答案详解(巩固)
- 2026河南开封尉氏县审计局招聘人事代理人员5人笔试模拟试题及答案解析
- 2026眉山天府新区道安办招聘镇(街道)交管办专职工作人员7人笔试备考题库及答案解析
- 南极磷虾油项目可行性研究报告
- 2026校招:浦发银行试题及答案
- 八年级语文下册 第三单元 整本书阅读 《经典常谈》 怎样读知识性作品 教学课件
- 机关内部协调配合制度
- 法律出版社有限公司营销中心招聘笔试备考试题及答案解析
- 2025年云南省投资控股集团有限公司招聘(128人)笔试历年典型考点题库附带答案详解2套试卷
- 2025四川长虹电子控股集团有限公司招聘公司办公室副主任岗位测试笔试历年难易错考点试卷带答案解析2套试卷
- 2026年湖南中医药高等专科学校单招职业技能考试题库含答案解析
- 2026年南阳农业职业学院单招职业适应性测试题库及答案详解(网校专用)
评论
0/150
提交评论