实用多元统计分析相关习题_第1页
实用多元统计分析相关习题_第2页
实用多元统计分析相关习题_第3页
实用多元统计分析相关习题_第4页
实用多元统计分析相关习题_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、练习题一、填空题1 .人们通过各种实践,发现变量之间的相互关系可以分成相关和不相关两种类型.多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数.2 .总离差平方和可以分解为回归离差平方和和剩余离差平方和两个局部,其中回归离差平方和在总离差平方和中所占比重越大,那么线性回归效果越显著.3 .回归方程显著性检验时通常采用的统计量是SR/p/Se/n-p-1.4 .偏相关系数是指多元回归分析中,当其他变量固定时,给定的两个变量之间的的相关系数.5 .Spss中回归方程的建模方法有一元线性回归、多元线性回归、岭回归、多对多线性回归等.6 .主成分分析是通过适当的变量替换,使新变量成

2、为原变量的线性组合,并寻求降维的一种方法.7 .主成分分析的根本思想是设法将原来众多具有一定相关性比方P个指标,重新组合成一组新的互相无关的综合指标来替代原来的指标.8 .主成分表达式的系数向量是相关系数矩阵的特征向量.9 .样本主成分的总方差等于1.10 .在经济指标综合评价中,应用主成分分析法,那么评价函数中的权数为方差奉献度.主成分的协方差矩阵为对称矩阵.主成分表达式的系数向量是相关矩阵特征值的特征向量.11 .SPSS中主成分分析采用analyze-datareduction-facyor命令过程.12 .因子分析是把每个原始变量分解为两局部因素,一局部是公共因子,另一局部为特殊因子.

3、13 .变量共同度是指因子载荷矩阵中第i行元素的平方和.14 .公共因子方差与特殊因子方差之和为1.15 .聚类分析是建立一种分类方法,它将一批样品或变量根据它们在性质上的亲疏程度进行科学的分类.16 .Q型聚类法是按样品进行聚类,R型聚类法是按变量进行聚类.17 .Q型聚类统计量是距离,而R型聚类统计量通常采用相关系数.18 .六种Q型聚类方法分别为最长距离法、最短距离法、中间距离法、类平均法、重心法、离差平方和法.19 .快速聚类在SPSS中由k-均值聚类analyzeclassify-kmeanscluster过程实现.20 .判别分析是要解决在研究对象已已分成假设干类的情况下,确定新的

4、观测数据属于类别中哪一类的多元统计方法.21 .用判别分析方法处理问题时,通常以判别函数作为衡量新样本点与各组别接近程度的指标.22 .进行判别分析时,通常指定一种判别规那么,用来判定新样本的归属,常见的判别准那么有Fisher准那么、贝叶斯准那么.23 .类内样本点接近,类间样本点疏远的性质,可以通过类与类之间的距离与类内样本的距离的大小差异表现出来,而两者的比值能把不同的类区别开来.这个比值越大,说明类与类间的差异越类与类之间的距离越大,分类效果越好024 .Fisher判别法就是要找一个由p个变量组成的线性判别函数,使得各自组内点的离差尽可能接近,而不同组问点的尽可能疏远.二、简做题1、

5、简述复相关系数与偏相关系数.答:复相关系数:又叫多重相关系数.复相关是指因变量与多个自变量之间的相关关系.例如,某种商品的需求量与其价格水平、职工收入水平等现象之间呈现复相关关系.偏相关系数:又叫局部相关系数.局部相关系数反映校正其它变量后某一变量与另一变量的相关关系.偏相关系数是指多元回归分析中,当其他变量固定后,给定的两个变量之间的的相关系数.偏相关系数的假设检验等同于偏回归系数的t检验.复相关系数的假设检验等同于回归方程的方差分析.2、简述逐步回归分析方法的具体实施步骤.答:逐步回归过程如下:1自变量的剔除;2重新进行少一个自变量的多元线性回归分析;3重新进行多一个自变量的多元线性回归分

6、析;4重新进行上述步骤,直至无法再删除和再引入自变量为止.3、提取样本主成分的原那么.答:主成分个数提取原那么为主成分对应的特征值大于1的前m个主成分.特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此,一般可以用特征值大于1作为纳入标准.4、简述系统聚类法的根本思想及主要步骤.答:系统聚类的根本思想是:距离相近的样品或变量先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品或变量总能聚到适宜的类中.系统聚类过程是:假设总共有n个样品或变量,第一步将每个样品或变量单独聚成一类,共有n类;第二步根

7、据所确定的样品或变量“距离公式,把距离较近的两个样品或变量聚合为一类,其它的样品或变量仍各自聚为一类,共聚成n1类;第三步将“距离最近的两个类进一步聚成一类,共聚成n2类;,以上步骤一直进行下去,最后将所有的样品或变量全聚成一类,也简称聚集法.还有与以上方法相反的称分解法.5、简述快速聚类k均值聚类的根本思想及主要步骤.答:根本思想:1.一个样品分配给最近中央均值的类中,将所有样品分成k个初始类.2.通过欧式距离将每个样品划入离中央最近的类中,并对得到样品或失去样品的类重新计算中央坐标.3.重复步骤2,直到所有样品都不能再分配时为止.6、判别分析的分类.答:判别分析是多元统计分析中用于判别样本

8、所属类型的一种统计分析方法.判别分析按判别的组数来分,有两组判别分析和多组判别分析;按区分不同总体所用的数学模型来分,有线性判别和非线性判别;按判别对所处理的变量方法不同,有逐步判别、序贯判别等;按判别准那么不同,有距离判别、贝叶斯判别Bayes、费歇Fisher判别等.7、简述Fisher判别规那么及具体判别步骤.答:Fisher判别法的根本思想:从多个总体类抽取一定的样本,借助方差分析的思想,建立p个指标的线性判别函数,把待判样品代入线性判别函数,然后与临界值比拟,就可判样品属于哪个类.*1*Fisher判别法的具体算法步骤:由Fisher线性判别式SM1M2求解向量的步骤:1把来自两类2

9、练习样本集X分成1和2两个子集X1和X2.1MiXk,I1,2由niXkXi,计算Mi.TSiXkMiXkMic由XkXi计算各类的类内离散度矩阵Si,i=1,2o计算类内总离散度矩阵sSiS2O1计算S的逆矩阵S.*1*由SM1M2求解.三、计算题1 .现收集了92组合金钢中的碳含量x及强度y,且求得:X0.1255,y45.7989L.0.3019Lxv26.5126Lvv2941.03xxxyyy(1)求y关于x的一元线性回归方程;求y与x的相关系数;(3)列出对方程作显著性检验的方差分析表;(4)在x=0.1时,求?的点估计.Q京y关于戈的一线性回归方程;cL265126=工=解:h=

10、S7.S191:=v-=45:,匏-S7S151黑口1255="二7ML03019"一4AXAy-34.777S+81911;即,y-34.7775487.8191y(2中)与,的f目关系加.对出对方程作显著性情蛉的方差为析哀来源平方和自由度均方F值由月232SJJ141232S.3J14712499臊双LQE23267S1总计门阻打912 .某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程为edui10.360.094sibSi0.131medUi0.210feduiR20.214式中,edu为劳动力受教育年数,sibs为劳动力家庭中兄弟姐妹的个

11、数,medu与fedu分别为母亲与父亲受到教育的年数.问(1)假设medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?(2)请对medu的系数给予适当的解释.(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为12年,另一个的父母受教育的年数均为16年,那么两人受教育的年数预期相差多少年首先计算的大受致育的年数分月他1叮网X风二TIKM4HWij10一骊粒因此,两人的受教育年龈的差异为15-816-14452=1J64操作时种不同品种的玉米进行产鞍批实心幅定言实瞌区其它豪幅油国片数据如下乱品种145AI47.5454心46645.2A24f45,5

12、二一工才947.1A3432-5-辆45,SA444141.63SS43.242.5问玉米的不同品种的平均声里是否有显著差异?miK平方和df均方F显普性组同组内总数63.98240,064108.9463161922.9612JO49.170,001管:PR.0010恋拒葩原假设,故不同品种的平均产里有显著差异2F面列出在不同重剪下弹簧的茨度:1!ix面510152030茬虔强7R8.12S.959.9011.80在囹篇坐标系下作勖点图,弃判断Y关于X的相关关系是否携性;(编图也,旧通话相、散声、简单分布分析、回归、线性、统计里中选择相应的1答:线性相关.2求出Y关于X的一元线性回归方程;棋

13、型非标准化系数标准*熟tSig.B标准误差试用版1常量6.283.053117.624.000重量X.183.031.00065.745.000a.因变量:长虔y解:Y=0.183X*6.283;3对所求得的回归方程作显著性检缝,列比方差分析表:Anovaw提型平方和df均方FSig.1回归14.665114.6654454.018.OOO1残差.0134.003总计14.6785a.预测变量二常量,重量x.b.因变量:氏度y4求出Y与X间的相关系麴.楮定性重量X长度y重量xPearson相关性11.000-显著性双恻D.000N66长度yPearson相关性1.0001显著性双恻.000M6

14、6*.在.1水平双那么上显著相关.3.下表给出一二元模型的回归结果方差来源平方和(SS)自由度(d.f.)来自回归(ESS)65965一来自残差(RSS)一一总离差(TSS)6604214求:(1)样本容量是多少?RSS是多少?ESS和RSS的自由度各是多少?222(2)R2和R?(3)检验假设:解释变量总体上对Y有无影响.你用什么假设检验?为什么?解:(1)样本容量为14+1=15RSS-TSS-ESS=66042-65965=77ESS的自由度为:d£=2RSS的自由度为:dl=n-2-l=12(2)RESSTSS=65W560042=0,«88=1-(1-R2)(n-

15、l)(n-k-l>14),0012,14/12=0.99860)应该采用方程显著性检验,即F检验I理由是只有这样才能判断Xl、X二一起是否对Y有影响“4.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见卜表:Y1Y2Y3Y4Y5Y6头长x10.350.530.76-0.05-0.040.00头宽x20.330.70-0.640.000.00-0.04肱骨x30.44-0.19-0.050.530.190.59尺骨x40.44-0.25-0.020.48-0.15-0.63股骨x50.43-0.28-0.06051-0.670.48胫骨x60.44-0.22-0.

16、05048-0.700.15特征值4.570.710.410.170.080.06(1)计算前三个主成分各自的奉献率和累积奉献率.对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断M:5 .在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4).这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:12,920U1(0.1485,0.5735,0.5577,0.5814)21.024U2(0.9544,0.0984,0.2695,0.0824)30.049U3(0.2516,0.7733

17、,0.5589,0.1624)40.007U4(0.0612,0.2519,0.5513,0.7930)写出四个主成分,计算它们的奉献率.解:各自的主成分为:Z1=0.1485X1-0.5735X2-0.5577X3-0.5814X4Z2=0.9544X1-0.0984X2+0.2695X3+0.0824X4Z3=0.2516X1+0.7733X2-0.5589X3-0.1624X4Z4=-0.0612X1+0.2519X2+0.5513X3-0.7930X4那么各自的奉献率为:W1=2.920/(2.920+1.024+0.049+0.007)=0.73W2=1.024/(2.920+1.0

18、24+0.049+0.007)=0.256W2=0.049/(2.920+1.024+0.049+0.007)=0.01225W2=0.007/(2.920+1.024+0.049+0.007)=0.001756 .对纽约股票市场上的五种股票的周上升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票上升率,x4,x5表示两个石油公司的股票上升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:1 2.857U1(0.464,0.457,0.470,0.421,0.421)2 0.809U2(0.240,0.509,0.260,0.526,0.582)(1)计算这两个主成分的方差奉献率.解:各自的主成分为:Z1=0.464X1+0.457X2+0.470X3+0.421X4+0.421X5Z2=0.240X1+0.509X2+0.260X3-0.526X4-0.582X5那么各自的奉献率为:W1=2.58

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论