实用多元统计分析相关习题学习资料_第1页
实用多元统计分析相关习题学习资料_第2页
实用多元统计分析相关习题学习资料_第3页
实用多元统计分析相关习题学习资料_第4页
实用多元统计分析相关习题学习资料_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实用多元统计分析相关习题精品文档练习题一、填空题1.人们通过各种实践,发现变量之间的相互关系可以分成(相关)和(不相关)两种类型。多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数。2.总离差平方和可以分解为(回归离差平方和)和(剩余离差平方和)两个部分,其中(回归离差平方和)在总离差平方和中所占比重越大,则线性回归效果越显著。3.回归方程显著性检验时通常采用的统计量是(S/p)/[S/()]。RE4.偏相关系数是指多元回归分析中,(当其他变量固定时,给定的两个变量之间的)的相关系数。5.Spss中回归方程的建模方法有(一元线性回归、多元线性回归、岭回归、多对多线性回归)等。6.主成分分析是通过适当的变量替换,使新变量成为原变量的(线性组合),并寻求(降维)的一种方法。7.主成分分析的基本思想是(设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来替代原来的指标)。8.主成分表达式的系数向量是(相关系数矩阵)的特征向量。9.样本主成分的总方差等于(1)。10.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为(方差贡献度)。主成分的协方差矩阵为(对称)矩阵。主成分表达式的系数向量是(相关矩阵特征值)的特征向量。11.SPSS中主成分分析采用(analyze—datareduction—facyor)命令过程。收集于网络,如有侵权请联系管理员删除精品文档12.因子分析是把每个原始变量分解为两部分因素,一部分是(公共因子),另一部分为(特殊因子)。13.变量共同度是指因子载荷矩阵中(第i行元素的平方和)。14.公共因子方差与特殊因子方差之和为(1)。15.聚类分析是建立一种分类方法,它将一批样品或变量按照它们在性质上的(亲疏程度)进行科学的分类。16.Q型聚类法是按(样品)进行聚类,R型聚类法是按(变量)进行聚类。17.Q型聚类统计量是(距离),而R型聚类统计量通常采用(相关系数)。18.六种Q型聚类方法分别为(最长距离法)、(最短距离法)、(中间距离法)、(类平均法)、(重心法)、(离差平方和法)。19.快速聚类在SPSS中由(k-均值聚类(—classify—kmeanscluster))过程实现。20.判别分析是要解决在研究对象已(已分成若干类)的情况下,确定新的观测数据属于已知类别中哪一类的多元统计方法。21.用判别分析方法处理问题时,通常以(判别函数)作为衡量新样本点与各已知组别接近程度的指标。22.进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有(Fisher准则)、(贝叶斯准则)。23.类内样本点接近,类间样本点疏远的性质,可以通过(类与类之间的距离)与(类内样本的距离)的大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差异越(类与类之间的距离越大),分类效果越(好)。收集于网络,如有侵权请联系管理员删除精品文档24.Fisher判别法就是要找一个由p个变量组成的(线性判别函数),使得各自组内点的(离差)尽可能接近,而不同组间点的尽可能疏远。二、简答题1、简述复相关系数与偏相关系数。答:复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。偏相关系数:又叫部分相关系数。部分相关系数反映校正其它变量后某一变量与另一变量的相关关系。偏相关系数是指多元回归分析中,当其他变量固定后,给定的两个变量之间的的相关系数。偏相关系数的假设检验等同于偏回归系数的t检验。复相关系数的假设检验等同于回归方程的方差分析。2、简述逐步回归分析方法的具体实施步骤。答:逐步回归过程如下:1)自变量的剔除;2)重新进行少一个自变量的多元线性回归分析;3)重新进行多一个自变量的多元线性回归分析;4)重新进行上述步骤,直至无法再删除和再引入自变量为止。3、提取样本主成分的原则。答:主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主收集于网络,如有侵权请联系管理员删除精品文档4、简述系统聚类法的基本思想及主要步骤。收集于网络,如有侵权请联系管理员删除精品文档答:Fisher判别法的基本思想:从多个总体(类)抽取一定的样本,借助方差分析的思想,建立p个指标的线性判别函数,把待判样品代入线性判别函数,然后与临界值比较,就可判样品属于哪个类。*S1MM*Fisher判别法的具体算法步骤:由Fisher线性判别式求解向量的步21骤:1①把来自两类训练样本集X分成和两个子集X1和X2。1221,IMXikn②由,计算M。xXiikiTXMxMSikiki计算各类的类内离散度矩阵S,i=1,2。i③由xXkiSSS④计算类内总离散度矩阵。211⑤计算S的逆矩阵S。SMM**⑥由求解。12三、计算题1.现收集了92组合金钢中的碳含量x及强度,且求得:x0.1255,y45.7989L0.3019L26.5126L2941.03求y关于x的一元线性回归方程;求y与x的相关系数;列出对方程作显著性检验的方差分析表;在x=0.1时,求y的点估计。收集于网络,如有侵权请联系管理员删除精品文档2.某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程为edu10.360.094sibs0.131medu0.210feduR20.214iiii式中,edu为劳动力受教育年数,sibs为劳动力家庭中兄弟姐妹的个数,medu与分别为母亲与父亲受到教育的年数。问(1)若medu与保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?(2)请对medu的系数给予适当的解释。(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为12年,另一个的父母受教育的年数均为16年,则两人受教育的年数预期相差多少年收集于网络,如有侵权请联系管理员删除精品文档收集于网络,如有侵权请联系管理员删除精品文档收集于网络,如有侵权请联系管理员删除精品文档3.下表给出一二元模型的回归结果。方差来源来自回归(ESS)来自残差(RSS)总离差(TSS)平方和(SS)65965—自由度(d.f.)——1466042求:(1)样本容量是多少?RSS是多少?ESS和RSS的自由度各是多少?2(2)2和?RR(3)检验假设:解释变量总体上对有无影响。你用什么假设检验?为什么?Y4.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y4Y5Y6头长x1头宽x2肱骨x3尺骨x4股骨x5胫骨x6特征值0.350.330.440.440.430.444.570.76-0.64-0.05-0.02-0.06-0.050.410.00–0.040.59–0.630.480.150.060.710.170.08(1)计算前三个主成分各自的贡献率和累积贡献率。(2)对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。收集于网络,如有侵权请联系管理员删除精品文档解:5.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4)。这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:2.920U0.5577,0.5814)111.024U(0.9544,220.049U0.1624)330.007U(0.7930)44写出四个主成分,计算它们的贡献率。解:各自的主成分为:Z1=0.1485X-0.5735X-0.5577X-0.5814X1234Z2=0.9544X-0.0984X+0.2695X+0.0824X1234Z3=0.2516X+0.7733X-0.5589X-0.1624X1234Z4=-0.0612X+0.2519X+0.5513X-0.7930X1234则各自的贡献率为:W1=2.920/(2.920+1.024+0.049+0.007)=0.73W2=1.024/(2.920+1.024+0.049+0.007)=0.256W2=0.049/(2.920+1.024+0.049+0.007)=0.01225W2=0.007/(2.920+1.024+0.049+0.007)=0.001756.对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率,x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:2.857U110.809(0.240,0.509,0.260,0.526,0.582)U22收集于网络,如有侵权请联系管理员删除精品文档(1)计算这两个主成分的方差贡献率。解:各自的主成分为:Z1=0.464X+0.457X+0.470X+0.421X+0.421X12345Z2=0.240X+0.509X+0.260X-0.526X-0.582X12345则各自的贡献率为:W1=2.587/(2.587+0.809)=0.762W2=0.809/(2.587+0.809)=0.238(2)能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。答:解释:由SPSS抽取的两个主成分,其特征值分别为2.857和0.809,。根据主成分分析得知:各自的贡献率为W1=76.2%,W2=23.8%。由此可知,第一个主成分对变量(股票回升率)影响较大。命名:一、化学工业公司股票回升率二、石油公司股票回升率7、下面给出了八个样品的两个指标数据12345678指X1X2244701311239511214316使用按动态聚类法进行聚类,采用欧氏距离取1、3、7号样本为聚点。解:四、上机操作会进行回归、聚类、因子、主成分、判别分析基本操作,上级题目随机抽取。收集于网络,如有侵权请联系管理员删除精品文档★请指出下面SPSS软件操作分别代表多元统计分析中什么分析:(1)Analysis→Regression→Linearregres

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论