多元统计分析实例(共10页)_第1页
多元统计分析实例(共10页)_第2页
多元统计分析实例(共10页)_第3页
多元统计分析实例(共10页)_第4页
多元统计分析实例(共10页)_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、交通学院(xuyun)小组作业从2010年统计摘要上获得了民航客运量和它的影响(yngxing)因素的数据。若以Y表示(biosh)民航客运量(万人),X1表示国民收入总值(亿元),X2表示消费金额(亿元),X3表示铁路承载量(万人)X4 表示民航航线距离(万公里),X5表示境外旅客人数(万人),则可以得到下表:年份YX1X2X3X4X51995277316222669778918217199635840202634103667195041997412442630371106452368419984814729335911436026932199953451103665119906289512

2、000469568340301272532711372001665678246861324243115422002893842458551345323321402003119694316662130295392738200415721117676631349154732282005173014086964614717445380320061540158111080613656857294020071992172611159611485461329520082614198681316311409767400320093463242681558211963210039742010406029858

3、191391265501154983参数估计通过SPSS软件的处理可以得到以下的结果CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)714.040213.3783.346.007x1.396.0972.7514.106.002x2-.618.141-2.735-4.391.001x3-.008.002-.094-4.028.002x419.7294.541.4854.345.001x5.429.054.5567.968.000a. Depen

4、dent Variable: y由以上的表格可以行到各个参数的估计值,从而(cng r)可以得到:回归系数的解释(jish)1、常系数(xsh)表示,当时的值。2、回归系数有两种解释。一种是,当变化一个单位而其他预测变量固定取常数时,的该变量,这个该变量与其他预测变量固定取什么常数无关。在实际中,预测变量间往往是有关联的,可能无法做到固定某些预测变量的值而改变其他变量的值。这是这种解释的弱点。另一种表示,经过其他预测变量的“调整”后,对响应变量的贡献。现以回归系数的估算为例来说明这种解释。1)拟合对,的回归模型。记此回归的残差为,拟合的回归方程为2)拟合对,的回归模型。记此回归的残差为,拟合的

5、回归方程为残差和的值见下表。偏残差表行号1-62.66337.2112316.50660.955397.96117.3474-97.800-47.6435-167.50313.5896-2.95312.2297116.31214.7628101.26129.3469-212.794-102.43610-63.323-70.70711238.516171.78112-247.931-130.82213-205.675-157.6961435.24666.20615-18.57651.48616173.41634.3913)拟合(n h)残差对的简单(jindn)回归模型的回归方程为在此回归方程中

6、的系数与全模型拟合(n h)的方程中的系数是一样的,都是0.396。由上述计算过程可以看出这种解释比第一种解释统计意义更深刻一些。中心化和规范化中心化:年份yX1X2X3X4X51995-1114-8343.94-5470.81-25002.31-28-2099.941996-1033-7485.94-5102.81-19124.31-27-1812.941997-979-7079.94-4699.81-12146.31-23-1632.941998-910-6776.94-4377.81-8431.31-20-1384.941999-857-6395.94-4071.81-2885.31-1

7、8-1365.942000-922-5822.94-3706.814461.69-19-1179.942001-726-4723.94-3050.819632.69-15-774.942002-498-3081.94-1881.8111740.69-13-176.942003-195-2074.94-1074.817503.69-7421.062004181-329.94-73.8112123.691911.0620053392580.061909.1924382.69-11486.0620061494305.063069.1913776.6911623.0620076015755.06385

8、9.19-7937.3115978.06200812238362.065426.19-8694.31211686.062009207212762.067845.19-3159.31541657.062010266918352.0611402.193758.69692666.06单位(dnwi)化:年份yX1X2X3X4X51995-0.2495-0.2692-0.2768-0.4886-0.2552-0.36321996-0.2314-0.2415-0.2582-0.3737-0.2461-0.31361997-0.2193-0.2284-0.2378-0.2374-0.2096-0.2824

9、1998-0.2038-0.2186-0.2215-0.1648-0.1823-0.23951999-0.1919-0.2064-0.2060-0.0564-0.1641-0.23632000-0.2065-0.1879-0.18760.0872-0.1732-0.20412001-0.1626-0.1524-0.15440.1882-0.1367-0.13402002-0.1115-0.0994-0.09520.2294-0.1185-0.03062003-0.0437-0.0669-0.05440.1466-0.06380.072820040.0406-0.0107-0.00370.237

10、00.00910.157620050.07590.08320.09660.4765-0.0090.257020060.03340.13890.15530.26920.10030.107820070.13460.18570.19529-0.15510.13610.169120080.27390.26980.2746-0.16990.19140.291620090.46410.41180.3970-0.06170.49220.286620100.59780.59210.57700.07350.62890.4611对经过中心化和单位化后的数据(shj)进行回归分析,得到下面的结果系数a模型非标准化系

11、数标准系数tSig.B标准 误差试用版1(常量)4.017E-5.003.012.991X12.736.6712.7364.075.002X2-2.722.624-2.722-4.362.001X3-.094.023-.094-4.039.002X4.487.112.4874.360.001X5.556.070.5567.965.000a. 因变量: y复相关系数由SPSS运行(ynxng)数据得:ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression19896989.91253979397.9821024.771.000aResidual

12、38832.088103883.209Total19935822.00015a. Predictors: (Constant), x5, x3, x4, x2, x1b. Dependent Variable: yModel SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.999a.998.99762.315a. Predictors: (Constant), x5, x3, x4, x2, x1b. Dependent Variable: y则复相关系数:修正(xizhng)的:由以上(yshng)结果可以

13、看出,=0.998,表示民航客运量中的99.8%的变差可有5个变量解释。同时(tngsh)可以看出的值接近,此时观测值和预测值离得很近,模型(mxng)较好地所合了数据。单个回归系数的推断(1)假设(自变量与因变量没有线性关系)备择假设(自变量与因变量有线性关系)计算检验的统计量利用SPSS软件对数据进行多元回归分析,得到的结果如下:系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准误差试用版下限上限1(常量)714.040213.3783.346.007238.6041189.477X1.396.0972.7514.106.002.181.611X2-.618.141

14、-2.735-4.391.001-.931-.304X3-.008.002-.094-4.028.002-.013-.004X419.7294.541.4854.345.0019.61129.847X5.429.054.5567.968.000.309.550a. 因变量: y临界值查表得我们知道当时,则表示在显著性水平0.05下拒绝,接受。观察t检验的统计表,发现(国民收入总值)、(消费金额)、(铁路承载量)、(民航航线距离)、(境外旅客人数)的回归系数是显著不为0的(拒绝,接受),即说明、对经过其他预测变量调整后的响应变量y的预测效果在统计上是显著的。(2)区间估计,其95% 的置信区间为

15、,计算得到单个参数的置信区间:检验(jinyn)某些回归系数相等(1)在假设(jish) QUOTE 的情况下检验(jinyn)假设 QUOTE 根据单个系数的t检验, QUOTE 和 QUOTE 是显著的,因此原假设为因此全模型为: QUOTE 。根据软件输出结果为:系数表模型非标准化系数tB标准 误差1(常量)-253.0185.156-2.9710.979X10.140.0168.743X50.0130.0860.154a. 因变量: Y在原假设下,设 QUOTE ,则简化模型为: QUOTE ,令变量 QUOTE ,则简化模型为:根据软件输出结果为:系数(xsh)表模型非标准化系数tB

16、标准 误差1(常量)-282.32383.569-3.3780.976W0.1210.00523.981a. 因变量: YF统计(tngj)量为 QUOTE 查表得 QUOTE ; QUOTE ,易见F4.679.07,因此结果是不显著(xinzh)的,所以不能拒绝原假设。 假设检验的结果告诉我们,方程与数据并未出现不一致。所以我们得出结论,在确定民航客运量时,有相同的正影响。预测查询2011年全国统计年鉴可得到2011年国民生产总值为471564亿元,消费金额为37532亿元,铁路承载量为186000万人,民航航线距离为339.06万公里,境外旅客人数为13542万人。(1)即给定在本文中取

17、0.05,因为=0.05这个精度已经可以满足本文的研究。,用Excel计算(j sun)得到计算(j sun)可得:即给定(i dn)设其响应均值为,其估计值即为:,意义本文分析了国民生产总值、国民消费金额、铁路承载量、民航航线距离、境外游客人数五个影响因素对民航客运量的影响。通过软件分析可得=0.998,即民航客运量与几个影响因素之间的线性关系非常强,通过分析每个影响因素与民航客运量的关系,可得以下结论:民航客运量与国民生产总值成正相关,随着国民生产总值增加,民航客运量也随之增加,因为随着国民经济能力的增强,出行、旅游的也增多了,而经济能力的增强也使得人们出行更偏好选择舒适快捷的飞机作为出行工具,民航客运量与铁路承载量呈负相关,这是因为,铁路与航空存在着竞争(jngzhng),尤其是近些年高铁的发展,使得铁路与航空在中长途旅客运输方面的竞争更加激烈,因此,随着铁路承载量的增加民航客运量会出现减少趋势。民航客运量与民航航线距离呈正相关,这是因为,随着(su zhe)民航航线距离的增加,民航覆盖面积的增加,不但为很多以前不通民航地区的人们多提供了一种出行方式,更会因为它的完整性而吸引跟多乘客。民航客运量与境外旅客人数呈正相关,这是因为,境外游客一般生活条件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论