




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、八京航玄航夭大爭 8 E I H A N G UNIVERSITY 应用数理统计 第一次大作业 学号: 班级:B11班 2015年12月 民航客运量的多元线性回归分析 摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996 年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人 数,城镇居民可支配收入等因素,利用统计软件SPSS寸各因素进行了筛选分析, 采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以 及随机误差的正态性进行了检验,并采用 2014年的数据进行检验,得到的结果 达到预期,证明该模型建立是较为成功的。 关键词:多元线性回归,
2、逐步回归法,民航客运量 0.符号说明 变量 符号 民用航空客运量 Y 国民生产总值 Xi 铁路客运量 X2 民航航线里程 X3 入境过夜旅游人数 X4 城镇居民人均可支配收入 X5 1. 引言 随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人 们日益关注的问题。因为航空的安全性,快速且价格水平越来越倾向大众, 越来 越多的人们选择航空这种交通方式。 近年来,我国的航空客运量已经进入世界前 列,为掌握航空客运的动态,合理安排班机数量。科学地对我国民航客运量的影 响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。 本文收集整理了与我国航空客运量相关的历年数据,
3、运用SPSS软件对数据进行 分析,研究1996年起至2013年我国民航客运量y (万人)与国民生产总值 Xi (亿元)、铁路客运量X2 (万人)、民航航线里程X3 (万公里)、入境过夜旅游 人数X4 (万人)、城镇居民人均可支配收入 X5 (元)的关系。采用逐步回归法 建立线性模型,选出较优的线性回归模型。 2. 数据的统计与分析 本文在进行统计时,查阅中国统计摘要,中国统计年鉴2014以及中 国知网数据查询中的数据,收集了 1996年至2013年各个自变量因素的数据,分 析它们之间的联系。整理如表1所示。 表1: 年份 民航客运 量(万人) 国生产总 值(亿元) 铁路客运 量(万人) 民航航
4、线 里程(万 公里) 入境过夜 旅游人数 (万人) 城镇居民 可支配收 入(元) 1996 5555 78973 94797 116.65 1356.26 4838.9 1997 5630 84402.3 93308 142.5 1578.53 5160.3 1998 5755 89677.1 95085 150.58 1692.45 5425.1 1999 6094 88479.2 100164 152.22 1765.25 5854.1 2000 6722 99214.6 105073 150.29 1750.96 6280.1 2001 7524 109655.2 105155 155.
5、36 1880.36 6859.6 2002 8594 120332.7 105606 163.77 2012.45 7702.8 2003 8759 135822.8 97260 174.95 2033.58 8472.2 2004 12123 159878.3 111764 204.94 2519.89 9421.6 2005 13827 184937.4 115583 199.85 2925.63 10493.1 2006 15968 216314.4 125656 211.35 3486.45 11759.5 2007 18576 265810.3 135670 234.3 3398.
6、58 13785.8 2008 19251 314045.4 146193 246.18 3696.71 15780.8 2009 23052 340506.9 152451 234.51 4025.96 17174.7 2010 26769 397983.5 168145 276.5 4753.84 19109.4 2011 29316 473104 146192 349.05 4924.32 21809.8 2012 31896 519470.1 189337 328.01 5668.63 24564.7 2013 35397 568845.2 210597 410.6 5562.39 2
7、6955.1 2.1模型的建立 以民航客运量y为因变量,以上5种影响因素为自变量Xi ,构建回归方程: y = Po + B禹 + * 其中几为常数项,E为误差项。 先观察自变量与因变量的关系,用SPSS#到各个自变量与因变量的散点图: JQCODjO- 30CODO- 20CODO- 1IODOOO.O ZJOOCD.O 30C0QJO JOCOJOJO 50CX)D0,D 6CODOO.O 国内生产总値 图1民航客运量与国生产总值散点图 图2民航客运量与铁路客运量散点图 40000 0t nnnn l 民用航宀V客运燔 :oooo.q 10000.C1 ico .00 20D.0D 3i:
8、ri.ozi 403.00 5DQD0 图3民航客运量与航线里程散点图 xoo&jo- 2COOO.O-I 1C0QM- 10-30.0D2COOOOaocoa40ODa0D印ODQO30C0.0C 过丧讷客 图4民航客运量与入境过夜人数散点图 4DraC.Q- 2300C.0 noDc.o- .0= 500D.Q1QC0C-Q150QOD2800250Q0.Q3OC0O.0 蛾领屈民人胸可支配枚入 图5民航客运量与人均可支配收入散点图 从以上五散点图,我们可以看出因变量民航客运量与国生产总值, 入境过夜 旅游人数和城镇居民人均可支配收入均有较好的线性关系,这说明建立线性模型 是有意义的。 继
9、续下一步逐步回归分析,逐步回归的基本思想是将变量逐个引入模型,每 引入一个变量后都要进行F检验,并对已经选入的变量逐个进行t检验,当原来引 入的变量由于后面变量的引入变得不再显著时, 则将其删除。以确保每次引入新 的变量之前回归方程中只包含先主动变量。 这是一个反复的过程,直到既没有显 著的变量选入回归方程,也没用不显著的变量从回归方程中剔除为止。在 SPSS 软件中可直接进行逐步回归分析,得出以下结果: 由表2知,逐步回归后得出两个模型,模型1只包含城镇居民可支配收入,其 他自变量都没有进入模型,模型2在1的基础上再纳入了过夜入境旅游人数, 其他 的自变量也都被排除了。 输入/移去的变量 模
10、型 输入的变量 移去的变量 方法 1 城镇居民人均可支配 收入 步进(准则: F-to-e nter 的概率 =.100 ) o 2 过夜游客 步进(准则: F-to-e nter 的概率 =.100 ) o a.因变量:民用航空客运量 表3 已排除的变量 模型 Beta In t Sig. 偏相关 共线性统计量 容差 国生产总值 .197 b .517 .612 .132 .003 铁路客运量 -.001 b -.014 .989 -.004 .058 1 民航航线里程 -.040 b -.388 .704 -.100 .044 过夜游客 .421 b 3.432 .004 .663 .01
11、8 国生产总值 .306 c 1.059 .308 .272 .003 2 铁路客运量 -.020 c -.289 .777 -.077 .058 民航航线里程 .011 c .138 .892 .037 .043 a. 因变量:民用航空客运量 b. 模型中的预测变量:(常量),城镇居民人均可支配收入。 c. 模型中的预测变量:(常量),城镇居民人均可支配收入,过夜游客。 模型汇总 模 型 R R方 调整R方 标准估计的误差 更改统计量 R方更改 F更改 df1 df2 Sig. F 更改 1 .996 a .993 .992 876.7400 .993 2183.841 1 16 .000
12、2 .998 b .996 .995 677.6913 .003 11.779 1 15 .004 a. 预测变量:(常量),城镇居民人均可支配收入。 b. 预测变量:(常量),城镇居民人均可支配收入,过夜游客。 c. 因变量:民用航空客运量 2.2拟合度检验 由表4,模型1的决定系数R2=0.992,模型2的决定系数R2=0.995,可以看出 回归方程都高度显著,且模型2比模型1更优。 2.3回归方程的显著性检验: 由表5,方差分析表Sig值都0.05,说明每个模型都拒绝回归系数均为0的 假设,每个方程都是显著的。 Anovaa 模型 平方和 df 均方 F Sig. 回归 16786593
13、97.184 1 1678659397.184 2183.841 .000b 1 残差 12298767.261 16 768672.954 总计 1690958164.444 17 回归 1684069181.370 2 842034590.685 1833.437 .000c 2 残差 6888983.075 15 459265.538 总计 1690958164.444 17 a. 因变量: 民用航空客运量 b. 预测变量 :(常量), 城镇居民人均可支配收入 0 c. 预测变量 :(常量), 城镇居民人均可支配收入 ,过夜游客。 由表6可以得到两个模型的回归方程分别: 1. 以城镇居民
14、可支配收入为自变量的拟合函数: y=-1698.669+1.406X5 2. 以城镇居民可支配收入和过夜入境旅游人数为自变量的拟合函数: y=-3267.728+0.817X5+2.871X4 且所有系数的显著性水平都小于0.05,每个回归方程都是有意义的 系数 模型 非标准化系数 标准系数 t Sig. B 标准误差 试用版 (常量) 1 城镇居民人均可支配收入 (常量) 2城镇居民人均可支配收入 过夜游客 -1698.669 1.406 -3267.728 .817 2.871 423.955 .030 562.492 .173 .837 .996 .579 .421 -4.007 46.
15、732 -5.809 4.721 3.432 .001 .000 .000 .000 .004 a.因变量:民用航空客运量 表7是残差统计结果。主要显示预测值、标准化预测值、残差和标准化残差 等统计量的最大值、最小值、均值和标准差。残差平方和Q描述的是随机误差 引起因变量丫的分散程度,Q越大分散性也越大,则线性关系越不明显。由表 7 可见标准化残差的最大绝对值为 1.758。而且标准残差的均值为 0,说明随机误 差对丫值的影响很小。 残差统计量a 极小值 极大值 均值 标准偏差 N 预测值 4581.804 35339.836 15600.444 9953.0344 18 残差 -1191.5
16、225 973.1963 .0000 636.5802 18 标准预测值 -1.107 1.983 .000 1.000 18 标准残差 -1.758 1.436 .000 .939 18 a.因变量:民用航空客运量 2.4多重共线性的诊断 表8 共线性诊断 模型维数 特征值 条件索引 方差比例 (常量) 城镇居民人均可支配 收入 过夜游客 1 1 2 1 2 2 3 1.873 .127 2.852 .147 .002 1.000 3.843 1.000 4.410 39.683 .06 .94 .01 .37 .62 .06 .94 .00 .01 .99 .00 .00 1.00 a.因
17、变量:民用航空客运量 表8是SPSS软件的多重共线性诊断表,它包括 3项诊断值:特征值、条件 数和方差比率。特征值表明在自变量中存在多少截然不同的维数,当几个特征值 都接近0是,变量是高度相关的。条件数是最大特征值对每一个连续特征值的比 率的平方根,若条件数大于15则表明可能存在多重共线问题,若大于30则表明 存在严重的多重共线性问题。显然表 8中变量X4过夜入境旅游人数的条件数大 于30,说明回归方程存在多重共线性。 2.5残差检验 如图6是残差分布直方图。在回归分析中,总是假定残差服从正态分布,这 个图就是根据样本数据的计算结果显示残差分析的实际情况。 从图来看标准化残 差还是近似服从正态
18、分布的。 固娶晁;民用肌空客运駅 巴谊57&-1S n= ia 图6 如图7残差的积累概率图基本围绕在假设直线(正态分布)周围,说明残 差分布基本符合正态分布,说明民航客运量这个因变量基本上可以用线性回归方 法建立模型。 3. 结论 为了解决多重共线性的问题,排除模型 2,考虑到模型1的拟合度也是很好 的,综合来看认为模型1为更优。最终得到的回归方程为: y=-1698.669+1.406X5 并以2014年的数据检验该回归方程,2014年航空客运量为39195万人,城 镇居民人均可支配收入为 28843.9,将自变量X5带入回归方程得到y=38855.85 万人,与实际的客运量39195万人的误差为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 消防者投诉管理制度
- 搏击馆制度管理制度
- 机房进线间管理制度
- 未纳入闭环管理制度
- 售楼部员工管理制度
- 培训机构多管理制度
- 接入网安全管理制度
- 处方及药物管理制度
- 2025年合肥项目创业计划书
- 生活委员课件
- 扩频通信中直接扩频系统的同步技术
- 幼儿园食育环境创设的实践研究 论文
- 电机学知到章节答案智慧树2023年东北电力大学
- 气候变化科学概论试题及答案
- 湖南省郴州市2016年中考数学试卷(解析版)
- 项目部内审检查表
- 森林计测学(测树学)智慧树知到答案章节测试2023年浙江农林大学
- 对外汉语教学法智慧树知到答案章节测试2023年西北师范大学
- jgj113-2015建筑玻璃技术规范
- 陕西延长石油四海煤化工有限公司金属镁厂1万吨-年金属镁生产项目环评报告
- 学校校本课程开辟汇报材料
评论
0/150
提交评论