北航数理统计大作业(逐步回归)_第1页
北航数理统计大作业(逐步回归)_第2页
北航数理统计大作业(逐步回归)_第3页
北航数理统计大作业(逐步回归)_第4页
北航数理统计大作业(逐步回归)_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京航空航天大事BEIHANG UNIVERSITY应用数理统计第一次大作业学号:姓名:班级:20 15年12月民航客运量得多元线性回归分析摘要:本文为建立以民航客运量为因变量得多元线性回归模型,选取了 199 6年 至 2013年得统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居 民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回 归法得到最优多元线性回归模型,并对模型得回归显著性、拟合度以及随机误差得 正态性进行了检验,并采用201 4年得数据进行检验,得到得结果达到预期,证明该 模型建立就是较为成功得.关键词:多元线性回归,逐步回归法,民航客运量

2、0、符号说明变量符号民用航空客运量Y国民生产总值X,铁路客运量X2民航航线里程X3入境过夜旅游人数X4城镇居民人均可支配收入X51、引言随着社会得进步,人民生活水平得提高,如何获得更快捷方便得交通成为人们日 益关注得问题因为航空得安全性,快速且价格水平越来越倾向大众,越来越 多得人 们选择航空这种交通方式。近年来,我国得航空客运量已经进入世界前列,为掌握航 空客运得动态,合理安排班机数量科学地对我国民航客运量得影响因素得分析,并 得出其回归方程,进而能够估计航空客运量就是非常有必要得。本文收集整理了与我 国航空客运量相关得历年数据,运用SPSS软件对数据进行分析,研究199 6年起至20 13

3、年我国民航客运量y(万人)与国民生产总值Xi(亿元)、铁路客运量X2(万人)、民航航线里程X3 (万公里)、入境过夜旅游人数X4 (万人)、城镇居民人均可支配收入X5 (元)得关系。采用逐步回归法建立线 性模型,选出较优得线性回归模型。2、数据得统计与分析本文在进行统计时,查阅中国统计摘要,中国统计年鉴2 0 14以及中国 知网数据查询中得数据,收集了 19 96年至201 3年各个自变量因素得数据,分析它们 之间得联系。整理如表1所示。表1:年份民航客运量(万人)国内生产 总值(亿 元)铁路客运量(万人)民航航线 里程(万 公里)入境过夜旅游人数。人城镇居民可支配收入(元)1 9985755

4、8 967 7 .95085150.5811 692. 4554 2 5、11 9 996 0 94228 847 9 .24、655.21001641 0 50 7 3105155152、22150、2915 5、36176 5.255 8 54、11 7 50、966280、11880、36 6859、632、71 05606163、7720 1 2 457702、822、89 7 2601 74、 9520 3 3. 58878、3111764204、 942519、89942 1、6200 520 0 62244810、3045、41 1 5 583199、852 9 25、63 10

5、493、11 2 56562 11、353486、45 11 759、51 35670234、333 9 8、5813785、81 46 1 9324 6、1 83 6 9 6、1 5 7 80. 81 9 9655557 8 9739 479 71 16. 651356、264838、9199756 3 0844 0 2、393308142.5157 8、5351 6 0.3506、91524 5 1234、 51983、5714025、9 617174、168145276、54 753、8419109、449 2 4、3 22 1809、24564、7、0547 0 .11893 3 74

6、5. 22 1 059741 0、65 5 62. 3926955. 12 1模型得建立以民航客运量y为因变量,以上5种影响因素为自变量Xj,构建回归方程:其中“0为常数项,为误差项。先观察自变量与因变量得关系,用SPSS得到各个自变量与因变量得散点图:4CC0D.0-民用航空客运览3CC0D0-20CODO-1CCOOO.OO10(X100.0 2DOOCO.O 300CODO 40CODD.0 500300.0 6CODOO.O国内生产总值40003.0-O30003.0-OOO20003.0-10003D-.0.80000.01000030120000.0140000.01600030

7、1 EOOOO.O 20CQ00.0 220COO.O铁路客运虽民航客运量与铁路客运量散点图40000 0COOOO.O-民用航空客运鱼20000.0-10000.0-0o0-1OD .00200.00300.00400.00500.00民航航线里程4000D.0-*3。八。OO:COODO-Ao oo01000D0-0-10D10D2000 003: CO0 400D.0DSC00 0()9:CC.C0过夜游客图4民航客运量与入境过夜人数散点图400300民用肌空客运凤33030.0-23030.0-010030.0-osP0.0-.05COO.O 10C0C.015000.02O3OD.0

8、25000.020COO.O城镇居民人均可支配牧人图5民航客运量与人均可支配收入散点图从以上五张散点图,我们可以瞧出因变量民航客运量与国内生产总值,入境过夜旅游人数与城镇居民人均可支配收入均有较好得线性关系,这说明建立线性模型就是有意义得。继续下一步逐步回归分析,逐步回归得基本思想就是将变量逐个引入模型,每引入一个变量后 都要进行F检验,并对已经选入得变量逐个进行t检验,当原来引 入得变量111于后面变量得引入变 得不再显著时,则将其删除。以确保每次引入新得变量之询回归方程中只包含先主动变量。这就是一 个反复得过程,直到既没有显著得变量选入回归方程,也没用不显著得变量从回归方程中剔除为止。 在

9、SPSS软件中可直接进行逐步回归分析,得出以下结果:山表2知,逐步回归后得出两个模型,模型1只包含城镇居民可支配收入,其她自变量都没有进 入模型,模型2在1得基础上再纳入了过夜入境旅游人数,其她得自变量也都被排除了。表2输入/移去得变量输入部变冢侈去得变敬方法12城锁居民人均对支配收入甦夜游客步进C住则:F-to-enter 得概率=050.F-to-remove 得低率 x、100) 步进C隹则:F-to-enter 得概率=050.F-to-remove 得做率r*100)a-因变!R:民用航空客运事表3模型Beta In1Si 幅相关r性统计量容差国内生产忌值 19t 517612 13

10、2 003跣路客运量1.OOP,014989004 0581民航航线里程. 388 704 100 044过夜游客421,3432OOS663018国内生产总值、3061 -059、308272 0032铁路客运量 020,一餐9 777、O77 058民新航地里程,oir 138892037 043a,因变量:民用航空客近履b 馍型中得预测变址:(常筮).城锚居民人均J支配收入。C 模型中得预测变量:(常址).城锚居民人均盯支配收入.过夜游客,表4模教汇总型RR方HgR标准估计得泯筐更改统计累R方更改F更改df 1df2Sig -F更改19961993992876 *74 009932183

11、*8 41116 0002998996995677 -69 1 3*00311 *779115*004欲 预测变屡:(常筮八城居民人均可支配收人b 预测变承:(常Si )-城居冕人均可支配收入.过夜迎客-C 因变累:民用航空客运量2、2拟合度检验山表4模型1得决定系数R2 = 0、9 9 2模型2得决定系数R2=0. 995,可以瞧出回归方程都高度显著, 且模型2比模型1更优。2.3回归方程得显著性检验:山表5,方差分析表Sig值都0、0 5,说明每个模型都拒绝回归系数均为0得假设,每个方程都就是 显著得。表5Ano vaa懊型平方与dfFSig*回归硅M1678659397* 1841229

12、87 67 26 1I16167865939 7*184768 6 72 95 42183 84000、2总计回归1 6 90 9 581 64 44416 84069181 376888983 17 685 5381833 4 37 0 00总计1690958164 *444因变堪:民用航空客运址,预测变址:(常址城钳居民人均可支配收入C-预测变址:(常址)城辍居民人均可支配收入过夜游客。由表6可以得到两个模型得回归方程分别:以城镇居民可支配收入为自变量得拟合函数:y=J 6 98、669 + I、40 6X5、以城镇居民可支配收入与过夜入境旅游人数为自变量得拟合函数:y= 3267 728

13、+0 817X5+2、8 71X,且所有系数得显著性水平都小于0、05,每个回归方程都就是有意义得。表6模型非标准化系数标;隹系数tSi B标准误差试用版 ()1698 669423 955 4 0 07 001城辍居民人均可支配收入1 70603099646 732 000(常童3267 *728562 79 25 8090002城镇居m何支配收入817 173、5794-721000过夜游客2 - 8718 37423-432-0043因变星:民用航空客运娥表7就是残差统计结果。主要显示预测值、标准化预测值、残差与标准化残差等统计量得最大 值、最小值、均值与标准差。残差平方与Q描述得就是随

14、机误差引起因变量丫得分散程度,Q越大分 散性也越大,则线性关系越不明显。山表7可见标准化残差得最大绝对值为1、758。而且标准残差得均 值为。,说明随机误差对丫值得影响很小。表7残差统计圾小值;mi标准脩差N测值1581 80435 3 39 1 8 3 615600 4449 953 * 0344)8残差1191 *5225973、1963,0000636、580218标准-1 * 1071 9830001 -00018标准残差1-75843 6,ooo 939182、4多重共线性得诊断表8共线性诊新.摸型维教待征伯条件索引方羞比疵(B)城镇居民人均可支配收入垃夜游咨111 8731 *0007606121273*843949412.8521 *000、01000022147414103701003A00239 6R3*62,991 *003因变量:限用航空客运崇表8就是SPSS软件得多重共线性诊断表,它包括3项诊断值:特征值、条 件数与方差比率。特征 值表明在自变量中存在多少截然不同得维数,当儿个特征值都接近。就是,变量就是高度相关得.条 件数就是最大特征值对每一个连续特征值得比率得平方根,若条件数大于15则表明可能存在多重共 线问题,若大于30则表明存在严重得多重共线性问题。显然表8中变量X4过夜入境旅游人数得条件 数大于3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论