版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学号:20150702xxx2016年3月至2016年4月2015-2016年第二学期研究生“应用数理统计”课程课外作业摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费的主要因素。利用SPSS受到其中哪些因素的影响,并就回归模型分析具体可能的成因。关键词:民航客运量影响因素回归模型一、问题提出及问题分析内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。民航机队规模不断扩大,界上最先进的飞机。2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位。城市居民消费水平(绝对元),定期航班航线里程(万千里)等。为了研究过[1]去的情况,从中国统计年鉴得到1994年统计摘要,分析类似因素对我国航空客[2]运量的影响。第2页共16页2015-2016年第二学期研究生“应用数理统计”课程课外作业二、数据描述如下为所得统计数据:表11978-1993年统计数据y民航客运量(万人)三、模型建立:(1)提出假设条件,明确概念,引进参数;第3页共16页2015-2016年第二学期研究生“应用数理统计”课程课外作业参考相关书籍[3],设随机变量民航客运量为X,X,Y12X,X,X345EY|Xx,Xx,,Xx)xx,称11225501155,0,,为多元线性回归模型,YxxEDDY201155,,,为回归系数,为随机误差。015(x,x,,x,y),i1,2,,5为上述来自多元线性回归模型的样本值,满足:i1i2i5i,0,,1,2,,5,yx11x5i5ED2ii0iii,,,相互独立125些基本假定。1.解释变量X,X,X,X,X是可控制的、非随机变量,互不相关。123452.随机误差项具有零均值和同方差的性质,即,i1,2,,5,并且2i,,,相互独立,则有,ijij0,,,1,2,…,5。Cov125ij3.随机变量误差项服从正态分布,即~0,,1,2,5N2ii(2)模型构建:由表1通过绘制变量X,i1,2,,5对因变量Y的关系散点图如下:i第4页共16页125由以上的散点图看出:y与x存在非线性关系,但与其它几个变量基本是线3性相关的。所以首先考虑回归模型为多元线性模型。模型14标准系数贝塔Bt2.532x2x1x3x4x5-2.485-4.4784.152-3.5105.3548.44055.488.56425.193a.因变量:y12345(1)决定系数由决定系数R2=0.998看出回归方程高度显著。(2)方差分析表123452015-2016年第二学期研究生“应用数理统计”课程课外作业y的影响显著。其中x。3(4)检验残差序列的自相关性(D-W检验):D-W=所以认为模型不存在序列的自相关性。(6)异方差检验~N0,2i综上,认为用最小二乘估计的方法估计的模型理论上是有效的。(7)模型进一步分析x与y正相关,但x(国民消22x和x的VIF很大,x,x的VIF1245谈论。如下表是各变量之间的相关系数:yyNNN*NNNy可以看出,y与xxxx高,,,1245第9页共16页2015-2016年第二学期研究生“应用数理统计”课程课外作业y度线性相关,验证之前的散点图。用与自变量作多元线性回归是适合的。另一方面,x与各变量的相关系数均小于0.5,而x,x,x,x之间的相关系数均31245达到0.9以上,所以应尝试解决它们之间的共线性。首先剔除最大的x,计算剩余变量参与的回归方程。结果如下:1表6统计量表模型1Bt(常量)-.23377.5462.319-.134.788.5174.951.08033.81224.469a.因变量:yx的VIFx也没通过t0.233远大于0.05,22故继续剔除x。计算剩余参数的回归方程,结果如下:27Bt8模型汇总模型标准估计的误差R1.99779.78835第10页共16页9Anovab平方和F回归残差总计7由P-P图和直方图可知残差服从正态分布,所以模型是有效的。所以民航[4]345岭回归结果。R-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFKKRSQx1x2x3x4.00000.998232.447386-2.48510-.083140.530538.563537.02000.99233.187301.092804-.095611.457966.300920.04000.99085.215764.162616-.086464.389117.260362.06000.98998.228824.190661-.081056.356915.243273.08000.98932.235679.205373-.076926.337619.233855.10000.98873.239543.214116-.073407.324407.227824.12000.98816.241760.219676-.070252.314569.223561.14000.98759.242981.223345-.067345.306809.220327.16000.98699.243559.225800-.064628.300426.217741.18000.98636.243702.227435-.062066.295009.215585.20000.98571.243539.228490-.059635.290298.2137302015-2016年第二学期研究生“应用数理统计”课程课外作业dfSS182.6195114.0000000VariablesintheEquationSE(B).0028297.0048155.00288201.6646128.0355048Tsig.0000003.0000020.0441836.0000099.0005002.2641200x1x2x3x4x5-.006631213.5798345.1792510.3338892.2321170.00000008.15795395.04863821.1831346Constant337.9451625285.6354347可以看出除了x3通过。方差分析显示回归模型高度显著。所以该方法所得的回归模型为:y337.94520.0342x0.0470x0.0066x13.5798x0.1793x12345七、主要的结论或发现。比较两种方法的得到的回归模型:y591.876x26.436x0.317x345y337.94520.0342x0.0470x0.0066x13.5798x0.1793x12345可以看出两种模型均认为x,x,对y的正面贡献度度小于x,x,或者认为124550到70阶段是从1980-1992年,民航实施企业化改革,成立了新的地区管理局、国家骨干航空公司和一些区域性的航空公司。这个阶段正是数据来源时期。在该时期,运量是相当小的。这也解释了为什么x游客数量的回归系数大于x,x(事实512第14页共16页2015-2016年第二学期研究生“应用数理统计”课程课外作业上x,x两者的线性相关程度很高,国民收入提高,消费自然上升),而x是124与的关系最直接的,航线里程数的增加,自然反映客运量的增加,所以该自变量的系数是最大的。x3运量产生的影响很小,所以x的系数依旧很小。3为了体现所有变量对的影响,最终决定使用y337.94520.0342x0.0470x0.0066x13.5798x0.1793x作为回归12345模型。参考资料[1]201435(798:160-161[2]中国统计年鉴,1978—1993[3]杨虎、刘琼荪、钟波,《数理统计》,高等教育出版社,2004,103-118[4]卢文岱、朱红兵,《SPSS统计分析》(第五版),电子工业出版社,2015,270-300[5]中国人民大学出版社,2011169-189附录Spss岭回归代码INCLUDE'C:\ProgramFiles(x86)\SPSSInc\PASWStatistics18\Samples\English\RidgeRegression.sps'.RIDGEREGDEP=y/ENTERx1x2x3x4x5/start=0.0/stop=0.2/inc=0.02.INCLUDE'C:\ProgramFiles(x86)\SPSSInc\PASWStatistics18\Samples\English\RidgeRegression.sps'.第15页共16页2015-2016年第二学期研究生“应用数理统计”课程课外作业RIDGEREGDEP=y/ENTERx1x2x3x4x5/k=0.085.Sps文件修改代码*.*Calculaterawcoefficientsfromstandardizedones,computestandarderrors*ofcoefficients,andanintercepttermwithstandarderror.Thenprint*outsimilartoREGRESSIONoutput.*(从这里开始是给出系数估计).computebeta={b;0}..computeb=(b&/std)*puteintercpt=ybar-t(b)*t(xmean)..computeb={b;intercpt}..computexpx=(sse/(sst*(n-nv-1)))*inv(xpx+(k&*ident(nv,nv)))*xpx*inv(xpx+(k&*ident(nv,nv)))..computexpx=(sy*sy)*(mdiag(1&/std)*xpx*mdiag(1&/std))..computeseb=sqrt(diag(xpx))..computeseb0=sqrt((sse)/(n*(n-nv-1))+xmean*xpx*t(xmean))..computeseb={seb;seb0}..computernms={varname,'Constant'}..computeratio=b&/puteppp=2*(1-tcdf(abs(ra
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 挂靠合同协议模板
- 拆墙铺砖合同范本
- 国企合作合同范本
- 商场改造合同范本
- 培训团建合同范本
- 墓碑定做合同范本
- 墙面销售合同范本
- 拟归还协议书范本
- 捐赠协议赠与合同
- 排水接驳合同范本
- 2026年云南中烟工业有限责任公司毕业生招聘(502人)笔试考试参考试题及答案解析
- 2025江苏苏州大学劳务派遣制人员招聘3人(第五批)笔试考试参考试题及答案解析
- 海洋信息安全:大数据平台建设保障
- 炉底和炉墙砌筑分项工程质量检查评估表
- 2026年沈阳职业技术学院单招职业倾向性考试必刷测试卷带答案
- 2025年铁路专业基础知识考试题库(含答案)
- 2025年地面装饰工(地砖铺贴)考试试卷及答案
- 全媒体运营师培训
- 小学语文教师专业技术工作总结范文
- 外贸综合服务协议书
- 天桥养护施工方案
评论
0/150
提交评论