




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
应用回归分析课程设计 题目 大学生在校人数的多元回归分析姓名 唐家彬 乔利飞 文韬 学号 10801020120 10801020119 10801020121指导教师 胡爱萍 高红霞 康新梅 成绩 大学生在校人数的多元回归分析摘要:自从1978年恢复高考以来,我国高等教育在快速发展,尤其在近十几年发展速度惊人。由以前千军万马挤独木桥演变成满城尽是大学生。我们将研究以普通高等学校在校人数为因变量做回归分析。研究其受那些因素的影响。最终我们选者了x3、x4、x6这几个变量进行回归,分别对应了普通高等学校招生人数、国家财政教育经费、人均可支配收入这几个变量。得出标准化回归方程为:普通高等学校在校人数=0.241*普通高等学校招生人数+0.219*国家财政教育经费+0.216*人均可支配收入。关键词:强制回归 逐步回归 岭回归一、 问题的提出自从1978年恢复高考以来,我国高等教育在快速发展,尤其在近十几年发展速度惊人。由以前千军万马挤独木桥演变成满城尽是大学生。数据显示,从2000年到2005年,高等教育阶段在校生人数一路攀升:从1230万人,增长到1300万人、1500 万人、1900 万人和2000 万人,至2009年增长到2300万人。大学教育越来越普及,在校大学生人数也是剧增。我们将研究以普通高等学校在校人数为因变量做回归分析。研究其受那些因素的影响。二、 模型的建立普通高等学校在校人数应该从学校和学生两方面来分析。学校方面因素应该有:普通高等学校学校数(下文称 学校数 )、普通高等学校专职教师数(教师数)、普通高等学校招生人数(招生数)、国家财政教育经费(教育经费)。学生方面因素应该包括:高中升学率(升学率)、人均可支配收入(可支配收入)。可建立多元回归模型:y=0+1*1+2*x2+3*x3+4*x4+5*x5+6*x6+其中:y 普通高等学校在校人数(万人)x1普通高等学校学校数(所)x2普通高等学校专职教师数(万人)x3普通高等学校招生人数(万人)x4国家财政教育经费(亿元) x5高中升学率 x6 人均可支配收入(元) (0, )通过查找中国统计年鉴找出了因变量y和自变量x1、x2、x3、x4、x5、x6从1990-2008年的数据。数据如下表。年 份yx1x2x3x4x5x61990206.3107539.560.9564.827.31510.21991204.4107539.162617.828.71700.61992218.4105338.875.4728.734.92026.61993253.6106538.892.4867.743.32577.41994279.9108039.6901174.746.73496.21995290.6105440.192.61411.549.942831996302.1103240.396.61671.7514838.91997317.4102040.51001862.548.65160.31998340.9102240.7108.42023.446.15425.11999413.4107142.6159.72287.163.858542000556.1104146.3220.62562.673.262802001719.1122553.2268.3305778.86859.62002903.4139661.8320.53491.483.57702.820031108.6155272.5382.23850.683.4847220041333.5173185.8447.34465.882.5942220051561.8179296.6504.5516176.31049320061738.81867107.6546.16348.375.11173920071884.91908116.8565.98280.270.313786200820212263123.7607.79752.772.715781数据来自中国统计年鉴三、相关系数矩阵求解首先做因变量y与自变量之间的相关系数矩阵 表1 因变量和各自变量的相关系数矩阵 由表1可以得出因变量y与x1、x2、x3、x4、x6的相关系数在0.9以上,和x5的相关系数也在0.7上,均和y高度线性相关。各自变量的相互相关程度也比较高。四、运用强制回归法进行分析 所以我们用强制进入法对6个变量进行拟合优度检验、回归方程的显著性检验、最小二乘估计、回归系数的显著性检验和多重共线性的检测。(用SPSS软件分析结果如表2-5)4.1拟合优度检验表2 强制回归拟合优度检验表由表2中可知 复相关系数、复决定系数和调整的复决定系数都等于1,因此可以认为拟合优度很高,被解释变量基本可以全部被模型解释4.2回归方程的显著性检验表3 强制回归方差分析表由表3可知,F统计量=11879.835,它对应的概率p值近似为零,如果显著水平为0.05,由于p小于,应拒绝回归方程显著性检验的零假设,认为回归系数不同时为零,被解释变量与解释变量全体的线性关系是显著的。4.3最小二乘估计 表4 强制回归方程分析结果由表4可以得出回归方程为:y=-315.732-0.011x1+10.734x2+1.497x3-0.012x4-0.022x5+0.015x6回归方程中有3个系数为负值,这显然和现实意义不相符,这6个变量的回归效果不好。4.4回归系数的显著性检验由表4可知t检验统计量对应的p值只有x2和x3小于显著水平,所以只有x2和x3通过了回归系数的显著检验,对y有显著影响。4.5多重共线性诊断我们将根据方差扩大因子和特征根判别法进行诊断。 表5 强制回归多重共线性分析表根据方差扩大因子和特征根判别法进行诊断由表4的VIF(方差扩大因子)都远远超过10,说明存在严重的多重共线性由表5的条件指数列可以看出第3、4、5、6、7的条件指数的开方都大于10,也说明变量存在多重共线性。4.6强制回归总结综上所述,应用强制进入回归将6个变量进行回归分析,存在一些不容忽视的问题,应重新建立回归方程。五、运用逐步回归法进行分析下一步我们将用逐步回归法对6个变量进行筛选,选取显著水平进=0.05,出=0.015.1拟合优度检验表6 逐步回归拟合优度检验表由表6可以得出逐步回归最终选取变量为x2、x3、x6,复相关系数,复决定系数、调整的复决定系数都等于1,说明拟合优度很高。5.2回归方程的显著性检验表7 逐步回归方差分析表由表7可知,模型3的F统计量=25638.106,p=0.000,回归方程通过了显著性检验。5.3最小二乘估计 表8 逐步回归方程分析结果由表8可知,最终的回归方程为:y=-296.151+9.957x2+1.564x3+0.009x65.4回归系数的显著性检验各系数的显著性检验p值都为零,所有回归系数均通过显著性检验5.5多重共线性诊断表9 逐步回归多重共线性分析表通过表8的VIF(方差扩大因子)都大于10,说明还存在严重的多重共线性由表9的条件数这一列中,最大的条件数的开方为27.182,也说明自变量存在较强的多重共线性,因此回归模型仍然需要改进。六 运用岭回归法分析下面我们尝试采用岭回归估计来选取自变量和改进普通最小二乘估计。6.1岭迹图分析对全部6个变量作岭迹分析,岭迹图见图1图1可以从图1看出,岭迹图比较混乱,根据选择自变量的原则,我们首先去掉x1、x2和x5,保留x3、x4、x6,再作岭迹图2图2从图2的岭迹图上可以看出当k=1.4以后,各参数开始趋于稳定,所以选取k=0.1,计算当k=01.4时的岭估计,用SPSS软件计算的结果如下表116.2岭估计结果分析表10 岭回归分析结果表* Ridge Regression with k = 1.40 *Mult R .9351138RSquare .8744379Adj RSqu .8493255SE 246.9524036ANOVA tabledf SS MSRegress 3.000 6370714.8 2123571.6Residual 15.000 914782.34 60985.490F value Sig F34.82093215 .00000053-Variables in the Equation-B SE(B) Beta B/SE(B)x3 .7805048 .0773449 .2408349 10.0912189x4 .0532262 .0054993 .2194296 9.6787361x6 .0336813 .0034639 .2158646 9.7235105Constant 179.6071427 78.9794293 .0000000 2.2741003C- END MATRIX -由表10可以得出岭回归方程为:y=179.607+0.780x3+0.053x4+0.337x6标准化岭回归方程为:y=0.241x3+0.219x4+0.216x6复决定系数为0.874,F值为34.821,p值=0.000,模型整体拟合效果不错七、得出结论 最终我们选者了x3、x4、x6这几个变量进行回归,分别对应了普通高等学校招生人数、国家财政教育经费、人均可支配收入这几个变量。得出标准化回归方程为: 普通高等学校在校人数=0.241*普通高等学校招生人数+0.219*国家财政教育经费+0.216*人均可支配收入所以我们可以对1990-20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食堂素食日活动方案
- 航空技术考试题及答案
- 汉字练字考试题及答案
- 广州医保考试题及答案
- 古诗考试题及答案小学
- 各地校长考试题及答案
- 新闻写作基础知识与实践应用教学
- 团队项目管理进度跟踪表
- 防震减灾考试题及答案
- 采购合同条款标准化模板
- 乡镇综合行政执法队队长试用期满转正工作总结
- 2025天津医科大学眼科医院第三批招聘1人备考考试试题及答案解析
- 2025年法院书记员招聘考试笔试试题含答案
- CPK、PPK和SPC(X-R控制图)模板
- 汉诺塔课件教学课件
- 2025年二级建造师考试施工管理真题及答案
- 2025年北京市高考英语试卷真题(含答案解析)
- 医务科依法执业自查表
- 全桥LLC自动计算表格
- 高中数学竞赛讲义-高中数学竞赛
- YB/T 100-1997集成电路引线框架用4J42K合金冷轧带材
评论
0/150
提交评论