




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归分析课程设计(题目)(副标题) 指导教师 学院名称 专业名称设计提交日期年月目 录1. 课程设计简述-2 2. 多元线性回归-33. 违背基本假设的情况-53.1 异方差性-53.2 自相关性-63.3 异常值检验-64. 自变量的选择与逐步回归-74.1 所有子集回归-74.2 逐步回归-85. 多重共线性的情形及其处理-105.1 多重共线性诊断-105.2 消除多重共线性-116. 岭回归-127. 主成分回归-148. 含定性变量的回归模型-9. 附录(程序代码)-1.课程设计简述本课程设计的主题是讨论国内生产总值GDP与一些因素,包括进出口额、旅客客运量、第一产业固定投资额、居民消费价格指数等10个因素之间的统计关系。数据来源是网络数据库中宏数据库,时间是2008年1月到2012年9月,以季度为时间单位。变量的定义在表1中给出,变量具体数值在表2给出。变量定义yGDP/亿元x1进出口总额/亿美元x2贸易差额/亿美元x3实际利用外商直接投资金额/亿美元x4固定资产投资施工项目个数/百个x5第一产业固定资产投资/亿元x6第二产业固定资产投资/亿元x7第三产业固定资产投资/亿元x8居民消费价格指数/%x9商品零售额/亿元x10人均可支配收入/元表1 各变量定义表2 数据2.多元线性回归利用普通最小二乘法对回归参数进行估计(表3)表3 最小二乘法参数估计结果结果显示大多数参数不通过检验,首先剔除x4,再对剩余变量进行最小二次法估计。表4 剔除x4后,最小二乘法参数估计结果可知仍有参数不通过检验,继续剔除x7。表5 剔除x7后,最小二乘法参数估计结果同理继续进行剔除-检验步骤,直到参数均通过检验。过程依次剔除x3,x6和x8(详细过程略),并得到最终估计结果如下表。表6 最终估计结果剩余参数为常数项、x1,x2,x5,x9和x10,均通过显著性检验。表7 方程拟合优度检验与显著性检验结果决定系数R2=0.971678,我们认为回归方程非常显著。F=89.2F(6,12)=3.00,P值=0.05,认为不存在异方差;表10结果显示各等级相关系数t检验统计量的P值均大于显著性=0.05。综上,我们有很大把握认为异方差问题不存在。3.2自相关性这里使用DW检验对回归方程进行自相关性检验,结果如下。表11 DW检验结果根据样本量n=19和解释变量k=6,查DW分布表得临界值dL=0.56, dU=1.77。而DW=1.944 dU,我们可以认为所拟合的回归方程不存在自相关性3.3异常值检验这里通过学生化残差以及库克距离来判断是否存在异常值,SAS计算结果如下。表12 异常值检验由表知,绝对值最大的学生化残差SRE6=2.6003,根据学生化残差不存在异常值;最大的库克距离D5最大等于0.91410,故继续剔除x9,在进行VIF检验。表21 方差扩大因子分析从上表可以看出剔除x9后,反而让Intercept、x2、x5、x10系数均变得不显著。于此,我们不再考虑利用剔除一些不重要的变量来消除共线性,下面考虑使用逐步回归法。根据表17我们可以直接知道逐步回归的最终剩余变量。对剩下变量进行方差扩大因子分析如下。表22方差扩大因子分析由于x8没有通过显著性检验,进行剔除。再进行分析:表23方差扩大因子分析得到消除多重共线性之后的回归方程:y=72494-29.75790x4+4.14060x9标准化回归方程:y=-0.42577x4+0.96399x9复决定系数为0.9070,调整后的复决定系数为0.8954。6.岭回归为消除上面回归方程的多重共线性,在这里利用标准化后的数据进行岭回归,以消除多重共线性。首先绘制岭迹图:图2 x1-x10的岭迹图根据岭回归选择变量原则:剔除标准岭回归系数比较稳定且决定值很小的自变量;剔除标准化岭回归系数不稳定,震动趋向于零的自变量;剔除标准化岭回归系数很不稳定的自变量,我们首先剔除x2,再绘制岭迹图:图3 剔除x2后的岭迹图同理,我们依次剔除x5、x10(岭迹图略)。得到剩下变量的岭迹图:图4 最终岭迹图从图中,我们可以看到但k值在0.5之后,方程系数趋于稳定,故取k=0.5,通过查下表得到k=0.5时,标准化岭回归方程:y=0.10493x1+0.14058x3-0.18632x4+0.12514x6+0.17548x7+0.12487x8+0.24989x9非标准化岭回归方程:y=73523-5.28744x1+79.71041x3-32.97367x4+0.23344x6+0.13232x7-32.80008x8+5.45638x97.主成分回归通过SAS中的PRINCOMP函数对data进行主成分分析过程,输出结果:表24相关矩阵的特征值从累计贡献率中可以看到前4个主成分所包含的信息量达到了96.36%,因此我们可删除的主成分个数为6,下面给出所有主成分表25 主成分我们对前4个主成分进行多元线性回归得到估计结果:表26 y对z1-z4的线性回归估计得到主成分回归的回归方程:y=0.34863z1+0.11868z2-0.26396z3-0.28695z4分别把已知主成分z1-z4代入以上方程,整理得到最终主成分回归方程:y=15450.99+3.24656x1+7.9454x2+142.497x3-19.9586x4+0.3037x5+0.12950x6+0.12495x7+22.4974x8+0.7579x9+3.5372x108.含定性变量的回归模型9.附录(程序代码)proc import out=data /*使用import过程导入数据到数据集data*/datafile=C:UsersmanyDesktopdata.xls /*设置数据路径*/dbms=excel2000 replace;getnames=yes; /*首行为变量名*/run;proc glm data=data; /*使用GLM过程对自变量进行线性回归*/model y=x1-x10/clparm; /*得到表3*/run;proc glm data=data;model y=x1-x3 x5-x10; /*剔除x4,得到表4*/run;proc glm data=data;model y=x1 x2 x5 x9 x10;/*剩余自变量,得到表6、表7*/run;proc standard data=data out=a mean=0 std=1; /*标准化数据*/var y x1-x10;run;proc glm data=a; /*对标准化数据进行最小二乘*/model y=x1 x2 x5 x9 x10; /*得到表8*/run;proc reg data=data;model y=x1 x2 x5 x9 x10/spec DW p r;/*对回归方程进行怀特检验(spec,表9)DW检验(表11)异常值建议(表12)*/output out=out r=residual;run;data out1;set out;t=_n_;z=abs(residual); /*定义z为残差绝对值*/run;proc gplot data=out1;plot residual*t;run;proc corr data=out1 outs=out2; /*Spearman检验(表10)*/var z x1 x2 x5 x9 x10;run;proc reg data=data;model y=x1-x10/selection=adjrsq; /*最优R2法,表13*/run;proc reg data=data;model y=x1-x10/selection=cp; /*最优Cp法,表14*/run;proc reg data=data;model y=x1-x10/selection=forward; /*前进法,表15*/run;proc reg data=data;model y=x1-x10/selection=backward; /*后退法,表16*/run;proc reg data=data;model y=x1-x10/selection=stepwise; /*逐步回归法,表17*/run;proc reg data=data;model y=x1-x10/vif collin; /*多重共线性诊断,vif为方差扩大因子法(表18),collin为特征根判定法(表19)*/run;proc reg data=data; /*利用逐步回归消除多重共线性,表22*/model y=x4 x8 x9/vif;run;proc reg data=data;model y=x4 x9;run;proc reg data=a outest=rid; /*岭回归,图2*/model y=x1-x10/noint ridge=0.1 to 1 by 0.1;plot/ridgeplot;run;proc print data=rid;run;proc reg data=a outest=rid;model y=x1 x3 x4 x6 x7 x8 x9/noint ridge=0.4 to 1 by 0.05;plot/ridgeplot;/*最终岭迹图,图4*/run;proc print data=rid;run;proc reg data=data;model y=x1 x3 x4 x6 x7 x8 x9;run;proc princomp data=data prefix=z out=b; /*主成分回归,表24*/var x1-x10;run;proc reg data
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 7.2 东南亚 第二课时 说课稿2025-2026学年 人教版地理七年级下册
- 钒铁沉淀工内部技能考核试卷及答案
- 4.3 中心对称教学设计-2025-2026学年初中数学浙教版2012八年级下册-浙教版2012
- 厂矿用机车司机抗压考核试卷及答案
- 内蒙古呼伦贝尔农垦拉布大林上库力三河苏沁农牧场有限公司招聘笔试题库带答案详解
- 半导体分立器件和集成电路装调工安全规范考核试卷及答案
- 城市管理网格员综合考核试卷及答案
- 项目1-2 规划学习时间教学设计-2025-2026学年中职基础课-第二册-苏教版(2021)-(信息技术)-57
- 教师招聘之《幼儿教师招聘》综合检测题型汇编及答案详解(有一套)
- 岩土钻探劳务合同标准模板
- 两人合伙贷款合同范本
- 人工智能全套课件下载
- 美容护肤产品合同协议
- 2025-2030中国高压造影剂注射管行业市场现状供需分析及投资评估规划分析研究报告
- 终止妊娠药品规范化管理
- 护理输入过期液体不良事件
- 全面了解农业职业经理人考试的试题及答案
- 高职高考语文复习语言知识与应用第四章正确使用词语(包括熟语)课件
- 考研英语一阅读理解真题大全
- 销售经理竞聘述职报告
- 普通发热患者接诊流程
评论
0/150
提交评论