实验五回归分析SAS过程_第1页
实验五回归分析SAS过程_第2页
实验五回归分析SAS过程_第3页
实验五回归分析SAS过程_第4页
实验五回归分析SAS过程_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验五 回归分析SAS过程(2)实验目的:1.会对实际问题建立有效的多元回归模型,能对回归模型进行残差分析;2.掌握SAS输出结果用于判别回归方程优良性的不同统计量,能对回归模型进行运用,对实际问题进行预测或控制.实验要求:编写程序,结果分析实验内容:1.误差的正态性检验有几种方法,何时认为误差项服从正态分布?答:1.学生化残差 2.残差正态性的频率检验 3.残差的正态QQ图检验判断若散点大致在一条直线上 相关系数:认为来自正态分布,接受误差正态性检验2.回归方程的选取的穷举法中,评价回归方程优良性的准则有哪些?根据准则何时方程最优?答:1)修正的复相关系数准则或均方残差准则(或准则) 2)准

2、则3)预测平方和准则(准则)拟合所有可能的个回归方程,画出图:,在图中选取最接近参考直线的点所对应的回归方程为最优方程3.简述逐步回归方法的思想和步骤基本思想:逐个引入自变量建立回归方程,每次引入对Y影响最显著的自变量, 并对方程中旧变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中,既不漏掉对Y显著影响的变量,又不包含对Y影响不显著的变量. 添加或删除某个自变量的准则是用残差平方和的相对减少或增加来衡量步骤:(1)修正的复相关系数准则、准则选择模型(2)预测平方和准则选择PRESSp最优回归方程(3)4.做2.6 2.8(选作) 2.9注意:可以选课外综合题目。data

3、 examp2_6;input x1 x2 y;cards;8.3 70 10.3 8.6 65 10.3 8.8 63 10.210.5 72 16.410.7 81 18.810.8 83 19.711.0 66 15.611.0 75 18.211.1 80 22.611.2 75 19.911.3 79 24.211.4 76 21.011.4 76 21.411.7 69 21.312.0 75 19.112.9 74 22.212.9 85 33.813.3 86 27.413.7 71 25.713.8 64 24.914.0 78 34.514.2 80 31.714.5 74

4、 36.316.0 72 38.316.3 77 42.617.3 81 55.417.5 82 55.717.9 80 58.318.0 80 51.518.0 80 51.020.6 87 77.0;run;proc reg data= examp2_6;model y=x1-x2;output out=a p=predict r=resid h=h student=r;run;data b; set a; drop x1-x2; run;proc print data=b; run;(a)学生化残差的正态QQ图 (b)拟合值的残差图结果分析:1) 由学生化残差的正态QQ图可知,其点明显不

5、在一条直线上;2) 求得有序学生化残差与相应正态分布的分位数的相关系数与1相差较大因此,若拟合线性回归模型,则误差分布与正态分布有较大的偏离;3) Y拟合值的残差图也表明与不满足线性关系,且两个拟合值还为负数由此知, 直接假定体积与直径和树干高度之间的线性回归关系是不恰当的(2)对因变量作Box-Cox变换第一步:确定变换参数鉴于(1)中的残差分析结果,我们对作Box-Cox变换对不同的值,由式,并利用SAS系统proc iml 过程计算的值由图2.5给出了随的变化曲线求变换参数l的程序:proc iml; n=31; t=1; use examp2_6; read all varx1 x2

6、y into m; do i=1 to n; t=t#mi,3; end;prod=t#(1/n); j=j(n,1,1); xx=j|m,1:2; h=xx*inv(xx*xx)*xx; do lamb=-0.5 to 0.5 by 0.01; if lamb=0 then zlamb=prod#log(m ,5); else zlamb=(m,3#lamb-j)/(lamb#(prod#(lamb-1); sse=zlamb*(i(n)-h)*zlamb; lsse=lsse/(lamb|sse); end;tt=prod#log(m ,3); sse0=tt*(i(n)-h)*tt; l

7、sse30,1=0; lsse30,2=sse0; index=lsse>:<,; minlsse=index1,2; lambda0=lsseminlsse,1; print lambda0;create plotdata varlambda sse; append from lsse; z=(m,3#lambda0-j(n,1,1)/lambda0; outm=m,1:2|z; create trans varx1 x2 z; append from outm; quit;proc print data=trans; run;goptionsreset procgplotdat

8、aplotsymbolvirun由结果给出了随的变化曲线由图可知,在时达到最小,因此,在Box-Cox变换式中取记变换后的因变量为,即 第二步:对关于拟合线性回归模型,利用残差分析考察模型的合理性并作出拟合结果建立回归模型,作残差分析程序如下:proc reg data=trans; model z=x1-x2; output out=c p=predict1 r=resid1 student=r1; run;goptions reset=all; proc capability graphics noprint data=c; qqplot r1/normal; run;goptions r

9、eset=all; proc gplot data=c;plot resid1*predict1;symbol v=dot i=none;run;回归模型及残差分析结果输出:对关于拟合线性回归模型,求出残差及学生化残差做出学生化残差的正态QQ图以及的拟合值的残差图如图所示(a)学生化残差的正态QQ图(q, r)(b) 的拟合值的残差图由图知,线性回归关系高度显著且复相关系数的平方和为,即线性部分描述了的绝大部分变化量由此得拟合的回归方程为回归模型残差的相关系数检验有序学生化残差与相应正态分布的分位数的相关系数与1比较接近因此变换效果比以前好了。2.9(1)程序如下:data examp2_9;

10、input x1 x2 x3 y;cards; 50 51 2.3 48 36 46 2.3 57 40 48 2.2 66 41 44 1.8 70 28 43 1.8 89 49 54 2.9 36 42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44

11、58 2.9 52 43 50 2.3 60;run;proc reg data= examp2_9;model y=x1-x3;output out=a p=predict r=resid h=h student=r;run;data b; set a; drop x1-x3; run;proc print data=b; run;proc capability graphics noprint data=a; /* 对数据集a调用capability过程,高分辨图,不打印输出 */qqplot r/normal; /* 作student数据的正态QQ图*/run;goptions rese

12、t=all; /*将图形的设置恢复为默认状态*/proc gplot data=a; /* 对数据集a作出画高分辨的散点图或曲线图 */plot resid*predict; /* 画纵坐标为残差、横坐标为yi散点图 */symbol v=dot i=none; /* 散点表示符号圆点 ,不画连线 */run;/*此处至Quit是计算学生化残差对应的标准正态分布的分位数*/proc sort data=a; by r; /* 按r排序*/proc iml; /* 调用iml矩阵分析模块,计算数据 */use a; /* 打开数据集a */read all varr into rr; /* 读入

13、集a中变量r(学生化残差)各观测值到矩阵rr中*/do i=1 to 23; /* 此循环计算 */ qi=probit(i-0.375)/54.25); q=q/qi; /* 矩阵qi上下连接而成,即得54*1阶矩q=(q(1),q(2),¼,q(30))T */end;rq=rr|q; /* 表示矩阵rq=(rr q)*/create correl varr q; /* 创建数据集correl, 变量为r、q */append from rq; /* 从矩阵rq读取数据 ( ) */quit; /* iml过程结束 */proc corr data=correl; /* 计算学生

14、化残差与对应的标准正态分布的分位数的相关系数*/run; (a)学生化残差的正态QQ图(b)拟合值的残差图结果分析:1) 由学生化残差的正态QQ图可知,其点基本在一条直线上;2) 求得有序学生化残差与相应正态分布的分位数的相关系数与1相差较小因此,若拟合线性回归模型,则误差分布与正态分布有较小的偏离;3) Y拟合值的残差图也表明与满足线性关系,由此知, 直接假定病人的满意程度与病人的年龄和病情程度、忧虑程度之间的线性回归关系是恰当的(2)【1】1)修正的复相关系数准则、准则选择模型data examp2_9; input x1-x3 y;cards; 50 51 2.3 48 36 46 2.

15、3 57 40 48 2.2 66 41 44 1.8 70 28 43 1.8 89 49 54 2.9 36 42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44 58 2.9 52 43 50 2.3 60;data a;set examp2_9;z=

16、(y*0.07-1)/0.07; /* 作Box-Cox变换Z=(Y0.07-1)/0.07 */run;proc reg data=a; /* 对集合a调用回归分析的reg过程 */model z=x1-x3/selection=adjrsq; /* 建立回归模型Z=b0+b1X2+b3X3+ ,用修正的 准则选择模型 */run;proc reg data=a; /* 对集a调用回归分析的reg过程 */model z=x1-x3/selection=cp; /* 建立回归模型Z=b0+b1X2+b3X3 + ,利用 准则选择模型 */run;=0.6237最大 x1 x2 为最优由准则选

17、择最优模型Z=b0+b1X1+b2X2+ C3=2.7967»3 x1 x2 最优集由准则选择最优模型Z=b0+b1X1+b2X2+预测平方和准则选择PRESSp最优回归方程对集a调用回归分析的reg过程,用预测平方和准则()选择回归方程) 2)PRESSp输出结果 Z=b0+b1X1+b2X2+的预测平方和PRESSp=1.5990749最小,为最优选择模型 全模型 Z=b0+b1X1+b2X2+b3X3+的预测平方和PRESSp= 1.8059710的预测平方和PRESSp=1.5990749最小,此模型为最终选择的模型复相关系数平方和为与表2.8的结果相比较,可见均方残差、回归

18、系数估计及拟合优度的度量值均变化很小,即当 在模型中时, 对的影响是很小的最优回归方程为 由上述三种模型的选择结果可以看出各准则下的选择结果不一致。(3)1) 程序如下:data exam2_9;input x1-x3 y;cards; 50 51 2.3 48 36 46 2.3 57 40 48 2.2 66 41 44 1.8 70 28 43 1.8 89 49 54 2.9 36 42 50 2.2 46 45 48 2.4 54 52 62 2.9 26 29 50 2.1 77 29 48 2.4 89 43 53 2.4 67 38 55 2.2 47 34 51 2.3 51

19、 53 54 2.2 57 36 49 2.0 66 33 56 2.5 79 29 46 1.9 88 33 49 2.1 60 55 51 2.4 49 29 52 2.3 77 44 58 2.9 52 43 50 2.3 60;data a;set exam2_9;z=(y*0.07-1)/0.07; /* 作Box-Cox变换z=(y0.07-1)/0.07 */run;proc reg data=a; model z=x1-x3/selection=stepwise slentry=0.10 slstay=0.10 details;run;2) 结果输出第一步 1进:样本容量 n=23,统计量集,,添加自变量,拟合模型 ,计算,及,结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论