数据分析.doc_第1页
数据分析.doc_第2页
数据分析.doc_第3页
数据分析.doc_第4页
数据分析.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章2.5 (1)拟合线性回归模型:程序:data examp2_3;input x y;cards; 0.05 5.9421 0.15 5.4691 0.25 5.8724 0.35 5.1815 0.45 5.1955 0.55 5.2487 0.65 5.1356 0.75 5.2260 0.85 5.0813 0.95 5.2236 1.05 4.7349 1.15 4.5949 1.25 5.1543 1.35 5.2844 1.45 5.3448 1.55 5.1462 1.65 5.4091 1.75 5.6500 1.85 6.0256 1.95 5.5350;run;proc reg data=examp2_3;model y=x/i;run;(2)方差分析输出结果及分析:方差的估计值为MSE=0.13620,线性回归关系显著性检验H0:B1=B2=B3=0 H1:B1B2B3至少有一个不为零 统计量观测值F0=0.00(F越大越显著),检验的p值p0=0.9832(大于一般给定的显著性水平,故不显著) R-Square= 0.000(复相关系数,越大越显著) 因此以上信息均表明Y与X之间的线性回归关系十分不显著。(3)参数估计的相关结果以及分析可以直接得到回归方程:Y=5.31970+0.00305X 由最后一列的p值可知X对Y的影响并不显著即当x增加一个单位,Y只会增加0.00305个单位。(4)输出血生化残差结果及分析:最后一列中全部分布在(-1,1)内,所以得知学生化残差分布在个区间内的概率与N(0,1)相差很大,因此拒绝模型服从正态分布的假设。(5)残差的正态QQ图:(6)残差图分析:的残差图说明了回归方程可能是非线性的,需要引进自变量的二次项。 (7)拟合回归模型 Y=x2+5残差图:(8BOX-COX变换,求参数)在 =0(3.088*E-16)时,SSE达到最小,因此取=0。变换之后因变量的值为下图最后一列变换之后的正态QQ图和残差图:变换之后的线性回归模型方程为:Y=1.43820说明BOX-COX变换不适用任何情况。2.6程序代码:data exercise2_6;input x1-x2 y;cards; 8.3 70 10.3 8.6 65 10.3 8.8 63 10.210.5 72 16.410.7 81 18.810.8 83 19.711.0 66 15.611.0 75 18.211.1 80 22.611.2 75 19.911.3 79 24.211.4 76 21.011.4 76 21.411.7 69 21.312.0 75 19.112.9 74 22.212.9 85 33.813.3 86 27.413.7 71 25.713.8 64 24.914.0 78 34.514.2 80 31.714.5 74 36.316.0 72 38.316.3 77 42.617.3 81 55.417.5 82 55.717.9 80 58.318.0 80 51.518.0 80 51.020.6 87 77.0;run;proc reg data=exercise2_6;model y=x1-x2;output out=a p=predict r=resid student=student;run;proc capability graphics noprint data=a;qqplot student/normal;run;goptions reset=all; /*将图形的设置恢复为默认状态*/proc gplot data=a;plot resid*predict;symbol v=dot i=none;proc sort data=a; /*此处至quit是计算学生化残差对应的标准正态分布的分位数*/by student;proc iml;use a;read all varstudent into rr;do i=1 to 31;qi=probit(i-0.375)/31.25);q=q/qi;end;rq=rr|q;create correl varr q;append from rq;quit;proc corr data=correl; /*计算学生化残差与对应的标准正态分布的分位数的相关系数*/run;proc iml; /*此处至quit是进行Box-Cox变换*/n=31;t=1;use exercise2_6_2;read all varx1 x2 y into m;do i=1 to n;t=t#mi,3;end;prod=t#(1/n);j=j(n,1,1);xx=j|m,1:2;h=xx*inv(xx*xx)*xx;do lamb=-0.5 to 0.5 by 0.01;if lamb=0 then zlamb=prod#log(m ,3);else zlamb=(m,3#lamb-j)/(lamb#(prod#(lamb-1);sse=zlamb*(i(n)-h)*zlamb;lsse=lsse/(lamb|sse);end;tt=prod#log(m ,3); /*由于舍入误差的影响,循环过程中得不到lambda精确为0时*/sse0=tt*(i(n)-h)*tt; /*sse的值,程序中的倒数第2-4 行重新求了lambda=0时的sse值*/lsse51,1=0;lsse51,2=sse0;index=lsse:,;minlsse=index1,2;lambda0=lsseminlsse,1;print lambda0;create plotdata varlambda sse;append from lsse;transy=(m,3#lambda0-j(n,1,1)/lambda0;outm=m,1:2|transy;create trans varxx1 xx2 yy;append from outm;quit;proc print data=trans;run;goptions reset=all;proc gplot data=plotdata;plot sse*lambda;symbol v=point i=spline;run;proc reg data=trans; /*利用变换后的数据拟合回归模型并作有关图形*/model yy=xx1-xx2;output out=c p=predict1 r=resid1 student=student1;run;goptions reset=all;proc capability graphics noprint data=c;qqplot resid1/normal;run;goptions reset=all;proc gplot data=c;plot resid1*predict1;symbol v=dot i=none;run;proc sort data=c; /*此处至quit是计算变换数据的学生化残差对应的标准正态分布的分位数*/by student1;proc iml;use c;read all varstudent1 into rrr;do i=1 to 31;qii=probit(i-0.375)/31.25);qq=qq/qii;end;rrqq=rrr|qq;create correl1 varrr qq;append from rrqq;quit;proc corr data=correl1; /*计算变换数据学生化残差与对应的标准正态分布的分位数的相关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论