SAS 相关与回归模型.doc_第1页
SAS 相关与回归模型.doc_第2页
SAS 相关与回归模型.doc_第3页
SAS 相关与回归模型.doc_第4页
SAS 相关与回归模型.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与回归模型SAS程序主要内容1、散点图2、相关分析3、一元回归模型建立及检验4、一元回归模型的拟合图与残差图5、多元回归模型与数据标准化系数6、共线性检验(VIF,7、变量的逐步选择8、模型的自相关DW检验相关与回归分析指导一、散点图例:一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清不良贷款形成的原因,管理者希望利用银行业务的有关数据进行定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 分行编号不良贷款 (y)各项贷款余额 (x)10.967.321.1111.334.8173.043.280.857.8199.762.716.271.6107.4812.5185.491.096.1102.672.8110.364.2124.0132.2130.858.6143.5174.61510.2263.5163.079.3170.214.8180.473.5191.024.7206.8139.42111.6368.2221.695.7231.2109.6247.2196.2253.2102.2Data e41;Input x y ;Label y= 不良贷款 x= 各项贷款余额;Cards;0.967.3 1.1111.3 4.8173.0 3.280.8 7.8199.7 2.716.2 1.6107.4 12.5185.41.096.1 2.672.8 0.364.2 4.0132.2 0.858.6 3.5174.6 10.2263.5 3.079.30.214.8 0.473.5 1.024.7 6.8139.4 11.6368.2 1.695.7 1.2109.6 7.2196.23.2102.2;proc gplot data=e41; plot y*x; run;二、相关系数分析Proc corr data=e41 ;Var x y;Run;2、计算协方差与相关矩阵Proc corr data=e41 cov;Var x y;Run;例:10个企业的销售收入和销售利润资料企业编号销售收入x销售利润y1508210131212415251522620257252582828930310303Data e42; input x y ;Cards;50.8 101 121.2 152 152.2202.5 252.5 282.8 303 303;Proc corr data=e42;Var x y;Run;例,分析变量年龄,体重,跑步时间和需氧量的关系data fitness;input Age Weight Runtime Oxygen ;datalines;57 73.37 12.63 39.407 54 79.38 11.17 46.08052 76.32 9.63 45.441 50 70.87 8.92 .51 67.25 11.08 45.118 54 91.63 12.88 39.20351 73.71 10.47 45.790 57 59.08 9.93 50.54549 76.32 . 48.673 48 61.24 11.5 47.92052 82.78 10.5 47.467 44 73.03 10.13 50.54145 87.66 14.03 37.388 45 66.45 11.12 44.75447 79.15 10.6 47.273 54 83.12 10.33 51.85549 81.42 8.95 40.836 51 77.91 10.00 46.67248 91.63 10.25 46.774 49 73.37 10.08 50.38844 89.47 11.37 44.609 40 75.07 10.07 45.31344 85.84 8.65 54.297 42 68.15 8.17 59.57138 89.02 9.22 49.874 47 77.45 11.63 44.81140 75.98 11.95 45.681 43 81.19 10.85 49.09144 81.42 13.08 39.442 38 81.87 8.63 60.055;proc corr data=fitness pearson spearman hoeffding;var weight oxygen runtime;run;三、一元回归分析模型建立及检验回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化,因变量 y 是随机变量,自变量 x 是非随机的确定变量,回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 u残差(residual)Proc reg data=e42;Model y= x ;Run;模型的检验,模型系数T检验与模型拟合优度R2简单模型Proc reg data=e41 ;Model y=x;Run;加描述统计量的简单模型 ,加allProc reg data=e41 all;Model y=x;Run;Proc GLM data=e41;Model y= x ;Run;四、一元回归模型的拟合图和残差图和异方差画出残差图Proc reg data=e41 all;Model y=x;plot r.*p./ vref=0;Run;PROC REG DATA=e41;MODEL Y = X;Plot ;Plot y*x;RUN;Proc REG data=e41;Model y=x;Plot y*x p.*x/overlay ;Run;symbol;proc reg data=e41;model y=x;plot y*x/pred nostat mse aic bic ; plot y*x / conf pred;plot r.*nqq./ noline mse ;plot rstudent.*obs.;output out=regout p=rhat;run;计算预测值与残差Proc reg data=e41;Model y=x/r cli clm;Run;残差Q-Q图,P-P图symbol i=spline v=star h=2 color=pink width=2;proc reg data=e41 outest=kk;model y=x/r aic bic edf gmsep jp pc sbc sp selection=rsquare;plot r.*nqq. / aic bic mse ; plot npp.*r./ nostat ;run;proc print data=kk;run;预测区间图Proc reg data=e41 all;Model y=x;plot (y PREDICTED. u95. l95.)*x/overlay;Run;身高H与体重W的关系data wh1001;input h w ;cards;172.4 75.0 169.3 54.8 169.3 64.0 171.4 64.8 166.5 47.4 171.4 62.2168.2 66.9 165.1 52.0 168.8 62.2 167.8 65.0 165.8 62.2 167.8 65.0164.4 58.7 169.9 57.5 164.9 63.5 160.3 55.2 175.0 66.6 172.5 73.5172.0 64.0 168.4 57.0 155.0 57.0 175.5 63.9 172.3 69.0 168.6 58.0176.4 56.9 173.2 57.5 167.5 50.0 169.4 52.2 166.7 72.0 169.5 57.0165.7 55.4 161.2 48.5 172.8 57.0 175.1 75.5 157.5 50.5 169.8 62.9168.6 63.4 172.6 61.0 163.8 58.5 165.1 61.5 166.7 52.5 170.9 61.0166.1 69.5 166.2 62.5 172.4 52.6 172.8 60.0 177.8 63.9 162.7 56.8168.8 54.0 169.1 66.2 177.5 60.0 177.0 66.2 169.9 55.9 167.4 54.4169.3 58.4 172.8 72.8 169.8 58.0 160.0 65.3 179.1 62.2 172.3 49.8163.3 46.5 172.9 66.7 165.4 58.0 175.8 63.2 162.3 52.2 165.4 65.7171.5 59.3 176.6 66.3 181.7 68.6 175.2 74.9 169.5 59.5 169.6 61.5169.1 63.1 185.5 77.0 173.9 65.5 162.5 50.0 171.5 58.5 175.6 59.8166.0 75.5 167.2 63.3 171.9 57.0 176.6 58.4 177.3 67.0 169.2 71.8166.2 49.8 181.7 63.0 175.8 68.3 172.3 55.5 172.7 58.5 174.3 64.0171.2 59.0 174.8 68.0 165.4 55.5 169.1 64.8 167.9 62.0 176.8 64.0183.5 69.9 165.5 48.6 171.0 70.5 170.3 58.5;Proc reg data=wh1001 corr;model w=h;plot p.*r.;title QQ Plot;plot r.*nqq./ noline mse;run;Proc reg data=wh1001;model w=h;plot (w PREDICTED. u95. l95.)*h/overlay ; plot W*H / pred nostat;run;五、多元回归模型与数据标准化系数回归方差分析表变异来源source离差平方和SS自由度df均方MSF统计量FP概率值P回归RP误差E总变异T例 某学校20名一年级女大学生体重(公斤)、胸围(厘米)、肩宽(厘米)及肺活量(升)实测值如表所示,试对影响女大学生肺活量的有关因素作多元回归分析。 20名一年级女大学生肺活量及有关变量测量结果编号体重X1(公斤)胸围X2(厘米)肩宽X3(厘米)肺活量Y(升)151.373.636.42.99248.983.934.03.11342.878.331.01.91455.077.131.02.63545.381.730.02.86645.374.832.01.91751.473.736.52.98853.879.437.03.28949.072.630.12.521053.979.537.13.271148.883.833.93.101252.688.438.03.281342.778.230.91.921452.588.338.13.271555.177.231.12.641645.281.630.22.851751.478.336.53.161848.772.530.02.511951.378.236.43.152045.274.732.11.92data ex43;input x1 x2 x3 y;cards;51.373.636.42.9948.983.934.03.1142.878.331.01.9155.077.131.02.6345.381.730.02.8645.374.832.01.9151.473.736.52.9853.879.437.03.2849.072.630.12.5253.979.537.13.2748.883.833.93.1052.688.438.03.2842.778.230.91.9252.588.338.13.2755.177.231.12.6445.281.630.22.8551.478.336.53.1648.772.530.02.5151.378.236.43.1545.274.732.11.92;proc reg;model y=x1 ;model y=x1 x2 ;model y= x2 x3;model y=x1 x2 x3/ stb mse aic bic caxis=red ctext=blue ;run; quit;六、共线性检验(VIF,共线性(collinearity, multicollinearity)问题是指独立变量间存在线性关系共线性的诊断可使用方差膨胀因子、条件指数和方差比例方差膨胀因子(VIF)是对由于共线性而引起的参数估计量的方差增加的一个相对度量, 一般采用 VIF 10 表明存在共线性问题容忍度Tol,为VIF的倒数,当TOL小于0.0001时程序会自动拒绝一个自变量。n VIF10,有多重共线性;TOL=1/VIF;条件数,C20,共线性严重proc reg data=xiaoshou;model y=x1 x2/ COLLIN vif tol;run;collin对自变量之间的共线性进行分析collinoint对自变量之间的共线性进行分析,不包括截距项collin对自变量之间的共线性进行分析collinoint对自变量之间的共线性进行分析,不包括截距项proc reg data=ex43 simple corr ;model y=x1 x2 x3 / p cli clm r vif influence partial collin tol collinoint;run; 七、变量的逐步选择一、 stepwise逐步回归过程stepwise过程对逐步回归提供了九种方法。当你有许多自变量且想找出哪些自变量是该选入回归模型时,stepwise是有用的。常用的自变量的选择法, BACKWARD,FORWARD, STEPWISE proc reg data=xiaoshou;model y=x1 x2/ selection=stepwise CP details=summary;run;标准回归系数proc reg data=xiaoshou;model y=x1 x2/ selection=stepwise std details=summary;run;八、模型的自相关DW检验当DW值愈接近2时,残差项间愈无相关。当DW值愈接近0时,残差项间正相关愈强。当DW值愈接近4时,残差项间负相关愈强。SAS回归分析程序Proc Reg 选项串 ; 1) data=输入文件名,缺省则为最后一个sas文件 2)0utest=输出文件名 3)all 印出所有分析结果 4)corr 印出相关系数阵 1) Tol(rance) (定义为1-R2)印出各参数的容忍量2) Vif (Variance Inflance) 变异数的膨胀值3) Collin 执行多自变量间的共线性分析4) P 因变量的实际值与预测值及误差的表5) R 比7)更多,包括(cook)D 值(用于发现奇异样本)6) clm 各个预测值均值的95%的置信区间上下限7) Partial 对每一个自变量作净回归图8) selection=stepwise (forward backward Rsquare Adjrsq MaxR )(分别为)逐步回归(向前回归,向后回归,复相关系数平方法,修正的复相关系数平方法,最大相关法)Plot 图形指令串/选项串;1)Plot 纵轴变量名.*横轴变量名.回归模型收入与消费的关系Data datareg;Input dq $1-8 x1 y1 x2 y2;Lable dq=省区 x1=城镇居民年人均可支配收入 y1=城镇居民年人均消费 x2=农民人均纯收入 y2=农民人均生活消费;cards; Hebei 10305 7343 3802 2495 Liaoning 10370 7987 4090 3067Jiangsu 14084 9629 5813

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论