用SAS作回归分析ppt课件.ppt_第1页
用SAS作回归分析ppt课件.ppt_第2页
用SAS作回归分析ppt课件.ppt_第3页
用SAS作回归分析ppt课件.ppt_第4页
用SAS作回归分析ppt课件.ppt_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析中SAS的使用,1,1、回归分析计算,PROCREGDATA=数据集名;MODEL应变量=自变量;RUN;,PROCREGDATA=数据集名;MODEL应变量=自变量名列/pcliclmRUN;,2,2、回归线作图,PROCREGDATA=数据集名;MODEL应变量=自变量/pcliclmr;PLOTy变量*x变量/选项;RUN;,利用plot语句可以绘制与拟合数据有关散点图、回归线和置信曲线、预测区间曲线,3,回归线作图,PROCREGDATA=数据集名;MODEL应变量=自变量/pcliclmr;PLOTy变量*x变量/选项;RUN;,y变量和x变量可以是应变量、自变量和其它与回归分析有关的变量:p.(predicted)预测值r.(residual)余差U95.,L95.预测值置信限U95M.,L95M.预测均值置信限,选项:conf95作预测均值置信曲线pred95作预测值置信曲线overlay将语句中规定的图迭置在一幅图上AICCPMSESSE在图上显示相应的统计量,4,3、逐步回归分析计算-变量选择,PROCREGDATA=数据集名;MODEL应变量=自变量名列/pcliclmrselection=stepwiseslentry=0.05slstay=0.05details;RUN;,5,4、回归诊断,例外值(outliers)或异常作用点的检查从已拟合回归的数据中分析线性模型的假定是否被破坏:应变量的均值是否是独立变量的线性函数,是否需要对变量进行变换或拟合曲线回归余差(residuals)是否同方差,不相关,正态分布独立变量间是否存在线性关系(仅多元有)考察余差散点图是进行回归诊断的必要步骤,6,回归诊断,7,回归诊断,回归分析的余差值是回归诊断的重要工具,利用余差可以考察余差和预测值的散点图也可以检验余差分布的正态性,8,回归诊断,模型合适,应改曲线模型,不等方差,观测值不独立,9,回归诊断生成余差,在PROCREG的model语句加上选项p,就会输出预测值和相应的余差,PROCREGDATA=数据集名;MODEL应变量=自变量/p;PLOTy变量*x变量/选项;RUN;,利用plot语句plotr.*p.;就可得到余差-预测散点图,其中可以把p值换成自变量x,就得到相应的散点图。,10,回归诊断识别异常观测值,在PROCREG的model语句加上选项r,就会输出与预测值和余差有关的一些统计量。他们可用于识别异常数据(outlier)及其影响,PROCREGDATA=数据集名;MODEL应变量=自变量/r;RUN;,PredictValue预测值StdErrPredict预测值标准差Residual余差StdErrPredict余差标准差StudentResidualstudent化的余差-2-1012余差显著性图CooksDCooksD统计量其中D是距离的缩写。,11,回归诊断余差分布正态性,有了余差的数据,就可对其运用图形方法或正式的分布正态性的检验在INSIGHT中可直接对数据表中的预测余差变量进行分析在PROCREG可利用下列语句用图形分析余差分布正态性,PROCREGDATA=数据集名graphics;MODEL应变量=自变量;PLOTnqq.*student.(nqq.*r.);RUN;,12,回归诊断识别有影响的观测,CookD统计量度量一个观测从分析中剔除时参数估计值的变化对一个观测值其CookD统计量的值超过4/n时(n为样本容量),这个观测存在反常效应,其中4/n只是经验,没有统一的标准。,13,回归诊断识别有影响的观测,Dffitsi度量第i个观测对预测值的影响,第i个观测的预测值,用排除第i个观测的回归对第i个观测的预测值,第i个观测的预测值的标准差,是为了把数据标准化。其中Dffits越大越好,D是different和fit的缩写说明,,p为模型中参数的个数,n为样本容量,其中,14,回归诊断识别有影响的观测,ProcREG的Model语句加选项r可获得CookD统计量,ProcREG的Model语句加选项influence可获得Dffits等反映观测值影响的统计量,PROCREGDATA=数据集名;MODEL应变量=自变量/rinfluence;RUN;,15,选项influence生成的统计量,Hatdiag:帽子矩阵,可以把杠杆点找出来,用的较多。Dbet:表示某个点删除前后统计量的变化。,16,五、影响点诊断,procregdata=e4;modely1=x1-x4/influencer;run;其中选项influence同上一页。R主要给出Cook-distance.前面已有。,17,六、共线性诊断,共线性(collinearity,multicollinearity)问题是指独立变量间存在线性关系1.变量间的线性关系会隐蔽变量的显著性2.也会增加参数估计的方差3.产生不稳定的模型只有拟合多元回归才会发生这一问题共线性的诊断可使用方差膨胀因子、条件指数和方差比例,18,回归诊断共线性诊断-VIF,方差膨胀因子(VIF)是对由于共线性而引起的参数估计量的方差增加的一个相对度量,Rr2是Xr关于模型中其它独立变量回归的R2,一般采用VIF10表明存在共线性问题,ProcREG的Model语句加选项VIF,19,回归诊断共线性诊断-条件指数和方差比例,条件指数(conditionindex)和方差比例(varianceproportion)联合使用可确认存在线性关系的变量组条件指数(hi=(lmax/li)1/2)在10-30间为弱相关在30-100间为中度相关大于100表明有强相关大的条件指数伴随方差比例0.5可确认有共线性的独立变量子集,ProcREG:Model语句加选项collin或c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论