




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,用SAS作回归分析,SASInstitute(Shanghai)Co.,Ltd.,(RegressionAnalysis),Insight,Air或Iris看散点图阵,2,变量的相关关系,散点图是直观地观察连续变化变量间相依关系的重要工具,Insight:AnalyzeScatterplot(YX)或Multivariate(Ys),编程:procgplot,Analyst:GraphsScatterplot,3,变量的相关关系,用直线描述,用曲线描述,可能有周期变化,无明显关系,InsightIris看散点图与相关,4,相关系数(CorrelationCoef.),线性联系是描述变量联系中最简单和最常用的一种(Y=a1x1+a2x2+b)相关系数是描述两个变量间线性联系程度的统计指标相关系数的计算公式:,5,相关系数(CorrelationCoef.),正相关:一个变量数值增加时另一个变量也增加,负相关:一个变量数值增加时另一个变量减少,Insight:置信椭圆,6,相关系数(CorrelationCoef.),若变量有高度线性相关时相关系数接近1,若变量有正相关时相关系数0,若变量有负相关时相关系数0.0435,dffits58977+statisitcstestsCollinearity,vif,71,回归诊断生成余差,在PROCREG的model语句加上选项p,就会输出预测值和相应的余差,PROCREGDATA=数据集名graphics;MODEL应变量=自变量/p;PLOTy变量*x变量/选项;symbolnc=颜色v=值;RUN;,利用plot语句plotr.*p.;就可得到余差-预测散点图,72,回归诊断识别异常观测值,73,回归诊断识别异常观测值,在PROCREG的model语句加上选项r,就会输出与预测值和余差有关的一些统计量。他们可用于识别异常数据(outlier)及其影响,PROCREGDATA=数据集名;MODEL应变量=自变量/r;RUN;,PredictValue预测值StdErrPredict预测值标准差Residual余差StdErrPredict余差标准差StudentResidualstudent化的余差-2-1012余差显著性图CooksDCooksD统计量,74,与余差有关的统计量,75,回归诊断余差分布正态性,有了余差的数据,就可对其运用图形方法或正式的分布正态性的检验在INSIGHT中可直接对数据表中的预测余差变量进行分析在PROCREG可利用下列语句用图形分析余差分布正态性,PROCREGDATA=数据集名graphics;MODEL应变量=自变量;PLOTnqq.*student.(nqq.*r.);RUN;,76,回归诊断识别有影响的观测,77,回归诊断识别有影响的观测,CookD统计量度量一个观测从分析中剔除时参数估计值的变化对一个观测值其CookD统计量的值超过4/n时(n为样本容量),这个观测存在反常效应,SAS/INSIGHT在下拉菜单选VarCooksD,78,回归诊断识别有影响的观测,Dffitsi度量第i个观测对预测值的影响,第i个观测的预测值,用排除第i个观测的回归对第i个观测的预测值,第i个观测的预测值的标准差,p为模型中参数的个数,n为样本容量,SAS/INSIGHT在下拉菜单选VarDffits,79,回归诊断识别有影响的观测,Analyst:StatisticsRegressionLinear.SaveData,80,回归诊断识别有影响的观测,ProcREG的Model语句加选项r可获得CookD统计量,ProcREG的Model语句加选项influence可获得Dffits等反映观测值影响的统计量,PROCREGDATA=数据集名;MODEL应变量=自变量/rinfluence;RUN;,81,回归诊断编程,Dst.carsp311/rp312output+p.r.student.p313plotstudent.*p.P314-1/influencep314-2outputcookddffitsp315/collinvif,R022Influence,82,选项influence生成的统计量,83,回归诊断识别有影响的观测,偏杠杆图是使有影响观测可视化的方法偏杠杆图是两个回归的散点图例如对变量xr的偏杠杆图:纵轴是Y关于除xr以外所有x的回归的余差横轴是xr关于所有x的回归的余差有影响观测通常分离与其它数据点或在某一轴上有极端数值偏杠杆图还可识别要加入哪些变量的高次项,84,回归诊断识别有影响的观测,SAS/INSIGHT在下拉菜单选GraphsPartialLeverage,ProcREG的Model语句加选项partial可获得杠杆图(低分辨),PROCREGDATA=数据集名;MODEL应变量=自变量/partial;RUN;,85,回归诊断识别有影响的观测,如何处理有影响的观测复验数据,确认并无数据输入错误发生若数据是有效的,模型可能不合适。拟合此数据可能需要使用高阶模型也可能数据是反常的一般,不剔除数据。某些有影响的观测提供重要的信息。要剔除数据,应给出必要的描述和说明,86,回归诊断共线性诊断,共线性(collinearity,multicollinearity)问题是指独立变量间存在线性关系变量间的线性关系会隐蔽变量的显著性也会增加参数估计的方差产生不稳定的模型只有拟合多元回归才会发生这一问题共线性的诊断可使用方差膨胀因子、条件指数和方差比例,dst.cars2,87,回归诊断共线性诊断-VIF,方差膨胀因子(VIF)是对由于共线性而引起的参数估计量的方差增加的一个相对度量,Rr2是Xr关于模型中其它独立变量回归的R2,一般采用VIF10表明存在共线性问题,INSIGHT在拟合回归时自动生成VIF,ProcREG的Model语句加选项VIF,88,回归诊断共线性诊断-条件指数和方差比例,条件指数(conditionindex)和方差比例(varianceproportion)联合使用可确认存在线性关系的变量组条件指数(hi=(lmax/li)1/2)在10-30间为弱相关在30-100间为中度相关大于100表明有强相关大的条件指数伴随方差比例0.5可确认有共线性的独立变量子集,INSIGHT在下拉菜单中选TablesCollonearityDiagnostics,ProcREG:Model语句加选项collin或collinoint,89,回归分析计算,PROCREGDATA=数据集名graphicsnoprint;MODEL应变量=自变量名列/pcliclmrvifinfluencepartialcollincollinoint;PLOTy变量*x变量/选项.;id=变量名;output=数据集名关键统计量名=输出名.;RUN;,作图变量:r.,student.,nqq.,.,Reg228,Reg228_1-228_4Ascombes例,90,回归诊断,例外值(outliers)或异常作用点的检查从已拟合回归的数据中分析线性模型的假定是否被破坏:应变量的均值是否是独立变量的线性函数,是否需要对变量进行变换或拟合曲线回归余差(residua
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广告标识制作合同书
- 2025通信设备租赁合同
- 2025企业短企业短信中EWWQ心销售及短信服务合同范本
- 2025年按揭贷款的合同范本
- 2025【各行各业合同协议】【各行各业合同协议】代理记账客户合同范本
- 2025年新疆粮油加工设备租赁合同协议
- 2025电影制作合同签订
- 2025精简版私有住宅购买合同模板
- 2025果酒的加工合同范本
- 2025房屋租赁合同范本管理资料
- 校长讲法治课课件
- 村播培训直播课件
- 2025年度云南省政府采购评审专家资格通关考试题库带答案解析
- 2025河南新乡长垣市公证处招聘合同制人员5人考试参考题库及答案解析
- 颈椎骨折课件导图
- 2025至2030中国工业云平台行业发展研究与产业战略规划分析评估报告
- 2025餐饮合伙经营合同协议书
- 2025年山东西学中题库及答案
- 14.2物质的比热容同步练习(含答案) 沪科版物理九年级全一册
- 《国家机构有哪些》课件
- 肉制品安全培训会课件
评论
0/150
提交评论