SAS讲义第四章回归与回归诊断.doc_第1页
SAS讲义第四章回归与回归诊断.doc_第2页
SAS讲义第四章回归与回归诊断.doc_第3页
SAS讲义第四章回归与回归诊断.doc_第4页
SAS讲义第四章回归与回归诊断.doc_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 回归与回归诊断教学目标:回归分析是基于观测数据建立变量间的依赖关系,并可用于预报、控制等问题。不仅要熟练掌握线性回归模型的建模理论与方法,而且要能够利用回归分析的SAS过程解决有关实际应用问题。为学生将来从事科研和应用打下坚实的基础。重难点:各种回归模型的建模理论与方法,参数估计、模型与参数的检验;利用回归分析的SAS过程解决有关实际应用问题。第一节 多元线性回归一多元线性回归模型假设是一个可观测的随机变量,非随机因素和随机误差对有影响,并且它们之间具有线性关系 (1)其中是均值为零、方差为的误差项,它表示除了之外其它因素对的影响以及试验或测量误差,是未知参数.本章假定。该模型称为线性回归模型,且称为因变量,为自变量。假定我们有了因变量和自变量的组独立的观测值,它们满足(1)式,即 (2)其中误差项相互独立,且服从分布。二参数估计方法最小二乘准则获得参数向量的估计的一个最重要方法是最小二乘法,该法是找的估计,使得偏差向量的长度之平方和达到最小,即其中。分别对的每一分量求偏导数,并令其为零,可以得到方程组它称为正规方程这个线性方程组有唯一解的充要条件是的秩为等价地,的秩为以后在线性回归模型的讨论中,我们总假定这个条件满足于是我们得到的最小二乘估计为根据微积分的极值理论,只是函数的一个驻点可以证明确实使达到最小记并将其代入(1),去掉误差项,得到回归方程在线性回归模型(1)中还有一个重要参数,它是模型误差项的方差,因而有时简称为误差方差. 反映了模型误差以及观察误差的大小,在回归分析中起着重要作用.现在我们讨论的估计问题.误差向量是一个不可观测的随机向量,用最小二乘估计代替其中的,得到称为残差向量,其中为对称幂等矩阵。称数为残差平方和,它的大小反映了实际数据与理论模型(1)的偏离程度或者说拟合程度.可以证明为的无偏估计。三假设检验问题1. 回归方程的显著性检验和之间是否存在显著的线性关系,还需要对回归方程进行检验。(1)方差分析表方差来源自由度平方和均方比回归误差总和(2)线性回归关系的显著性检验检验假设:构造统计量。可以证明当为真时,。当不真时,又偏大的趋势。如观测值,则接受;否则拒绝。(3)检验的值在SAS及其他一些数据分析软件中,对显著性检验问题,其输出结果通常是检验的值。在上述线性回归关系的显著性检验问题,其检验的值为,对于给定的显著水平,任何检验准则均为。2. 回归系数的显著性检验回归关系显著并不意味着每个自变量对因变量的影响都显著,可能其中的某个或某些对的影响不显著。希望从回归方程中剔除那些对的影响不显著得自变量,从而建立一个简单有效的回归方程,以便于实际应用。检验的影响是否显著等价于检验假设:由于的一个估计为。可以证明其中为的主对角线上的第个元素的平方根。由此得到检验准则为对上述统计量,其值为,于是若,则接受,反之就拒绝。四使用REG过程进行多元线性回归计算PROC REG过程PROC REG过程是SAS系统中回归分析的一种,它可拟合线性回归模型,可提供多种选取最优模型的方法及模型诊断检查方法,其基本语句形式为:PROC REG options(数据集);Model dependent(因变量)=regressors(自变量)/options;Output Out=SAS data set keyword=name ;例4.1.1 建立用电量KWH与空调每天使用的小时数AC和烘干器每天使用的次数DRYER的经验公式。解 data kilowatt;input kwh ac dryer;cards;35 1.5 163 4.5 266 5.0 217 2.0 094 8.5 379 6.0 393 13.5 166 8.0 194 12.5 182 7.5 278 6.5 365 8.0 177 7.5 275 8.0 262 7.5 185 12.0 143 6.0 057 2.5 333 5.0 065 7.5 133 6.0 0;proc plot data=kilowatt;plot kwh*ac=*;run;proc reg data=kilowatt;model kwh=ac dryer;run;print cli; %计算的预测值和95%置信限run; Plot of kwh*ac. Symbol used is *. kwh 95 * * 93 * 91 89 87 85 * 83 * 81 79 * * 77 * 75 * 73 71 69 67 * * 65 * * 63 * * 61 59 57 * 55 53 51 49 47 45 43 * 41 39 37 35 * 33 * * 31 29 27 25 23 21 19 17 * 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 13.5 ac Dependent Variable: kwh Analysis of Variance (方差分析) Source DF Sum of Squares Mean Square F Value Pr F Model 2 9299.80154 4649.90077 300.24 |t值| Intercept 1 8.10539 2.48085 3.27 0.0043 ac 1 5.46590 0.28076 19.47 .0001 dryer 1 13.21660 0.85622 15.44 F Model 2 53845 26922 5679.47 |t| Intercept 1 3.45261 2.43065 1.42 0.1809 x1 1 0.49600 0.00605 81.92 .0001 x2 1 0.00920 0.00096811 9.50 .0001分析:各参数的估计分别为;各参数估计可得标准差分别为;检验假设()的统计量的观测值分别为1.42、81.92、9.50,相应的检验值分别为0.1809、0.00010.05、0.0001 F Model 2 2285.64535 1142.82268 749.84 |t| Intercept 1 -17.66377 5.43598 -3.25 0.0038 speed 1 5.53776 0.64485 8.59 F Model 1 1831.89616 1831.89616 22.80 0.0006 Error 11 883.86692 80.35154 Corrected Total 12 2715.76308 Variable Parameter Estimate Standard Error Type II SS F Value Pr F Intercept 117.56793 5.26221 40108 499.16 F Model 2 2641.00096 1320.50048 176.63 F Intercept 103.09738 2.12398 17615 2356.10 .0001 x1 1.43996 0.13842 809.10480 108.22 .0001 x4 -0.61

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论