回归分析与协方差分析.ppt_第1页
回归分析与协方差分析.ppt_第2页
回归分析与协方差分析.ppt_第3页
回归分析与协方差分析.ppt_第4页
回归分析与协方差分析.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析与协方差分析,内容,9.1 一元线性回归,学习目标,散点图, 回归系数, 正规方程, 经验 回归方程;回归平方和,剩余平方和, 相关系数, 显著性检验.,不确定关系,人的身高,体重,农作物的单位面积产量,施肥量,9.1 一元线性回归,1. 一元线性回归的基本概念,线性模型,例 为了研究弹簧悬挂不同重量(单位:克力) x时长度(单位:厘米)y的关系。通过试验得到 一组数据。,重量xi 5 10 15 20 25 30 长度yj 7.25 8.12 8.95 9.90 10.90 11.80,把这些数据点(xi, yj )画在xoy坐标系中,图形 称为散点图。,*,*,*,*,*,*,L,散点图,记L为,进行n次独立试验,测得数据如下:,我们的问题是,如何根据这些观测值用“最 佳的”形式来表达变量Y与X之间的相关关系?,一般而言,在变量x取值以后,若Y所取 的值服从N (+x,2)分布,当、及2 未知时,根据样本(x1,Y1),(x2,Y2),(xn,Yn)的 观测值(x1,y1),(x2,y2),(xn,yn) 对未知参数、 及2所作的估计与检验称为一元线性回归 分析,而称为截距,称为回归系数, E(Y)+x 称为回归方程。,由回归方程可以推出,根据样本及其观测值可以得到、及 2的估计量及估计值,得到回归方程的估计式或经验回归方程,最常用的是最小二乘法,即求出,的值最小,所求出的a称为经验截距,简称 为截距,b称为经验回归系数,简称为回归 系数,而,2. 总体中未知参数的估计,根据最小二乘法的要求由,得到一元线性回归的正规方程组,并求出,建立一元线性回归方程的具体步骤:,(3)计算b和a,写出一元线性回归方程。,与上述a和b相对应的Q的数值又记作SSE, 称为剩余平方和。,将a、b和SSE以及 和 看作是统计量, 它们的表达式分别为,这些统计量之间以及它们与总体参数之间 有以下的内在联系:,为提高a的估计精度,最理想的选择是 使 0,其绝对值越小越好;,为提高b的估计精度,应该使lxx 取较大 的数值,x1、x2、xn越分散越好; 观测值的个数n不能太小。,3. 线性回归方程的显著性检验,因此,必须对回归方程的拟合情况或效果 作显著性检验。,其理论基础就是总平方和的分解,即,表示n个y1、y2、yn与 之间的差异,当 各个yi已知时,它是一个定值,称为总平方 和,记作SST。,通过回归已经达到了最小值,称为剩余平 方和,记作SSE。,称为回归平方和,记作SSR。,因此,SSTSSE+SSR。,如果SSR的数值较大,SSE的数值便比较 小,说明回归的效果好;如果SSR的数值 较小,SSE的数值便比较大,说明回归的 效果差。,如果|r|较大,SSE的数值便比较小,说明 回归的效果好或者说x与Y的线性关系密切; 如果|r|较小,SSE的数值便比较大,说明回 归的效果差或者说x与Y的线性关系不密切; 因此称r为x与Y的观测值的相关系数。 又由r及回归系数的计算公式,可以推出:r0时b0,x增加时Y的观测值 呈增加的趋势;r0时称x与Y正相关, r0时称x与Y负相关。,综上所述,如果设H0为0,也就是假设 x与Y不是线性关系,则可以用以下三种实质 相同的方法检验线性回归方程的显著性,且 当检验的结果显著时x与Y的线性关系显著, 回归方程可供应用;当检验的结果不显著时 x与Y的线性关系不显著,回归方程不可应用。, F检验法:,当H0为真时,,且SSR与SSE相互独立;因此,当H0为真时,,当FF1-(1,n-2)时应该放弃原假设H0。,(2)t检验法:,当H0为真时,,当|t|t1-0.5(n-2)时应该放弃原假设H0。,(3)r检验法:,根据x与Y的观测值的相关系数,可以推出,当H0为真时,,当FF1-(1,n-2)或|r|r(n-2)时应该放 弃原假设H0,式中的,可由r检验用表中查出。,因此,r常常用来表示x与Y的线性关系在x 与Y的全部关系中所占的百分比,又称为x 与Y的观测值的决定系数。,4. 利用回归方程进行点预测和区间预测,若线性回归作显著性检验的结果是放弃H0, 也就是放弃回归系数0的假设,便可以 利用回归方程进行点预测和区间预测,这是 人们关注线性回归的主要原因之一。, 当xx0时,,Y0的观测值y0的点预测是无偏的。, 当xx0时,用适合不等式PY0(G,H) 1-的统计量G和H所确定的随机区间(G,H) 预测Y0的取值范围称为区间预测,而(G,H)称 为Y0的1-预测区间。,若Y0与样本中的各Yi相互独立,则根据 ZY0-(a+bx0)服从正态分布,E(Z)0,,Z与SSE相互独立,,可以导出,因此,Y0的1-预测区间为 a+bx0(x0),,例1.1吸附方程某种物质在不同温度下可 以吸附另一种物质,如果温度x(单位:)与 吸附重量Y(单位:mg)的观测值如下表所示:,温度x1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0,重量y4.8 5.7 7.0 8.3 10.9 12.4 13.1 13.6 15.3,试求线性回归方程并用三种方法作显著性检 验,若x02,求Y0的0.95预测区间。,解:根据上述观测值得到n9,,所求的线性回归方程为,显著性检验方法 F检验法: SSTlyy114.516, SSRblxy112.485, SSESST-blxy2.031,n-27, F0.99(1,7)12.2,,所以回归方程极显著;, t检验法:,所以回归方程极显著;,(3) r检验法:,所以回归方程极显著.,Y0的0.95预测区间为(4.09,8.15)。 这说明当温度为2时,应该预测吸附另一种 物质的重量在4.09至8.15之间,并且预测100 次将有95次是正确的。,例1.2植物保护一些夏季害虫的盛发期 与春季温度有关,现有1956-1964年间3月下 旬至4月中旬旬平均温度的累计数x和一代三 化螟蛾盛发期Y(以5月10日为0)的观测值如下:,温度x 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2,盛发期y 12 16 9 2 7 3 13 9 -1,试求线性回归方程并用三种方法作显著性检 验,若x040,求Y0的0.95预测区间。,解:根据上述观测值得到n9,,所求的线性回归方程为,显著性检验方法 F检验法: SSTlyy249.5556,SSRblxy174.8886, SSESST-blxy74.6670,n-27, F0.99(1,7)12.2,,所以回归方程极显著;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论