[理学]第10章直线相关与回归ppt课件_第1页
[理学]第10章直线相关与回归ppt课件_第2页
[理学]第10章直线相关与回归ppt课件_第3页
[理学]第10章直线相关与回归ppt课件_第4页
[理学]第10章直线相关与回归ppt课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第10章章本本 章章 重重 点点掌握:掌握:直线相关、直线回归的根本概念直线相关、直线回归的根本概念相关系数、回归系数的意义相关系数、回归系数的意义相关、回归分析的本卷须知相关、回归分析的本卷须知熟习:熟习:相关、回归系数的假设检验相关、回归系数的假设检验直线回归的运用直线回归的运用等级相关的计算等级相关的计算 客观世界中的种种景象可分为确定性景客观世界中的种种景象可分为确定性景象和非确定性景象两类。象和非确定性景象两类。就两个变量而言,假设对一个变量的每就两个变量而言,假设对一个变量的每个能够取值,另一个变量都有完全确定的个能够取值,另一个变量都有完全确定的值与之对应,那么称这两个变量之间

2、的关值与之对应,那么称这两个变量之间的关系呈现函数关系。系呈现函数关系。( (圆周长圆周长2 2r r 在生物医学研讨中,变量之间的关系多在生物医学研讨中,变量之间的关系多不是确定的,表现为具有随机性的一种不是确定的,表现为具有随机性的一种“趋势,也即自变量趋势,也即自变量(independent (independent variable)variable)取不同数值时,应变量取不同数值时,应变量(dependent variable)(dependent variable)可以是不同的取可以是不同的取值,而且某值的出现完全是随机的。值,而且某值的出现完全是随机的。 但是对应但是对应XiXi

3、在一定范围内的不同取值,在一定范围内的不同取值,应变量应变量Y Y随随X X的变化呈现一定的趋势。的变化呈现一定的趋势。 人的身高与体重、收缩压与年龄之间的人的身高与体重、收缩压与年龄之间的关系,普通说来,身高愈高的人,体重关系,普通说来,身高愈高的人,体重也重一些;年龄愈长者,收缩压也越高,也重一些;年龄愈长者,收缩压也越高,从总体上看,都有某变量随另一变量变从总体上看,都有某变量随另一变量变化的趋势。但这种关系显然不是函数关化的趋势。但这种关系显然不是函数关系。系。 相关与回归分析就是研讨两变量之间非相关与回归分析就是研讨两变量之间非确定性关系的一种统计方法。确定性关系的一种统计方法。一、

4、线性相关的根本概念一、线性相关的根本概念直线相关是研讨两变量直线相关是研讨两变量 x x、y y 之间协之间协同变同变化的数量关系的分析方法。化的数量关系的分析方法。第一节线性相关第一节线性相关 为了研讨父亲与成年儿子为了研讨父亲与成年儿子身高之间的关系,卡尔身高之间的关系,卡尔.皮皮尔逊丈量了尔逊丈量了1078对父子的对父子的身高。把身高。把1078对数字表示对数字表示在坐标上,如图。用程度在坐标上,如图。用程度轴轴X上的数代表父亲身高,上的数代表父亲身高,垂直轴垂直轴Y上的数代表儿子上的数代表儿子的身高,的身高,1078个点所构成个点所构成的图形是一个散点图。它的图形是一个散点图。它的外笼

5、一致块橄榄状的云,的外笼一致块橄榄状的云,中间的点密集,边沿的点中间的点密集,边沿的点稀少,其主要部分是一个稀少,其主要部分是一个椭圆。椭圆。 1.51.51.61.61.71.71.81.81.91.92 22.12.12.22.22.32.32.42.42.52.52.62.62.72.72.82.82.92.930303232343436363838404042424444 体重体重kg,x 肺活量肺活量 ,Y L10名女中学生体重与肺活量散点图名女中学生体重与肺活量散点图二、相关系数二、相关系数 意义:描画两个变量直线相关的方向与亲意义:描画两个变量直线相关的方向与亲密密 程度的目的。

6、程度的目的。 表示方法:表示方法: -1 r 1正相关正相关 负相关负相关0 r 1 -1 r 3.690 P r0.005(9)=0.776,P0,回归直线从左下方走向右上方,回归直线从左下方走向右上方,即因变量即因变量Y随随X的添加而添加;的添加而添加; b0,回归直线从左上方走向右下,回归直线从左上方走向右下方,即因变量方,即因变量Y随随X的添加而减少;的添加而减少; b=0,回归直线平行于,回归直线平行于X轴,即轴,即Y与与X无一致线性依存关系。无一致线性依存关系。 a为回归直线在Y轴上的截距(intercept) a 0,表示直线与Y交点在原点上方 a 0,表示直线与Y交点在原点下方

7、 a =0,表示直线经过原点温度温度(oC)与蛙的心率与蛙的心率(次次/分分)对象 温度(X) 心率(Y) XY X2 Y2 1 2 5 10 4 25 2 4 11 44 16 121 3 6 11 66 36 121 4 8 14 112 64 196 5 10 22 220 100 484 6 12 23 276 144 529 7 14 32 448 196 1024 8 16 29 464 256 841 9 18 32 576 324 1024 10 20 34 680 400 1156 11 22 33 726 484 1086 合计132 246 3622 2024 6569例

8、例10.3 1. 绘制散点图绘制散点图2. 计算回归系数及常数项:计算回归系数及常数项:3. 建立回归方程:建立回归方程:36.22 12 36226569 246 2024 13222YXXYYYxx523. 1440670111322024112461323622)()(222nXXnYXXYbxY523. 108. 408. 412523. 136.22xbya4. 作回归直线作回归直线 在X实测值范围内,任取两个相距较远的点A、B,衔接两点即得回归直线。本例取x1=3,x2=21;代入回归方程得:3,8.65)和17,6.06)两点的直线即为所求的回归直线。 06.3621523. 1

9、08. 465. 83523. 108. 4yy绘制回归直线绘制回归直线xy523. 108. 4 三、回归系数的假设检验三、回归系数的假设检验 前面所求得的回归方程是由样本的信前面所求得的回归方程是由样本的信息所息所计算,抽样误差在所难免,必需对其进计算,抽样误差在所难免,必需对其进展假展假设检验。我们知道,即使设检验。我们知道,即使X、Y的总体的总体回归系回归系数数为零,由于抽样误差的存在,其样为零,由于抽样误差的存在,其样本回本回归系数归系数b也不一定为零。因此需作也不一定为零。因此需作能否能否为零为零的假设检验,可用方差分析或的假设检验,可用方差分析或t检验。检验。 目的:推断总体回归

10、系数目的:推断总体回归系数能否为能否为0,确,确定所求得的回归方程能否成立。定所求得的回归方程能否成立。假设:假设: H0: = 0 H1: 0 = 0.05一方差分析一方差分析首先我们分析一下首先我们分析一下Y的离均差平方和。的离均差平方和。对于任一点对于任一点PX,Y,其纵坐标被回其纵坐标被回归线和截成三段:归线和截成三段:Y YY YY Y因变量因变量Y的离均差平方和划分表示的离均差平方和划分表示PX,Y Y xYYPX,Y222)()()(iiiiyyyyyy YYYYYY对于任一对于任一x和和y,有:,有:)()()(iiiiyyyyyy对于许多对于许多x和和y,有:,有:Y的离均差

11、平方和,又的离均差平方和,又称总平方和,表示应变称总平方和,表示应变量量y总的变异,即总的变异,即SS总。总。回归平方和,总变异中,回归平方和,总变异中,x和和y的线性关系引起的的线性关系引起的变异,即变异,即SS回。回。其它要素对其它要素对y的影响,的影响,即即SS剩余。剩余。nyyyySS222)()(总XXXYiLLXXbYXXbYyySS22222)( )()(回归回归总剩余SSSSSS 1回归2-n剩余1- n总因此,因此,Y Y的总变异及其自在度分别分解为的总变异及其自在度分别分解为 SS SS总总=SS=SS回回+SS+SS剩余剩余 总总=回回+剩余剩余按照方差分析的思想,构造检

12、验统计量按照方差分析的思想,构造检验统计量 剩余回剩余剩余回回MSMSSSSSF回回=1=1,剩余剩余=n-2=n-21建立检验假设:建立检验假设:H0:0H1:00.052计算统计量计算统计量55.1067112466569)(222nyySS总32.4723.102055.1067SSSS回归总剩余SS23.1020440670)( )(2222XXbyySSi回归 方差分析表变异来源SS MSF P总变异 1067.55 10回归 1020.23 1 1020.23 194.04 0.01剩余 47.32 9 5.258 04.19447.32/91020.23/1/SS/SSMS剩余剩

13、余回归回归剩余回归MSF2-n 1 剩余回归3结论结论 查查F界值表,界值表, 回归回归1, 剩余剩余9,F0.01(1,9)=10.56 P0.01,回绝,回绝H0,接,接受受H1,可以为温度与蛙的心率之间存在,可以为温度与蛙的心率之间存在线性回归关系。线性回归关系。二t检验 ( y - y ) 2S yx = n-2 | b - 0 | bt = = , = n - 2 S b S b S yxS b = _ ( x - x ) 2_ _ 剩余剩余剩余 MS/s .xSSy假设没有计算假设没有计算MS剩余,那么有以下公式:剩余,那么有以下公式:xxxyyyxylllyynyyS22.2本例

14、:本例:29. 247.32/9/s .x剩余剩余SSy 0.10944029. 2bs921197.13109. 00523. 10bsbt查查t界值表,界值表,t0.05(9)=3.25, P0.01同一资料方差分布结果同一资料方差分布结果和和t 检验结果一致。检验结果一致。tF 四、运用直线回归方程应留意的问题四、运用直线回归方程应留意的问题作回归分析要有实践意义;作回归分析要有实践意义;作回归分析时,假设两变量间是依存因果作回归分析时,假设两变量间是依存因果关系关系,那么那么“因变量为因变量为x, “果变量为果变量为y;假设无因果关系假设无因果关系,那么以易于丈量和较稳那么以易于丈量和

15、较稳定的变量为定的变量为X。回归分析中,应变量是随机变量,自变量可以是回归分析中,应变量是随机变量,自变量可以是随机变量随机变量(型回归模型型回归模型) ) ,也可以是给定的,也可以是给定的量量(型回归模型型回归模型) ) 。凡随机变量均要求服从。凡随机变量均要求服从正态分布。正态分布。经检验回绝了无效假设的回归方程才有意义。经检验回绝了无效假设的回归方程才有意义。直线回归方程的适用范围普通以自变量的取值范直线回归方程的适用范围普通以自变量的取值范围为限,不要随意扩展。围为限,不要随意扩展。五、直线回归方程的运用五、直线回归方程的运用(补充补充) 描画两变量的数量依存关系;描画两变量的数量依存

16、关系;利用回归方程对应变量利用回归方程对应变量Y进展估计。进展估计。 利用回归方程进展统计控制,即利用回利用回归方程进展统计控制,即利用回归方程进展逆估计由归方程进展逆估计由 y 估计估计 x。第三节第三节 直线回归与直线相关直线回归与直线相关的联络与区别的联络与区别(二二)直线相关反映两变量的互存关系直线相关反映两变量的互存关系(双向双向) ; 直线回归反映两变量的依存关系直线回归反映两变量的依存关系(单向单向)。(一一)相关分析要求双变量正态分布相关分析要求双变量正态分布 回归分析:回归分析:型回归模型型回归模型(因变量服从正态分布因变量服从正态分布);型回归模型型回归模型(双变量正态分布

17、双变量正态分布)区别:区别:1同一组资料的同一组资料的 r 与与 b 的正负符号是一致的;的正负符号是一致的;2同一组资料的同一组资料的 r 和和 b 的假设检验结果是一致的,即的假设检验结果是一致的,即 t r = t b ;3当当 r = 1时,两变量存在直线回归关系;时,两变量存在直线回归关系;二、线性相关与回归的联络二、线性相关与回归的联络总回归SS/222SSllllllryyxxxyyyxxxy三、相关回归可以相互解释:三、相关回归可以相互解释:r的平方称为确定系数的平方称为确定系数此式阐明当此式阐明当SS总不变的情况下,回归平方总不变的情况下,回归平方和的大小决议了确定系数的大小,和的大小决议了确定系数的大小,r2反映反映出回归平方和在总平方和中所占的比重。出回归平方和在总平方和中所占的比重。R2越接近越接近1,回归效果越好;,回归效果越好;利用确定系数可以从回归角度对相关程度利用确定系数可以从回归角度对相关程度做进一步的了解。例如,做进一步的了解。例如,r=0.5,r2=0.25,阐明一个变量的变异仅有阐明一个变量的变异仅有25%由另一变量由另一变量所引起。所引起。第四节等级相关第四节等级相关Sp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论