医学统计学课件:直线回归_第1页
医学统计学课件:直线回归_第2页
医学统计学课件:直线回归_第3页
医学统计学课件:直线回归_第4页
医学统计学课件:直线回归_第5页
已阅读5页,还剩64页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

直线回归

LinearRegressionMedicalStatistics医学统计学主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

2体重与体表面积

3体重

X体表面积Y1112131415165.05.56.06.5直线回归方程宏观上来讲,体重和体表面积呈直线关系,但并不能用

来描述。所以我们用“hat”表示估计值,给定X时Y的条件均数。

4直线回归方程

Y

因变量,响应变量

dependentvariable,responsevariableX

自变量,解释变量

independentvariable,explanatoryvariableb

回归系数,斜率

regressioncoefficient,slopea

截距

intercept

5为什么叫“回归”?

6Regression?

回归?

F.GaltonK.Pearson“Regressiontothemean”

7主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

8直线回归方程的求解例:3岁男童的体重与体表面积

9编号体重(kg)X体表面积(103cm2)Y111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266直线回归方程的求解

10体重X体表面积Y1112131415165.05.56.06.5X(1)Y(2)11.05.28311.85.29912.05.35812.35.29213.15.60213.76.01414.45.83014.96.10215.26.07516.06.411直线回归方程的求解最小二乘法:LeastSquareMethod

11直线回归方程的求解:最小二乘法对于本例,经计算得

12直线回归方程的求解3岁男童体重和体表面积间的直线回归方程

13回归直线的绘制

14体重X体表面积Y1112131415165.05.56.06.5(12,5.3832)(15,6.0987)(13.44,5.7266)主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

15直线回归方程的解释b

的意义a

的意义和的意义的意义

16回归系数b的解释b

的涵义:体重增加1

(kg),则体表面积平均递增0.2385(103cm2)。体重为X+1

(kg)的3岁男童,其平均体表面积比体重为X

kg的3

岁男童之平均体表面积多0.2385

(103cm2)。

17截距

a的意义a

的含义截距(intercept,constant);X=0时,Y

的估计值;a的单位与Y值相同;当X

可能取0

时,a

才有实际意义。

18

19编号(1)体重(kg),X(2)体表面积(103cm2),Y(3)(4)(5)111.05.2835.1450.138211.85.2995.336-0.037312.05.3585.383-0.025412.35.2925.455-0.163513.15.6025.646-0.044613.76.0145.7890.225714.45.8305.956-0.126814.96.1026.0750.027915.26.0756.146-0.0711016.06.4116.3370.074合计133.457.26657.2660.000

20

体重X体表面积Y1112131415165.05.56.06.5

21

残差平方和(residualsumofsquares)综合表示点距直线的距离。在所有的直线中,回归直线的残差平方和是最小的。(最小二乘)

22

231112131415165.05.56.06.5点到回归直线的纵向距离平方和为最小!直线回归方程的求解:最小二乘法回归直线的有关性质直线通过均点直线上方各点到直线的纵向距离之和

=直线下方各点到直线的纵向距离之和

即:各点到该回归线纵向距离平方和较到其它任何直线者为小。

24主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

25直线回归方程的假设检验直线回归系数的t检验直线回归方程的方差分析

26主要内容直线回归系数的t

检验总体回归系数

=0,则回归关系不成立。H0:总体回归系数为0,

=0;H1:总体回归系数不为0,0;=0.05。

27直线回归系数的t

检验

28Y的剩余标准差——扣除X的影响(即回归所能解释的部分)后Y本身的变异程度直线回归系数的t

检验H0:总体回归系数=0,即体重与体表面积无回归关系;H1:总体回归系数

≠0,即体重与体表面积有回归关系。

=0.05。

=10-2=8按=8查t界值表,得P<0.001。按

=0.05水准拒绝H0,接受H1。可以认为体重与体表面积之间有直线回归关系。

29回归系数与相关系数的假设检验

30主要内容直线回归方程的假设检验直线回归系数的t

检验直线回归方程的方差分析

31因变量总变异的分解X

P

(X,Y)Y

32因变量总变异的分解

33

因变量总变异的分解

34

35Y的总变异可以用回归来解释的部分即与X有关的部分不能用X来解释的部分即与X无关的部分(随机误差)份额的大小可以用相关系数的平方来衡量(决定系数)因变量总变异的分解回归方程的方差分析

36回归方程的方差分析H0:体重与体表面积间无直线回归关系;H1:体重与体表面积间有直线回归关系。α=0.05。列方差分析表

37回归方程的方差分析

38变异来源SSMSF回归1.416611.416689.01剩余0.127380.0159总变异1.543990.1715回归方程的方差分析

39变异来源SSMSF回归1.416611.416689.01剩余0.127380.0159总变异1.543990.1715回归方程的方差分析今1=1,2=8,查F界值表,得P<0.01,拒绝H0,接受H1,故可认为3岁男童的体重与体表面积之间有线性回归关系。

40变异来源SSMSF回归1.416611.416689.01剩余0.127380.0159总变异1.543990.1715直线回归中三种假设检验间的关系在直线回归中,相关系数的假设检验,回归系数的假设检验,以及回归方程的方差分析结果等价。

41

42剩余标准差(1)扣除了X的影响后,Y方面的变异;(2)引进回归方程后,Y方面的变异。

43名词辨析:Y的变异Y本身的变异Y体重增加量(g)X进食量(g)600650700750800850900950120140160180200154.42gSY=22.630SY.X=12.39主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

44直线回归方程的区间估计

45总体回归系数

的可信区间估计根据

t分布原理:本例中已计算得sb=0.02528

46可信区间与容许区间均数的可信区间:均数界值×标准误个体的容许区间(参考值范围):

均数界值×标准差

47

样本总体Y的总平均给定X时Y的平均

(Y的条件均数)根据

t分布原理:

48

49Y的容许区间估计给定X

时Y

的估计值是Y

的均数的一个估计。给定X

时Y值的容许区间是Y

值的可能范围。

Y的100(1-)%容许限:

50Y的容许区间估计5.38322.3060.1372=5.0666~5.6998即体重为12kg的3岁男童,估计有95%的人体表面积在5.0666到5.6998(103cm2/kg)之间。

51剩余标准差、条件标准误、条件标准差

52抽样误差抽样误差+个体变异估计值、95%可信区间和95%容许区间

531112131415164.55.05.56.06.57.0体表面积Y(103cm2)体重X(Kg)

54x=x3时的E(y)x=x2时y的分布x=x1时y的分布x=x2时的E(y)x3x2x1x=x1时的E(y)0xyx=x3时y的分布0+1x

可信区间与容许区间主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

55直线回归与直线相关的联系均表示线性关系;符号相同:共变方向一致;假设检验结果相同:是否存在共变关系;换算关系回归解释相关

56决定系数直线回归与直线相关的区别r没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关;相关表示相互关系;回归表示数量依存关系;对资料的要求不同:当X

和Y

都是随机的,可以进行相关和回归分析;当Y

是随机的(

X

是控制的),理论上只能作回归而不能作相关分析;

I型回归:X是精确控制的;II

型回归:X是随机的。

57主要内容直线回归的定义直线回归方程的求解直线回归方程的解释直线回归方程的假设检验直线回归方程的区间估计相关与回归的区别和联系直线回归分析的正确应用

58相关和回归分析的正确应用作直线回归分析要有实际意义;充分利用散点图;回归系数的统计学意义;不能仅根据回归系数假设检验之P值判断回归效果的优劣;对于判断大样本回归系数的统计学意义尤其要谨慎;要想说明回归的贡献大小,需用决定系数r2作定量的度量;

59相关和回归分析的正确应用作直线回归分析要有实际意义;充分利用散点图;回归系数的统计学意义;不能仅根据回归系数假设检验之P值判断回归效果的优劣;对于判断大样本回归系数的统计学意义尤其要谨慎;要想说明回归的贡献大小,需用决定系数r2作定量的度量;回归关系可以内插,不宜外延;

60直线回归不允许任意外推

61体重X体表面积Y1112131415165.05.56.06.5内插(Interpolate)外推(extrapolate)相关和回归分析的正确应用应用条件(LINE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论