《医学统计学》教学课件:第十三章直线相关_第1页
《医学统计学》教学课件:第十三章直线相关_第2页
《医学统计学》教学课件:第十三章直线相关_第3页
《医学统计学》教学课件:第十三章直线相关_第4页
《医学统计学》教学课件:第十三章直线相关_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、例:调查15名男生的胸围和肺活量. 欲了解胸围和肺活量有无线性关系?如果有关其密切程度如何?,编号 胸围 肺活量,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15,72 68 78 66 70 65 74 64 69 71 65 60 70 75 69,2400 2200 2750 1800 2700 2500 2650 2100 2000 2600 2300 1900 2400 2500 2350,第十三章 直线相关与回归,探讨两个变量间的线性关系的一种统计分析方法 直线相关 (linear correlation) (简单相关,simple correlation):

2、 是探讨服从正态分布的两个变量X 和Y 有无线性相 关关系的一种统计方法 直线回归 (linear regression) (简单回归,simple regression): 是探讨两个连续性变量X 和Y 间的数量依存关系的一种统计方法 先确定相关关系- 再作回归,分析其数量上的依存关系,第一节 直线相关,直线相关分析的目的: 解决服从正态分布的两个随机变量X 和Y 是否存在线性关系,以及关系的密切程度和方向. 例如, 血压和年龄, 疗效和药物剂量,胰岛素和血糖, 胸围和肺活量之间是否有关系,我们可以先用简单的图来表示两个变量之间是否有关联. -散点图- 用点的位置表示两变量间的数量关系和变化

3、趋势,15名男生的胸围和肺活量. 试做相关分析.,编号 胸围 肺活量,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15,72 68 78 66 70 65 74 64 69 71 65 60 70 75 69,2400 2200 2750 1800 2700 2500 2650 2100 2000 2600 2300 1900 2400 2500 2350,反映关联的密切程度和方向的指标- 相关系数(correlation coefficient) 样本的相关系数 r,总体的相关系数 . 一.相关系数的特点及意义: 1. 没有单位 2. 取值范围 : -1 r 1 3.

4、r 的绝对值越接近于1,两变量的相关关系的密切程度越高. 4. r0 正相关, r0负相关; r =0无相关; r =1 完全相关,相关系数的定义 (Pearson积差相关系数),二. 相关系数的计算,表. 15名男生的胸围和肺活量. 试做相关分析.,编号 胸围(X) 肺活量(Y),1 2 3 4 5 6 7 8 9 10 11 12 13 14 15,72 68 78 66 70 65 74 64 69 71 65 60 70 75 69,2400 2200 2750 1800 2700 2500 2650 2100 2000 2600 2300 1900 2400 2500 2350,X2

5、 Y2 XY,5184 4624 6084 4356 4900 4225 5476 4096 4761 5041 4225 3600 4900 5625 4761,5760000 4840000 7562500 3240000 7290000 6250000 7022500 4410000 4000000 6760000 5290000 3610000 5760000 6250000 5522500,172800 149600 214500 118800 189000 162500 196100 134400 138000 184600 149500 114000 168000 187500

6、162150,合计 1036 35150 71858 83567500 2441450,r = 0.7194,三. 相关系数的假设检验 基本思想: 检验总体相关系数是否为0, =0? 当实际测得的样本的相关系数r 0时,是总体的相关系数就不等于0,还是总体相关系数等于0,但因抽样误差造成的样本相关系数不等于0. 检验方法: t 检验: 检验步骤: 1. 建立检验假设,确定检验水准 H0: =0, H1: 0, =0.05 2. 计算统计量 t 值,3. 确定P值和判断结果 以自由度df = n-2, 查t界值表(P287,表9-9),确定P值. 查表法: 根据自由度df = n-2,查相关系数

7、 r界值表(表12-3), 确定P值. 算得的r值 表中的r值,则P 其对应的概率.,df =n-2,第二节 直线回归,两个连续性变量之间存在线性相关关系,进一步想要确定它们之间的数量关系,即以一个变量的值去推算另一个变量的值.这种统计分析方法-直线回归分析 直线回归的主要任务: 就是确定两个变量的数量依存关系,即自变量与应变量的关系. 直线回归的方法: 根据两个变量的观察值,去获取一个直线回归方程,并确定一条最合适的回归直线,来描述两个变量变化的数量关系.,一. 直线回归方程 (linear regression equation),X 自变量, 应变量Y的估计值, a 样本回归直线在Y轴上

8、的截距 (intercept) b 样本回归系数(regression coefficient), 回归直线的斜率. b的意义: 表示当X变动一个单位时,Y平均变化多少个单位. b0, Y随X增大而增大; b0, Y随X增大而减小; b=0, X与Y 没有直线线性关系,回归方程中a和 b的计算-最小二乘法原理 回归方程中, a和 b取不同的数值可以获得不同的回归直线. 当获得的回归直线,能保证各实测点到直线纵向距离的平方和为最小时,这时的a和 b的值是最适宜的. 根据公式求出a和 b的值.,例 前面相关分析的结果, 胸围和肺活量之间存在线性相关关系,进一步作回归分析. 根据基本数据分别计算 a

9、 和 b,建立回归方程.,肺活量 = -772.5211+45.1137胸围,二. 样本回归系数的假设检验 基本思想: 同相关系数的假设检验. 即判断b是否从回归系数为 0 (=0) 的总体中随机抽得的. 检验方法: t检验 也可以用相关系数的假设检验代替. 同一个样本相关系数有统计学意义,则回归系数必然有统计学意义.,检验步骤: 1.建立假设,确定检验水准 H0: =0, H1: 0, =0.05 2. 计算统计量 3. 确定P值,判断结果 查 t 界值表,df =n-2,三、直线回归方程的应用,描述两变量间的数量依存关系 利用回归方程进行预测 进行统计控制,第三节 直线相关与回归分析的关系

10、,直线相关与回归的联系: 1. 对于符合相关回归条件的资料, 相关系数与 回归系数的正负号相同 2. 相关与回归系数的假设检验是等价的. 3. 可以用回归解释相关 决定系数=r2 r2=SS回/SS总 SS总 表示应变量Y的总变异,即离均差平方和 SS总=SS回+SS剩余 SS回- 反映Y的总变异中可以用X解释的部分 r2越接近1,相关和回归效果越好,直线相关与回归的区别: 1. 对变量X、Y的要求不同 相关要求变量X、Y是正态分布的随机变量 回归要求变量Y是正态随机变量,X可以是精确测量 或严格控制的变量,也可以是正态分布的随机变量。 2. 意义不同 应用时应注意的问题: 1. 相关关系不一定是因果关系 2. 不能只根据相关系数的绝对值大小来推断有无相关关系及关系的密切程度,而应作假设检验 3. 回归方程一般只适用于自变量X的实测数据的范围内,不能随意外推. 4. 进行相关回归分析要具有实际意义.,第四节 Spearm

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论