医学统计学(第3版)课件 第十一章 两变量之间关系的分析相关与回归_第1页
医学统计学(第3版)课件 第十一章 两变量之间关系的分析相关与回归_第2页
医学统计学(第3版)课件 第十一章 两变量之间关系的分析相关与回归_第3页
医学统计学(第3版)课件 第十一章 两变量之间关系的分析相关与回归_第4页
医学统计学(第3版)课件 第十一章 两变量之间关系的分析相关与回归_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章两变量之间关系的分析医学统计学目录简单线性相关1简单线性回归2秩相关3相关与回归的区别与联系42一、基本概念两个变量之间,一个增大,另一个也相应地增大(或是减小),这种现象称为共变,也就是这两个变量之间有“相关关系”。如果两个变量的关系呈线性趋势,表明这两个变量间线性相关(linearcorrelation),又称简单相关(simplecorrelation),简称相关(correlation)。图10.2肝癌患者血清胆固醇与三酰甘油关系散点图3一、基本概念线性相关系数(linearcorrelationcoefficient):又称Pearson积差相关系数(Pearsonproductmomentcoefficient),用以定量描述两个变量间线性关系的密切程度与相关方向的统计指标。符号:样本r

总体

资料要求:两个变量均服从正态分布,即双变量正态分布。4XX一、基本概念5(d)(b)(a)(c)正相关Positivecorrelation负相关Negativecorrelation完全正相关完全负相关线性(直线)关系YYXYXY(f)(e)零相关/不相关零相关/不相关(g)零相关/不相关(h)非线性相关/曲线相关XYXYXYXY图11.1不同r值的相关系数示意图患者序号血清胆固醇三酰甘油14.891.4823.411.0135.701.30………………………………203.631.15213.890.78二、相关系数的计算例11.1某临床医生共

测定了21名肝癌患者血清中胆固醇(mmol/L)和三酰甘油的含(mmol/L)量,问肝癌患者血清中胆固醇与三酰甘油有无线性相关关系?表11.121例肝癌患者血清胆固醇与三酰甘油相关性研究6二、相关系数的计算图11.2肝癌患者血清胆固醇与三酰甘油关系散点图2.计算例11.1中血清胆固醇与三酰甘油的样本相关系数绘制散点图

≠0?71.建立检验假设,确定检验水准

H0:ρ=0(两变量间无线性相关关系)

H1:ρ≠0(两变量间有线性相关关系)

=0.052.查表根据

=n-2,查r临界值表,Pearson相关系数检验用。

︱r︱>界值,P<

。r的绝对值越大,概率P越小。三、相关系数的统计推断81.建立检验假设,确定检验水准

H0:ρ=0(两变量间无线性相关关系)

H1:ρ≠0(两变量间有线性相关关系)

=0.052.查表根据

=n-2,查r临界值表,Pearson相关系数检验用。

︱r︱>界值,P<

。r的绝对值越大,概率P越小。三、相关系数的假设检验91.建立检验假设,确定检验水准

H0:ρ=0(两变量间无线性相关关系)

H1:ρ≠0(两变量间有线性相关关系)

=0.052.查表3.下结论按

=0.05水准拒绝H0,接受H1,可以认为肝癌患者血清胆固醇与三酰甘油之间有线性相关关系。三、相关系数的假设检验10三、相关系数的假设检验相关系数的假设检验(t检验)步骤:1.建立检验假设,确定检验水准

H0:ρ=0(两变量间无线性相关关系)

H1:ρ≠0(两变量间有线性相关关系)

=0.052.计算检验统计量t值:

=21-2=1911三、相关系数的假设检验3.确定P值,下结论查t界值表得t0.05/2,19=2.093,t=6.086>

t0.05/2,19,P<0.05。按

=0.05水准,拒绝H0,接受H1,可以认为肝癌患者血清胆固醇与三酰甘油之间有线性相关关系。12目录简单线性相关1简单线性回归2秩相关3相关与回归的区别与联系413一、简单线性回归基本概念若有理由认为两变量间存在某种内在联系,且某一变量Y随着另一变量X的变动而变动,其散点图呈直线趋势,则统计上把这种描述两变量间依存变化的数量关系的现象称为线性回归。X:自变量(independentvariable),通常也称为解释变量(explanatoryvariable),即Y所依存的变量。*一个自变量,称简单回归(simpleregression)*多个自变量,称多元回归(multipleregression)Y:应变量(dependentvariable),通常也称为反应变量(responsevariable),即被估计或被预测变量。14一、简单线性回归基本概念15图11.2肝癌患者血清胆固醇与三酰甘油关系散点图Y

应变量

(responsevariable)X

自变量

(independentvariable)

三酰甘油胆固醇样本回归方程(11.3)理论回归方程(11.4)图11.2肝癌患者血清胆固醇与三酰甘油关系散点图二、简单线性回归方程的计算残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。在所有的直线中,回归直线的残差平方和是最小的。(最小二乘)16患者序号血清胆固醇三酰甘油14.891.4823.411.0135.701.30………………………………203.631.15213.890.78二、简单线性回归方程的计算例11.2某临床医生共

测定了21名肝癌患者血清中胆固醇(mmol/L)和三酰甘油(mmol/L)的含量,问肝癌患者血清中胆固醇与三酰甘油有无线性回归关系?表11.121例肝癌患者血清胆固醇与三酰甘油相关性研究17计算步骤1.绘制散点图,由散点图(图11.2)可见,两变量间呈直线趋势,故进行下列计算。2.求回归系数b和截距a

3.列出回归方程(绘制回归直线见图11.2)18

b

的意义斜率(slope)

血清胆固醇每增加1mmol/L,

则三酰甘油平均增加0.2353mmol/Lb

的单位为(Y的单位/X的单位)19

三、直线回归中的假设检验20样本回归方程(一)回归方程的假设检验b0能否说明总体中血清胆固醇(X)与三酰甘油(Y)有线性关系存在(即β≠0)呢?

变异来源离均差平方和(SS)自由度均方(MS)F总变异

回归1剩余

表10.4回归分析的方差分析表1.建立假设,确定检验水准H0:β=0肝癌患者血清胆固醇与三酰甘油无线性回归关系。H1:β≠0肝癌患者血清胆固醇与三酰甘油有线性回归关系。α=0.052.计算统计量SS总

=lYY=1.8474SS回

=b×lXY

=lXY2/lXX=1.2236SS残=SS总-

SS回=lYY-

lXY2/lXX=0.6238=37.269表10.5例102资料的方差分析计算表变异来源SSDFMSFP总变异1.847420

回归1.223611.223637.269<0.05剩余0.6238190.03283

3.确定P值按

=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为肝癌患者血清胆固醇含量与三酰甘油含量有线性回归关系。2.t检验回归系数的标准误回归的剩余标准差241.建立假设,确定检验水准H0:β=0肝癌患者血清胆固醇与三酰甘油无线性回归关系。H1:β≠0肝癌患者血清胆固醇与三酰甘油有线性回归关系。α=0.052.计算统计量t=6.1117,v=n-2=19253.确定PZHI

t检验和方差分析的结果是等价的263.确定P值,下结论。目录简单线性相关1简单线性回归2秩相关3相关与回归的区别与联系427一、秩相关的基本概念与计算若不满足双变量正态分布总体分布未知原始数据用等级表示的资料。—秩相关(rankcorrelation)总体Spearman秩相关系数:

s样本Spearman秩相关系数:rs又称为等级相关系数,间接反应两个变量之间等级上的相关性而不依赖于变量的分布。28一、秩相关的基本概念Spearman等级相关rs:相同秩次的例数较多时:29二、等级相关系数的计算例11.6为了研究肝癌病人分期与血清甲胎蛋白水平之间的相关关系,某研究人员收集了10例肝癌病人的数据。问:肝癌病人分期与血清AFP是否有相关关系?30表11.9肝癌病人分期与AFP(ng/mL)相关关系研究序号12345678910分期IVIIIIVIVIIIIIIIIIIIIAFP9402.02134.812905.045354.011.22.6313.0173.14411.02532.0二、等级相关系数的计算31表11.10肝癌病人分期与甲胎蛋白(ng/mL)Spearman等级相关计算表序号(1)分期X(2)秩次Pi(3)甲胎蛋白Y(4)秩次Qi(5)秩次差值di(6)秩次差值

di2(7)1IV9.09402.08112III6.02134.85113IV9.012905.09004IV9.045354.010-115I1.511.22-0.50.256II3.52.612.56.257II3.5313.04-0.50.258I1.5173.13-1.52.259III6.04411.07-1110III6.02532.0600合计

二、等级相关系数的计算32

s≠0?二、等级相关系数的统计推断33查表法:

当n≤50时,可查rs界值表表,rs超过临界值,拒绝H0;u检验法:当n

>50时,可作u检验。二、等级相关系数的统计推断1.建立检验假设,确定检验水准H0:

ρs=0,肝癌病人分期与AFP水平的无相关关系H1:

ρs≠0,肝癌病人分期与AFP水平的有相关关系2.计算统计量rs34本例n<50,查附表13得r0.05/2,10=0.648,rs=0.9192>r0.05/2,10,故P<0.05。

=0.05的检验水准,拒绝H0,接受H1,可以认为肝癌病人分期与AFP水平的有正相关关系存在。3.确定P值,下结论目录简单线性相关1简单线性回归2秩相关3相关与回归的区别与联系435一、相关与回归的区别1.应用与意义:相关:分析两变量的相互关系,两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归:分析两个变量的依存关系,自变量的改变会引起应变量的变化,是一种单向变化的关系。36一、相关与回归的区别2.研究性质:相关:对两个变量之间的线性关系进行描述,看两个变量是否有关,关系是否密切,是正相关还是负相关。回归:对两个变量定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。

37一、相关与回归的区别3.相关系数r与回归系数b的绝对值反映的意义不同:r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高;b的绝对值越大,回归直线越陡,说明

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论