预防医学 相关与回归学习资料_第1页
预防医学 相关与回归学习资料_第2页
预防医学 相关与回归学习资料_第3页
预防医学 相关与回归学习资料_第4页
预防医学 相关与回归学习资料_第5页
已阅读5页,还剩70页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

双变量关联性分析问题的提出

某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,如下表。据此回答两变量是否有关联?其方向与密切程度如何?关联性分析的目的推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。主要内容直线相关秩相关直线相关

linearcorrelation问题的提出

某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,如下表。据此回答两变量是否有关联?其方向与密切程度如何?最直观方法:绘制散点图(scatterplot)

统计学上两个随机变量之间呈直线趋势的关系被称为直线相关。直线相关系数(linearcorrelationcoefficient):定量描述两变量间直线关系的方向和密切程度。直线相关系数(linearcorrelationcoefficient)又称Pearson

积矩相关系数(productmomentcorrelationcoefficient)离均差乘积和相关系数r

的性质

,其正负表示两变量间直线相关的方向;

r

绝对值大小表示两变量之间直线联系的密切程度。具体步骤绘制散点图观察两变量间是否有直线趋势。计算相关系数相关系数的统计推断(假设检验)1.t检验(1)建立假设检验,确定检验水准,即体重和双肾体积之间无直线相关关系

,即体重和双肾体积之间有直线相关关系

(2)计算检验统计量

(3)确定P值并作出统计推断

查t界值表,得,按=0.05水准,拒绝,接受,相关系数有统计学意义,可以认为体重和双肾体积之间有直线相关关系。2.

查表法直接查相关系数界值表,

=0.514,

=0.760,

,结果与t检验法一致。注意事项进行相关分析前应先绘制散点图有无线性关系有无离群点(outlier)出现离群点时慎用相关(a)注意事项线性相关分析要求两个随机变量服从二元正态分布。注意事项相关关系不一定是因果关系。

注意事项观察例数较少(如n<15)时,相关系数容易受个别观察对象的特殊值影响。分层资料不可盲目合并。(b)(c)秩相关(等级相关)

rankcorrelation问题的提出例13.4某研究者对15例30~50岁成年男子的舒张压(mmHg)与夜间最低血氧含量分级进行研究,试分析两者的关联性。资料列于下表。

某医生欲研究血小板浓度和出血症的关系,测得12名病人的血小板浓度(109/L)和出血症如下表:秩相关的适用条件

不服从二元正态分布

用等级资料表示的原始资料

总体分布未知或边界不确定的资料基本思想

对于不符合正态分布的资料,不用原始数据计算相关系数,而是按其取值由小到大排秩,然后根据其秩次来计算秩相关系数。例13.4某研究者对15例30~50岁成年男子的舒张压(mmHg)与夜间最低血氧含量分级进行研究,试分析两者的关联性。资料列于下表。设有n例观察对象,对每一例观察对象同时取得两个测定值(Xi,Yi),分别按Xi,Yi

(i=1,2,…,n)

的值由小到大排秩为1,2,…,n。它们的秩分别为与,将及的秩次直接代入直线相关系数的计算公式可得到Spearman秩相关系数。具体步骤计算相关系数的假设检验当n≤50时,可用查表法(查附表15,界值表)。当n>50时,按式(13.4)和(13.5)进行t检验。ν=n-2建立假设检验,确定检验水准,即舒张压与夜间最低血氧含量分级无相关关系

,即舒张压与夜间最低血氧含量分级有相关关系(2)计算检验统计量本例,直接查等级相关系数界值表,得=0.779

。(3)确定P值并作出统计推断

=0.779,P<0.001,按水准,拒绝,接受,可以认为舒张压与夜间最低血氧含量分级之间有正相关关系。

直线回归分析主要内容直线回归方程的建立直线回归的统计推断直线回归的应用直线回归需注意的问题直线回归与直线相关的联系与区别医学领域里常常需要研究两个变量之间的关系,例如:人的身高与体重,体温与脉搏次数,年龄与血压,药剂量与疗效,体表面积与肺活量,身高与臂长……

两变量关系的密切程度可以用直线相关衡量;两变量的数量变化关系可以用直线回归衡量。

直线回归概念直线回归(linearregression)用来研究两个连续型变量之间数量上的线性依存关系。

因变量(dependentvariable)常用y表示自变量(independentvariable)常用x表示例某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用磁共振成像法测量其腹腔内脂肪面积(cm2),结果如表14.1所示。试建立腹腔内脂肪面积和腰围的直线回归方程。为了直观了解腹腔内脂肪面积与腰围的关系,以这20名男性志愿者的腰围为横坐标,腹腔内脂肪面积为纵坐标绘制散点图图14.1两变量直线回归关系散点图腹腔内脂肪面积

(cm2)腰围

(cm)函数关系与回归关系函数关系:自变量取某一数值时,应变量有一个完全确定的数值与之对应,如:y=2x+1回归关系:变量间虽然存在一定的关系,但关系不是十分确定,如本例。直线回归方程:

为自变量的取值为当

取某一值时应变量y的平均估计值为截距(intercept),即当时y的平均估计值b为回归系数(regressioncoefficient),表示改变一个单位

时y的平均改变量。

a>0a=0a<0b>0:每增加(减少)一个观测单位,增加(减少)b个单位。b>0b<0:每增加(减少)一个观测单位,减少(增加)|b|个单位。b<0b=0:与

没有直线回归关系。b=0回归方程的估计原理:最小二乘法(leastsquaremethod)

各实测点到直线的纵向距离平方之和达到最小计算公式本例

故所求回归方程为:直线回归的统计推断样本回归系数b总体回归系数β对β的两种假设检验方法:方差分析法

t检验法t检验法公式:其中:本例查t界值表,得P<0.001,结论与方差分析法一致实际上:对同一资料作总体回归系数是否为0的假设检验,方差分析和t检验是一致的。总体回归系数的区间估计本例:直线回归分析的应用因变量总体条件均数的置信区间估计应变量个体y值的预测区间总体条件均数的置信区间估计点估计:

是在给定x=xp下的条件平均值的点估计

的1-α的置信区间估计

公式为:

其中:应变量个体y值的预测区间对于给定的x=xp,y值的预测区间计算公式为:其中:二者的区别(置信带和预测带)直线回归分析需注意的问题回归分析前应绘制散点图(必需有直线趋势时,才适宜作直线回归分析。应注意资料有无离群点(outlier)及离群点的处理。结果的解释及正确应用反映自变量对应变量数量上影响大小的是回归系数,而非P值。

直线回归与直线相关分析的联系与区别联系对于服从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,相关系数与回归系数正负号一致。本例:r=0.762

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论