7双变量关联性分析_第1页
7双变量关联性分析_第2页
7双变量关联性分析_第3页
7双变量关联性分析_第4页
7双变量关联性分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、双变量关联性分析授课教师:蒋敏 单变量分析方法(univariateanalysis):t检验、z检验、方差分析 双变量分析方法(bivariableanalysis) :直线回归与相关、秩相关等直线相关关联性分析的目的n 检查两变量间存在的关联性是否具有统计学意义;n 两变量间的关联方向和密切程度。例13.1 某医师为了解胎儿发育迟缓患者的出生体重与2型纤溶酶原激活物抑制剂(PAI-2)的关系,测量了26例患儿的出生体重(g)和PAI-2含量(ng/ml),结果如表13.1。请你据此回答两变量是否有关联?其方向与密切程度如何?n 绘制散点图:观察散点是否随一变量的变化而变化,所有散点是否呈直

2、线关系表13.126例胎儿发育迟缓患者的出生体重和PAI-2含量PAI-2 含量PAI-2 含量(ng/ml, y )出生体重(g, x )出生体重(g, x )编号编号y )(ng/ml,1234567891011121321502050100023009002450235023501900240017001950125018520012525257829060651251227525141516171819202122232425261700200092012701550150019002800360032503000300030501801701225253024200300300200

3、200230图13.126例胎儿发育迟缓患者的出生体重和PAI-2含量的散点图直线相关的概念n 用相关系数描述两变量间直线关系的密切程度和方向n 相关系数又称Pearson 积矩相关系数,样本相关系数用r 表示,总体相关系数用 r 表示相关的种类0 r 1-1 r 0r = 1r = -1r = 0r = 0相关的种类n 正相关:0r10完全正相关: r完全负相关: r1-1n 负相关:-1rn 零相关:r 0n 相关系数没有单位,其值为-1r1相关系数的意义n 相关密切程度:用r的大小表示,r的绝对值越接近于1,说明相关越密切n 相关方向: 用r的正负号表示直线相关的计算步骤n 计算样本相关

4、系数(本例r =0.875)离均差积和(x - x )( y - y )(x - x )2 ( y - y )2lxyr =lxxlyyn 计算样本相关系数(本例r =0.738)(x - x )( y - y )lxyr =(x - x )2 ( y - y )2lxxlyy相关系数的假设检验n 检验r是否来自总体相关系数r为零的总体。n 常用t 检验:= r - 0 =ru = n - 2trS1- r2rn - 2n Ho: r0,两变量间无直线相关关系n H1: r0两变量间有直线相关关系n a0.050.738u = 26 - 2 = 24t = 5.3581- (0.738)226

5、 - 2n 查附表3,t界值表,得p0.001,可以认为发育迟缓患者的出生体重和PAI-2含量之间有线性相关关系。相关分析应用中应注意的问题n 1. 进行相关分析前应先绘制散点图散点图能使我们直观地看出两变量间有无线性关系并发现可能的离群点(outlier),当散点有线性趋势时,才能进行相关分析。n 2. Pearson积矩相关系数的统计推断要求两个随量均服从正态分布直线相关适用于二元正态分布资料,对于不服从正态分布、总体分布未知、存在值或原始数据用等级表示的资料,都不宜用Pearson积矩相关系数来分析相关性。n 3. 出现离群点时慎用相关n 4. 相关关系不一定是因果关系,有可能是伴随关系

6、。进行两变量因果分析时,还需结合专业知识和其他研究方法。n 5. 分层资料不可盲目合并n 3. 分层资料不可盲目合并n 3. 分层资料不可盲目合并n 3. 分层资料不可盲目合并秩相关n 概念采用秩相关(rank correlation),也称等级相关,来分析两个变量间相关的方向与密切程度。该法不 以特定的总体分布为前提,属于非参数统计方法。直线回归与直线相关的区别与联系区别1.资料要求不同回归:y服从正态分布,x没有特别的要求。相关:x和y服从双变量正态分布(若x数值系人为选定,莫作相关例 药物的剂量-反应关系)区别2.应用情况不同回归:反映两变量间的数量关系(b)相关:反映两变量间互依的程度

7、和方向(r)n 提问方式不同年龄增加,血压发生什么样的变化?年龄和血压之间有关系吗?联系1.方向一致:对同一组数据若同时计算r和b,其正负号是一致的Question: r和b的大小有关系吗?r较大,是否b也较大?联系2.假设检验等价:r和b的假设检验是等价的,即对同一样本,两者的t值相等,检验结果完全一致联系3.用回归解释相关r的平方称为决定系数l2l2lSS=xy=xyxx=r2回lxxlyylyySS总决定系数r2n 表示回归平方和占总平方和的比例,即应变量y的总 变异中由自变量x可以解释的比例。n SS回越接近于SS总,则r2越接近于1,说明引入相关变量的效果越好n 当相关系数较小时,若

8、引入回归,可能由于减少的 误差太少而无实际意义examplen 如 r0.20,n100时,P0.05,r有统计学意义。但r20.04,表示SS回在SS总中仅占4,说明两变量相关分析的实际意义不大。应用直线回归和相关的注意点1、作回归和相关分析之前,先绘制散点图2、据资料的性质正确选用回归和相关3、用回归方程进行预测的时候,应当谨慎。X不能偏离实测范围太远,否则偏差太大。exampley = 81.54 +1.222xx:2050妇女年龄y:血压x0时,y = 81.54应用直线回归和相关的注意点4、相关关系不一定是因果关系,也可能是伴随关系n 如某生春种一植物,不久长出幼苗。恰邻院盖楼,细心

9、观测,苗长楼增。计算发现,苗高与楼高具 有相关性。n 两者是否真有内在联系?例:18751920,美国年铁制品产量与英国年出生率相关系数为-0.98因素:社会、经济、技术应用直线回归和相关的注意点5、不能只根据相关系数的绝对值大小来判断相关的密切程度,应首先作假设检验例:r=0.601r=0.401n=8n=42p=0.100.20p=0.0050.016、r 和b为零仅说明没有变量间没有直线关系, 不能说明变量间没有关系直线回归与直线相关分析的联系与区别联系 对于服从双变量正态分布的同一组数据,既可作 直线相关分析又可作直线回归分析,相关系数与 回归系数正负号一致。本例:r=0.762 b=2.11 对于同一样本,相关系数与回归系数的假设检验等价 。tb=tr 对于服从双变量正态分布的同一组资料 用回归可以解释相关:R2 = SS/ SS= r2回总r =bSxSy区别 资料要求:直线相关要求双

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论