《医学统计学》最新版Ch09相关分析_第1页
《医学统计学》最新版Ch09相关分析_第2页
《医学统计学》最新版Ch09相关分析_第3页
《医学统计学》最新版Ch09相关分析_第4页
《医学统计学》最新版Ch09相关分析_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Medical Statistics 医学统计学,相关分析 Correlation Analysis,主要内容,引言 数值变量的相关 相关的定义(掌握) 相关的图示(掌握) 相关系数的计算(掌握) 相关系数的假设检验(掌握) 相关系数的区间估计(了解) 两样本相关系数的比较(了解) 分类和等级变量的相关 行列表资料的关联性(熟悉) 等级资料的关联性(熟悉) 相关分析的正确应用(掌握),一个分析实例:3岁男童体重与体表面积,分析方法之一,将10名儿童按体重分为两组(三组) 结论:体重较重的一组3岁男童,体表面积也较大。,分析方法之二,如果想得到的结论为: 体重越重,体表面积越大。 关联的密切程度

2、 相关分析 体重为X时,体表面积估计为多少? 数量依存关系 回归分析,相关关系与确定性关系,所谓确定性关系是指两变量间的关系是函数关系。已知一个变量的值,另一个变量的值可以通过这种函数关系精确计算出来。 C =2R y=ax2+bx+c 非确定性关系是指两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。 青少年身高随年龄增长而增高; 体表面积与体重有关,数值变量的相关,相关的定义(掌握) 相关的图示(掌握) 相关系数的计算(掌握) 相关系数的假设检验(掌握) 相关系数的区间估计(熟悉) 两样本相关系数的比较(了解),相关的定义,当两个数值变量之间出现如下情况:当一个变量增大,另一个也随

3、之增大(或减少),我们称这种现象为共变,也就是有相关关系(correlation) 。 若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positive correlation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negative correlation)。 直线相关(linear correlation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。,相关系数,用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数(correlation coefficient),又称为积差相关

4、系数(coefficient of product-moment correlation),Pearson相关系数 。 总体相关系数用希腊字母表示,而样本相关系数用r表示,取值范围均为-1,1。,绘制散点图!,直线相关的图示,r =-1,-1r 0,r =0,直线相关的图示与相关系数的关系,0r 1,r =1,直线相关系数的计算,离均差积和,离均差平方和,绘制散点图,相关系数的计算,相关系数的假设检验,H0:0,两变量间无直线相关的关系; H1:0,两变量间有直线相关的关系。,例,试对例10.1资料相关关系是否存在进行假设检验,并估计总体相关系数。 H0:体重与体表面积无相关关系; H1:体重

5、与体表面积有相关关系。 =0.05。 = n-2=10-2=8 按自由度 =8查附表2 t界值表,得P0.001。按=0.05水准,拒绝H0,接受H1,故可认为3岁男童的体重与体表面积之间有正相关关系。,总体相关系数的区间估计,从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。,相关系数的抽样分布( = - 0.8),在一个总体相关系数为-0.8的总体中,进行随机抽样,每次抽取10个个体,测量其X和Y值,并计算样本相关系数,重复1000次,将所得的相关系数绘制成频数图。,相关系数的抽样分布( = 0),相关系数的抽样分布( =0.8),R.A. Fisher(1921) 的 z 变换

6、,z 近似服从均数为 , 标准差为 的正态分布。,相关系数的z 值的抽样分布( = - 0.8),相关系数的z 值的抽样分布( = 0),相关系数的z 值的抽样分布( = 0.8),相关系数的可信区间估计,将 r 变换为 z ; 根据 z 服从正态分布,估计 z 的可信区间; 再将 z 变换回 r 。,相关系数的可信区间估计,Fishers 变换 r z 正态近似 Fishers 反变换 的95CI z的95CI,两样本相关系数的比较,某医院分别测定正常成年男子12人和正常成年女子12人的心率(X,次/分)与心脏左室电机械收缩时间QS(Y,毫秒) ,试比较男子和女子的心率(次/分)与心脏左室电

7、机械收缩时间QS(毫秒)的相关是否相同。,Step 1: 散点图,男,女,Step 2: 计算样本相关系数,男子的相关系数: 女子的相关系数:,Step 3: 检验两总体相关系数是否为0,=122=10,则P10.001,P20.20,故尚不能认为男子和女子的心率与心脏左室电机械收缩时间间的相关系数不等。,分类和等级变量的相关,定性资料的关联性(熟悉) 四格表资料的列联相关系数 RC表资料的列联相关系数 等级资料的关联性(熟悉),定性资料的关联性分析(association),定性指标间的相关程度和方向常用列联系数(contingency coefficient)来表示。,例:四格表资料的相关

8、分析,某中医师采用两种方法观察舌象200例,试分析两种观察方法的结果有无联系?,相关系数计算,列联相关系数的假设检验,列联相关系数的假设检验,列联相关系数的假设检验,如果两法没有相关性,那么在乙法判断为阳性和阴性的病例中,甲法判断为阳性的比例应该相同!即a/(a+b)=c/(c+d) 检验行间的构成比或者率!2检验,H0:两种方法观察舌象的结果无相关; H1:两种方法观察舌象的结果有相关。 =0.05。 =1 查附表3 2界值表,得P0.005,按=0.05水准,拒绝H0,接受H1,认为甲乙两种方法观察舌象的结果有相关关系。,当用0、1分别编码“”、“”时,点相关系数等于Pearson系数。,

9、行列表资料的相关分析,Cramr修正列联系数C较适合于定性资料的相关 C的取值范围在01之间,0表示不相关;越接近于1表示关系越密切;1表示完全相关。 C只表示两指标间的相关程度,并不表示相关方向。,某人按两种血型系统统计某地6094人的血型分布,结果见表10.5,问两种血型的分布间有无关系?,注意: Cramr修正列联系数对行或者列的顺序信息是不敏感的!,等级资料的相关,Spearman等级相关 将各变量X,Y分别编秩RX, RY; 计算RX与RY的Pearson相关; 所得结果即为Spearman等级相关rS。 -1rs1,例 抗白指数与临床疗效的关系,某研究所用野百合治疗白血病,并作抗白

10、血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系? 病例号 抗白指数X 临床疗效Y (1) (2) 1 2 + 2 3 + 3 9 + 4 10 + 5 11 + 6 30 7 35 8 45 9 55 + 10 70 + 11 88 12 90 ,RX (3) 1 2 3 4 5 6 7 8 9 10 11 12,RY (4) 9 9 9 11.5 11.5 3 3 3 6.5 6.5 3 3,将X,Y分别由小到大编秩。其中Y有相同等级,分别取平均秩次。 计算等级相关系数rs。,等级相关的假设检验,H 0:S0,抗白指数与疗效无相关关系; H 1: S0,抗白指数与疗效有

11、相关关系。 = 0.05。 当n50时,用查“等级相关界值表”; 当n50时,用 t 检验: t 服从自由度为n-2的 t 分布。,本例,n=12,查附表15 rs界值表得,双侧 (0.05,12) =0.587,P50,计算t值 查附表2 t界值表,P0.05,说明儿童智力等级与母亲文化程度间存在正等级相关关系。,等级相关的含义,等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。,例1 X Y 1 1 2 2 3 3 4 4 5 5,例2 X Y 1 1 2 4 3 9 4 16 5 25,例3 X Y 1 1 2 1.1 3 1.2 4 1.3 5 1.4,例4 X Y 1

12、1 2 10 3 100 4 1000 5 10000,相关分析的正确应用,相关关系是一种共变关系,不一定是因果关系。 谨防多个变量间的相关性所带来的虚假关系 充分利用散点图 判断线性趋势 判断离群值 排除资料的间杂性 直线相关分析对资料本身的要求:双变量正态分布 当样本含量较大时,统计学检验的作用减小; 多个变量间的相关分析要使用多重相关。(multiple correlation) 关联性和差异性是辨证统一的!,散点图的作用,飞行员的着陆次数(x)与焦虑程度(Y),散点图的作用,识别离群值;,离群值对相关的影响,排除间杂性,(a),(b), 样本甲观察点 样本乙观察点,样本的间杂性对相关和

13、回归的误导,二元正态分布,二元正态分布的密度函数为:,二元正态分布曲面(11=1,22=1,12=0),二元正态分布曲面(11=1,22=1,12=0),二元正态分布曲面(11=2,22=4,12=0.75),二元正态分布曲面(11=2,22=4,12=0.75),二元正态分布曲面(11=2,22=4,12=0.75),二元正态分布曲面剖面(11=1,22=1/2,12=0.75),多个变量间的相关,因此,谈到多个变量间的相关性时,往往要说在扣除了其他变量的影响后,考察某两个变量的相关性。 偏相关(Partial Correlation),关联性和差异性,何为关联? 两个变量中一个发生变化,另一个也随之变化 如果X为分组变量,Y为观察结果 那么所谓关联性,意味着X的取值变化(对应于不同分组),Y的平均水平(均数、率)出现有统计学意义的变化。 故关联性=差异性!,例:关联性=差异性,某医院用某新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/l)如下,问新药与常规药物的疗效有无差别? t = 1.0195,P = 0.3215 新药与常规药物的疗效无差别。,例:关联性=差异性,以group=0做为新药组, group=1做为对照药组。 Pearson相关系数r=-0.2336

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论