统计相关分析_第1页
统计相关分析_第2页
统计相关分析_第3页
统计相关分析_第4页
统计相关分析_第5页
免费预览已结束,剩余53页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Linear correlation线性相关两指标间的关系分析陈涛Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University直线相关分析(linear correlation analysis)1 问题的提出 the Relationship 2 确定性关系与相关关系3 相关关系4 散点图5 Pearson相关系数6 相关系数的计算7 相关系数的性质8 相关关系示意图9 相关系数的含义10 相关系数的假设检验11 总体相关系数的区间估计12 相关分析的正确应用问题的

2、提出以往方法的局限仅限于考察一个观察指标问题的提出人的体重往往随着身高的增加而增加。二者之间是否存在某种关联?如果存在,可否用身高来推测体重的多少?人的肺活量往往随着胸围的增加而增加。举重运动员所能举起的最大重量是否与他的体重有关?联系与相互影响是普遍的现象受教育的水平工作后的收入预防疾病支出疾病的发病率1 the RelationshipCould you give me some examples about the relationship between two variables? R1R1R2R1R2R31 the Relationship Type One1 the Relati

3、onship Type Two2 确定性关系与相关关系确定性的函数关系:两变量间的函数关系 。 随机性的相关关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。 圆的周长与半径的关系: C2R 速度、时间与路程的关系:LST 青少年身高与年龄的关系; 体重与体表面积的关系;相关关系与确定性关系(2)当对事物的规律了解加深时,相关关系可以转变为确定性关系。父亲患白化病X, (X=是,否);子女患白化病Y, (Y=是,否);X与Y的关系不确定。当母亲患白化病时,X与Y的关系确定: X=是,则Y=是; X=否,则Y=否。 (父亲为异常基因的携带者出外。)3 相关关系当一个变量增大,另一个

4、也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。 若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positive correlation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negative correlation)。3 相关关系直线相关(linear correlation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。直线相关的概念3 相关关系 The story Sir Francis Galton 1822-1911 an expl

5、orer and anthropologist half-cousin of Charles Darwin Heredity experiments lead to initial concepts of correlation and regression. Sweet peas experiment (1875) Symmetric studies of Stature (1885)3 相关关系 The storyTable 1 Data on Diameters of Parent and Daughter Seeds Generated from Galton (1894) Table

6、 2 in Natural Inheritance .Diameter of Parent Seed(inch) Diameter of Daughter Seed(inch) 1516.771617.281716.921817.351917.692018.282118.29Correlation exists between two variables when one of them is related to the other in some way.3 相关关系 The story4 Scatter plot (or scatter diagram)is a graph in whi

7、ch the paired (x,y) sample data are plotted with a horizontal x axis and a vertical y axis. Each individual (x,y) pair is plotted as a single point.散点图(Scatter plot )在平面直角坐标系上标识两变量(x,y)间关系的统计图。16.51717.51818.515161718192021Figue 1 Plot of Diameter of Daughter Seed versus Diameter of Parent Seed from

8、 the data in Table 1. 反映两定量指标间的相关关系用 Pearson 相关系数,r。 (Pearson correlation coefficient) 用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标.Correlation analysis Analysis of the degree to which changes in one variable are associated with changes in another variable.5 Pearson相关系数5 Pearson相关系数X 的离均差平方和:Y 的离均差平方和:X与Y 间的离均

9、差积和: 以下资料选自Galton的一项研究,目的是探讨成年时身高是否与两岁时的身高(单位:英寸)有关。两岁时的身高(英寸)3930323435363630成年身高(英寸)71636367686870646 相关系数的计算绘制散点图Y 成年后身高(单位:英寸)X 2岁时的身高(单位:英寸)30323436384063656769716 相关系数的计算6 相关系数的计算Table 1 Data on Diameters of Parent and Daughter Seeds Generated from Galton (1894) Table 2 in Natural Inheritance

10、.Diameter of Parent Seed Diameter of Daughter Seed 1516.771617.281716.921817.351917.692018.282118.296 相关系数的计算6 相关系数的计算7 相关系数的性质-1 r 1r0为正相关r0为负相关r0为零相关或无相关相关系数绝对值越大,两变量间相关程度越密切;相关系数越接近于0,表示相关越不密切。r = 0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关8 相关关系示意图r =-1-1r 0r =0直线相

11、关的图示与相关系数的关系0r 1r =1体重(kg),X肺活量Y(L)40424446485052545658602.22.42.62.83.03.23.43.6相关系数的大小示意图r = 1 0 r 1r = 0XY10 相关系数的假设检验0H 0:0,亲代种子直径与子代无相关关系;H 1: 0,亲代种子直径与子代有相关关系。 = 0.05。t 服从自由度为n-2的 t 分布。10 相关系数的假设检验Table 1 资料相关系数的假设检验自由度102,P=0.0020拒绝H0,接受H1。可以认为亲代种子直径与子代之间有正相关关系,相关系数为0.93。11 总体相关系数的区间估计从相关系数不等

12、于0的总体中抽样,样本相关系数的分布是偏态的。 相关系数的抽样分布( = - 0.8)-0.8-0.6-0.4-0.20.00100200300-1.0相关系数的抽样分布( = 0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相关系数的抽样分布( =0.8) 00.20.40.60.81.00100200300R.A. Fisher(1921) 的 z 变换 z 近似服从均数为 ,标准差为 的正态分布。 相关系数的z 值的抽样分布( = - 0.8)00.51.01.52.0050100150200相关系数的z 值的抽样分布( = 0)-2-

13、1012050100150200相关系数的z 值的抽样分布( = 0.8) 01234050100150200相关系数的可信区间估计将 r 变换为 z ;根据 z 服从正态分布,估计 z 的可信区间;再将 z 变换回 r 。相关系数的可信区间估计 Fishers 变换 r z 正态近似 Fishers 反变换 的95CI z的95CI 该可信区间有什么含义? 相关关系不等于因果关系; 相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系; 极端值可能影响相关系数; 注意相关关系成立的数据范围; 警惕虚假相关。12 相关分析的正确应用定量资料在进行相关分析(Pearson相关)前,需作散点图,从散点图的趋势判断是否可以作线性相关分析;12 相关分析的正确应用某地160名20岁男子身高与体重散点图(双变量正态分布) 成都市男中小学生12个年龄组的平均身高 紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照射不同时间的细胞密度(个/mm3)某肿瘤病人的生存率大白鼠进食量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论