医学12周相关分析.ppt_第1页
医学12周相关分析.ppt_第2页
医学12周相关分析.ppt_第3页
医学12周相关分析.ppt_第4页
医学12周相关分析.ppt_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

linearcorrelation线性相关,两指标间的关系分析,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,问题的提出,以往方法的局限仅限于考察一个观察指标,问题的提出,人的体重往往随着身高的增加而增加。二者之间是否存在某种关联?如果存在,可否用身高来推测体重的多少?人的肺活量往往随着胸围的增加而增加。举重运动员所能举起的最大重量是否与他的体重有关?,联系与相互影响是普遍的现象,1therelationship,couldyougivemesomeexamplesabouttherelationshipbetweentwovariables?,1therelationshiptypeone,1therelationshiptypetwo,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,2确定性关系与相关关系,确定性的函数关系:两变量间的函数关系。,随机性的相关关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。,圆的周长与半径的关系:c2r速度、时间与路程的关系:lst,青少年身高与年龄的关系;体重与体表面积的关系;,函数关系,是一一对应的确定关系;设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值;各观测点落在一条线上;,相关关系,变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值可能有几个各观测点分布在直线周围,相关关系与确定性关系(2),当对事物的规律了解加深时,相关关系可以转变为确定性关系。父亲患白化病x,(x=是,否);子女患白化病y,(y=是,否);x与y的关系不确定。,当母亲患白化病时,x与y的关系确定:x=是,则y=是;x=否,则y=否。(父亲为异常基因的携带者出外。),直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,3相关关系,当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。,若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positivecorrelation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negativecorrelation)。,3相关关系,直线相关(linearcorrelation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。,直线相关的概念,3相关关系thestory,sirfrancisgalton1822-1911anexplorerandanthropologisthalf-cousinofcharlesdarwin,heredityexperimentsleadtoinitialconceptsofcorrelationandregression.,sweetpeasexperiment(1875)symmetricstudiesofstature(1885),3相关关系thestory,correlationexistsbetweentwovariableswhenoneofthemisrelatedtotheotherinsomeway.,3相关关系thestory,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,4scatterplot(orscatterdiagram)isagraphinwhichthepaired(x,y)sampledataareplottedwithahorizontalxaxisandaverticalyaxis.eachindividual(x,y)pairisplottedasasinglepoint.,散点图(scatterplot)在平面直角坐标系上标识两变量(x,y)间关系的统计图。,figue1plotofdiameterofdaughterseedversusdiameterofparentseedfromthedataintable1.,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,反映两定量指标间的相关关系用pearson相关系数,r。(pearsoncorrelationcoefficient)用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标.,correlationanalysisanalysisofthedegreetowhichchangesinonevariableareassociatedwithchangesinanothervariable.,5pearson相关系数,5pearson相关系数,x的离均差平方和:y的离均差平方和:x与y间的离均差积和:,以下资料选自galton的一项研究,目的是探讨成年时身高是否与两岁时的身高(单位:英寸)有关。,5相关系数的计算,绘制散点图,y成年后身高(单位:英寸),x2岁时的身高(单位:英寸),30,32,34,36,38,40,63,65,67,69,71,5相关系数的计算,5相关系数的计算,例10.110名3岁男童体重与体表面积的关系,编号体重(x,kg)体表面积(y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266,10名3岁男童体重与体表面积散点图,体重(kg),x,体表面积y(103cm2),例10.1资料相关系数的计算,5相关系数的计算,5相关系数的计算,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,6相关系数的性质,-1r1r0为正相关r0为负相关r0为零相关或无相关相关系数绝对值越大,两变量间相关程度越密切;相关系数越接近于0,表示相关越不密切。,6相关系数的性质,r,6相关系数的性质,r=-1,-1r0,r=0,直线相关的图示与相关系数的关系,0r1,r=1,相关系数的正负示意图,体重(kg),x,肺活量y(l),相关系数的大小示意图,r=1,0r1,r=0,exercise,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,7相关系数的含义(了解),协方差(covariance,cov):两个变量与其均值离差乘积的平均数,是相互关系的一种度量。,样本协方差:,7相关系数的含义(了解),对协方差的理解,协方差为大的正值时,表示强的正相关。,对协方差的理解,协方差接近于零时,表示很小或没有线性相关关系。,对协方差的理解,协方差为大的负值时,表示强的负相关。,对协方差的理解,-aretheyright?,-maybe.,cm,kg,mm,kg,大于,基本结论:协方差受计量单位影响,从而不能真实反映相关的程度。,相关系数:协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。,协方差,标准差,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,x,y,8相关系数的假设检验,0,h0:0,亲代种子直径与子代无相关关系;h1:0,亲代种子直径与子代有相关关系。=0.05。t服从自由度为n-2的t分布。,8相关系数的假设检验,table1资料相关系数的假设检验,自由度102,p=0.0020拒绝h0,接受h1。可以认为亲代种子直径与子代之间有正相关关系,相关系数为0.93。,h0:0,体重与体表面积无相关关系;h1:0,体重与体表面积有相关关系。=0.05。t服从自由度为n-2的t分布。,例10.1资料相关系数的假设检验,例10.1资料相关系数的假设检验,自由度102,p0.001拒绝h0,接受h1。可以认为3岁男童体重与体表面积之间有正相关关系。,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,9总体相关系数的区间估计,从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。复习均数的区间估计率的区间估计事件数的区间估计,相关系数的抽样分布(=-0.8),相关系数的抽样分布(=0),相关系数的抽样分布(=0.8),r.a.fisher(1921)的z变换,z近似服从均数为,标准差为的正态分布。,相关系数的z值的抽样分布(=-0.8),相关系数的z值的抽样分布(=0),相关系数的z值的抽样分布(=0.8),相关系数的可信区间估计,将r变换为z;根据z服从正态分布,估计z的可信区间;再将z变换回r。,相关系数的可信区间估计,fishers变换rz正态近似fishers反变换的95ciz的95ci,该可信区间有什么含义?,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,例某医院分别测定正常成年男子12人和正常成年女子12人的心率(x,次/分)与心脏左室电机械收缩时间qs(y,毫秒)的数据见表10.2,试比较男子和女子的心率(次/分)与心脏左室电机械收缩时间qs(毫秒)的相关是否相同。,10两个相关系数的比较(了解),10两个相关系数的比较(了解),男女的心率和电机械收缩时间,分析思路:两组资料的相关性如何?两个相关系数是否相等?由于相关系数并不服从正态分布,因此对两个相关系数的差别的假设检验可以通过z变换的原理,对两个z变换值作假设检验得到。,10两个相关系数的比较(了解),24名成年男女的心率(x)与收缩时间(y)的散点图,男性女性,10两个相关系数的比较(了解),分别对两相关系数是否为0进行假设检验。=122=10,则p10.001,p20.20,故尚不能认为男子和女子的心率与心脏左室电机械收缩时间间的相关系数不等。,10两个相关系数的比较(了解),直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,11分类资料的列联系数,配对四格表的pearson点相关系数列联系数(contingencycoefficient),11分类资料的列联系数,甲法乙法abcd-1rn+1,例10.4两种方法观察舌象结果的相关性,某中医师采用两种方法观察舌象200例,观察结果如下,试分析两种观察方法的结果有无联系?甲法乙法84(a)16(b)20(c)80(d),cramr修正列联系数rc:r,c分别是列联表的行数和列数。2是列联表的2检验。0rc1,11分类资料的列联系数,例10.5两种血型系统的相关性,某人按两种血型系统统计某地6094人的血型分布,结果见表10.5,问两种血型的分布间有无关系?abomn血型血型mnmn合计o4314909021823a3884108001598b4955879502032ab137179325641合计1451166629776094,构成比的检验:h0:不同的abo血型,其mn的血型构成相同;h1:不同的abo血型,其mn的血型构成不同;自由度(4-1)(3-1)6,p0.1979。,11分类资料的列联系数,2为列联表的2。,11分类资料的列联系数,列联系数的假设检验等价于列联表的构成比的假设检验。,11分类资料的列联系数,直线相关分析(linearcorrelationanalysis),1问题的提出therelationship2确定性关系与相关关系3相关关系4散点图5pearson相关系数6相关系数的性质7相关系数的含义8相关系数的假设检验9总体相关系数的区间估计10两个相关系数的比较11分类资料的相关12等级资料的相关13相关分析的正确应用,12等级资料的相关,spearman等级相关将各变量x,y分别编秩rx,ry;计算rx与ry的pearson相关;所得结果即为spearman等级相关rs。-1rs1,例抗白指数与临床疗效的关系,某研究所用野百合治疗白血病,并作抗白血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系?病例号抗白指数x临床疗效y(1)(2)12+23+39+410+511+630735845955+1070+11881290,rx(3)123456789101112,ry(4)99911.511.53336.56.533,rx(3)123456789101112,ry(4)99911.511.53336.56.533,rs=-0.6894,12等级资料的相关,等级相关的假设检验,h0:s0,抗白指数与疗效无相关关系;h1:s0,抗白指数与疗效有相关关系。=0.05。当n50时,用查“等级相关界值表”;当n50时,用t检验:t服从自由度为n-2的t分布。,资料的假设检验,本例n=12,查界值表,得:rs(0.05,12)=0.587即,若h0成立,则等级相关系数有95%的可能在(-0.587,0.587)之间。现rs=-0.6894,故p0.05。可以认为,抗白指数与疗效有等级相关关系。,例母亲文化程度与儿童智商的关系,母亲文化程度儿童智商等级(y)合计(x)中下中等中上上等小学2281303136初中5723613526454高中或中专1111210517245大专及以上1410722合计9143328053857rs=0.2261,大样本时的等级相关检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论