




已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
两指标间的关系分析,Linearcorrelation线性相关,By李奕辰E-mail:liyichen17,内容提要:,10.1确定性关系与相关关系10.2定量资料的相关10.3定性资料的相关10.4等级资料的相关10.5相关分析的正确应用,End,问题的提出,以往方法的局限仅限于考察一个观察指标,问题的提出,人的体重往往随着身高的增加而增加。二者之间是否存在某种关联?如果存在,可否用身高来推测体重的多少?儿童所能发出的最长音调往往和年龄有关。同样,是否可以建立年龄和音调长度的数量关系?人的肺活量往往随着胸围的增加而增加。举重运动员所能举起的最大重量是否与他的体重有关?,10.1相关关系与确定性关系,确定性关系:两变量间的函数关系圆的周长与半径的关系:C2R速度、时间与路程的关系:LSTX与Y的函数关系:Ya+bX非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;年龄与血脂的关系;身高与体重的关系;体重与体表面积的关系;药物浓度与反应率的关系;,相关关系与确定性关系(2),当对事物的规律了解加深时,相关关系可以转变为确定性关系。父亲患白化病X,(X=是,否);子女患白化病Y,(Y=是,否);X与Y的关系不确定。,当母亲患白化病时,X与Y的关系确定:X=是,则Y=是;X=否,则Y=否。(父亲为异常基因的携带者除外。),10.2定量资料的相关,反映两定量指标间的相关关系用Pearson相关系数。(Pearsoncorrelationcoefficient),当两个数值变量之间出现如下情况:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,也就是有相关关系。若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positivecorrelation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negativecorrelation)。,用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数(correlationcoefficient),又称为积差相关系数(coefficientofproduct-momentcorrelation),Pearson相关系数。总体相关系数用希腊字母表示,而样本相关系数用r表示,取值范围均为-1,1。,KarlPearson,英国统计学家1901年10月与Weldon,Galton一起创办Biometrika提出了2检验发展了相关和回归,KarlPearson18571936,例10.110名3岁男童体重与体表面积的关系,编号体重(X,kg)体表面积(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266,10名3岁男童体重与体表面积散点图,体重(kg),X,体表面积Y(103cm2),Pearson相关系数的计算,X的离均差平方和:Y的离均差平方和:X与Y间的离均差积和:,相关系数的性质,-1r1r0为正相关r0为负相关r0为零相关或无相关,相关关系示意图,r=-1,-1r0,r=0,直线相关的图示与相关系数的关系,0r1,r=1,相关系数的含义,相关系数的正负,体重(kg),X,体表面积Y(103cm2),相关系数的正负,体重(kg),X,体表面积Y(103cm2),例10.1资料相关系数的计算,相关系数的假设检验,H0:0,体重与体表面积无相关关系;H1:0,体重与体表面积有相关关系。=0.05。t服从自由度为n-2的t分布。,例10.1资料相关系数的假设检验,自由度102,P0.001拒绝H0,接受H1。可以认为3岁男童体重与体表面积之间有正相关关系。,总体相关系数的区间估计,从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。,相关系数的抽样分布(=-0.8),相关系数的抽样分布(=0),相关系数的抽样分布(=0.8),R.A.Fisher(1921)的z变换,z近似服从均数为,标准差为的正态分布。,相关系数的z值的抽样分布(=-0.8),相关系数的z值的抽样分布(=0),相关系数的z值的抽样分布(=0.8),相关系数的可信区间估计,(1)将r变换为z;(2)根据z服从正态分布,估计z的可信区间;(3)再将z变换回r。,相关系数的可信区间估计,r,Fishers变换z,正态近似Z的95CI,Fishers反变换,的95CI,例10.2相关系数的可信区间,r=0.9579,则z的95%可信区间:1.91981.960.3780=(1.1789,2.6607)的95%可信区间:0.82710.9903,例10.324名成年男女的心率(X)与收缩时间(Y),男性女性心率收缩时间心率收缩时间(次/分)(毫秒)(次/分)(毫秒)574055639161393594106339763387664006737467380673856838368376693767037870382723847538875370793667935083370873578634594329,24名成年男女的心率(X)与收缩时间(Y)的散点图,男性女性,24名成年男女的心率(X)与收缩时间(Y)的相关分析,男性女性相关系数-0.8827-0.9179t值5.93987.3149P值0.00010.0001z变换值-1.3897-1.5755,两相关系数的比较,H0:男子心率与心脏左室电机械收缩时间的相关系数与女子的相等,12;H1:男子心率与心脏左室电机械收缩时间的相关系数与女子的不等,12。=0.05。P=0.6906。拒绝H0,不可以认为男子心率与心脏左室电机械收缩时间的相关与女子的相等。,10.3分类资料的列联系数,配对四格表的Pearson点相关系数列联系数(contingencycoefficient),10.3.1四格表的列联系数,甲法乙法abcd-1rn+1,例10.4两种方法观察舌象结果的相关性,某中医师采用两种方法观察舌象200例,观察结果如下,试分析两种观察方法的结果有无联系?甲法乙法84(a)16(b)20(c)80(d),列联系数的假设检验,甲法乙法,a,c,d,b,10.3.2列联表的列联系数,Cramr修正列联系数rC:R,C分别是列联表的行数和列数。2是列联表的2检验。0rc1,例10.5两种血型系统的相关性,某人按两种血型系统统计某地6094人的血型分布,结果见表10.5,问两种血型的分布间有无关系?ABOMN血型血型MNMN合计O4314909021823A3884108001598B4955879502032AB137179325641合计1451166629776094,列联系数的假设检验,等价于列联表的构成比的假设检验。,构成比的检验:H0:不同的ABO血型,其MN的血型构成相同;H1:不同的ABO血型,其MN的血型构成不同;自由度(4-1)(3-1)6,P0.1979,不拒绝H0,尚不能认为两种血型分布间有相关关系。,10.4等级资料的相关,Spearman等级相关将各变量X,Y分别编秩RX,RY;计算RX与RY的Pearson相关;所得结果即为Spearman等级相关rS。-1rs1,Spearman,例10.6抗白指数与临床疗效的关系,某研究所用野百合治疗白血病,并作抗白血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系?病例号抗白指数X临床疗效Y(1)(2)12+23+39+410+511+630735845955+1070+11881290,RX(3)123456789101112,RY(4)99911.511.53336.56.533,等级相关的假设检验,H0:S0,抗白指数与疗效无相关关系;H1:S0,抗白指数与疗效有相关关系。=0.05。当n50时,用查“等级相关界值表”;当n50时,用t检验:t服从自由度为n-2的t分布。,例10.6资料的假设检验,本例n=12,查界值表,得:rs(0.05,12)=0.587即,若H0成立,则等级相关系数有95%的可能在(-0.587,0.587)之间。现rs=-0.6894,故P0.05。可以认为,抗白指数与疗效有等级相关关系。,例10.7母亲文化程度与儿童智商的关系,母亲文化程度儿童智商等级(Y)合计(X)中下中等中上上等小学2281303136初中5723613526454高中或中专1111210517245大专及以上1410722合计9143328053857rs=0.2261,大样本时的等级相关检验,本例n=857,大于50,用t检验:P0.01。可以认为,母亲文化程度与儿童智商等级间存在相关关系,母亲文化程度越高,儿童智商等级亦高。,等级相关的含义,等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。,例1XY1122334455,例2XY112439416525,例3XY1121.131.241.351.4,例4XY11210310041000510000,相关分析的正确应用(1),相关关系是一种共变关系,不一定是因果关系;定量资料在进行相关分析(Pearson相关)前,需作散点图,从散点图的趋势判断是否可以作线性相关分析;,某地160名20岁男子身高与体重散点图(双变量正态分布),成都市男中小学生12个年龄组的平均身高,紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照射不同时间的细胞密度(个/mm3),某肿瘤病人的生存率,大白鼠进食量(X,g)与体重增加(Y,g)的关系,免疫球蛋白A(IgA,g)与火箭电泳高度(Y,mm)的关系,26名病人的胃液的pH值及
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- v架空线路工程施工组织设计方案
- 湿敏器件创新创业项目商业计划书
- 《施工组织设计专项施工方案资料》某市人民医院传染病房工程安全文明施工方案
- 渔业品牌塑造与市场营销创新创业项目商业计划书
- 农作物智能温控大棚种植技术创新创业项目商业计划书
- 工业互联网项目-汇报-1226
- 2025年教师招聘之《幼儿教师招聘》检测卷附参考答案详解(达标题)
- 2025内蒙古呼伦贝尔林业集团有限公司招聘工作人员5人笔试备考及完整答案详解1套
- 教师招聘之《幼儿教师招聘》练习题含答案详解(夺分金卷)
- 教师招聘之《小学教师招聘》过关检测试卷附答案详解【模拟题】
- 2025-2026学年人教版(2024)初中数学七年级上册教学计划及进度表
- 非煤矿山通用三级安全教育培训资料公司级
- 2023年6月浙江省大学英语三级考试真题试卷
- 工业设计概论
- 安全生产标准化管理文件7.事故管理(填写模板)参考模板范本
- 纤维桩粘接及临床操作课件
- 复盘把的经验转化为能力课件
- 500kV倒闸操作(实操课课件)
- 药品专业知识与技能培训
- 针灸治疗肩痛的技术与方法课件
- 铝合金门窗 工程监理实施细则
评论
0/150
提交评论