




已阅读5页,还剩49页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1/53,两指标间的关系分析,linear correlation 线性相关,2/54,内容,相关关系与确定性关系 定量资料的相关 定性资料的相关 等级资料的相关 相关分析的正确应用,3/54,10.1 相关关系与确定性关系,确定性关系:两变量间的函数关系 圆的周长与半径的关系: c2r x与y的函数关系: ya+bx 非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。 收入与消费的关系; 青少年身高与体重的关系;,4/54,当一个变量增大,另一个也随之增大(或减少),称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。 相关关系不一定是因果关系。 反映两定量指标间的直线相关关系用 pearson 相关系数。 (pearson correlation coefficient),10.2 定量资料的相关,5/54,相关关系示意图,6/54,散点图中点的基本情况: 1.正相关(positive correlation) y随x的增加而增加, x随y的增加而增加 ; 2.负相关(negative correlation) y随x的增加而减少, x随y的增加而减少。 3.无相关(zero correlation) 无论x增加还是减少, y不受影响,反之, x也不受y的影响。 4.非线性相关(nonlinear correlation),7/54,直线相关系数(coefficient correlation) 说明具有直线关系的两个变量间相关相关方向和密切程度的统计量。又称为积差相关系数(coefficient of product-moment correlation),pearson相关系数 。样本来源于正态总体。 总体相关系数用希腊字母 表示,而样本相关系数用 r 表示。,8/54,pearson相关系数的计算,x 的离均差平方和: y 的离均差平方和: x与y 间的离均差积和:,10/54,离均差平方和、离均差积和的展开:,11/54,相关系数的特点: (1)相关系数r是一个无量纲的数值,-1r1; (2)符号表示相关的方向:r0为正相关,r0为负相关,r=0为无线性关系; (3) r的绝对值表示相关的密切程度: 绝对值越接近于1,相关性越好;绝对值越接近于0,相关性越差。,12/54,例10.1 10名3岁男童体重与体表面积的关系,编号 体重(x,kg) 体表面积(y,103cm2) 1 11.0 5.283 2 11.8 5.299 3 12.0 5.358 4 12.3 5.292 5 13.1 5.602 6 13.7 6.014 7 14.4 5.830 8 14.9 6.102 9 15.2 6.075 10 16.0 6.411 合计 133.4 57.266,13/54,分析步骤,1、散点图 2、计算相关系数计算 3、相关系数的假设检验,14/54,10名3岁男童体重与体表面积散点图,体重/kg x,体 表 面 积 y/ 103cm2,15/54,例10.1资料相关系数的计算,16/54,17/54,10.2.2 相关系数的假设检验,h 0:0,体重与体表面积无相关关系; h 1:0,体重与体表面积有相关关系。 = 0.05 t 服从自由度为 n-2 的 t 分布。,18/54,例10.1资料相关系数的假设检验,自由度:v102,p0.001 拒绝 h0,接受 h1。可以认为3岁男童体重与体表面积之间有强的 正的 线性的 相关关系。,19/54,10.2.3 总体相关系数的区间估计,相关系数 分布 相关系数 =0 样本相关系数的分布是对称的,当样本含量较大时,近似正态分布 相关系数不等于0 样本相关系数的分布是偏态, =0, = -0.8, =0.8,z,z,z,21/54,z变换(双曲正切变换),r.a.fisher(1921)提出的,其反变换,z值 的分布 变换值 z 近似服从均数为 标准差为 的正态分布 将相关系数 r 变换为 z 值,并按正态分布原理估计 z 的 100(1- )%的可信限,然后再进行反变换,求出的可信区间,23/54,以例10.1数据为例,试计算总体相关系数 的95%及99%可信区间,z的95%可信区间: 1.91981.960.3780 = (1.1789,2.6607) z的99%可信区间: 1.91982.580.3780 = (0.9446,2.8950),24/54,的95%可信区间:0.82710.9903 的99%可信区间:0.73730.9939,25/54,10.2.4 两样本相关系数的比较,例10.3 某医院分别测定正常成年男子12人和正常成年女子12人的心率(x,次/分)与心脏左室电机械收缩时间qs(y,毫秒)的数据见表10.2,试比较男子和女子的心率(次/分)与心脏左室电机械收缩时间qs(毫秒)的相关是否相同。,表10.2 24名成年男女的心率(x)与收缩时间(y),27/54,分析思路,分析男、女心率与机械收缩时间是否有关 散点图 相关系数 相关系数假设检验( ?) 比较两相关系数是否相同,28/54,(1)散点图,男,女,29/54,(2) 分别计算两样本相关系数r,男性 女性,30/54,(3) 对两相关系数进行假设检验,统计量,男 女,31/54,=12-2=10,则p10.001,p20.001。故可以认为无论男子和女子,其心率与心脏左室电机械收缩时间均呈负相关关系 。,32/54,(4)比较两总体相关系数是否相等,h0:男子心率与心脏左室电机械收缩时间的相关与女子的相等,12; h1:男子心率与心脏左室电机械收缩时间的相关与女子的不等,12。 =0.10。,作z变换,然后对z值进行分析,33/54,34/54,35/54,p0.20,故尚不能认为男子和女子的心率 与心脏左室电机械收缩时间间的相关系数不等。,36/54,10.3 定性资料的相关,列联系数 contingency coefficient,37/54,10.3.1 四格表的列联系数,甲法 乙法 a b c d -1 rn +1,38/54,例10.4 两种方法观察舌象结果的相关性,某中医师采用两种方法观察舌象200例,观察结果如下,试分析两种观察方法的结果有无联系? 甲法 乙法 84 (a) 16(b) 20 (c) 80(d),39/54,10.3.2 列联表的列联系数,cramr修正列联系数 rc : r,c分别是列联表的行数和列数。2是列 联表的2检验的2 值。 0 rc 1,40/54,例10.5 两种血型系统的相关性,abo mn血型 血型 m n mn 合计 o 431 490 902 1823 a 388 410 800 1598 b 495 587 950 2032 ab 137 179 325 641 合计 1451 1666 2977 6094,某人按两种血型系统统计某地6094人的血型分布,结果见表10.5,问两种血型的分布间有无关系?,41/54,构成比的检验: h0: 不同的abo血型,其mn的血型构成相同; h1: 不同的abo血型,其mn的血型构成不同; 自由度(4-1)(3-1)6,p0.1979。,42/54,2为列联表的2。,43/54,列联系数的假设检验,等价于四个表卡方检验和列联表的构成比的假设检验。,44/54,10.4 等级资料的相关(rank correlation),spearman等级相关 将各变量x,y分别编秩rx, ry; 计算rx与ry的pearson相关;10.12 所得结果即为spearman等级相关rs。 -1rs1,45/54,例10.6 抗白指数与临床疗效的关系,某研究所用野百合治疗白血病,并作抗白血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系? 病例号 抗白指数x 临床疗效y (1) (2) 1 2 + 2 3 + 3 9 + 4 10 + 5 11 + 6 30 7 35 8 45 9 55 + 10 70 + 11 88 12 90 ,rx (3) 1 2 3 4 5 6 7 8 9 10 11 12,ry (4) 9 9 9 11.5 11.5 3 3 3 6.5 6.5 3 3,46/54,等级相关的假设检验,h 0:s0,抗白指数与疗效无相关关系; h 1:s0,抗白指数与疗效有相关关系。 = 0.05。 当n50时,用查“等级相关界值表”; 当n50时,用 t 检验: t 服从自由度为n-2的 t 分布。,47/54,例10.6资料的假设检验,本例 n = 12, 查界值表15 ,得: rs(0.05/2,12)=0.587 即,若 h0 成立,则等级相关系数有95%的可能在(-0.587,0.587)之间。 现 rs = -0.6894,故 p 0.05。 可以认为,抗白指数与疗效有等级相关关系。,48/54,例10.7 母亲文化程度与儿童智商的关系,母亲文化程度 儿童智商等级 (y) 合计 (x) 中下 中等 中上 上等 小学 22 81 30 3 136 初中 57 236 135 26 454 高中或中专 11 112 105 17 245 大专及以上 1 4 10 7 22 合计 91 433 280 53 857,x的秩次范围,x的平均秩次,1136 68.5 137590 363.5 591835 713 836835 857,rs=0.2261,y的秩次范围 191 92524 525804 805857 y的平均秩次 46 308 664.5 831,49/54,大样本时的等级相关检验,本例 n =857,大于50,用 t 检验: p0.01。 可以认为,母亲文化程度与儿童智商等级间存在相关关系,母亲文化程度越高,儿童智商等级亦高。,50/54,等级相关的含义,等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。,例1 x y 1 1 2 2 3 3 4 4 5 5,例2 x y 1 1 2 4 3 9 4 16 5 25,例3 x y 1 1 2 1.1 3 1.2 4 1.3 5 1.4,例4 x y 1 1 2 10 3 100 4 1000 5 1000
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 玛丽波尔卡打击乐课件
- 市场监管放心码信息归集和公示规范编制说明
- 安全教育活动培训制度内容课件
- 狼和鸭子课件
- 高校青蓝工程方案(3篇)
- 电池碰撞实验工程方案(3篇)
- 牧场安全规范培训内容
- 农业品牌创新驱动:2025年资金申请战略研究报告
- 历年保研面试题库及答案
- 安全教育培训通知书课件
- 脓毒症指南课件
- 生产副总经理岗位职责标准版本(五篇)
- 对颈椎概念和命名的再认识
- 淀粉与变性淀粉知识
- 华为信息安全宣传
- 物业管理供方管理程序
- GB/T 37642-2019聚己内酯(PCL)
- GB/T 3730.2-1996道路车辆质量词汇和代码
- GB 25585-2010食品安全国家标准食品添加剂氯化钾
- 国防科技大学介绍
- 设计文件审核记录表(模本)
评论
0/150
提交评论