




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一章两变量关联性分析前面章节中讲述了单一数值变量的统计分析方法,但在医学科学研究中,常要分析变量间的关系,如年龄与血压、药物剂量和动物死亡率、环境介质中污染物浓度与污染源距离等,回归与相关就是研究这种关系的统计方法,属于双变量分析范畴。,第一节线性相关,一、直线相关的概念及其统计描述例111随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间(秒),数据如表111所示。据此资料如何判断这两项指标间有否相关?表11115名健康成人凝血时间与凝血酶浓度测量值记录,1、散点图,1).正相关:散点呈椭圆形分布,Y随X的增加而增加,X随Y的增加而增加,即两变量X、Y同时增大或减小,变化趋势是同向,称为正相关;各点的排列越接近椭圆的长轴,相关也就越密切。当各点的分布在一条直线上时,则X与Y就是完全正相关了。,2).负相关散点呈椭圆形分布,Y随X的增加而减少,X随Y的增加而减少,变化趋势是反向的,称为负相关;各点的排列越接近椭圆的长轴,相关也就越密切。当各点的分布在一条直线上时,则X与Y就是完全负相关了。,3).零相关:无论X增加还是减少,Y不受其影响,反之,X也不受Y的影响。,2、相关系数它又称为积差相关系数,以符号r来表示相关系数。它是说明两变量间相关关系的密切程度和相关方向。,现在我们来解释协方差(covariance)的含义。当样本值为(x1,y1),(x2,y2),(xn,yn)时,x和Y的样本均数分别为,二、相关系数的假设检验,r是样本相关系数,它是总体相关系数的估计值。要判断X、Y间是否有相关关系,就要检验r是否来自总体相关系数为零的总体。对相关系数的假设检验方法有两种:1、查表法2、采用t检验检验统计量为:,例113前面所得r值,检验健康成人凝血浓度与凝血时间间是否有直线相关。,三、线性相关应用中应注意的问题1、样本的相关系数接近零时并不意味着两变量间一定无相关性。2、一个变量的数值人为选定时莫作相关3、出现异常点时慎用相关4、相关未必真有内在联系5、分层资料盲目合并易出假象。,第二节秩相关,一、秩相关的概念及其描述秩相关,又称为等级相关,适用于下列资料(1)不服从双变量正态分布不宜作积差相关(2)总体分布型未知(3)用等级表示的原始。下面介绍最常用的Spearman等级相关,例11-4某地研究27岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表112,试用秩相关分析。,一、Spearman等级相关它是用等级相关系数rs说明两变量间相关关系的密切程度和方向。rs也应进行相关性检验,在n小于等于50时用查表法,当n大于50时计算统计量t值:即前面的积差相关系数的检验假设t值,本例计算,二、秩相关系数的统计推断查rs临界值表,,第三节分类变量的关联性分析,对两个定量变量间线性联系我们用pearson积差相关系数或秩相关系数来描述,对于定性变量间的联系通用方法是根据两个定性变量交叉分类计数所得的频数资料作关联(association)分析,即关于两独立性的卡方检验。,一、交叉分类22表的关联性分析例116为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,把该院儿科所有消化不良的患儿视为一个总体的话,则该院82例患儿可看成是一份随机样本。对每个个体分别观察腹泻与否和喂养方式两种属性,22种结果分类记数如表113所示。试分析两种属性的关联性。表113婴儿腹泻与喂养方式的关系,22交叉分类频数表的一般形式如表114表11422交叉分类频数表的一般形式所谓两属性X和Y互相独立(independence),是指属性X的分布的概率与属性Y的概率分布无关,否则称这两种属性之间存在关联性。从概率的角度考虑,独立是指在交叉分类表每一格子中同时具有两种属性的联合概率等于相应属性的边际概率的乘积。ij=(ri)(cj)i,j=1,2欲检验的假设为:H0:两属性之间相互独立,,H1:两属性之间相互关联,检验统计量仍采用拟合优度卡方检验:现讨论理论频数的计算在H0成立的条件下必有:ij=(ri)(cj)。由于(ri)和(cj)未知,只能用样本中的频数近似地代替,现就例116的数据作两种属性的关联性分析H0:喂养方式与腹泻之间互相独立H1:喂养方式与腹泻之间有关联0.05则拒绝原假设,说明婴儿腹泻与喂养方式之间存在着关联性。关于两个分类变量关联程度,我们可用Peason列联系数(contingencycoefficient)来描述:,本例列联系数为:列联系数介于0与1之间,理论上也应就总体列联系数是否为0作假设检验,但这个假设检验等价于上述的卡方检验。,二、22配对资料的关联性分析例117有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长情况,结果见表115,问两种培养基的结果有无关联?表115两种白喉杆菌培养结果,H0:两种培养基之间互相独立H1:两种培养基之间有关联0.05则拒绝原假设,两种培养基之间存在着关联性。进一步计算列联系数。,本例列联系数为:列联系数介于0与1之间,理论上也应就总体列联系数是否为0作假设检验,但这个假设检验等价于上述的卡方检验。,三、RC分类资料的关联性,例118某地居民主要有三种祖籍,均流行甲状腺肿。为探讨较甲状腺肿与祖籍是否有关联,现根据居民甲状腺肿复查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表116的资料。问甲状腺肿与祖籍有无关系?表116某地居民按甲状腺肿类型与祖籍两属性的交叉分类表,:甲状腺肿类型与祖籍无关联:甲状腺肿类型与祖籍有关联,对于此类资料,研究常常分析两分类变量间有无关系?关系的密切程度如何?此时可用行*列表的卡方检验来推断两个分类变量间有无关系:在有关系的前提,若须进一步分析关系的密切程度时,可计算Pearson列联系r。列联系数取值范围在0-1之间.,例11-9测得某地1043人的ABO血型和MN血型结果如果下表,问两种血型系统之间是否有关联?表11-7某地1043人的血型,第六节小结本章主要介绍了两变量间的关联性。对不同类型,可用不同的统计方法去描述它们间的关联程度。1、服从正态分布的两连续变量,若有一份随机样本,可绘制散点,发现有直线趋势,进而计算Pearson相关系数,以描述两变量的线性关系。2、对不满足正态分布的两连续变量,若有一份随机样本,仍可绘制散点,发现有直线趋势,进而计算Spearman秩相关系数,以描述两变量的相关关系。,3、对两个反映属性的分类变量,若有一份随机样本,可作交叉分类的频数表,利用独立性的卡方检验和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静海区全网营销解决方案
- 2025年牛羊防疫员考试题及答案
- 2025年区块链技术在供应链金融中的应用案例研究报告
- 药房咨询方案模板下载
- 盾构专项应急预案(3篇)
- 对于事故应急预案(3篇)
- 药师专业测试题及答案
- 税收学专业面试题及答案
- 2025年城市配送新能源汽车车路协同通信技术实施效果报告
- Welcome to the unit说课稿-2025-2026学年高中英语牛津译林版必修三-牛津译林版2004
- Unit 2 Home Sweet Home 重点短语和句式-人教版英语八年级上册
- 黄体破裂护理常规课件
- 防治大气污染课件
- 环境监测质量管理课件
- 国际音标教学课件
- 2025-2030中国可变磁阻旋转变压器行业产销状况与应用趋势预测报告
- (高清版)DB31∕T 310001-2020 船舶水污染物内河接收设施配置规范
- 诊所治疗室管理制度
- 2025年高考英语全国二卷听力试题真题及答案(含MP3+原文)
- 常用概率分布题目及答案
- 2025年互联网营销师考试题及答案
评论
0/150
提交评论