讲两变量关联分析-刘媛媛.ppt_第1页
讲两变量关联分析-刘媛媛.ppt_第2页
讲两变量关联分析-刘媛媛.ppt_第3页
讲两变量关联分析-刘媛媛.ppt_第4页
讲两变量关联分析-刘媛媛.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章 两变量关联性分析 前面章节中讲述了单一数值变量的统计分 析方法,但在医学科学研究中,常要分析变量间 的关系,如年龄与血压、身高与体重,回归与相 关就是研究这种关系的统计方法,属于双变量 分析范畴。 第一节 线性相关 一、直线相关的概念及其统计描述 二、相关系数的假设检验 三、相关系数的适用条件 四、直线相关系数的意义 五、线性相关应用中应注意的问题 例111 随机抽取15名健康成人,测定血液的凝血酶 浓度(单位/毫升)及凝固时间(秒),数据如表111 所示。据此资料如何判断这两项指标间有否相关? 171514161516141716141315151314 凝血时间 0.71.01.10.91.10.91.00.60.91.11.20.91.01.21.1 凝血酶浓度 151413121110987654321受试者号 表111 15名健康成人凝血时间与凝血酶浓度测量值记录 1、散点图 1). 正相关: 散点呈椭圆 形分布,Y随X的增加而增加 ,X随Y的增加而增加,即两 变量X、Y同时增大或减小, 变化趋势是同向,称为正相 关;各点的排列越接近椭圆 的长轴,相关也就越密切。 当各点的分布在一条直线上 时,则X与Y就是完全正相关 了。 2). 负相关 散点呈椭 圆形分布,Y随X的增加而 减少,X随Y的增加而减少 ,变化趋势是反向的,称 为负相关;各点的排列越 接近椭圆的长轴,相关也 就越密切。当各点的分布 在一条直线上时,则X与Y 就是完全负相关了。 3). 零相关: 无论X增加还是减少,Y不受其影响, 反之,X也不受Y的影响。 2、相关系数 它又称为积差相关系数,以符号r 来表示相 关系数。 它是说明两变量间相关关系的密切程度和相 关方向。 当样本值为(x1,y1), (x2,y2), (xn,yn)时 ,x和Y的样本均数分别为 例11-2 计算例11-1中凝血酶浓度与凝血时间之间 的样本相关系数 相关系数的特点: 参与相关分析的两个变量是对等的,不分自变量 和因变量,因此相关系数只有一个; 相关系数没有单位,其值为1r1,r绝对值 越大,相关关系越密切; 相关系数的正负号反映相关关系的方向,r值为正 表示正相关,r值为负表示负相关,r值等于零为 零相关,r值的绝对值等于1为完全相关; 计算相关系数的两个变量都是随机变量。 第一节 线性相关 一、直线相关的概念及其统计描述 二、相关系数的假设检验 三、相关系数的适用条件 四、直线相关系数的意义 五、线性相关应用中应注意的问题 r是样本相关系数,它是总体相关系数 的 估计值。要判断X、Y间是否有相关关系,就要检 验r是否来自总体相关系数 为零的总体。 对相关系数的假设检验方法有两种: 1、查表法 P486 附表13 2、采用t检验 检验统计量为: 例113 前面所得r值,检验健康成人凝血浓度 与凝血时间是否有直线相关。 第一节 线性相关 一、直线相关的概念及其统计描述 二、相关系数的假设检验 三、相关系数的适用条件 四、直线相关系数的意义 五、线性相关应用中应注意的问题 积差相关系数的适用条件 两个变量的测量值应来自于同一总体或同一样本中 n个个体的测量,或者是来自于对两个有意义配对 的总体或样本的测量; 两个变量的分布应近似于正态分布; 样本量不能太小,样本量太小时所计算出的相关系 数不够稳定。 第一节 线性相关 一、直线相关的概念及其统计描述 二、相关系数的假设检验 三、相关系数的适用条件 四、直线相关系数的意义 五、线性相关应用中应注意的问题 直线相关系数的意义 直线相关系数r的值,在任何情况下总在1与1 之间,而在医学研究中由于影响因素众多,很少有 完全相关的情况; 相关系数r的正负号表示相关的性质,即正相关、 负相关以及零相关; 相关系数r的绝对值大小表示相关程度的大小(强 弱),愈接近于1,相关程度愈高;愈接近于0,相 关程度愈低。 第一节 线性相关 一、直线相关的概念及其统计描述 二、相关系数的假设检验 三、相关系数的适用条件 四、直线相关系数的意义 五、线性相关应用中应注意的问题 1、样本的相关系数接近零时并不意味着两变量间 一定无相关性。 2、一个变量的数值人为选定时莫作相关。 3、出现异常点时慎用相关。 4、相关未必真有内在联系。 5、分层资料盲目合并易出假象。 6、注意变量取值的离散程度。 第二节 秩相关 一、秩相关的概念及其描述 二、秩相关系数的统计推断 秩相关,又称为等级相关,适用于下列资料 :(1)不服从双变量正态分布 (2)总体分布型未知 (3)等级资料 秩相关中最常用的是Spearman等级相关 表11-2 急性白血病患儿的血小板和出血症状 例11-4 某地研究27岁急性白血病患儿的血小板数与 出血症状程度之间的相关性,结果见表112,试用秩 相关分析。 4516307865078合计 4212.253.5126.5132.2511.5+12111143811 3512.253.5-10010129010 31.512.253.5-81912609 2812.253.5-64810608 24.512.253.5-4977407 54819.0+3665406 45819.0+2554265 1412.253.5- 1643104 21497.0+931653 18819.0+421382 11.5132.511.5+111211 pqq2秩次现血症状p2秩次血小板病人编号 Spearman等级相关: 它是用秩相关系数rs说明两变量间相关关系的密切 程度和方向。 本例计算: 第二节 秩相关 一、秩相关的概念及其描述 二、秩相关系数的统计推断 rs也应进行相关性检验 1.查表法 n小于等于50时 (P487 附表14) 2.t检验 n大于50时计算统计量t值 查rs临界值表, 第三节 分类变量的关联性分析 一、交叉分类22表的关联性分析 二、22配对资料的关联性分析 三、RC分类资料的关联性 例116 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随 机收集了消化不良的婴儿82例,把该院儿科所有消化不良的患儿 视为一个总体的话,则该院82例患儿可看成是一份随机样本。对 每个个体分别观察腹泻与否和喂养方式两种属性,22种结果分 类记数如表113所示。试分析两种属性的关联性。 表113 婴儿腹泻与喂养方式的关系 无有 823547合计 422517母乳 401030人工 合计 腹泻 喂养方式 22交叉分类频数表的一般形式如表114 表114 22交叉分类频数表的一般形式 Y2Y1 nm2 (c2)m1 (c1)合计 n2 (r2)A22(22)A21(21)X2 n1 (r1)A12(12)A11(11)X1 合计 属性Y 属性X 所谓两属性X和Y互相独立(independence),是指 属性X的分布的概率与属性Y的概率分布无关,否则称 这两种属性之间存在关联性。从概率的角度考虑,独 立是指在交叉分类表每一格子中同时具有两种属性的 联合概率等于相应属性的边际概率的乘积。 ij= (ri) (cj) i,j=1,2 欲检验的假设为: H0:两属性之间相互独立,H1:两属性之间相互关联 检验统计量仍采用拟合优度卡方检验: 在H0成立的条件下必有: ij= (ri) (cj)。由于(ri)和 (cj)未知,只能用样本中的频数近似地代替 H0:喂养方式与腹泻之间互相独立 H1:喂养方式与腹泻之间有关联 0.05 则拒绝原假设,说明婴儿腹泻与喂养方式之间存 在着关联性。 关于两个分类变量关联程度,我们可用Peason列联 系数(contingency coefficient)来描述: 列联系数介于0与1之间,表示两种属性相关的密切程度 。 本例列联系数为: 理论上也应就总体列联系数是否为0作假设检 验,但这个假设检验等价于上述两变量关联性分析 的卡方检验。 两变量独立 存在关联性 =0 0 第三节 分类变量的关联性分析 一、交叉分类22表的关联性分析 二、22配对资料的关联性分析 三、RC分类资料的关联性 例117 有56份咽喉涂抹标本,把每份标本一分 为二,依同样的条件分别接种于甲、乙两种白喉杆 菌培养基上,观察白喉杆菌生长情况,结果见表11 5,问两种培养基的结果有无关联? 表115 两种白喉杆菌培养结果 563224合计 16142_ 401822 _+ 合计 乙培养基 甲培养基 H0:两种培养基之间互相独立 H1:两种培养基之间有关联 0.05 则拒绝原假设,两种培养基之间存在着关联性。进一步 计算列联系数。 本例列联系数为: 列联系数介于0与1之间,理论上也应就总体列联系 数是否为0作假设检验,但这个假设检验等价于上 述的卡方检验。 第三节 分类变量的关联性分析 一、交叉分类22表的关联性分析 二、22配对资料的关联性分析 三、RC分类资料的关联性 例118 某地居民主要有三种祖籍,均流行甲状腺肿 。 为探讨较甲状腺肿与祖籍是否有关联,现根据居民甲状 腺肿复查结果,按甲状腺肿类型与祖籍两种属性交叉分 类,得表116的资料。问甲状腺肿与祖籍有无关系? 表116 某地居民按甲状腺肿类型与祖籍两属性的交叉分类表 合计 719 577 140 1436 甲 486 2 4 492 乙 133 260 51 444 丙 100 315 85 500 祖籍 甲状腺肿类型 合计 弥漫型 结节发型 混合型 : 甲状腺肿类型与祖籍无关联 :甲状腺肿类型与祖籍有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论