卫生统计学相关分析_第1页
卫生统计学相关分析_第2页
卫生统计学相关分析_第3页
卫生统计学相关分析_第4页
卫生统计学相关分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关分析卫生统计学教研室在医学研究中,往往需要对两个随量之间的关系进行量化的研究,以确定二者之间是否有联系。如果存在一定的联系,还需要定量地确定它们之间关系的强弱。研究两个随量的相关关系,应根据变量的类型确定相应的计算方法。两变量间关系的常见类型:1.2.3.定量变量(线性相关; 非线性相关);有序分类变量(秩相关、等级相关);无序分类变量(关联性分析)1. 线性相关线性相关系数直线相关系数(linear correlation coeffiecient) ,简称相关系数。相关系数是描述两个变量之间线性相关的程度和相关方向的统计指标。判断两连续型变量之间的相关关系,最简单的办法就是在直角坐标系

2、中把一个指标取作变量X, 另一个取作Y做散点图。如果散点图显示了一定的线性相关关系,可以通过计算Pearson相关系数r来定量地确定相关关系的强弱。例 1某发热门诊医生根据患者就诊顺序随机抽取 12 名 2040 岁发热患者,试探讨体温与脉搏之间的伴随关系,数据见表 1。表 112 名发热患者的体温()与脉搏(次/分)指标123456789101112体温X脉搏Y41.037.540.738.438.840.038.039.039.539.840.839.6120124106117125130138135一般而言,总体相关系数 是未知的,通常用样本相关系数 r 进行估计。样本相关系数 r 按下

3、式计算: ( X X )(Y Y )l XYr ( X X )2 (Y Y )2l XX lYY上述相关系数又称为 Pearson 相关系数相关系数的特点:相关系数 r 是一个无量纲的数值,且-1 r 1 ;r0 为正相关,r0 为负相关;(1)(2)(3)r越接近于,说明两个变量的线性相关程度越紧密;r越接近于 0,说明两个变量的线性相关程度越不紧密。(1)(2)(3)(4)根据经验可以将相关系数划分为以下几种情况:当 r 0.8 时,相关程度高;当0.5 0.8 时,相关程度一般;r当0.3 0.5 时,相关程度低;r当 r 0.3 时,可视为不相关;通常总体的相关系数是未知的,的相关系数

4、r去估计 。为了判断r对的代表性大小,需要对相关系数进行假设检验。首先假设总体相关性为零,即H0为两总体的线性相关系数 =0。其次,计算相应的统计量,并得到对应的概率P。如只能通过样本获得果P值小于显著性水平,则H0,认为两总体存在显著的线性相关关系;反之则认为两总体不存在显著的线性相关关系。样本相关系数与样本量样本相关系数r的大小与样本量有关。特别n=2,当两个点的连线不平行于横轴和纵轴时,r1或r=1。样本相关系数大小不能直接评价两个变量之间的相关性。通常研究者首先关心的是0?对 Pearson 简相关系数采用 t 检验,统计量为 r 0trsr其中, sr 为样本相关系数 r 的标准误1

5、 r 2n 2sr 度为 n 2 的 t 分布。H0 成立时, tr 服从小结由于X、Y两个变量都是随量,它们间的关系不可能以一个变量的数值精确地计算出另一个变量的数值,称这类变量之间的关系为非确定性关系;假设检验要求两变量服从双变量正态分布;简相关系数r =0,只是说明不存出现异常值时慎用相关 ;相关未必有实际意义 ;资料是否需要分层。性相关关系;线性相关相关系数刻画了X与Y的相关程度,即:X与Y伴随变化的同步程度,但相关系数与X伴随Y同步变化幅度没有之间联系。即:回归系数可以很小,但同步变化的一致程度很高(相关程度可以很强)。2.秩相关Pearson相关的假设检验要求和均服从正态分布。对那

6、些从正态分布的资料,或是总体分布未知的资料,因为难以进行假设检验,所以就不宜用积差相关系数来刻画相关性。此时,可采用秩相关(rcorrelation),或称等级相关来刻画两个变量间相关的程度与方向。这类方法是利用两变量的大小作线性相关分析,对原变量的分布不作要求,属非参数统计方法。以下介绍最常用的Spearman秩相关。将 pi、qi,直换 Pearson 线性相关公式中的 Xi 与 Yi,对计算得的相关系数称为 Spearman 秩相关系数或等级相关系数,用统计量r 表示。s( p p)(l pq)r sll( p p)q)2pp类似于积差相关系数,关于秩相关系数的检验假设为H0:s=0,H

7、1:s0当 n50 时,可查书后的 rs 界值表,若秩相关系数超过临界值,则拒绝 H0;n50 时,也可采用 t 检验。对 Spearman 秩相关系数采用 t 检验,统计量为 rs 0trssrs其中,sr 为样本相关系数 r 的标准误1 r2ssn 2rs度为 n 2 的 t 分布。H0 成立时, tr 服从例 2:某地研究岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表 2,试用秩相关进行分析。急性白血病患儿的血小板(109/L)和症状表 2血小板数 X症状p22pq=pY234567891011121211381653104265407401060126012901438

8、200423456789101112149162536496481100121144+-+-+-11.59.07.03.59.09.03.53.53.53.511.53.5132.25814912.25818112.2512.2512.2512.25132.2512.2511.5182114455424.52831.535126.5427865078630451合计3.二维列联表数据的关联性分析对定性变量之间的联系通用的方法是根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联(assotion)分析,即关于两种属性独立性的 2 检验。根据实验设计的类型以及数据的特点,可以分为 22 表

9、的关联分析、RC 表的关联分析、以及配对样本的关联性分析。关于两个分类变量关联的程度,(contingency coefficient)来描述:可用 Pearson 列联系数 2r 2n例 3为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82 例,把该院儿科所有消化不良的患儿视为一个总体的话,则该 82 例患儿可看作是一份随机样分别观察腹泻与否和喂养方式两种属性,22本。对每个种结果分类记数如表 3 所示。试分析两种属性的关联性。表 3婴儿腹泻与喂养方式的关系喂养方式腹泻合计有无301710254042人工473582合计小结对于四格表资料来说,当有理论频数大于1而小于5的时候,需要对卡方统计量进行连续性校正;对于RC列联表资料来说,如果出现理论频数过小的话,需要从专业的角度对相邻的行或列进行合并,或增加样本含量;注意控制混杂。4.偏相关某些情况下,需要扣除其它的影响,才能较为真实准确地反映A、B两的关系。之间偏相关分析是指当两个变量同时与第三个变量相关时,将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论