医学统计相关分析_第1页
医学统计相关分析_第2页
医学统计相关分析_第3页
医学统计相关分析_第4页
医学统计相关分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CorrelationAnalysis相关分析,童新元中国人民解放军总医院,名人格言,如果你想得到一个明智的回答,你就必须理智的提问。-歌德德国(1749-1832),医学问题讨论,父母与子女之间哪些方面相像?怎样研究父子两代人之间的相像?,相关简介,医学科研中,我们不仅会关心单个变量的变化,而且更多地会去研究两个或多个连续变量间相互变化、相互。比如,如人体的血压和脉搏,儿童的生长发育要观察身高和体重等等。要研究这些变量间的相互关系怎样?,(2)函数与统计模型,哲学观点认为,世上万物的变化发展不是独立的,是有联系的.两个变量之间的关系可以分为确定性关系和不确定性关系。两个变量确定性关系,可用经典数学中函数关系进行表达:y=f(x)如匀速直线运动距离与时间的关系S=V*tS,自由落体运动规律:公式:h=1/2g*t2重力加速度常数g=9.80665米/秒2公式是怎样产生的?,h,牛顿的自由落体运动自由落体高度与时间的关系,不确定性关系,儿童年龄x与身高Y关系;父母身高X与子女的身高Y关系;人体体重X与血压Y;血糖X与胰岛素Y的关系;脉搏X与血压Y的关系;统计学模型:y=f(x)+e,不确定性关系的研究,相关分析回归分析,什么是“相关”,相关:即彼此关联现代汉语词典.(达尔文,1859年10月24日出版)提出“相关”(correlation)来描述生物物种的进化与环境之间的定性关系;生物统计学高尔顿(Galton,1822-1911)引入统计学研究关于父子两代人之间的身高的相互关系。,“相关”的统计定义,当一个变量随另一个变量变化时,统计学中称它们有相关关系。两变量之的相关关系有线性相关与非线性相关.我们主要学习线性相关.,第一节直线相关,如果在两个变量之间,当一个变量增大,另一个也随之增大(或减少),且有线性趋势时,称两个变量间有线性相关关系。,在直角坐标系中,两个成对出现变量X和Y的值对应平面上的一个点(Xi,Yi),将每个点(Xi,Yi)绘在该坐标系中,形成散点图。例,研究父高与子女身高的关系图.P47,一、散点图,散点图可直观判断两个变量间是否有线性相关.,二、相关性大小的度量,统计学家皮尔逊(Pearson,1857-1936)提出相关系数r的概念,并提出用相关系数r来度量两个变量之间相关大小的统计理论公式。统计学上称为Pearson相关系数r,或简单相关系数.,Pearson相关统计量的构造,1、相关系数的计算公式,Pearson相关系数(r)表示两个变量X,Y间的直线关系,它说明两个变量联系的紧密程度。,相关系数r的特点,1、r在-1+1范围内波动。2、绝对值愈接近1,两个变量间的直线相关愈密切,愈接近0,线性相关愈不密切。3、相关系数r没有单位。,正相关和负相关,若两个变量同时增加或减少,变化趋势是同向的,则称两变量之间关系为正相关(positivecorrelation);r0。若一个变量增加时,另一个变量减少,变化趋势是反向的,则称两变量之间关系为负相关(negativecorrelation);rr0。r愈接近1,相关愈密切。当所有点子都在一条直线上时,r=1,称为完全正相关。,2负相关Y随X的增加而减少,X亦随Y的增加而减少,0r-1。r愈接近-1,相关愈密切。当所有点子都在一条直线上时,r=-1,称为完全负相关。,3无相关X不论增加或减少,Y的大小不受其影响;反之亦然,此时r0。,2、相关系数的检验,(1)建立检验假设:,(2)相关系数r的t值和P值:,(3)判断与决策,二、实例分析,例12-1测定16种食物中的热量(卡路里)和脂肪含量(克),结果见表12.1中的,问食物热量与脂肪含量有无相关?,解题分析,从表12.1中看出,随着食物脂肪含量的增加,其热量亦随之增大,但两者间联系的紧密程度如何,两变量间是否有线性关系,相关的程度和方向的确定,还必须用相关分析来做解答。,解题步骤如下:1)作散点图,判断是否有线性趋势。按表12.1中数据(X,Y)的值在直角坐标系上画出16个点,见下图。,由散点图判断,两变量有线性趋势,且为正相关。可作相关分析。2)计算相关系数r=0.9106,3)检验假设,步骤如下:(1)建立检验假设:H0:0,脂肪含量与热量无关;H1:0,脂肪含量与热量有关。0.05。,(2)计算统计量t值和P值:t=8.2416,自由度=14,查t界值表得P0.05。(3)判定与决策按0.05,拒绝H0,接受H1,故可认为这16种食物的脂肪含量与热量之间有正相关关系。,4.相关分析的CHISS实现,点击统计统计推断相关矩阵CHISS实现直线相关的步骤:1、进入数据模块打开数据库b12-1.DBF。点击数据文件打开数据库表找到文件名为:b12-1.DBF确认2、进入统计模块进行统计计算点击统计统计推断相关矩阵反应变量:X脂肪Y热量确认,5.相关大小的分类,当经假设检验两个变量间存在相关时:若r0.7称为高度相关;若0.7r0.4称为中度相关;若r0.4称为低度相关.,6.线性相关的条件,线性关系双变量正态,第二节Spearman等级相关,当两个变量总体分布未知或不服从正态分布时,不能直接用线性相关分析,我们可以采用两变量的秩次大小作线性相关分析,来说明两个变量间相关的程度大小与方向,统计学上称为等级相关,亦称秩相关(rankcorrelation)。最常用的Spearman秩相关。,一、秩相关系数的计算,秩相关系数rs计算的原理:对原始数据进行排序编秩,用秩次的大小代替原始数据来计算pearson相关系数即为秩相关系数rs。rs用来说明两个变量间相关的程度与方向。它也是总体相关系数s的估计值。,秩相关系数rs的特点,1)rs介于1和1之间2)rs0为负相关,rs0为正相关rs3)无量纲.,二、秩相关系数的检验,由样本算出的秩相关系数是否有统计学意义,同样应作假设检验。1)建立假设:H0:s0,H1:s02)求t值和P值。3)判断与决策。,三、实例分析,例12-2某实验用白蚊伊蚊c6/36细胞微量培养中和试验,检测临床诊断为乙脑患者的晚期血清,并与血凝抑制试验进行比较,测量结果如下。问两种试验方法是否存在相关性?,四、等级相关CHISS实现,1、点击数据文件打开数据库表找到文件名为:b12-2秩相关.DBF确认2、进入统计模块进行统计计算点击统计统计推断非参数方法秩相关反应变量:XY确认,五、等级变量的数量化,临床上常常出现等级数据,如无效(-),有效(+),显效(+),痊愈(+)等。处理这类资料时,常将它们用数值来代替,如以0代,以1代,以2代+,以3代+等。这里,数值之间的关系仅仅是等级关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论