医学统计学 第九章.ppt_第1页
医学统计学 第九章.ppt_第2页
医学统计学 第九章.ppt_第3页
医学统计学 第九章.ppt_第4页
医学统计学 第九章.ppt_第5页
免费预览已结束,剩余28页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章直线相关与回归,医学研究中,常常要研究两个或两个以上变量的关系。如成人的身高与体重、青少年的身高与年龄、体温与脉搏次数、年龄和血压、反应物浓度与反应速度、溶液浓度与渗透压等。相关与回归就是研究这种关系的统计方法。变量与变量之间的关系,可以分成两种类型:一种是确定性关系(函数关系),另一种是非确定性关系。,如果仅仅研究变量间相互关系的密切程度和变化趋势,并用适当的统计指标表达,这就是相关分析。如果要把变量间数量上依存关系用函数形式表示出来,用一个或多个变量来推测另一变量的估计值及波动范围,这就是回归分析。,回归一词最早由Golton在一项有关父亲与儿子身高的研究中提出。儿子的高度与父亲的高度自然是相关的。他发现身材高大的父亲所生儿子的高度不少要比其父亲矮,而身材矮小的父亲所生儿子的高度不少要比父亲高;也就是说,无论是身材高还是矮的父亲所生儿子的身高有向人群的平均身高回归的趋势,这就是回归的生物学内涵,后来人们借用回归这个词来描述通过自变量的数值预测反映变量的平均水平。,9.1直线相关9.1.1直线相关的概念当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确地求出另一个变量的数值,我们称这类变量之间的关系称为相关关系。直线相关分析关心的是两个变量间是否有线性的协同变化的关系、变化的趋势、变化的密切程度和方向。,直线相关的性质可由散点图(scatterdiagram)直观地说明。通常以自变量(independentvariable)X为横坐标,应变量(dependentvariable)Y为纵坐标,在方格坐标中,每对变量值(X、Y)的交叉点处,描出一个点,就成为散点图。从散点图上可以粗略地看出,两个变量间相关的方向和密切程度以及两变量间是否呈直线关系。,例9-1某医师研究某种代乳粉营养价值时,用大白鼠做实验,得大白鼠进食量与体重增加量的资料(表9-1)。表9-1大白鼠进食量与体重增加量的关系,图9-1大白鼠进食量与体重增加量的散点图,图9-2相关系数示意,9.1.2相关系数的计算与检验1)相关系数的意义相关系数(correlationcoefficient)又称为积差相关系数(coefficientofproduct-momentcorrelation),以符号r表示。它是说明具有线性关系在两个变量间,相关关系的密切程度和方向的指标。样本相关系数用符号r表示,总体相关系数用希腊字母(读作rho)表示,计算公式为:,2)计算相关系数例9-2现仍用例9-1的资料,试分析大白鼠进食量与体重增加量之间有无直线相关关系?1作散点图,判断是否有线性趋势。从图9-1可知,两变量有线性趋势,成正相关。2列相关系数计算表3按公式9-1得相关系数r,3)相关系数的假设检验相关系数r是样本相关系数,它是总体相关系数的估计值。和其他统计量一样,根据样本资料计算出来的相关系数也有抽样误差。在0的总体中随机抽样,由于抽样误差的影响,所得r值常不等于零。因此,在计算得到相关系数后,还不能根据的大小对X、Y间是否有相关关系作判断,而应进行r是否来自0的假设检验。相关系数的假设检验可用t检验法,其计算统计量t值的公式为:,(1)建立假设,确定检验水准(2)计算检验统计量,(3)查表确定p值P0,表示直线从左下方走向右上方,即Y随X的增大而增大;bt0.001(10),P0.001,按=0.05水准,拒绝H0,接受H1,认为在某代乳粉营养价值试验中,大白鼠进食量与体重增加量之间存在直线回归关系,即所拟合的样本直线回归方程有意义。,9.2.3回归方程的应用描述两变量间的依存关系通过回归系数的假设检验,若认为两变量间存在着直线回归关系,则可用直线回归方程来描述两变量间的依存关系2.利用回归方程进行预测所谓预测就是把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计,其波动范围可按求y值容许区间的方法计算。3.利用回归方程进行统计控制统计控制是利用回归方程进行逆估计,如果要求应变量Y在一定范围内波动,可以通过控制自变量X的取值来实现,9.4直线相关与回归应用时的注意问题9.4.1直线相关与回归的区别与联系:一、直线相关与回归的区别与联系1区别:(1)在资料要求上,如果X可以精确测量和严格控制,回归只要求应变量Y作为随机变量且服从正态分布,此种回归属于型回归;如果X和Y需要相互推断,则要求X、Y为随机变量且都要服从双变量正态分布,此资料类型属于型回归。可以计算两个回归方程:由X推Y的回归方程;由Y推X的回归方程。,(2)在应用上,相关分析用于说明两变量间的相互关系,描述两变量X、Y相互之间呈线型关系的密切程度和方向;回归分析用于说明两变量间的依存关系,可以用一个变量的数值推算另一个变量的数值。,2联系:(1)正负符号:在同一资料中,计算r与b值的符号应该相同。(2)假设检验:在同一资料中,r与b值的假设检验的统计量t值相等,即tr=tb。(3)r与b换算关系如下:,(4)用回归解释相关:相关系数r的平方称为决定系数,也称为相关指数。公式为:其值在0-1之间。决定系数表示Y的变异中可由X解释的部分占总变异的比例。因此r2越接近于1,说明应用相关分析的意义越大,即贡献越大;相反的意义亦成立。,9.4.2设计与应用直线相关与回归的注意事项1作相关与回归分析要有实际意义。不要把毫无关联的两个事物或现象用作相关、回归分析,2对相关分析的作用要正确理解。相关分析只是以相关系数来描述两个变量间直线关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质;即使存在相关关系,也并不能证明是因果关系(相关关系中有的是因果关系,有的不是因果关系)。要证明两事物间的内在联系,必须凭借专业知识从理论上加以阐明。但是,当事物间的内在联系尚未被认识时,可根据相关分析的数量关系给理论研究提供线索。,3相关和回归都是分析两变量间关系的统计方法。相关表示相互关系,回归表示从属关系。与相关分析一样,回归分析前也必须先作散点图,以判断两变量间的关系是否为线性趋势,有无离群点等。4积差和法相关与等级相关。积差和法相关计算相关系数r适用于正态资料;一般来说,能用积差和法相关计算的资料不应用等级相关计算。资料明显呈偏态分布或者原始资料只能用等级划分或难以判定资料属何种分布的,才宜按等级相关处理。有关等级相关资料的处理方法见非参数统计一章。,5回归系数的统计学意义。不能仅根据回归系数假设检验之P值判断回归效果的优劣,因P值除

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论