直线回归与直线相关.ppt_第1页
直线回归与直线相关.ppt_第2页
直线回归与直线相关.ppt_第3页
直线回归与直线相关.ppt_第4页
直线回归与直线相关.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十四章直线回归与直线相关,单变量的统计分析方法-统计描述与同一变量的不同处理组间的比较。,多变量的统计分析方法-多个变量之间的数量依存关系及关联度的研究,线性相关,线性相关的概念及统计描述,例随机抽取15名健康成人,测定血液的凝血酶浓度及凝固时间,数据见表11-1。试判断此数据是否相关?,表11-115例健康成人凝血时间与凝血酶浓度测量值记录,图1数据散点图,从散点图中可以看出:,图中散点虽不都在一条直线上,但它们有一种线性趋势存在,即凝血酶浓度高的,凝血时间短;凝血酶浓度低的,凝血时间长,说明凝血酶浓度与凝血时间之间确实存在联系且方向相反。,两变量的关系不象函数关系那样能以一个变量的数值精确地确定出另一个变量的数值,即为非确定性关系,若图中各散点趋势接近一直线,且变化方向相同,称为正相关;,若图中各散点趋势接近一直线,且变化方向相反,称为负相关;,若图中散点的趋势不呈直线,但有规律地呈一条曲线,称为非线性相关;,若图中散点杂乱无序,称为零相关。,直线相关的概念,研究两个连续型随机变量之间是否存在线性关系,关系是否密切以及是正相关还是负相关.,直线相关系数,又称pearson积差相关系数,以r表示样本相关系数,以表示总体相关系数.它反映两个变量线性关系的方向和密切程度的指标,没有单位,其值为-1r1.,计算公式,上式中,若为总体协方差或总体方差时,相关系数为总体相关系数,记为,0,X和Y线性相关,=0,X和Y线性不相关,上式中,若为样本协方差或样本方差时,相关系数为样本相关系数,记为r,相关系数的特点,1)是无量纲的数值,且-10为正相关,r0,说明两变量之间为正相关关系,r=1,完全正相关r0说明直线与Y轴的交点在原点的上方,a0表示Y随X的增大而增大,b0,表明SAH患者脑脊液IL-6随血清IL-6增加而增加,且血清IL-6每增加1pg/ml时,脑脊液平均增加1.181pg/ml。,总体回归系数的统计推断,总体回归系数的区间估计,总体回归系数的1-的置信区间为,例求上例中回归系数的95%置信区间,回归系数的95%置信区间为(1.180-2.3060.398,1.180+2.3060.398)=(0.262,2.098,总体回归系数的假设检验,目的判断b是否从回归系数为零(=0)的总体中随机抽样得来的.,方法(1)t检验,例对上例中的回归系数进行假设检验,(2)方差分析,应变量y的离均差平方和,回归平方和,即在y的总变异中可用x与y的线性关系解释的那部分变异,残差平方和,即扣除了x对y的线性影响后,其它所有因素对y变异的影响,P(x,y),应变量平方和分解图,例用方差分析对上述回归方程进行假设检验,回归模型的假设条件,1)反应变量Y与自变量X之间呈直线变化的趋势,作散点图观察,2)因变量Y服从正态分布或残差服从正态分布的随机变量,X可为随机或非随机的变量,3)任意两个观察值之间是相互独立的,4)在自变量X的取值范围内,不论X取何值,Y均有相同的方差,直线回归方程的图示,在自变量X的实测范围内任取两个值,代入回归方程算出对应的,根据两点成一直线就可以画出该直线的图形。说明:所绘直线经过点;该直线与纵轴交点的坐标必等于截距a.此两点可以检验图形的绘制是否正确。,直线回归方程的应用,描述两变量的数量依存关系利用回归方程进行预测所谓预测就是把预报因子(自变量X)代入回归方程对预报量进行估计,其波动范围按求个体Y值的容许区间方法来计算。利用回归方程进行统计控制统计控制时利用回归方程进行逆估计,如要求应变量Y在一定范围内波动,可以通过自变量X的取值来实现。,个体y值的容许区间,当X取某一定值时,个体Y有一波动范围,其标准差为,个体y值的100(1-)容许区间为,残差的标准误,剩余标准误,如:为使一名糖尿病人的血糖维持在正常范围(4.44,6.66),如何控制血中胰岛素水平?已知有胰岛素估计血糖平均水平的直线回归方程为,欲将血糖水平控制在正常范围的上界即6.66以内时,血中胰岛素应维持在什么水平?,即将一名血糖病人的血糖水平控制在6.66以内,胰岛素可维持在32.64U/L上,残差分析,残差(residual)是指观察值Yi与回归模型拟合值之差,即为,它反映模型与数据拟合优劣的信息。,非线性回归,通过自变量的变换化为线性回归通过因变量的变换化为线性回归,例9.14以不同剂量的标准促进肾上腺皮质激素释放因子CRF刺激离体培养的大鼠垂体前叶细胞,监测其垂体合成分泌肾上腺皮质激素ACTH的量。根据表中数据的量建立CRF-ACTH工作曲线。,例一位医院管理人员想建立一个回归模型,对重伤病人出院后的长期恢复情况进行预测。自变量为病人住院天数X,因变量为病人出院后长期恢复后的预后指数Y,指数取值愈大表示预后结果越好。数据见下表。,15名重伤病人的住院天数与预后指数,直线相关与直线回归的联系和区别,区别,资料的要求不同,相关要求两个变量均服从正态分布.若对该种资料进行回归,称为型回归.,回归要求因变量Y服从正态分布,X是可以精确测量和严格控制的变量,称为型回归.,回归用来说明两变量间依存变化的数量关系,应用不同,相关用来说明两变量间的相关关系.,意义不同,b表示X每增(减)一个单位时,Y平均改变b个单位;r说明具有直线关系的两个变量之间关系的密切程度与相关方向.,计算不同,取范围不同-b,-1r1,单位不同,b受X,Y计量单位的影响,r不受计量单位的影响,联系,方向一致.对一组数据若同时计算r和b,它们的正负号是一致的.,假设检验是等价的.r和b的假设检验是等价的,即对同一样本,二者的t值相等,用回归可解释相关.,r的平方称为决定系数,即,回归平方和越接近总平方和,则相关系数的平方越接近于1,因而回归的效果越好.,应用直线回归和直线相关应注意的问题,作回归和相关分析时要有实际意义,不能把毫无关联的两种现象勉强作回归或相关分析在进行直线回归和相关分析时,应先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论