《医学统计学》教学课件-相关与回归_第1页
《医学统计学》教学课件-相关与回归_第2页
《医学统计学》教学课件-相关与回归_第3页
《医学统计学》教学课件-相关与回归_第4页
《医学统计学》教学课件-相关与回归_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章线性相关与回归,(LinearCorrelationandRegression),学习目的通过学习相关与回归,明确变量间非确定性关系的统计分析方法,学会从专业角度考虑相关与回归的实际意义。学习要点相关与回归的概念,直线相关与直线回归分析,直线相关与直线回归的区别与联系,多重线性回归的意义。,临床应用,应用子宫高度直线回归方程法监测双胎妊娠时胎儿发育;由凝血酶浓度(写x)推算凝血时间(y)的回归方程;放射工作者个人受照剂量与淋巴细胞微核的相关分析;高血压患者门静脉压力与腹腔血管血流动力学指标的相关分析;正常408例胎儿长度与孕周的直线回归方程为EEL(预计胎儿长)=-6.00+1.075GA(孕周);眼玻璃体液钾浓度与死后时间(TSD)相关分析。,4,第一节线性相关(linearcorrelation),线性相关分析:描述两变量间是否有直线关系以及直线关系的方向和密切程度的统计分析方法。条件:两变量(x,y)都是来自正态分布的随机变量。,一、线性相关的概念,6,二、线性相关系数的意义与计算,相关系数:又称积差相关系数,是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。r:样本相关系数:总体相关系数,7,范围:r无单位,-1r1。大小:|r|越大,相关越密切。符号:r值为正正相关,r值为负负相关,8,三、相关系数的假设检验,1、tr检验,=n-2,9,三、相关系数的假设检验,2、查表法根据r值及=n-2查附表11(P254)相关系数r界值表。,10,四、直线相关分析步骤,1.考察资料是否满足双变量正态性。2.绘制散点图(scatterplot)考察两变量间有无直线趋势。3.计算相关系数rlxx=1000.909lyy=82.727lxy=230.455r=0.80124.相关系数的假设检验,11,【例6-1】20名糖尿病人的胰岛素水平(mU/L)与血糖水平(mmol/L)的测定值列于表6-1,试进行直线相关分析。,12,分析步骤:(1)对双变量进行正态性检验(2)绘制散点图(3)求相关系数(4)相关系数的检验假设H0:=0即胰岛素与血糖值H1:0即胰岛素与血糖值之间有直线相关关系=0.05r=-0.841,n=20,代入公式计算得t=-6.595根据=20-2=18,查t界值表,得P0.05,按=0.05检验水准,不拒绝H0,无统计学意义。故尚不能认为急性白血病患儿的血小板数与出血症状之间有等级相关关系。,第二节秩相关,第三节线性回归,一、线性回归的概念回归分析(regressionanalysis)是研究一个随机变量(Y)对另一个变量(X)或一组变量()间的依存关系的统计分析方法。,(LinearRegression),18,回归的由来:,英国统计学家PearsonK(18571936)1903年搜集了1078个家庭人员的身高、前臂长等指标的记录,发现儿子身高(y,英寸)与父亲身高(x,英寸)存在线性关系:=33.73+0.516x,19,表明:高个子父亲儿子的平均身高稍矮于其父亲的平均身高;而矮个子父亲儿子的平均身高稍高于其父亲的平均身高。英国人类学家GaltonF(18221911)将这种趋向于种族稳定的现象称之为“回归”。至此,“回归”逐渐发展成为分析两个变量或多个变量之间某种数量依存关系的一类统计方法。,SimpleLinearRegressionModel,根据散点图可以假定,对于x各个取值,相应的Y的总体均数在一条直线上,实际上是x对应的Y的总体均数的一个样本估计值。,等方差性EQUALSTANDARDDEVIATION对于任何x值,随机变量y的标准差y|x相等,独立性INDEPENDENCE每一观察值之间彼此独立,y|X=+x,二、直线回归模型的应用条件,线性LINEARITY反应变量均数与x间呈直线关系,正态性NORMALITY对于任何给定的x,y服从正态分布,均数为y|x,标准差为y|x,y,x,y,x,24,根据大量实测数据,寻求一个直线方程来描述两个变量间依存变化的近似的线性数量关系,此即线性回归。得出的直线方程称为线性回归方程。,b:回归系数意义a:截距,三、直线回归方程的建立,25,四、直线回归方程和回归系数的假设检验,(一)直线回归方程的假设检验方差分析(二)回归系数的假设检验t检验法(三)总体回归系数的可信区间估计(四)决定系数,27,方差分析的基本思想:把总的离均差平方和(即总变异)分解为至少两个部分,其自由度也分解为相应几个部分,其中至少有一部分表示(处理)因素的效应,有一部分表示抽样误差的影响,然后比较两者的均方,计算F值,若F值远大于1,可认为各组均数间差别有统计学意义,处理有效应,若F值接近甚至小于1,表示差别无统计学意义,处理组间效应相同(差异仅仅由抽样原因所致)。,(一)直线回归方程的假设检验,28,应变量Y的离均差平方和的分解,(x,y),29,应变量Y的离均差平方和的分解,SS总=SS回+SS剩,30,SS总=lYYSS回=blXY=lXY2/lXXSS剩=SS总-SS回=lYY-lXY2/lXY,SS总=SS回+SS剩总=n1回=1剩=n-2,(二)回归系数的假设检验,图6-5总体回归系数与样本回归系数示意图,(二)回归系数的假设检验,=n-2,其中Sy.x表示去除X影响后Y的变异大小,t检验法,(三)总体回归系数的可信区间估计,回归系数是总体回归系数的点估计,由于存在抽样误差,需要进行可信区间估计,公式为:,(四)决定系数,决定系数(determiningcoefficient,R2)就是相关系数的平方r2,是回归平方和在总的离均差平方和中所占的比例,反映因变量的总变异中可用回归关系解释的部分。0R21,R2值越接近于1,表示回归平方和在的总离均差平方和中所占的比重越大,模型对数据的拟合程度越好,表明利用回归方程进行预测也越有意义。反之,R2值越接近于,表示回归平方和在的总离均差平方和中所占的比重越小,模型对数据的拟合程度越差。所以,R2是评价回归效果的一个重要指标。,五、绘制回归直线,可在坐标轴上任意取相距较远且易读的两X值,根据所求直线回归方程算得对应值,用直线连接两点。应注意的是,回归直线可适当延长,但不应超过的实测值范围;另外,所绘回归直线必然通过(),据此可判断所绘图形是否正确。,六、残差分析,残差(residual)是因变量值与根据回归方程求出的预测值之差,反映回归方程预测而引起的误差,表达式为:残差分析(residualanalysis):通过残差了解数据与回归方程之间的关系,考察资料是否满足独立性、正态性和等方差性,检测有无异常值。最常用的是标准化残差与标准化残差图。以自变量为横轴,标准化残差为纵坐标,绘制标准化残差图。通常以(-2,2)区间为界限来证实模型的假定条件是否得到满足,判断有无异常值。,七、线性回归方程的应用1.定量描述两变量之间的线性依存关系。2.利用回归方程对因变量y进行估计(常用区间估计求当x取定某值时y值的波动范围),即进行预测。3.利用回归方程进行统计控制。,38,【例6-1】20名糖尿病人的胰岛素水平(mU/L)与血糖水平(mmol/L)的测定值列于表6-1,试进行直线相关分析。,直线回归分析,(1)考察资料是否满足直线回归分析的条件(2)绘制散点图(3)求直线回归方程(4)回归方程的假设检验(5)回归系数的检验(6)模型的评价(7)绘制回归直线(8)残差分析(9)模型的应用,八、进行线性回归分析的注意事项,1.只有将有联系的变量进行回归分析才有实际意义。2.以“因”或以易于测定、较为稳定或变异小者为x。3.因变量是随机变量,自变量既可以是随机变量,也可以是给定的量。4.回归方程建立后必须进行假设检验。5.使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围之外。,区别:1.资料要求不同:相关要求x、y服从双变量正态分布,回归要求y在给定某个x值时服从正态分布,x是可以精确测量和严格控制的变量。2.应用上:相关说明相关关系,回归说明依存关系;3.意义上:r说明具有直线关系的两变量间相互关系的方向与密切程度;b表示x每变化一个单位所导致的y的平均变化量;4.计算不同:5.取值范围不同:-1r1,-b;6.单位:r没有单位,b有单位。,九、线性相关和回归的区别与联系,联系:1.r与b正负号一致:r为正时,b也为正,表示两变量是正相关,是同向变化。r为负时,b也为负,表示两变量是负相关,是反向变化。2.r与b的假设检验等价:对同一组资料若同时进行r与b的假设检验,可得到相同的t值,即tr=tb;可用r的假设检验代替b的假设检验。3.型回归4.可用回归解释相关。*决定系数:即相关系数的平方r2,是回归平方和与总的离均差平方和之比,反映应变量y的总变异中可用回归关系解释的部分。越接近于1,表明利用回归方程进行预测越有意义。,九、线性相关和回归的区别与联系,43,SPSS的应用:,相关分析:analyzecorrelatebivariatecorrelationsvariables:xyok,44,SPSS的应用:,回归分析:analyzeregressionlinearregressiondependent:yIndependent:xok,【目的要求】,1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论