直线回归与直线相关_第1页
直线回归与直线相关_第2页
直线回归与直线相关_第3页
直线回归与直线相关_第4页
直线回归与直线相关_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十四章第十四章 直线回归与直线相关直线回归与直线相关单变量的统计分析方法单变量的统计分析方法-统计描述与同一变量统计描述与同一变量的不同处理组间的比较。的不同处理组间的比较。多变量的统计分析方法多变量的统计分析方法-多个变量之间的数多个变量之间的数量依存关系及关联度的研究量依存关系及关联度的研究线性相关线性相关线性相关的概念及统计描述线性相关的概念及统计描述例例 随机抽取随机抽取15名健康成人,测定血液的凝血酶浓度名健康成人,测定血液的凝血酶浓度及凝固时间,数据见表及凝固时间,数据见表11-1。试判断此数据是否相关?。试判断此数据是否相关?表表11-1 15例健康成人凝血时间与凝血酶浓度测量

2、值记录例健康成人凝血时间与凝血酶浓度测量值记录受试者号受试者号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15浓度浓度 1.1 1.2 1.0 0.9 1.2 1.1 0.9 0.6 1.0 0.9 1.1 0.9 1.1 1 0.7时间时间 14 13 15 15 13 14 16 17 14 16 15 16 14 15 17 图图1 数据散点图数据散点图从散点图中可以看出从散点图中可以看出: 图中散点虽不都在一条直线上,但它们有一种线性趋势图中散点虽不都在一条直线上,但它们有一种线性趋势存在,即凝血酶浓度高的存在,即凝血酶浓度高的,凝血时间短凝血时间短;凝血酶浓度

3、低的凝血酶浓度低的,凝凝血时间长血时间长,说明凝血酶浓度与凝血时间之间确实存在联系且说明凝血酶浓度与凝血时间之间确实存在联系且方向相反。方向相反。两变量的关系不象函数关系那样能以一个变两变量的关系不象函数关系那样能以一个变量的数值精确地确定出另一个变量的数值,量的数值精确地确定出另一个变量的数值,即为非确定性关系即为非确定性关系 若图中各散点趋势接近一直线,且变化方向若图中各散点趋势接近一直线,且变化方向相同,称为相同,称为正相关正相关; 若图中各散点趋势接近一直线,且变化方向若图中各散点趋势接近一直线,且变化方向相反,称为相反,称为负相关负相关; 若图中散点的趋势不呈直线,但有规律地若图中散

4、点的趋势不呈直线,但有规律地呈一条曲线,称为呈一条曲线,称为非线性相关非线性相关;若图中散点杂乱无序,称为若图中散点杂乱无序,称为零相关零相关。n 直线相关的概念直线相关的概念研究两个连续型随机变量之间是否存在线性关研究两个连续型随机变量之间是否存在线性关系系,关系是否密切以及是正相关还是负相关关系是否密切以及是正相关还是负相关.n 直线相关系数直线相关系数 又称又称pearson积差相关系数积差相关系数,以以r表示样本表示样本相关系数相关系数,以以表示总体相关系数表示总体相关系数.它反映两个变量线性关系的方向和密切程度它反映两个变量线性关系的方向和密切程度的指标的指标,没有单位没有单位,其值

5、为其值为-1 r 1.n 计算公式计算公式的的方方差差)的的方方差差)(的的协协方方差差和和相相关关系系数数YXYX 上式中,若为总体协方差或总体方差时,相上式中,若为总体协方差或总体方差时,相关系数为总体相关系数,记为关系数为总体相关系数,记为0,X和和Y线性相关线性相关=0,X和和Y线性不相关线性不相关yyxxxylllyyxxyyxxr 22)()()( 上式中,若为样本协方差或样本方差时,上式中,若为样本协方差或样本方差时,相关系数为样本相关系数,记为相关系数为样本相关系数,记为r1)(1)(,1)(22,122122 nyyxxsnyysnxxsniyxniynixn相关系数的特点相

6、关系数的特点1) 是无量纲的数值,且是无量纲的数值,且-1r0为正相关为正相关,r0,说明两变量之间为正相关关系,说明两变量之间为正相关关系,r=1,完完全正相关全正相关r0说明直线与说明直线与Y轴的交点在原轴的交点在原点的上方,点的上方,a0表示表示Y随随X的增大而增大,的增大而增大,b0,表明,表明SAH患者脑脊液患者脑脊液IL-6随血清随血清IL-6增加而增加,且血清增加而增加,且血清IL-6每每增加增加1pg/ml时,脑脊液平均增加时,脑脊液平均增加1.18 1pg/ml。总体回归系数的统计推断总体回归系数的统计推断v 总体回归系数的区间估计总体回归系数的区间估计总体回归系数总体回归系

7、数的的1-的置信区间为的置信区间为bstb , 2/ 2)(,2. nyyslssxyxxxyb线线的的分分散散程程度度。它它反反映映散散点点围围绕绕回回归归直直的的变变异异的的影影响响被被扣扣除除后后的的标标准准差差。它它反反映映了了)值值距距回回归归线线(剩剩余余标标准准差差,是是各各观观察察称称为为是是回回归归系系数数的的标标准准误误,,YXYssXYb 例例 求上例中回归系数求上例中回归系数的的95%置信区间置信区间306.2,3983.0117.31,227.7746)(8,2/05.0.2 tssyybxy回归系数回归系数的的95%置信区间为置信区间为(1.180-2.3060.3

8、98,1.180+ 2.3060.398)=(0.262,2.098bbsbtHH00:0:10 v总体回归系数的假设检验总体回归系数的假设检验u目的目的 判断判断 b 是否从回归系数为零是否从回归系数为零(=0)的总体中随的总体中随机抽样得来的机抽样得来的.u方法方法(1) t检验检验间间有有直直线线关关系系和和脑脑脊脊液液患患者者血血清清,可可认认为为,接接受受的的水水准准拒拒绝绝按按查查表表得得,间间有有直直线线关关系系,即即和和脑脑脊脊液液患患者者血血清清:间间无无直直线线关关系系,即即和和脑脑脊脊液液患患者者血血清清:6605.0,05.0,306.2962.2,306.2,8962

9、.23983.0/18.108210,3983.018.105.006606610)8(2/05.010 ililSAHHHpttsbtsbililSAHHililSAHHbb 例例 对上例中的回归系数进行假设检验对上例中的回归系数进行假设检验(2)方差分析)方差分析应变量应变量y的离均差平方和的离均差平方和 222)()()(yyyyyy回归平方和,即在回归平方和,即在y的总的总变异中可用变异中可用x与与y的线性的线性关系解释的那部分变异关系解释的那部分变异残差平方和,即扣残差平方和,即扣除了除了x对对y的线性影的线性影响后,其它所有因响后,其它所有因素对素对y变异的影响变异的影响02468

10、10120510152025xyyyy yy yy P(x,y)应变量平方和分解图应变量平方和分解图残残差差回回归归总总SSSSSS 残残差差回回归归总总 21 nMSMSSSSSF残残回回残残回回残残回回, PFFPFF,),(),(残残回回残残回回例例 用方差分析对上述回归方程进行假设检验用方差分析对上述回归方程进行假设检验存存关关系系存存在在。之之间间线线性性依依脊脊液液与与血血清清统统计计学学意意义义,可可认认为为脑脑,差差别别有有,接接受受的的水水准准拒拒绝绝按按,界界值值表表得得查查,间间有有直直线线关关系系,即即和和脑脑脊脊液液患患者者血血清清:间间无无直直线线关关系系,即即和和

11、脑脑脊脊液液患患者者血血清清:),(残残回回残残回回回回总总残残总总回回605. 0,05. 0,32. 57742. 832. 581,7742. 82273.7746101.162428737.849505. 0066066108105. 0210 ILHHPFFFMSMSFSSSSSSSSllSSililSAHHililSAHHxxxy 回归模型的假设条件回归模型的假设条件1) 反应变量反应变量Y与自变量与自变量X之间呈直线变化的趋势之间呈直线变化的趋势,作作散点图观察散点图观察2) 因变量因变量Y服从正态分布或残差服从正态分布的服从正态分布或残差服从正态分布的随机变量随机变量,X可为随

12、机或非随机的变量可为随机或非随机的变量3) 任意两个观察值之间是相互独立的任意两个观察值之间是相互独立的4) 在自变量在自变量X的取值范围内的取值范围内,不论不论X取何值取何值,Y均有相均有相同的方差同的方差直线回归方程的图示直线回归方程的图示n 在自变量在自变量X的实测范围内任取两个值,的实测范围内任取两个值,代入回归方程算出对应的代入回归方程算出对应的 ,根据两,根据两点成一直线就可以画出该直线的图形。点成一直线就可以画出该直线的图形。说明:所绘直线经过点说明:所绘直线经过点 ;该直线与;该直线与纵轴交点的坐标必等于截距纵轴交点的坐标必等于截距a.此两点可此两点可以检验图形的绘制是否正确。

13、以检验图形的绘制是否正确。Y),(yx直线回归方程的应用直线回归方程的应用p描述两变量的数量依存关系描述两变量的数量依存关系p利用回归方程进行利用回归方程进行预测预测 所谓所谓预测预测就是把预报因子(自变量就是把预报因子(自变量X)代入回归)代入回归方程对预报量进行估计,其波动范围按求个体方程对预报量进行估计,其波动范围按求个体Y值的容许区间方法来计算。值的容许区间方法来计算。p利用回归方程进行统计控制利用回归方程进行统计控制 统计控制统计控制时利用回归方程进行逆估计,如要求应时利用回归方程进行逆估计,如要求应变量变量Y在一定范围内波动,可以通过自变量在一定范围内波动,可以通过自变量X的的取值

14、来实现。取值来实现。个体个体y值的值的容许区间容许区间当当X取某一定值时取某一定值时,个体个体Y有一波动范围有一波动范围,其标准差为其标准差为 20.)(110 xxxxnssxyy个体个体y值的值的100(1-)容许区间为容许区间为0)(ysty 残差的标准误残差的标准误,剩余标准误剩余标准误2) (2. nyysxy如如:为使一名糖尿病人的血糖维持在正常范围为使一名糖尿病人的血糖维持在正常范围(4.44,6.66),如何控制血中胰岛素水平如何控制血中胰岛素水平?已知有胰岛已知有胰岛素估计血糖平均水平的直线回归方程为素估计血糖平均水平的直线回归方程为xy4585. 07957.18 欲将血糖

15、水平控制在正常范围的上界即欲将血糖水平控制在正常范围的上界即6.66以内时以内时,血中血中胰岛素应维持在什么水平胰岛素应维持在什么水平? 20.,)(1xxxxnstyxy 64.324585. 0262.216324. 14585. 07957.18)(166. 618,05. 020., xxtxxxxxnstyxy 即将一名血糖病人的血糖水平控制在即将一名血糖病人的血糖水平控制在6.66以内以内,胰岛素可维持在胰岛素可维持在32.64U/L上上 残差分析残差分析 残差残差(residual)是指观察值是指观察值Yi与回归模型拟与回归模型拟合值之差合值之差,即为即为iiiYYe 它反映模型

16、与数据拟合优劣的信息。它反映模型与数据拟合优劣的信息。非线性回归非线性回归通过自变量的变换化为线性回归通过自变量的变换化为线性回归通过因变量的变换化为线性回归通过因变量的变换化为线性回归例例9.14 以不同剂量的标准促进肾上腺皮质激素释放因以不同剂量的标准促进肾上腺皮质激素释放因子子CRF刺激离体培养的大鼠垂体前叶细胞,监测其垂刺激离体培养的大鼠垂体前叶细胞,监测其垂体合成分泌肾上腺皮质激素体合成分泌肾上腺皮质激素ACTH的量。根据表中数的量。根据表中数据的量建立据的量建立CRF-ACTH工作曲线。工作曲线。例例 一位医院管理人员想建立一个回归模型,对重伤病人一位医院管理人员想建立一个回归模型

17、,对重伤病人出院后的长期恢复情况进行预测。自变量为病人住院天数出院后的长期恢复情况进行预测。自变量为病人住院天数X,因变量为病人出院后长期恢复后的预后指数,因变量为病人出院后长期恢复后的预后指数Y,指数,指数取值愈大表示预后结果越好。数据见下表。取值愈大表示预后结果越好。数据见下表。编号编号123456789101112131415住院天住院天数数X预后指预后指数数Y2545507451037143519252620311634183813458521153860465615名重伤病人的住院天数与预后指数名重伤病人的住院天数与预后指数n直线相关与直线回归的联系和区别直线相关与直线回归的联系和区

18、别 n区别区别资料的要求不同资料的要求不同相关相关要求两个变量均服从正态分布要求两个变量均服从正态分布.若对该若对该种资料进行回归种资料进行回归,称为称为型回归型回归.回归回归要求因变量要求因变量Y服从正态分布服从正态分布,X是可以精是可以精确测量和严格控制的变量确测量和严格控制的变量,称为称为型回归型回归.回归回归用来说明两变量间依存变化的数量关系用来说明两变量间依存变化的数量关系,应用不同应用不同相关相关用来说明两变量间的相关关系用来说明两变量间的相关关系.意义不同意义不同b表示表示X每增每增(减减)一个单位时一个单位时,Y平均改变平均改变b个单位个单位;r说明具说明具有直线关系的两个变量之间关系的密切程度与相关方向有直线关系的两个变量之间关系的密切程度与相关方向.计算不同计算不同取范围不同取范围不同 -b,-1r1单位不同单位不同b受受X,Y计量单位的影响计量单位的影响, r不受计量单位的影响不受计量单位的影响 总总回归回归SSSSlllryyxxxy 22n联系联系方向一致方向一致.对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论