第十二章_简单回归分析(讲).ppt_第1页
第十二章_简单回归分析(讲).ppt_第2页
第十二章_简单回归分析(讲).ppt_第3页
第十二章_简单回归分析(讲).ppt_第4页
第十二章_简单回归分析(讲).ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十二章 简单回归分析,概述 简单线性回归 线性回归的应用 残差分析 非线性回归,概述,回归分析 因变量Y 随自变量X的变化而变化。 相关分析 因变量Y 与自变量X间的彼此关系。 在医学研究中,常要分析变量间的数量规律。回归则是研究这种关系的统计方法。 线性回归则是较简单的一种。,简单线性回归,函数关系:确定的。如, y=2r 回归关系:不确定的。 Y随着X的变化而变化,但不具有一一对应性。 例如成年人的胸围随着体重的增大而增大,但不能讲体重60公斤的人,胸围一定是多少。,回归描述的是通过自变量的数值反应因变量的平均水平。因此可以通过可测或易测的变量估计难测或不可测变量的状态。 例如:通过体重

2、估计体表面积; 通过身高、体重、肺活量估计心室血输出 量、体循环总血量; 本章只涉及一个自变量的回归问题!,简单线性回归,回归系数b的意义 直线回归的概念主要是通过直线回归系数b的概念体现的。当X增加一个单位时,Y相应地平均改变b个单位。 例如,由年龄X推算小儿体重Y的回归方程为 它表示年龄增加l岁,体重平均增加2公斤。显然,回归系数b可以很好地反映X与Y之间的数量规律(以上方程适用于212岁儿童)。,简单线性回归,一般表达式: (linear regression equation) 直线回归方程中只有两个待定的常量a和b,所以求回归方程的目的就是求出a和b。 a:称为截距(intercep

3、t),当X可以取零时a才有意义。 b:称为回归系数(regression coefficient),它就是回归直线的斜率。 b0,Y随X的增加而增大; b0,Y随X的增加而减小; b=0,直线与X轴平行,X与Y无直线关系。 |b|越大,表示Y随X变化越快,直线越陡峭。,简单线性回归,简单线性回归,回归方程参数的计算: 根据样本观察值(x,y),计算a,b的过程 最小二乘原则 使各实际散点(Y)到直线( )的纵向距离的平方和最小 也即 最小,简单线性回归,为残差:点到直线的纵向距离。,最小二乘 (Least squares)法图解,寻找使S(残差i)2 最小的直线,简单线性回归,由最小二乘法得到

4、a,b的计算公式为:,例:随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如下:,简单线性回归,例:凝血酶浓度与凝血时间,计算得到: a21.77393 b6.98,直线回归方程的图示,在X的实测范围内,任取两值带入方程,求得Y的估计值,从而画出回归直线。,回归直线的有关性质,(1)直线通过均点 (2)直线上方各点到直线的纵向距离之和 = 直线下方各点到直线的纵向距离之和 即: (3)各点到该回归线纵向距离平方和较到其它任何直线者为小。,回归系数的假设检验,方程的统计学意义: 方程有无统计学意义通俗地讲是方程的真伪、方程能不能用的问题。 直线回归方程只有一个自变量,所

5、以回归系数的统计学意义与方程的统计学意义是等价的。 回归系数是否有统计学意义,可以用方差分析和t检验。,回归系数的假设检验,方差分析 引起Y变异的因素有: 1.自变量X的线性影响 2.其他因素及测量误差,1、建立假设 H0: =0 H1:0 =0.05 2、计算统计量 F值,X,回归系数的假设检验,回归系数的假设检验,回归系数的假设检验,回归系数的假设检验,总体回归系数 的假设检验,t 检验 1、建立假设 H0: =0 H1:0 =0.05 2、计算统计量,总体回归系数的统计推断,样本回归系数b的标准误,总体回归系数的统计推断,总体回归系数的置信区间,标准差相等 EQUAL STANDARD

6、DEVIATION 对于任何X值,随机变量Y的方差相等,独立 INDEPENDENCE 任意两个观察值之间彼此独立,y|X = + x,线性 LINEARITY 反应变量y的均数与X间呈线性关系,回归模型的四个假定,正态 NORMALITY 指线性模型的误差项服从正态分布,线性回归的应用,总体回归线的95置信带,线性回归的应用,线性回归的应用,线性回归的应用,个体Y预测值的区间估计,线性回归的应用,线性回归的应用,非线性回归,非线性回归,变换自变量实现线性回归的步骤 1、首先将观测数据作散点图,观察散点的分布与何种函数类型类似 2、对照所选函数进行相应的变量变换 3、使用最小二乘法作线性模型的

7、参数估计,直线回归与相关的区别与联系,区别 r 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关; 相关表示两变量关系的方向和密切程度。而回归则用函数方程表示应变量随自变量变化的数量关系; 对资料的要求不同: 当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析,直线回归与相关的区别与联系,联系 均表示线性关系; 符号相同:共变方向一致; 假设检验结果相同:是否存在共变关系; 决定系数 表示由X导致Y的变异在总变异中所占的比重,越接近1越好。开方便是相关系数,回归分析的正确应用,要有实际意义; 充分利用散点图,判断: (1) 线性趋势 (2) 离群值 回归系数是有单位的,不能根据 b 的大小判断回归关系的密切程度 自变量的选择: 原因 容易测量的 变异小的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论