医学统计学简单回归分析_第1页
医学统计学简单回归分析_第2页
医学统计学简单回归分析_第3页
医学统计学简单回归分析_第4页
医学统计学简单回归分析_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第12章简单线性回归分析,曹,流行病学与卫生统计系,回归解释,2020年6月25日,简单线性回归,3,第12章简单线性回归,线性回归的应用线性回归残差分析回归分析中应注意的问题非线性回归,2020/6/25,简单线性回归,4,1,线性回归,线性相关:分析两个变量之间相关性的方向和紧密度的统计方法。为了分析两个变量的数量相关性或从一个简单变量中推断另一个变量,采用回归分析。简单线性回归:包含一个因变量和一个自变量的多元线性回归:体重和体表面积、胰岛素水平和血糖水平。通过身高、体重和肺活量估计心室输出量,2020年6月25日,简单线性回归,5,1,线性回归,简单线性回归模型的一般形式,线性回归分析

2、的基本步骤,线性回归分析的条件,2020年6月25日,简单线性回归,6。(1)简单线性回归模型的一般形式,例如,随机选择15名健康成人,测量其血液的凝血酶浓度(单位/毫升)和凝血时间(秒)。数据如下表所示:2020,6月25日,简单线性回归,8,y代表因变量、因变量和响应变量;x代表自变量、解释变量和预测变量。预测值)用数学中的二元线性方程的形式表示简单线性回归,2020/6/25,简单线性回归,9,(1)简单线性回归模型的一般形式,而整体回归模型表示为:样本回归模型:2020/6/25,简单线性回归,10,(1)简单线性回归模型的一般形式,当截距和常数x=0时,y的估计值的单位与y的相同,当

3、x可能取0时,a具有实际意义。2020/6/25,简单线性回归,11,(1)简单线性回归模型的一般形式,b b的含义,斜率的单位)b是B0(y的单位/x的单位),直线从左下到右上,y随着x的增加而增加;B0,直线从左上角到右下角,y随着x的增加而减小;B=0,表示直线平行于X轴,并且X和Y之间没有线性关系。在回归分析中,B称为回归系数,2020/6/25,简单线性回归,12,(1)简单线性回归模型的一般形式,B的含义是指X的每增加(减少)一个单位,Y平均改变了B个单位。例如,1 7岁儿童按年龄(单位/毫升)估算体重(公斤)的回归方程为:2020年6月25日,简单线性回归,13。(1)简单线性回

4、归模型的一般形式,当含义为X时,例如,2020年6月25日Y的平均值(人口平均值的点估计),简单线性回归,14,(2)线性回归分析的基本步骤,绘制散点图(观察是否有线性趋势或异常点),估计回归参数,列出回归方程,对回归方程进行假设检验,在散点图上绘制回归线,解释回归系数的统计显著性,评估回归方程的拟合效果,2020/。简单线性回归,15,(2)线性回归分析的基本步骤,绘制散点图(观察是否存在线性趋势或异常点),2020/6/25,简单线性回归,16,(2)线性回归分析的基本步骤,估计回归参数,列出回归方程以求解A和B,事实上,找到一个可以是最佳的“合理的”最小二乘法原理估计残差或残差,即测量值

5、Y和假设回归线上的估计值之间的纵向距离。最小平方和:回归残差和最小,即从每个测量点到直线的纵向距离的平方和最小。,2020/6/25,简单线性回归,18,(2)线性回归分析的基本步骤,估计回归参数,并列出可通过计算器或软件计算的回归直线公式,2020/6/25,简单线性回归,19,(2)线性回归分析的基本步骤,对回归方程H0进行假设检验方差分析:=0,无线性回归关系;H1:0,存在线性回归关系;2020/6/25,简单线性回归,20,(2)线性回归分析的基本步骤,方差分析将因变量Y的总变差分为两部分,一部分是由线性回归引起的变差,另一部分是由残差引起的变差,而与平均平方的总偏差之和分为两部分,

6、而总自由度分为两部分。2020/6/25,简单线性回归,22的总方差分解(关于Y的平均值的平方和),Y,关于回归的平方和回归的贡献,回归的平方和:2020/6/25,简单线性回归,23,Y自由度分解,总自由度:n-1回归自由度:1剩余自由度:n-2,2020/6/25,简单线性回归,24,(2)线性回归分析2020 回归系数的T检验,2020/6/25,简单线性回归,26,(2)线性回归分析的基本步骤,在散点图上画回归直线解释回归系数的统计显著性,2020/6/25,2020回归方程拟合效果的评价残差标准差:残差标准差反映的是扣除x对y的线性影响后y的残差标准差越小,回归方差的拟合效果越好,2

7、020年6月25日,简单线性回归,28, (2)线性回归分析的基本步骤,回归方程拟合效果的评价决定系数(决定系数):r2决定系数反映回归引起的变异占y总变异的比例越大(越接近1),回归的拟合效果越好。 2020年6月25日,简单线性回归,29。(2)线性回归分析的基本步骤,绘制散点图(观察是否有线性趋势或异常点),估计回归参数,列出回归方程,检验回归方程的假设,并在散点图上绘制回归线以解释回归系数的统计显著性。评估回归方程的拟合效果,2020/6/25,简单线性回归,30,教科书示例,对14名40-60岁健康女性的体重(Kg)和基础代谢(KJ/d)进行回归分析:绘制散点图,2020/6/202

8、0。教材实例,建立回归方程,教材实例,假设检验(方差分析),教材实例,假设检验(t检验),2020/6/25,简单线性回归,34,教材实例,画直线,2020/6/25,简单线性回归,35,教材实例,评价回归方程拟合线性:因变量Y和自变量X线性无关;每个观察值是独立的;正态性:给定X,Y服从等方差,如正态分布;在独立变量X的范围内,无论X取什么值,Y都有相同的方差。,2020/6/25,简单线性回归,38,2,线性回归的应用,回归分析中总体回归系数的置信区间估计,给定x=XP的y总体均值的置信区间估计,给定x=XP的个体y值的容许区间估计,2020/6/25,简单线性回归,39,2审查总体均值的

9、置信区间:具有平均边界值的标准误差的个体的容许区间(参考范围):平均边界值的标准偏差,2020/6/2020 简单线性回归,40,1,人口回归系数置信区间的估计,根据t分布原理的估计:人口回归系数置信区间、2020/6/25,简单线性回归。 2.置信区间估计:当给定X时,样本总体Y的均值为Y的均值(Y的条件均值)。根据T分布原理,人口回归线的95%置信带,2020年6月25日,简单线性回归,43,3,个体Y预测值的允许区间的估计,以及给定X时Y值的允许区间(。y单值95%预测带,2020/6/25,简单线性回归,45,3,残差分析,残差分析功能(直观图示)评价数据是否满足回归分析条件,识别异常

10、点,了解数据与回归模型的关系,2020/6/25,简单线性回归分析应有实际意义。散点图应该首先绘制,并且应该避免超出独立变量的范围。任意可拓残差图是检验回归分析条件是否满足的一种简单有效的方法。2020年6月25日,简单线性回归,49,线性回归和线性相关的区别和联系,相关性和回归分析的区别,不同相关性的作用意味着相互关系,没有依赖关系;回归是依赖的;r没有单位,B有单位;对数据的要求是不同的:相关要求是二元正态分布,回归分析条件(4)在X和Y是随机的情况下可以用于相关和回归分析;当y是随机的(x是受控的)时,理论上只能进行回归,而不能进行相关分析;2020/6/25,简单线性回归,50,所有连接都表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论