《直线回归》PPT课件.ppt_第1页
《直线回归》PPT课件.ppt_第2页
《直线回归》PPT课件.ppt_第3页
《直线回归》PPT课件.ppt_第4页
《直线回归》PPT课件.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

简单线性回归,概述,多个变量之间关系研究: 例: 某人群年龄、BMI与收缩压的关系; 儿童身高、胸围与肺活量的关系; 在此,介绍两个变量间线性的数量依存关系,即线性回归。,“回归”的由来,Regression 释义,大多数高个子父代的子一代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平; 大多数矮个子父代的子一代的平均身高不是更矮,而是稍高于其父代水平。 Galton将这种趋向于人群平均水平的现象称之为“回归”。,Regression 释义,Galton数据散点图(英寸),直线回归的概念,回归 F.Galton和Karl Pearson发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:,一. “回归”(regression)一词的由来,人们借用“回归”这个词来描述通过自变量(independent variable) 的数值预测反应变量(response variable)的平均水平。 为了通过可测或易测变量对未知或难测或不可测量的状态进行估计,可以借助于回归分析(regression analysis)。 例如:可以用身高体重活量估计心室输出量,体循环总血量。尿雌三醇含量估计胎儿的体重。,标准差相等 EQUAL STANDARD DEVIATION 对于任何X值,随机变量Y的标准差 Y|X相等,独立 INDEPENDENCE 每一观察值之间彼此独立,y|X = + x,直线回归模型的四个假定,线性 LINEARITY 反应变量均数 与X间呈直线关系 Y|X= a + X,正态 NORMALITY 对于任何给定的 X, Y 服从正态分布,均数为 Y|X,标准差为 Y|X,直线回归的一般表达,直线回归的概念,a:常数,截距(intercept) 当X取值为0时相应Y的均数估计; b:斜率(slope),回归系数(cofficient of regession) 当X变化一个单位时Y的平均改变的估计值。,直线回归方程的求法,最小二乘法(least square method)原理,最小二乘法原则 (least square method):使各实际散点(Y)到直线( )的纵向距离的平方和最小。即使 最小。,寻找使S(残差i)2 最小的直线,直线回归方程的求法,根据数学上的最小二乘法(least square method)原理,可导出a、b的算式如下:,因为直线一定经过 “均数”点,直线回归中的统计推断,回归系数的假设检验 总体回归系数 的可信区间,回归系数的假设检验,直线回归中的统计推断,b0原因: 总体回归系数=0,由于抽样误差引起 b0 总体回归系数 0,存在回归关系 因此需作是否为零的假设检验。 方法: 方差分析 t检验,X,方差分析方法 基本思想需要对应变量Y的 离均差平方和作分解。,应变量Y的平方和划分示意图:,Y的离均差平方和的分解,统计量F 的计算公式为: 分别称为回归均方与剩余均方。统计量F服从自由 度为 的F分布。求F值后,查F界值表,得P值,按所取检验水准作出推断结论。,直线回归中的统计推断,t检验方法,直线回归中的统计推断,Syx为y的剩余标准差- 扣除x对Y的线性影响后y对回归线的离散程度。,回归方程的评价,假设检验 Root MSE (剩余标准差) R-Square (决定系数) Adj R-Sq (校正决定系数),R-Square:回归平方和在Y的总离均差平方和中所占比重 R-Square=SS回归/SS总=1-SS剩余/SS总 0R-Square 1 当回归系数=0, 则R-Square=0 当所有的观测值正好落在拟和的回归线上时, 则R-Square=1 R-Square越接近1,说明回归模型对资料的拟合优度越佳,故R-Square作为衡量模型优劣的测度。,使用R-Square评价模型时需注意:,较大的R-Square并不一定意味着拟合模型是有用的,可能是因为: 只取得自变量很少几个水平的观察值,此时,尽管R-Square很大,甚至趋于1,但它不能作为衡量模型优劣的测度统计量;,Adj R-Sq :校正决定系数 可见,校正决定系数是相对SS残与SS总的自由度进行的加权调整。,总体回归系数的可信区间 的1-双侧可信区间为:,直线回归中的统计推断,Sb为回归系数的标准误,描述 预报 控制,直线回归的应用,描述两变量的依存关系 通过回归系数的假设检验,若认为两变量间存在着直线回归关系,则可用直线回归来描述两变量的依存关系。,直线回归方程的应用,利用回归方程进行预测(forecast) 把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计。,直线回归方程的应用,利用回归方程进行统计控制(statistical control) 利用回归方程进行逆估计,如要求应变量Y在一定范围内波动,可以通过自变量X的取值来实现。,直线回归方程的应用,总体均数 的可信区间 给定X=X0 时,总体均数 的可信区间 其中,直线回归的应用,直线回归中的统计推断,个体 Y值的预测区间 给定X=X0 时,对应的个体Y值也存在一个波动范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论