第八讲多元线性回归分析_第1页
第八讲多元线性回归分析_第2页
第八讲多元线性回归分析_第3页
第八讲多元线性回归分析_第4页
第八讲多元线性回归分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

讲述内容第一节 多元线性回归第二节 自变量选择方法第三节 多元线性回归的应用及其注意事项 目的 :作出以多个自变量估计应变量的多元线性回归方程。 资料 :应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。 用途 :解释和预报。 意义 :由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。第一节 多元线性回归 变量: 应变量 1 个,自变量 m 个,共 m+1 个。 样本含量: n 数据格式见表 15-1 回归模型一般形式:一、多元线性回归模型表 15-1 多元回归分析数据格式 条件(1)Y 与 mXXX , 21 L 之间具有线性关系。 (2)各例观测值 ),2,1( niYi L= 相互独立。 (3)残差 e 服从均数为 0、 方差为 2s 的正态分布,它等价于对任意一组自变量 mXXX , 21 L 值,应变量 Y 具有 相同方差,并且服从正态分布。 一般步骤建立回归方程(2)检验并评价回归方程及各自变量的作用大小二、多元线性回归方程的建立例 15-1 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表 15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。表 15-2 27名糖尿病人的血糖及有关变量的测量结果 求偏导数原 理最小二乘法三、假设检验及其评价 1. 方差分析法:(一) 对回归方程表 15-4 例 15-1的方差分析表 表 15-3 多元线性回归方差分析表2. 决定系数 R 2:3.复相关系数 (二)对各自变量 指明方程中的每一个自变量对 Y的影响(即方差分析和决定系数检验整体)。1. 偏回归平方和 表 15-5 对例 15-1数据作回归分析的部分中间结果 各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到,表 15-5给出了例 15-1数据分析的部分中间结果。结果2. t 检验法 是一种与偏回归平方和检验完全等价的一种方法。计算公式为结 果结 论3标准化回归系数 变量标准化是 将原始数据减去相应变量的均数,然后再除以该变量的标准差。计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数 。 注意:一般回归系数 有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时, 增加或减少一个单位时 Y 的平均变化量 。不能用各 来比较各 对 的影响大小。标准化回归系数 无单位,用来比较各自变量对应变量的影响大小, 越大, 对 的影响越大。结论第二节 自变量选择方法 目的 : 使得预报和(或)解释效果好一、全局择优法目的 :预报效果好意义 :对自变量各种不同的组合所建立的回归方程进行比较 择优 。选择方法:例 15-2 用全局择优法对例 15-1数据的自变量进行选择。 二、 逐步选择法1. 1.前进法 , 回归方程中的自变量从无到有、从少到多逐个引入回归方程。 此法已基本淘汰 。2. 后退法 , 先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作 F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论