12一般线性回归分析.ppt_第1页
12一般线性回归分析.ppt_第2页
12一般线性回归分析.ppt_第3页
12一般线性回归分析.ppt_第4页
12一般线性回归分析.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

六西格玛绿带培训教材一般线性回归分析 11 1 结束对本章节的学习后 学员将可以 解释什么是回归分析 进行一般线性回归分析与解释 假设 测定系数 R2与修正的R2 回归诊断 置信区间 有影响的观测数据 估计标准误 学习目的 定义 回归是确定一个响应变量 或输出 与一个或多个因变量 或输入 之间的统计关系的方法 Y f X1 X2 Xn 回归分析 其中 Y是响应变量 X1到Xn是因变量 11 2 定义 决定两个来自不同变量源的响应 或输出 之间线性关系的方法 也代表两个变量间的线性关联程度 由一个相关系数 R 来衡量两个变量间的联系强度 在这里 1 R 1 按照惯例 R表示真实的系数 R表示我们的最佳估算 相关 回归分析回归分析建立关于因变量与响应变量之间关系的估计方程式 公式 回归与相关 相关分析量化两个变量之间的线性关系的程度 即等式的适合性如何 VS 11 3 预测 系统模型 因子筛选 参数估算 回归的应用 一般线性回归 SLR 数学模型其中 一般线性回归 Y 轴上的截取值 预测 独立 变量 Y a bX 斜率 是 响应 非独立 变量 11 4 最小平方的方法 残差 或误差 由e1 Yi a bXi 表示 观测值 拟合值 最适合的直线即是残差平方和最小的那条线 最小平方的方法 11 5 在Minitab中 可通过以下两种方法得到一般线性回归模型 最佳拟合线 统计 回归 回归 统计 回归 拟合线图 例1 某黑带想了解一化学蒸馏过程中氧气的纯度 Y 与冷凝器中的炭氢化合物 之间的关系 数据在文件Oxygenpurity mtw中 建立Oxygenpurity mtw对Hydrocarbon X 之间的一般线性回归模式 例1A Minitab统计 回归 回归 11 6 例1A Minitab的对话窗口 回归分析 Oxygenpurity 与Hydrocarbon 回归方程为Oxygenpurity 74 3 14 9 Hydrocarbon 系数标 自变量系数准误TP 常量74 2831 59346 620 000 Hydrocarbon 14 9471 31711 350 000 S 1 08653R Sq 87 7 R Sq 调整 87 1 方差分析 来源自由度SSMSFP 回归1152 13152 13128 860 000 残差误差1821 251 18 合计19173 38 与Hydrocar的关系解释了y值87 7 的变异 F检验显示测定系数87 7 具备统计显著性 整体显著性 在Minitab中P数值是对回归等式的整体显著性的测量 P value 0 05表示在统计上回归关系显著 R2 87 7 P value 0 000 回归关系所表达的Y的变异的87 7 在统计上是显著的 例1B Minitab统计 回归 拟合线图 11 8 例1B 拟合线图 例2 残差分析 从文件Oxygenpurity中 建立Oxygenpurity对Hydrocarbon X 之间的一般线性回归模式并进行残差分析 11 9 例2 Minitab的残差图表 例2 Minitab的残差图表 11 10 随机 正态性 正态且均值为0 随机 置信区间 置信区间 CI 对于一个给出的X Y的平均值的分布区间 该区间在X X处最窄 X值离X越远其区间宽度越大 预测区间 PI 对于与一个给出的X值相应的个别的Y值的区间 由于其应用个体值 该区间比置信区间宽 例3 从文件Oxygenpurity mtw中 测定对已获得的线性回归模型的95 置信区间和预测区间 11 11 Minitab例3 Minitab统计 回归 拟合线图 例3 Minitab的CI PI图 11 12 利用回归模型进行预测 我们可以预测两个数 给出X值 预测y的均值uy 给出X值 预测y数值 我们不可以用此模型预测数据范围以外的uy或y 此模型只是在数据范围内才被验证为有效 例4 预测 从文件Oxygenpurity mtw中 给定X的值为1 15 确定uy和y的95 区间 11 13 例4 预测 Minitab统计 回归 回归 例4 Minitab输出 新观测值的预测值新观家拟合值测值拟合值标准误95 置信区间95 预测区间91 4730 250 90 947 91 999 89 130 93 815 新观测值的自变量值新观测值Hydrocarbon 11 15 11 14 具有影响的数据点 具有影响的数据点包括下列现象 1 在正常数据模式以外的数据 2 强烈影响回归结果的数据 也就是显著改变斜率或y轴截取值 这些现象并不一定是坏现象 因此你不一定要删除他们 不管怎样 并在分析回归结果之前应该识别这些数据点并评估其影响 具有影响的数据点 具有影响的数据可由于下列原因而被删除 测量误差 数据输入误差 违反物理定律 包含明显的虚假值的回归方程式会被视为无效 11 15 具有影响的数据现象 界外点 界外点 具有很大残差数值的现象数据 具有影响的数据现象 杠杆点 杠杆点 X方向的高数值数据 它对于平方占有很高的比例 11 16 具有影响的数据现象 界外点的处理方法 对于如下两种情况 可以取消界外点 对不将其纳入分析中有合理的解释 例如 输入错误 若纳入这些数据 会令回归分析的合理的解释失效 但是 因原因 2被撤消的点必须和回归分析同时报告 要么作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论