




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
六西格玛绿带培训教材 一般线性回归分析,11-1,结束对本章节的学习后,学员将可以: 解释什么是回归分析 进行一般线性回归分析与解释 假设 测定系数(R2与修正的R2) 回归诊断 置信区间 有影响的观测数据 估计标准误,学习目的,定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入) 之间的统计关系的方法。 Y=f(X1,X2,Xn),回归分析,其中:,Y是响应变量,X1到Xn是因变量,11-2,定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。 也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变 量间的联系强度,在这里-1R1。 按照惯例,R表示真实的系数,R表示我们的最佳估算。,相关,回归分析 回归分析建立关于因变 量与响应变量之间关系 的估计方程式(公式)。,回归与相关,相关分析 量化两个变量之间的线性关系 的程度,即等式的适合性如何?,VS,11-3,预测 系统模型 因子筛选 参数估算,回归的应用,一般线性回归(SLR)数学模型 其中:,一般线性回归,Y-轴上的截取值,预测(独立)变量,Y,=,a+bX,斜率,是响应(非独立)变量,11-4,最小平方的方法,残差(或误差)由e1=Yi-(a+bXi)表示。(观测值-拟合值) 最适合的直线即是残差平方和最小的那条线。,最小平方的方法,11-5,在Minitab中,可通过以下两种方法得到一般线性回归模型(最佳拟合线):,统计回归回归,统计回归拟合线图,例1,某黑带想了解一化学蒸馏过程中氧气的纯度(Y)与冷凝器中的炭氢化合物 %之间的关系。 数据在文件Oxygen purity. mtw中。 建立Oxygen purity. mtw对Hydrocarbon %(X)之间的一般线性回归模式。,例1A,Minitab统计回归回归,11-6,例1A:Minitab的对话窗口,回归分析:Oxygen purity%与Hydrocarbon% 回归方程为Oxygen purity%=74.3+14.9+Hydrocarbon% 系数标 自变量 系数 准误 T P 常量 74.283 1.593 46.62 0.000 Hydrocarbon% 14.947 1.317 11.35 0.000 S=1.08653 R-Sq=87.7% R-Sq(调整)=87.1% 方差分析 来源 自由度 SS MS F P 回归 1 152.13 152.13 128.86 0.000 残差误差 18 21.25 1.18 合计 19 173.38,与Hydrocar的关系解释 了y值87.7%的变异。,F检验显示测定系数87.7%,具备统计显著性。,整体显著性,在Minitab中P数值是对回归等式的整体显著性的测量,P-value0.05表示在统计上回归关 系显著,R2=87.7%,P-value=0.000,回归关系所表达的Y的变异的87.7%在统计上是显著的。,例1B,Minitab统计回归拟合线图,11-8,例1B:拟合线图,例2:残差分析,从文件Oxygen purity中,建立Oxygen purity对Hydrocarbon%(X)之间 的一般线性回归模式并进行残差分析,11-9,例2:Minitab的残差图表,例2:Minitab的残差图表,11-10,随机,正态性,正态且均值为0,随机,置信区间,置信区间(CI) 对于一个给出的X,Y的平均值的分布区间。该区间在X=X处最窄: X值离X越远其区间宽度越大。 预测区间(PI) 对于与一个给出的X值相应的个别的Y值的区间。由于其应用个体值, 该区间比置信区间宽。,例3,从文件Oxygen purity.mtw中,测定对已获得的线性回归模型的95%置信 区间和预测区间。,11-11,Minitab例3,Minitab统计回归拟合线图,例3:Minitab的CIPI图,11-12,利用回归模型进行预测,我们可以预测两个数:,给出X值,预测y的均值uy,给出X值,预测y数值,我们不可以用此模型预测数据范围以 外的uy或y。此模型只是在数据范围内 才被验证为有效。,例4:预测,从文件Oxygen purity.mtw中,给定X的值为1.15,确定uy和y的95% 区间。,11-13,例4:预测,Minitab统计回归回归,例4:Minitab输出,新观测值的预测值 新观家 拟合值 测值 拟合值 标准误 95%置信区间 95%预测区间 91.473 0.250 (90.947,91.999) (89.130,93.815) 新观测值的自变量值 新观 测值 Hydrocarbon% 1 1.15,11-14,具有影响的数据点,具有影响的数据点包括下列现象: 1.在正常数据模式以外的数据; 2.强烈影响回归结果的数据(也就是显著改变斜率或y轴截取值) 这些现象并不一定是坏现象,因此你不一定要删除他们。,不管怎样,并在分析回归结果之前应该识别 这些数据点并评估其影响。,具有影响的数据点,具有影响的数据可由于下列原因而被删除: 测量误差 数据输入误差 违反物理定律,包含明显的虚假值的回归方程式会被视为无效!,11-15,具有影响的数据现象:界外点,界外点 具有很大残差数值的现象数据。,具有影响的数据现象:杠杆点,杠杆点 X方向的高数值数据,它对于平方占有很高的比例。,11-16,具有影响的数据现象,界外点的处理方法,对于如下两种情况,可以取消界外点: 对不将其纳入分析中有合理的解释(例如:输入错误)。 若纳入这些数据,会令回归分析的合理的解释失效。 但是,因原因#2被撤消的点必须和回归分析同时报告,要么作为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤炭制品国际贸易合同条款考核试卷
- 电器具生产过程中的质量管理考核试卷
- 节能型纺织设备智能节能技术考核试卷
- 建筑设计方案设计要点汇报
- 《Q&HSE体系培训》课件
- 环保设备工程导论课件
- 《LED灯生产工艺与质量控制》课件
- 2019-2025年助理医师资格证考试之口腔助理医师考前冲刺模拟试卷B卷含答案
- 合规师初级考试试题及答案
- 小班耳朵相关课件
- 医院消毒隔离知识培训
- 武装部文职试题及答案
- 警犬培训授课课件
- 2025年四川绵阳交通发展集团有限责任公司招聘笔试参考题库附带答案详解
- 成本控制在质量管理中的策略试题及答案
- 人工智能在药物研发中的辅助作用与潜力
- 作风建设学习教育查摆问题清单及整改措施
- 2025届河北省石家庄第一中学高三下学期二模地理试题及答案
- 2024年山东开放大学招聘考试真题
- PSP问题解决流程分析
- 语文-华大新高考联盟2025届高三3月教学质量测评试题+答案
评论
0/150
提交评论