




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
六西格玛绿带培训教材一般线性回归分析,11-1,结束对本章节的学习后,学员将可以:解释什么是回归分析进行一般线性回归分析与解释假设测定系数(R2与修正的R2)回归诊断置信区间有影响的观测数据估计标准误,学习目的,定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)之间的统计关系的方法。Y=f(X1,X2,Xn),回归分析,其中:,Y是响应变量,X1到Xn是因变量,11-2,定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间的联系强度,在这里-1R1。按照惯例,R表示真实的系数,R表示我们的最佳估算。,相关,回归分析回归分析建立关于因变量与响应变量之间关系的估计方程式(公式)。,回归与相关,相关分析量化两个变量之间的线性关系的程度,即等式的适合性如何?,VS,11-3,预测系统模型因子筛选参数估算,回归的应用,一般线性回归(SLR)数学模型其中:,一般线性回归,Y-轴上的截取值,预测(独立)变量,Y,=,a+bX,斜率,是响应(非独立)变量,11-4,最小平方的方法,残差(或误差)由e1=Yi-(a+bXi)表示。(观测值-拟合值)最适合的直线即是残差平方和最小的那条线。,最小平方的方法,11-5,在Minitab中,可通过以下两种方法得到一般线性回归模型(最佳拟合线):,统计回归回归,统计回归拟合线图,例1,某黑带想了解一化学蒸馏过程中氧气的纯度(Y)与冷凝器中的炭氢化合物%之间的关系。数据在文件Oxygenpurity.mtw中。建立Oxygenpurity.mtw对Hydrocarbon%(X)之间的一般线性回归模式。,例1A,Minitab统计回归回归,11-6,例1A:Minitab的对话窗口,回归分析:Oxygenpurity%与Hydrocarbon%回归方程为Oxygenpurity%=74.3+14.9+Hydrocarbon%系数标自变量系数准误TP常量74.2831.59346.620.000Hydrocarbon%14.9471.31711.350.000S=1.08653R-Sq=87.7%R-Sq(调整)=87.1%方差分析来源自由度SSMSFP回归1152.13152.13128.860.000残差误差1821.251.18合计19173.38,与Hydrocar的关系解释了y值87.7%的变异。,F检验显示测定系数87.7%,具备统计显著性。,整体显著性,在Minitab中P数值是对回归等式的整体显著性的测量,P-value回归拟合线图,11-8,例1B:拟合线图,例2:残差分析,从文件Oxygenpurity中,建立Oxygenpurity对Hydrocarbon%(X)之间的一般线性回归模式并进行残差分析,11-9,例2:Minitab的残差图表,例2:Minitab的残差图表,11-10,随机,正态性,正态且均值为0,随机,置信区间,置信区间(CI)对于一个给出的X,Y的平均值的分布区间。该区间在X=X处最窄:X值离X越远其区间宽度越大。预测区间(PI)对于与一个给出的X值相应的个别的Y值的区间。由于其应用个体值,该区间比置信区间宽。,例3,从文件Oxygenpurity.mtw中,测定对已获得的线性回归模型的95%置信区间和预测区间。,11-11,Minitab例3,Minitab统计回归拟合线图,例3:Minitab的CIPI图,11-12,利用回归模型进行预测,我们可以预测两个数:,给出X值,预测y的均值uy,给出X值,预测y数值,我们不可以用此模型预测数据范围以外的uy或y。此模型只是在数据范围内才被验证为有效。,例4:预测,从文件Oxygenpurity.mtw中,给定X的值为1.15,确定uy和y的95%区间。,11-13,例4:预测,Minitab统计回归回归,例4:Minitab输出,新观测值的预测值新观家拟合值测值拟合值标准误95%置信区间95%预测区间91.4730.250(90.947,91.999)(89.130,93.815)新观测值的自变量值新观测值Hydrocarbon%11.15,11-14,具有影响的数据点,具有影响的数据点包括下列现象:1.在正常数据模式以外的数据;2.强烈影响回归结果的数据(也就是显著改变斜率或y轴截取值)这些现象并不一定是坏现象,因此你不一定要删除他们。,不管怎样,并在分析回归结果之前应该识别这些数据点并评估其影响。,具有影响的数据点,具有影响的数据可由于下列原因而被删除:测量误差数据输入误差违反物理定律,包含明显的虚假值的回归方程式会被视为无效!,11-15,具有影响的数据现象:界外点,界外点具有很大残差数值的现象数据。,具有影响的数据现象:杠杆点,杠杆点X方向的高数值数据,它对于平方占有很高的比例。,11-16,具有影响的数据现象,界外点的处理方法,对于如下两种情况,可以取消界外点:对不将其纳入分析中有合理的解释(例如:输入错误)。若纳入这些数据,会令回归分析的合理的解释失效。但是,因原因#2被撤消的点必须和回归分析同时报告,要么作为一次计数要么
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 有机氟残液焚烧工应急处置考核试卷及答案
- 瓦斯防突工作业指导书
- 铌碳还原火法冶炼工成本控制考核试卷及答案
- 重冶固体原料输送工应急处置考核试卷及答案
- 无人机装调检修工作业指导书
- 绒线编织工专项考核试卷及答案
- 重冶净化工岗位操作技能考核试卷及答案
- 风机操作工作业指导书
- 胶基糖制造工作业指导书
- 物流调度作业管理办法
- EPC工程总承包项目实施方案
- 国庆节详细活动方案
- 第八章新时代坚持和发展中国特色社会主义的重要保障-2024版研究生新中特教材课件
- 糖尿病课件教学课件
- 风力发电场突发环境污染事故应急预案
- 三年级地方课程教案上册贵州省
- 唐山市2024-2025学年度高三年级摸底演练 生物试卷
- 医疗美容诊所、门诊部规章制度及岗位职责
- 九年级化学上册开学第一课人教版2024化学
- 全过程工程咨询投标方案(技术方案)
- 11BS4排水工程华北标图集
评论
0/150
提交评论