单变量回归(eviews)_第1页
单变量回归(eviews)_第2页
单变量回归(eviews)_第3页
单变量回归(eviews)_第4页
单变量回归(eviews)_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日目的:目的: 介绍作为实证模型建立方法的回归分析,以模拟具有连续响应变量“ Y” 的过程。(定义:实证基于观测值或事实)目标:目标: 确定何时使用回归,以及为什么使用。 理解使用回归方法构建一个连续“X”变量与连续“ Y”响应变量的关系模型。 在Minitab中应用回归方法,根据数据拟合一条直线。在给定X的情况下,用拟合的直线方程式预测“ Y”。 了解确定模型是否为所给定数据的最佳

2、模型的数学方法。 说明并理解确定模型是否为所给定数据的最佳模型的图形方法。单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日什么是回归?什么是回归?描述“ Y”与“X”关系的数学方法 创建工序的“模型”。Y=b0+b1x+e 其中: b0为Y截距b1为直线斜率e为模型的误差项为何要使用回归?为何要使用回归? 寻找潜在的关键少数“ X” 预测“ Y” 优化“Y” 确定如何设置“ X”以优化“ Y”何时使用回归?何时使用回归? 筛选被动数据(历史或基准数据),以找到潜在的关键“ X”危险危险!不要使用被动数据得出最终不要使用被动数据得出最终

3、结论结论。还要继续进行。还要继续进行DOE(试验设计)(试验设计)记住被动数据是历史数据;这种关系记住被动数据是历史数据;这种关系当前可能并不存在。当前可能并不存在。 分析DOE(试验设计)的结果回归是一种必须谨慎使用的强有力的工具。回归是一种必须谨慎使用的强有力的工具。单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日 我们可能对独立变量(X)和响应变量之间的关系感兴趣。表示它们之间关系的散点图可能如下所示: 假定真正的关系为:线性关系存在“ b0”(常数)和“ b1”(系数)为固定、但未知的参数“ X” 为独立变量“ Y” 为观测的

4、响应值“ e” 为误差。常见的误差假设有:平均值为0.0不相关正态分布误差不存在型式的分布Yi = bo + b1 * Xi + ei单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日 收集数据收集数据 以估测方程的最佳方法是什么? “ b0”和“ b1”的估测值估测值是多少? 这是否是正确的函数形式函数形式(直线)? 关系是否具有统计显著性统计显著性(不是偶然出现)? 误差误差“ ei”有多大? 单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日要使估计的斜率误差误差最小最小,

5、将观测值的1/2置于“ X”的下限,将其它1/2置于上限,并使独立变量在广范围内取值。这适用于Y值高度变化、独立变量的范围较小、而且它们之间的关系预期为直线的情形。- 11xy要确定关系的形式(是直线还是曲线?是直线还是曲线?), 采用两级以上的独立变量。如果数据高度变化,常常采用3个级别。- 11xy0最好是以随机顺序随机顺序收集数据,而不要以低值的“ X”开始然后逐渐递增 另一个随时间变化的可能影响工序。单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日Minitab的单变量回归的单变量回归在Minitab中打开新工作表,并在C1和

6、C2中输入以下数据:举例举例:您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过下列数据证明这种关系的存在。单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日看上去是线性看上去是线性!GraphPlot单击单击“ OK” 运行运行单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日自变量自变量单击单击 Graphs 单击单击 Storage StatRegressionRegression.(参见下页的子对话框参见下页的子对话框 )并并单变量回归

7、单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日此对话框用于生成残差(误差)图采用这些图形检验您的模型中有关误差的假设单击此框,指明您想看的图形单击 OK, 然后单击对话框中的 Storage 按钮单击 Fits 和 Residuals ,以在数据窗口存储信息点击 OK 两次单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日“ X” 变量的变量的p值值 - 速度速度 Ho: 斜率= 0 Ha: 斜率 = 0或者,另一种表达方式: Ho: “ X” 不显著 Ha: “ X” 显著接受Ha无

8、法拒绝Ho关于会话窗口输出结果的进一步描述,可参见附录。常数常数的的p-值值H0:直线通过原点(0,0)(0速度=0蒸发) Ha:直线不通过原点(0,0)(“Ctrl-M” 移至会话窗口移至会话窗口单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日s:残差(误差)的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离。(对于优秀的模型,此值应较小)s = MS(error)1/2R-Sq:由拟合线“ 解释”的总变差的百分数。由“ X”解释的变差。(对于优秀的模型,此值应较大)R-Sq(adj):对过于拟合情况(

9、方程式中的变量过多)的调整,它将包括模型中的项数与观测值的个数进行对比 其中 n = 观测值数量 p =模型中项数,包括常数R2越大,模型对工序模拟得越好对于良好的模型,该值应接近R2值该值越小 (误差的大小),模型越好请参见附录更多的定请参见附录更多的定义义R adjRnn p21211() R2 = SSregressionSStotal单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日通过查看通过查看R-Sq, R-Sq(adj),s和和p值值来评估模型来评估模型SSregression:由模型中的“ X”而解释的响应变量“ Y”

10、的变差。每一X值对应的模型预测值和Y的总平均值之差的 平方和。SSerror:未被解释未被解释的“Y”的变差。每个数据点的Y观测值和该数据点Y的预测值之差的平方和。SStotal:Y值相对其平均值的总变差。误差项相对总数应很小p-值应 RegressionFitted Line Plot单击“ Options”单击这些选项以在单击这些选项以在图形输出窗口显示图形输出窗口显示更多的信息更多的信息“ 拟合线图”提供:会话窗口中的回归分析显示运用最小二乘法原理拟合直线*图显示置信区间(C.I.)和预测区间 (P.I.)图单击两次“ OK”* 参见附录中的最小二乘法参见附录中的最小二乘法单变量回归单变

11、量回归GE Appliances Copyright 1999修订版10 1999年1月11日置信区间和预测区间置信区间和预测区间C.I. = 置信区间置信区间 (95%置信度表示所有数据的平均值都位于此带内)P.I. = 预测区间预测区间 (95%置信度表示单个数据点位于此带内) 置信带预测带单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日会话窗口中的信息与早期生成的信息相同会话窗口中的信息与早期生成的信息相同无法否定Ho:接受Ha: 我们已经找到潜在的关键“ X” 速度根据散点图、及残差图(无型态)得出结论,线性模型拟合良好。拟合

12、有多好? 给定速度来预测蒸发率,为此目的,这个模型应该可以接受 (基于:R2=90.5%,以及较小误差项(S=.16)。 如果工序非常关键,应使用更多的数据。然后,可以建立误差分布更接近正态的回归模型。单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日您相信我们的家电所占据的展示厅面积的大小会影响销售量。您已经收集了过去12个月内,多个零售点销售量与总的占地面积方面的数据。现在,您希望分析这些数据,看占地面积是否确实与年销售量存在某种关系。在在Minitab输入以下数据:输入以下数据:应用您所学的单变量回归方法。准备好解释您的答案、以及

13、支持您的结论的结果。 ($K) (平方英尺)单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日 在进行回归之前,将“ Y”与“ X”的数据画图您首先需要知道哪种模型合适。 回归可用于被动数据,但一定要谨慎谨慎,因为它不是一个受到控制的试验。 在采用回归方法得出有关被动数据的结论之前,一定要进行 DOE。 观察 残差与拟合值图,以集中精力于您的模型可能存在的潜在问题。借助残差图来判断“ 拟合的优劣”。 采用拟合线图,通过数据创建一个回归线图形,并确定模型的置信区间和预测区间。单变量回归单变量回归GE Appliances Copyrigh

14、t 1999修订版10 1999年1月11日单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日 r:多重回归的相关系数(r)。越接近+/-1,模型拟合越好。 0表示无线性关系。R-Sq:相关系数的平方(R2)。R2的值越接近100%,说明可能存在关系,由模型解释的变差的百分比越高。R-Sq(Adj):在过度拟合情况下对R2的调整(将模型中的项数考虑在内)。估计值的估计值的数据相对预测“ 表面”的标准变差。标准误差标准误差s = MS误差1/2回归均方回归均方模型总体“ 之间”变差的估测。(MS回归回归)MS回归= SS回归/ DF回归

15、(DF=自由度)F-比率:比率:“ F”统计量。数值大表示模型可鉴别因素(X)与因变量Y值之间的关系。F=MS回归/MS误差p-值:值:接受“存在差异”时,发生错误的机率。p值0.05说明无法得出存在差异(显著)的结论。模型不是“好”模型的机率。“好”表明找到了因素X与响应变量Y之间的关系。单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日(Xi - n X - X) - Y) - X) (Y - Y) = b1(X 最小平方线通过(X, Y): (Y和经常用于表示总体值。“ b0”“ b1”是从数据中得出的总体值。 选择“ b0”“

16、b1”,使误差平方和为最小。“ 最小平方最小平方”:最小化: 取与“ b0”和“ b1”相关的偏导数,并使导数为0.0。 ii - X) - n X Y X Yii (Xii斜率为 b1 = - = - Xi 22 2 (ei2) = (Yi - b0 - b1 Xi)2单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日计算系数的置信区间计算系数的置信区间 (斜率斜率)(参考7.11页的例子)会话窗口中的回归方程式为: 蒸发率 = 0.069 + 0.00383 速度斜率估算值0.00383为根据数据得出的直线斜率估测值。由于它是估测值

17、,我们知道实际值位于可能取值的范围内 - 置信区间。斜率的置信置信区间区间可根据下列方程式计算:估算值估算值 +/- (t df, )(估计值的标准误差估计值的标准误差) 斜率估计值标准误差在StDev栏中查找:0.00044(上舍入) t值是使用模型中误差项的自由度(8)以及双边检验的0.05而从T表中获得的结果:t=2.31斜率的斜率的95%置信区间是置信区间是 :0.00383 +/- 2.31(0.00044)(0.00281, 0.00485)单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日首先将数据制图.GraphPlot占地面积和年销售量看上去呈线性关系下一步,运行回归功能得到模拟方程式不要忘记保存残差并创建残差图单变量回归单变量回归GE Appliances Copyright 1999修订版10 1999年1月11日 这里“ R-Sq”的大小对于这两种变量之间的关系大概可以接受 (商业质量过程具有大量无法控制的 噪音) “ R-Sq

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论