商务统计学Ch13.ppt_第1页
商务统计学Ch13.ppt_第2页
商务统计学Ch13.ppt_第3页
商务统计学Ch13.ppt_第4页
商务统计学Ch13.ppt_第5页
免费预览已结束,剩余40页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

business statistics: a first course, 5e 2009 prentice-hall, inc.,chap 13-1,第13章 多元回归,商务统计学(第5版),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-2,学习目标,在本章,你将学到: 如何建立多元回归模型 如何对回归系数进行解释 如何确定哪些自变量应该纳入模型 如何确定哪些自变量在预测因变量时是比较重要的 如何在回归模型中使用属性变量,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-3,多元回归模型,想法: 检查一个因变量(y)与两个或多个自变量(xi)之间的线性关系,有k个自变量的多元回归模型:,y轴截距,总体斜率,随机误差,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-4,多元回归方程,利用样本数据估计多元回归模型的系数,y的估计值(或预测值),估计出的斜率系数,k 个自变量的多元回归方程:,估计出的截距,在本章中,我们将利用excel或者minitab来得到回归斜率系数以及其他回归指标,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-5,两个自变量的模型,y,x1,x2,自变量 x1的斜率,自变量 x2的斜率,多元回归方程,(续),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-6,例: 2个自变量,一个冰冻甜点馅饼的经销商想要评估影响需求的因素 因变量: 馅饼销售量 (单位:每周) 自变量: 价格 (美元) 广告费用(100美元) 收集了15周的数据,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-7,销售馅饼的例子,销售量 = b0 + b1 (价格) + b2 (广告费用),多元回归方程:,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-8,多元回归的excel 输出,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-9,多元回归的minitab 输出,the regression equation is sales = 307 - 25.0 price + 74.1 advertising predictor coef se coef t p constant 306.50 114.30 2.68 0.020 price -24.98 10.83 -2.31 0.040 advertising 74.13 25.97 2.85 0.014 s = 47.4634 r-sq = 52.1% r-sq(adj) = 44.2% analysis of variance source df ss ms f p regression 2 29460 14730 6.54 0.012 residual error 12 27033 2253 total 14 56493,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-10,多元回归方程,b1 = -24.975: 给定广告费用时,价格每上涨1美元,销售量平均每周减少24.975个,b2 = 74.131:给定销售价格时,广告费用每增加100美元,销售量平均每周增加74.131个,其中 销量以每周卖出的个数为单位 价格以美元为单位 广告费用以100美元为单位.,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-11,利用多元回归方程做预测,预测销售价格为5.50美元,广告费用为350美元时一周的销售量:,预测销量为 428.62 个馅饼,注意广告费用是以100美元为单位的,所以在350美元也就意味着 x2 = 3.5,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-12,在excel中利用 phstat做预测,phstat | regression | multiple regression ,点击对话框 “confidence and prediction interval estimates”,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-13,输入值,在excel中利用phstat做预测,(续),预测值y,给定x值,y均值的置信区间,给定x值,单个y值的预测区间,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-14,在 minitab中的预测,输入值,predicted values for new observations new obs fit se fit 95% ci 95% pi 1 428.6 17.2 (391.1, 466.1) (318.6, 538.6) values of predictors for new observations new obs price advertising 1 5.50 3.50,给定x,y均值的置信区间,给定x,单个y值的预测区间,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-15,多元可决系数,描述了y的变化中能被一组变量x解释的部分所占的比例,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-16,52.1%馅饼的销量变化可以由馅饼价格的变化和广告费用的变化来解释,在excel输出中的多元可决系数,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-17,在minitab输出中的多元可决系数,the regression equation is sales = 307 - 25.0 price + 74.1 advertising predictor coef se coef t p constant 306.50 114.30 2.68 0.020 price -24.98 10.83 -2.31 0.040 advertising 74.13 25.97 2.85 0.014 s = 47.4634 r-sq = 52.1% r-sq(adj) = 44.2% analysis of variance source df ss ms f p regression 2 29460 14730 6.54 0.012 residual error 12 27033 2253 total 14 56493,52.1%馅饼的销量变化可以由馅饼价格的变化和广告费用的变化来解释,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-18,调整后的 r2,当模型中加入一个新的变量x时,r2 肯定不会减少 当比较模型时,这是一个劣势 当加入一个新变量时,有什么净影响呢? 当加入一个新变量x时,我们失去了一个自由度 添加一个新变量x的说服力是否足以抵消失去一个自由度的损失?,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-19,调整变量y可以被变量x解释的比例以反映自变量个数和样本大小 (其中 n = 样本量, k = 自变量个数) 惩罚过度使用不重要的自变量 比 r2小 在模型比较中有用,调整后的 r2,(续),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-20,考虑了样本量和自变量的个数,馅饼销量变化的44.2%可以被销售价格的变化和广告费用的变化解释,在 excel输出中的调整r2,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-21,在minitab输出中的调整r2,the regression equation is sales = 307 - 25.0 price + 74.1 advertising predictor coef se coef t p constant 306.50 114.30 2.68 0.020 price -24.98 10.83 -2.31 0.040 advertising 74.13 25.97 2.85 0.014 s = 47.4634 r-sq = 52.1% r-sq(adj) = 44.2% analysis of variance source df ss ms f p regression 2 29460 14730 6.54 0.012 residual error 12 27033 2253 total 14 56493,考虑了样本量和自变量的个数,馅饼销量变化的44.2%可以被销售价格的变化和广告费用的变化解释,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-22,这个模型显著吗?,f 检验检验模型整体的显著性 检验所有自变量x与y之间是否存在线性关系 利用f检验统计量 假设: h0: 1 = 2 = = k = 0 (不存在线性关系) h1: 至少一个 i 0 (因变量和至少一个自变量之间存在线性关系),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-23,整体显著性的f 检验,检验统计量: 其 fstat 自由度为 k 和 (n k - 1),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-24,(续),整体显著性的f检验在excel中的输出,自由度为2和12,f检验的p值,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-25,整体显著性的f检验在minitab中的输出,the regression equation is sales = 307 - 25.0 price + 74.1 advertising predictor coef se coef t p constant 306.50 114.30 2.68 0.020 price -24.98 10.83 -2.31 0.040 advertising 74.13 25.97 2.85 0.014 s = 47.4634 r-sq = 52.1% r-sq(adj) = 44.2% analysis of variance source df ss ms f p regression 2 29460 14730 6.54 0.012 residual error 12 27033 2253 total 14 56493,自由度为2和12,f 检验的p值,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-26,h0: 1 = 2 = 0 h1: 1 和 2 不全为零 = .05 df1= 2 df2 = 12,检验统计量: 决策: 结论:,由于检验统计量 fstat 在拒绝域 (p-value .05)中, 拒绝 h0,有证据证明至少有一个自变量影响y,0, = .05,f0.05 = 3.885,拒绝 h0,不拒绝 h0,临界值: f0.05 = 3.885,整体显著性的f检验,(续),f,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-27,两个自变量的模型,y,x1,x2,yi,yi,x2i,x1i,最好的模型通过最小化误差的平方和e2得到,样本观察值,多元回归模型的残差分析,残差 = ei = (yi yi),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-28,多元回归假设,假设: 误差的独立性 误差值是统计独立的 误差服从正态分布 给定一系列 x值, 误差服从正态分布 等方差 (也被称为方差齐性) 误差值的概率分布是等方差的,ei = (yi yi),回归模型的误差 (残差),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-29,残差图在多元回归中的应用,以下残差在多元回归中用到 残差与 yi 残差与 x1i 残差与 x2i 残差与时间 (时间序列数据),用残差图检查是否违背回归假设,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-30,单变量是否显著?,用t检验单个变量斜率 当其它变量为常数时,检查xj 和y是否是线性的 假设: h0: j = 0 (没有线性关系) h1: j 0 (在xj 和y之间存在线性关系),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-31,单变量是否显著?,h0: j = 0 (没有线性关系) h1: j 0 (在xj 和y之间存在线性关系) 检验统计量: (df = n k 1),(续),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-32,价格的t统计量 tstat = -2.306, p值是 .0398 广告费用的t统计量 tstat = 2.855, p值是 .0145,(续),单变量是否显著? excel输出,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-33,单变量是否显著? minitab输出,the regression equation is sales = 307 - 25.0 price + 74.1 advertising predictor coef se coef t p constant 306.50 114.30 2.68 0.020 price -24.98 10.83 -2.31 0.040 advertising 74.13 25.97 2.85 0.014 s = 47.4634 r-sq = 52.1% r-sq(adj) = 44.2% analysis of variance source df ss ms f p regression 2 29460 14730 6.54 0.012 residual error 12 27033 2253 total 14 56493,价格的t统计量 tstat = -2.306, p值是 .0398 广告费用的t统计量 tstat = 2.855, p值是 .0145,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-34,d.f. = 15-2-1 = 12 = .05 t/2 = 2.1788,斜率的推断:t检验例子,h0: j = 0 h1: j 0,每个变量的检验统计量落入拒绝域 (p值 .05),有证据表明价格和广告费用都影响销量 ,当 = .05时,excel 和 minitab输出:,对每个变量,拒绝 h0,决策: 结论:,拒绝 h0,拒绝 h0,a/2=.025,-t/2,不拒绝 h0,0,t/2,a/2=.025,-2.1788,2.1788,价格 tstat = -2.306, p值 .0398 广告费用 tstat = 2.855, p值 .0145,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-35,斜率的置信区间估计,总体斜率j的置信区间,例: 价格变化对销量影响的95%置信区间是: -24.975 (2.1788)(10.832) 所以区间是 (-48.576 , -1.374) (这个区间不包含0,所以价格对销量的影响是显著地),其中t的自由度是 (n k 1),其中t的自由度是 (15 2 1) = 12,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-36,斜率的置信区间估计,总体斜率j的置信区间,例:excel输出也给出了区间的端点: 在价格影响是固定的情况下,销售价格每增加$1,周销量将会减少1.37到48.58个,(续),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-37,虚拟变量的使用,虚拟变量是有两个取值的独立属性变量: 是或否,开或关,男或女 0,1变量 假设数量变量的斜率不随属性变量的斜率变化,business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-38,虚拟变量例子 (两个值),令: y = 馅饼销量 x1 = 价格 x2 = 假期 (x2 = 1 如果一周里有假期) (x2 = 0 如果一周里没假期),business statistics: a first course, 5e 2009 prentice-hall, inc,chap 13-39,相同斜率,虚拟变量例子 (两个值),(续),x1 (价格),y (销量),b0 + b2,b0,有假期 没假期,不同截距,有假期 (x2 = 1),没假期 (x2 = 0),如果拒绝h0: 2 = 0,假期对馅饼销量有显著影响,business statistics: a first course, 5e 2009 pr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论