案例之四回归分析:销售额影响因素解答汇编_第1页
案例之四回归分析:销售额影响因素解答汇编_第2页
案例之四回归分析:销售额影响因素解答汇编_第3页
案例之四回归分析:销售额影响因素解答汇编_第4页
案例之四回归分析:销售额影响因素解答汇编_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、mba数据、模型与决策案例(四)销售额影响因素xd是一家大型通讯设备生产公司,在我国主要的大中型城市都设有子公司。张伟最近被提拔为销售部经理。在即将召开的全国各地子公司负责人会议上,他想让大家清楚地了解影响销售额的相关因素。于是,从全国各地的子公司中,随机收集了十五个城市子公司的销售额、促销活动投入额和竞争对手销售额的数据。表1 xd子公司销售额及相关因素数据(百万元)成都101.801.3020.40沈阳144.400.7030.50长春08.301.4024.60哈尔滨 青岛85.1077.100.500.5021.7025.50武汉158.701.9021.70西安180.401.206

2、.80南京64.200.4012.60济南74.600.6031.30广州143.401.3018.60厦门120.6011.6019.90深圳 大连69.701.0025.6067.800.8027.40杭州 宁波106.700.6024.30119.601.1013.70子公司销售额子公司促销活动投入额竞争对手销售额子公司地址计算与思考:1 )分析子公司销售额与促销活动投入额、竞争对手销售额间的关系。子公司销售额与促销活动投入额的散点图如下:200iso16014012087mba数据、模型与决策案例(四)可以看出大致趋势为子公司销售额与促销活动投入额成正比关系子公司销售额与竞争对手销售额

3、间的散点图如下2)建立子公司促销活动投入额对其销售额的回归方程;解释方程的含义,说明子公司促销活动投入额对其销售额的影响程度;假设某地的子 公司促销活动投入额为120万元,预计其销售额及在置信水平 95%下的 预测区间。答:设y为销售额,x为促销活动投入额,做回归分析过程如下 summary output回归统计multiple r0.707693r square0.500829adjusted r square0.462431标准误差27.9912观测值15方差分析dfssmsfsignificancef回归分析1 10219.4210219.4213.043170.003161残差13 1

4、0185.59783.5072总计14 20405.01coefficients标准误差t statp-valuelower 95%upper95%95intercept42.2120617.935092.3536010.034993.46564580.958473.46x variable 159.6791416.52463.6115320.00316123.979995.3783723.子公司促销活动投入额对其销售额的回归方程为:y = 59.679x + 42.212r2= 0.5008子公司促销活动投入额对其销售额的影响程度:从r2 = 0.5008,可以看出回 归方程拟合优度不高,子

5、公司促销活动投入额对其销售额的影响程度仅为 50%。假设某地的子公司促销活动投入额为120万元,预计其销售额及在置信水平95%下的预测区间:(32.242, 195.413)3)建立子公司促销活动投入额和竞争对手销售额对子公司销售额的回归方程;解释方程的含义,检验子公司促销活动投入额和竞争对手销售 额各自对子公司销售额影响的显著性。答:设y为销售额,x1为促销活动投入额,x2为竞争对手销售额,做回归 分析过程如下回归统计multiple r0.856066r square0.732849adjusted r square0.688324标准误差21.31358观测值15方差分析dfssmsfs

6、ignificancef回归分析2 14953.797476.89316.459190.000364残差12 5451.223454.2686总计14 20405.01coefficients标准误差t statp-valuelower 95%upper95%intercept113.173525.877884.373370.00090756.79049169.556656x variable 149.7200612.955133.8378680.00236221.4932777.9468521x variable 2-2.822030.874153-3.228310.007242-4.726

7、65-0.91742-4.y = 49.679x1 2.822x2+113.174 r2=0.856子公司促销活动投入额和竞争对手销售额对子公司销售额的解释可达85.6%根据x1和x2的p值均小于0.05,所以子公司促销活动投入额和竞争对 手销售额各自对子公司销售额均有显著影响4)除了子公司促销活动投入额、竞争对手销售额之外,你认为还有哪些因素可能会对子公司销售额产生影响?若能取得相应的数据,你知道 哪些筛选自变量的方法?试叙述。答:当所研究的问题涉及较多的自变量时,我们很难想象事先选定的全 部自变量对因变量的影响 都有显著性意义;也不敢保证全部自变量之间 是相互独立的。换句话说,在建立多元线

8、性回归方程时,需要根据各自 变量对因变量的贡献大小进行变量筛选,剔除那些贡献小和与其他自变 量有密切关系的自变量、发现那些对回归方程有很坏影响的观测点(这 些都是回归诊断的重要内容),从而求出精练的、稳定的回归方程。一下介绍几种常见筛选变量的方法:1 .向前选择法(forward)模型中变量从无到有依次选一变量进入模型,并根据该变量在模型 中的ii型离差平和(ss2)计算f统计量及p值。当p小于slentry(程序 中规定的选变量进入方程的显著性水平)则该变量入选,否则不能入选; 当模型中变量少时某变量不符合入选标准,但随着模型中变量逐次增多 时,该变量就可能符合入选标准;这样直到没有变量可入

9、选为止。slentry缺省值定为0.5,亦可定为0.2到0.4,如果自变量很多,此值 还应取得更小一些,如让 slentry=0.05o向前选择法的局限性:slentry取值小时,可能任一个变量都不 能入选;slentry大时,开始选入的变量后来在新条件下不再进行检 验,因而不能剔除后来变得无显著性的变量。2 .向后消去法(backward)从模型语句中所包含的全部变量开始,计算留在模型中的各个变量所产生的f统计量和p值,当p小于slstay(程序中规定的从方程中剔 除变量的显著性 水平)则将此变量保留在方程中,否则,从最大的p值所对应的自变量开始逐一剔除,直到模型中没有变量可以剔除时为止。s

10、lstay缺省值为0.10,欲使 保留在方程中的变量都在a =0.05水平上 显著时,应让slstay=0.05o程序能运行时,因要求所选自变量的子集矩阵满秩 ,所以当观测点 少、且变量过多时程序会自动从中选择出观测点数减1个变量。向后消去法的局限性:slstay大时,任一个变量都不能剔除; slstay小时,开始剔除的变量后来在新条件下即使有了显著性,也不 能再次被入选回归模型并参入检验。3 .逐步筛选法(stepwise)此法是向前选择法和向后消去法的结合。模型中的变量从无到有像 向前选择法那样,根据f统计量按slentry水平决定该变量是否入选; 当模型选入变量 后,又像向后消去法那样,

11、根据 f统计量按slstay 水平剔除各不显著的变量,依次类推。这样直到没有变量可入选,也没 有变量可剔除或入选变量就是刚剔除 的变量,则停止逐步筛选过程。逐步筛选法比向前选择法和向后消去法都能更好地在模型中选出变量,但也有它的局限性:其一,当有m个变量入选后,选第m+ 1个变 量时,对它来说,前m个变量不一定是最佳组合;其二,选入或剔除变 量仅以f值作标准,完全没考虑其他标准。4 .最大r2增量法(maxr)首先找到具有最大决定系数r2的单变量回归模型,其次引入产生最 大r2增量的另一变量。然后对于该两变量的回归模型,用其他变量逐 次替换,并计算其r2,如果换后的模型能产生最大 r2增量,即

12、为两变 量最优回归模型,如此再找下去,直到入选变量数太多,使设计矩阵不 再满秩时为止。它也是一种逐步筛选法,只是筛选变量所用的准则不同,不是用 f值,而是用决定系数 r2判定变量是否入选。因它不受slentry和slstay的限制,总能从变量中找至井目对最大者;胀克服了用本节筛选法 13法时的一种局限性:找不到任何变量可进入模型的情况。本法与本节第3种方法都是逐步筛选变量方法,每一步选进或剔除 变量都是只限于一个,因而二者局限性也相似:第一,当有m个变量入 选后,选第m+1个变量时,对它来说,前m个变量不一定是最佳组合; 第二,选入或剔除变量仅以r2值作标准,完全没考虑其他标准。5 .最小r2

13、增量法(minr)首先找到具有最小决定系数 r2的单变量回归模型,然后从其余变 量中选出一个变量,使它构成的模腥其他变量所产生的r2增量最小,不断用新变量进行替换 老变量,依次类推,这样就会顺次列出全部单变 量回归模型,最后一个为单变量最佳模型;两变量最小r2增量的筛选类似 第4种方法,但引入的是产生最小 r2增量的另一变量。对该两变量的 回归模型,再用其他变量替换,换成产生最小 r2增量者,直至r2不能 再增加,即为两变量最优回归模型。依次类推,继续找含3个或更多变 量的最优回归模型等等,变量有进有出。它与本节第4种方法选的结果不一定相同,但它在寻找最优模型过 程中所考虑的中间模型要比本节第

14、4种方法多。本法的局限性与本节第3、4种方法相似:第一,当有m个变量入 选后,选第m+1个变量时,每次只有1个变量进或出,各变量间有复 杂关系时,就有可能找不到最佳组合;第二,选入变量或替换变量仅以 r2值作标准,完全没考虑其他标准。6 . r2 选择法(rsquare)从模型语句中的各自变量所有可能子集中选出规定数目的子集,使 该子集所构成的模型的决定系数 r2最大。要注意:当观测点少、且模 型语句中变量数目过多 时,程序不能运行,因为过多变量使误差项无自 由度,设计矩阵不满秩,所以最多只能从所有可能的变量中选择观测点数减1个变量放入模型。本法和第7、8种方法分别是按不同标准选出回归模型自变量的最优子集,这类选变量法不是从所有可能形成的变量 中,而仅仅从模袖量中穷举。本法的局限性在于:其一,当样本含量小于等于自变量(含交互作用 项)个数时,只能在一定数目的变量中穷举,为找到含各种变量数目的最 优子集,要么增加观测,要么反复给出不同模型;其二,选最优子集的 标准是r2,完全没考虑其他标准。7 .修正r2选择法(adjrsq)根据修正的决定系数 r2取最大的原则,从模型的所有变量子集中 选出规定数目的子集。程序能运行的条件是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论