案例之四回归分析:销售额影响因素--------解答_第1页
案例之四回归分析:销售额影响因素--------解答_第2页
案例之四回归分析:销售额影响因素--------解答_第3页
案例之四回归分析:销售额影响因素--------解答_第4页
案例之四回归分析:销售额影响因素--------解答_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、MBA数据、模型与决策案例(四)销售额影响因素XD是一家大型通讯设备生产公司,在我国主要的大中型城市都设有子公司。张伟最近被提拔为销售部经理。在即将召开的全国各地子公司负责人会议上,他想让大家清楚地了解影响销售额的相关因素。于是,从全国各地的子公司中,随机收集了十五个城市子公司的销售额、促销活动投入额和竞争对手销售额的数据。表1 XD子公司销售额及相关因素数据(百万元)子公司地址子公司销售额子公司促销活动投入额竞争对手销售额成 都101.80 1.30 20.40 沈 阳44.40 0.70 30.50 长 春108.30 1.40 24.60 哈尔滨85.10 0.50 21.70 青 岛7

2、7.10 0.50 25.50 武 汉158.70 1.90 21.70 西 安180.40 1.20 6.80 南 京64.20 0.40 12.60 济 南74.60 0.60 31.30 广 州143.40 1.30 18.60 厦 门120.60 1.60 19.90 深 圳69.70 1.00 25.60 大 连67.80 0.80 27.40 杭 州106.70 0.60 24.30 宁 波119.60 1.10 13.70 计算与思考:1) 分析子公司销售额与促销活动投入额、竞争对手销售额间的关系。答:子公司销售额与促销活动投入额的散点图如下:可以看出大致趋势为子公司销售额与促销

3、活动投入额成正比关系子公司销售额与竞争对手销售额间的散点图如下可以看出子公司销售额与竞争对手销售额间成反比关系2) 建立子公司促销活动投入额对其销售额的回归方程;解释方程的含义,说明子公司促销活动投入额对其销售额的影响程度;假设某地的子公司促销活动投入额为120万元,预计其销售额及在置信水平95%下的预测区间。答:设y为销售额,x为促销活动投入额,做回归分析过程如下SUMMARY OUTPUT回归统计Multiple R0.707693R Square0.500829Adjusted R Square0.462431标准误差27.9912观测值15方差分析dfSSMSFSignificance

4、 F回归分析110219.4210219.4213.043170.003161残差1310185.59783.5072总计1420405.01Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept42.2120617.935092.3536010.034993.46564580.958473.46564580.95847X Variable 159.6791416.52463.6115320.00316123.979995.3783723.979995.37837子公司促销活动投入额对其销售额的回归方程为

5、:y = 59.679x + 42.212 R = 0.5008子公司促销活动投入额对其销售额的影响程度:从R = 0.5008,可以看出回归方程拟合优度不高,子公司促销活动投入额对其销售额的影响程度仅为50%。假设某地的子公司促销活动投入额为120万元,预计其销售额及在置信水平95%下的预测区间:(32.242,195.413)3) 建立子公司促销活动投入额和竞争对手销售额对子公司销售额的回归方程;解释方程的含义,检验子公司促销活动投入额和竞争对手销售额各自对子公司销售额影响的显著性。答:设y为销售额,x1为促销活动投入额,x2为竞争对手销售额,做回归分析过程如下回归统计Multiple R

6、0.856066R Square0.732849Adjusted R Square0.688324标准误差21.31358观测值15方差分析dfSSMSFSignificance F回归分析214953.797476.89316.459190.000364残差125451.223454.2686总计1420405.01Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept113.173525.877884.373370.00090756.79049169.556656.79049169.5566056X

7、Variable 149.7200612.955133.8378680.00236221.4932777.9468521.4932777.94685174X Variable 2-2.822030.874153-3.228310.007242-4.72665-0.91742-4.72665-0.917417972子公司促销活动投入额和竞争对手销售额对子公司销售额的回归方程:y = 49.679x12.822x2+113.174 R =0.856子公司促销活动投入额和竞争对手销售额对子公司销售额的解释可达85.6%根据x1和x2的P值均小于0.05,所以子公司促销活动投入额和竞争对手销售额各自对

8、子公司销售额均有显著影响4) 除了子公司促销活动投入额、竞争对手销售额之外,你认为还有哪些因素可能会对子公司销售额产生影响?若能取得相应的数据,你知道哪些筛选自变量的方法?试叙述。答:当所研究的问题涉及较多的自变量时,我们很难想象事先选定的全部自变量对因变量的影响 都有显著性意义;也不敢保证全部自变量之间是相互独立的。换句话说,在建立多元线性回归方程时,需要根据各自变量对因变量的贡献大小进行变量筛选,剔除那 些贡献小和与其他自变量有密切关系的自变量、发现那些对回归方程有很坏影响的观测点(这些都是回归诊断的重要内容),从而求出精练的、稳定的回归方程。一下介绍几种常见筛选变量的方法:向前选择法(F

9、ORWARD)模型中变量从无到有依次选一变量进入模型,并根据该变量在模型中的型离差平和(SS2)计算F统计量及P值。当P小于SLENTRY(程序中规定的 选变量进入方程的显著性水平)则该变量入选,否则不能入选;当模型中变量少时某变量不符合入选标准,但随着模型中变量逐次增多时,该变量就可能符合入选标 准;这样直到没有变量可入选为止。SLENTRY缺省值定为0.5,亦可定为0.2到0.4,如果自变量很多,此值还应取得更小一些,如让 SLENTRY=0.05。向前选择法的局限性SLENTRY取值小时,可能任一个变量都不能入选;SLENTRY大时,开始选入的变量后来在新条件下不再进行检验,因而不能剔除

10、后来变得无显著性的变量。向后消去法(BACKWARD)从模型语句中所包含的全部变量开始,计算留在模型中的各个变量所产生的F统计量和P值,当P小于SLSTAY(程序中规定的从方程中剔除变量的显著性 水平)则将此变量保留在方程中,否则,从最大的P值所对应的自变量开始逐一剔除,直到模型中没有变量可以剔除时为止。SLSTAY缺省值为0.10,欲使 保留在方程中的变量都在=0.05水平上显著时,应让SLSTAY=0.05。程序能运行时, 因要求所选自变量的子集矩阵满秩,所以当观测点少、且变量过多时程序会自动从中选择出观测点数减个变量。向后消去法的局限性SLSTAY大时,任一个变量都不能剔除;SLSTAY

11、小时,开始剔除的变量后来在新条件下即使有了显著性,也不能再次被入选回归模型并参入检验。逐步筛选法(STEPWISE)此法是向前选择法和向后消去法的结合。模型中的变量从无到有像向前选择法那样,根据F统计量按SLENTRY水平决定该变量是否入选;当模型选入变量 后,又像向后消去法那样,根据F统计量按SLSTAY水平剔除各不显著的变量,依次类推。这样直到没有变量可入选,也没有变量可剔除或入选变量就是刚剔除 的变量,则停止逐步筛选过程。逐步筛选法比向前选择法和向后消去法都能更好地在模型中选出变量,但也有它的局限性其一,当有个变量入选后,选第个变量时,对它来说,前个变量不一定是最佳组合;其二,选入或剔除

12、变量仅以F值作标准,完全没考虑其他标准。最大R2增量法(MAXR)首先找到具有最大决定系数R2的单变量回归模型,其次引入产生最大R2增量的另一变量。然后对于该两变量的回归模型,用其他变量逐次替换,并计算其 R2,如果换后的模型能产生最大R2增量,即为两变量最优回归模型,如此再找下去,直到入选变量数太多,使设计矩阵不再满秩时为止。它也是一种逐步筛选法,只是筛选变量所用的准则不同,不是用F值,而是用决定系数R2判定变量是否入选。因它不受SLENTRY和SLSTAY的限制,总能从变量中找到相对最大者;胀克服了用本节筛选法法时的一种局限性找不到任何变量可进入模型的情况。本法与本节第种方法都是逐步筛选变

13、量方法,每一步选进或剔除变量都是只限于一个,因而二者局限性也相似第一,当有个变量入选后,选第个变量时,对它来说,前个变量不一定是最佳组合;第二,选入或剔除变量仅以R2值作标准,完全没考虑其他标准。最小R2增量法(MINR)首先找到具有最小决定系数R2的单变量回归模型,然后从其余变量中选出一个变量,使它构成的模腥其他变量所产生的R2增量最小,不断用新变量进行替换 老变量,依次类推,这样就会顺次列出全部单变量回归模型,最后一个为单变量最佳模型;两变量最小R2增量的筛选类似第种方法,但引入的是产生最小R2增量的另一变量。对该两变量的回归模型,再用其他变量替换,换成产生最小R2增量者,直至R2不能再增

14、加,即为两变量最优回归模型。依次类推,继续找含 个或更多变量的最优回归模型等等,变量有进有出。它与本节第种方法选的结果不一定相同,但它在寻找最优模型过程中所考虑的中间模型要比本节第种方法多。本法的局限性与本节第、种方法相似第一,当有个变量入选后,选第个变量时,每次只有个变量进或出,各变量间有复杂关系时,就有可能找不到最佳组合;第二,选入变量或替换变量仅以R2值作标准,完全没考虑其他标准。R2选择法(RSQUARE)从模型语句中的各自变量所有可能子集中选出规定数目的子集,使该子集所构成的模型的决定系数R2最大。要注意当观测点少、且模型语句中变量数目过多 时, 程序不能运行,因为过多变量使误差项无自由度,设计矩阵不满秩,所以最多只能从所有可能的变量中选择观测点数减个变量放入模型。本法和第、 种方法分别是按不同标准选出回归模型自变量的最优子集,这类选变量法不是从所有可能形成的变量中,而仅仅从模袖量中穷举。本法的局限性在于其一,当样本含量小于等于自变量(含交互作用项)个数时,只能在一定数目的变量中穷举,为找到含各种变量数目的最优子集,要么增加观测,要么反复给出不同模型;其二,选最优子集的标准是R2,完全没考虑其他标准。修正R2选择法(ADJRSQ)根据修正的决定系数R2取最大的原则,从模型的所有变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论