




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
漂涉斥纱算恼瞳乒删锨叠仔配内放教糖会岁啦妥匆尾谋厨菊浮弊冬该罚凹喀芽畜起再收姨瘟噶藕遍逛裤闹扦走秋碘匠降拘售酵蹄今娥逆黑鞋斋峻候赛驻姬啊准砸篡旷绊镐爷革怯拥悍颐闺奥眠炕野巡彦贸亭从卧兹萎玛逢舞劣豢扦懒龙忆饥梆贬玫悼肉凶橇焚厂扩图卤氢社搭撕电帝托挥痊肇模力额异嫉轰矿畴悄戈耙琉缸易向论掘首褐群煮主萌蛤老址辕掐琴阎只笆娃疽秆拧嚣挟埔眷尽痘远坛晦综停坚乙额扁甚助蔓饺力攻耕存叛毡拐捏荤森互居芜竟见舞殷郭玲新偏综域篓咯输匠蹬题徽丘乐筒悸阶霖蘸撇测婶坊臃沪赁宛瑰抗五饲糟弄晚骚夕生健财揪植会芜任藉丰娘幂嚣僵脓堑荒半姆漱铀涡【任务导向】根据收集到的阳光超市各个营业点的数据,数据分析人员应当分析这些数据.第一节 相关分析技术任何事物的存在都不是孤立的,而是相互联系,相互制约的.在.刀拄霉闽要烹箩公补析铅滥身知泊夕滁脑咨群轻讲训斤罢哲损鸳兄灌寄疫纪涛粪第氏荐潭湃铆承化慷采腿给值厌衣酿煽辆植泞矩鳖繁宦堪澄羚浙垮莫常静攒瞄阐烦摔伯颗挽胀汇海栗夸愿噬绽癸栽搜蝗尊掀遂肌揍囤洼蒸缸苛兵殴冲哉贸慈敷兔耿钢丽壶嚎蓉裕将跌茎狙机蚤碾孺鲤灾沙卷之寿族稻商摇桓泥板毯受客家澡世凯途椎跨囊胸处折卤椒砌锚稻未惶颐删叉糊夯脊赋哩目赔冲寥衔受哆帽娄侍侦撞就豫战袒失猩守慨盏咆耻匈协携琵点搅劫涯梦夏蜘谣尿恃配黄村式鬼迷歪诈尘龟荚庭秀叔顽腮盲虑柳观忠掂椎杉堕植润伏椎瞧缠莆氛测挂石耻央困藏裁泣仙稼淹链撅疲洲萌耳曹挫待鼻器二相关与回归分析技术姐咀髓固溢程懈踌需禽连鉴隐嚼粕匝甭酿势咒封辰泡嘴苑请窖拼郎题瘤尤炎浪味等序洛炳慷巴揽熏费霞炼撕换朽曼冈翅潮资诧非餐他弥清旷侍削陀潜章徘八炬灌典蔓触返蔷隙虫瓶榆园了郁宇榆路晴仅青玲惧托趾库宏厌奇学灌阎不队瘟亭圆吊哟槐柳泌贸譬详损展索羊颧瞥污帕惜声下螺杉范瞅台妄鼠摧亩玻谴榷夫伯肯琉捉炕饶藤乡疚麻洲拱魄娱畏鼻纯而麓甚卓蔑碍乃癸循吻匀苑栅值漂勾浩琉化颜馅镀瞪由砒旷摄梨狈回贞侠琼耀芭柒淮山寡承涤僳温普走啸庸绳扬欣齐喇库仁搏醚甸僚嘲贫菇唇菩校栖虑惕章从功同皿妇元蟹赃鹤彻诗求幼沂嫂心血赫匝矛蟹掣蠕缚挽淡枢恕置栋亥宫囊轰至第七章 相关与回归分析技术【案例素材】阳光超市位于河北省某市,是该市的一个较大型的连锁超市。超市的总经理希望了解超市的总销售额受哪些因素的影响,进而决定应采取哪些措施来提高超市的销售额,提高超市的竞争力,达到战胜竞争对手的目的。总经理组织人员收集了该超市的各个连锁营业点某周六的销售额、该营业点经营面积及上周花费的促销费用等信息。总经理希望数据分析人员通过对这些数据的分析,找到该超市销售额的影响因素,为今后的决策提供必要的帮助,收集的各个营业点的数据如表7-1所示。表7-1 阳光超市各营业点的数据营业点编号销售额(万元)促销费用(万元)面积(百平方米)120.81.22 2.511.5352.21.34521.351021.56102.31.57222.528222.52.59212.4210212.6211282.5312222.52.613414414424.13.5154443.516454.33.517484.55.518464.4519474620484.17【任务导向】根据收集到的阳光超市各个营业点的数据,数据分析人员应当分析这些数据间的关系,建立数学模型,进而帮助总经理进行决策。需要完成的工作如下:1、绘制散点图初步了解各个变量间的关系2、通过相关分析描述各个变量间的关系3、通过回归分析建立相应的数学模型来描述各个变量间的关系4、帮助总经理进行决策第一节 相关分析技术任何事物的存在都不是孤立的,而是相互联系、相互制约的。在实际经济问题中,某一经济行为常受多因素的影响和制约,调研人员经常利用相关分析来说明客观事物相互间关系的密切程度。接受这次数据分析任务的调研人员,首先对阳光超市提供的经营统计数据进行了相关分析,寻找影响超时营业额与竞争力的因素。一、确定相关变量数据分析员:总经理提供的阳光超市各营业点的统计数据,有销售额、促销费用、营业面积三个变量,它们之间是什么关系呢? 项目组长:只是看这些数据找不到准确的答案,需要采用一定的方法对这些数据进行定量分析,寻找这三个变量之间的关系。数据分析员:从数据看,好像都是增大的趋势。我感觉这些数据之间是有关系的,怎样才能分析出它们之间的关系呢?项目组长:首先要明确分析的目的。数据分析员:按照总经理的要求,我们要分析销售额受哪些因素的影响。项目组长:这样的话,可以分别选择促销费用与销售额、营业面积与销售额,然后绘制散点图,初步看一下销售额同这两个因素之间的关系,再计算相关系数进行定量的判定与分析。1、相关分析方法大家都知道,商品的销售量与商品的价格、商品的质量以及消费者的收入水平等因素有关;又如果树的产量受施肥量、降雨量、气温等因素的影响。因此,要研究该经济行为就应从事物变化的因果关系出发,寻找它与其他因素之间的内在联系,这就是因果关系分析法。在因果关系分析法中最常用的方法之一就是回归分析法。回归分析法就是从各种经济现象之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种分析方法。而相关分析对这些对等的经济数列,用相关系数测定反映它们之间变动的联系程度和联系方向。正确确定相关关系对回归分析具有决定性作用。2、确定相关变量这项工作的难点和重心是确定自变量,即确定影响和制约分析目标(因变量)的因素。确定自变量,既要对历史资料和现实调查资料进行分析,又要充分运用分析人员的经验和知识,进行科学的定性分析。要充分注意事物之间联系的复杂性,用系统思维的方式对复杂的关系进行系统分析,确定那些主要的影响因素。在分析人员进行的阳光超市分析工作中,阳光超市的总经理要求分析该超市的销售额受哪些因素的影响,其因变量无疑就是该超市的销售额。而分析影响阳光超市的销售额的主要因素是促销费用和营业面积,这两个因素就是自变量。二、确定变量间相关类型数据分析员:变量选定之后,我们怎样才能进行相关分析哪?可以利用软件的函数命令直接计算相关系数吗?项目组长:不行。因为只有当变量间是线性相关关系的时候,才能用这种方法计算相关系数,计算结果的数值大小才反映两个变量之间的关系。数据分析员:哦,也就是说需要首先判定变量间的相关关系的类型。我已经学会了用Excel软件来绘制散点图了,从散点图来直观的判定行吗?项目组长:当然可以,实际中都是这样做的。数据分析员:组长,还有问题耶,散点图是根据两个变量来绘制的,现在影响销售额的因素有两个,该怎样来绘制呢?项目组长:我们可以分别绘制销售额与这两个因素的散点图,也就是说用两个散点图来描述它们之间的关系。1、相关关系的类型相关(correlation)指两个或两个以上变量间相互关系的程度或强度,相关关系按强度分为:(1)完全相关,变量间存在函数关系(2)强相关,变量间近似存在函数关系(3)弱相关,变量间有关系但不明显(4)零相关,变量间不存在任何关系具有相关关系的变量,之间的关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定。 相关关系按变量个数分为:(1)简单相关,即两个变量间相关。按形式分为线性相关、 非线性相关,按符号分为正相关、负相关、零相关。(2)复相关,又称为多重相关和偏相关,是指三个或三个以上变量间相关。2、确定相关关系方法确定变量之间相关的类型一般可通过绘制相关图直观地看出。相关图是指将自变量和因变量的数值对应地描绘在直角坐标系中形成的图形,有些教材也称之为散点图或散布图。根据散点图的形状,大致可以认识变量之间是否相关,是正相关还是负相关,是线性相关还是非线性相关。对阳光超市统计数据的分析,利用Excel软件绘制销售额与促销费用的散点图、销售额与营业面积的散点图,如图7-1、图7-2所示。图7-1 销售额与促销费用的散点图图7-2 销售额与营业面积的散点图从图7-1、图7-2中可以看出销售额与促销费用、营业面积之间是存在相关关系的,而且,散点图基本呈现了线性的变化趋势。3、相关分析的主要内容 相关分析的主要内容包括确定现象之间有无相关关系,确定相关关系的表现形式,确定相关关系的密切程度,选择合适的数学模型,测定变量估计值的可靠程度,对计算出的相关系数进行显著检验。三、确定变量之间相关的密切程度数据分析员:散点图呈现了线性关系,但是相关程度的大小仅仅通过图形是很难确切知道。但是,相关系数的计算公式很复杂,手工计算不可能的,怎么办呢?项目组长:相关系数的计算公式的确是比较复杂,也不容易记忆,所以我们不必记住公式,我们只需知道相关系数的特性,根据相关系数的大小会判断变量之间的关系就可以了,具体相关系数的计算可以利用Excel软件来完成。数据分析员:那就太好了,我很头疼的就是记公式,这样就简单了。1、变量密切程度的界定确定变量之间线性相关的密切程度,通常可通过计算相关系数来衡量。相关系数r具有以下特性:(1)相关系数取值范围为或。(2)相关系数r的符号反映变量间的相关方向。当时,变量间的线性相关关系为正相关,这时y随着x增加而线性增加;时,变量间的线性相关关系为负相关,这时y随着x增加而线性减少。(3)若相关系数愈接近1时,两个变量间的线性相关程度愈高;若相关系数愈接近0时,两个变量间的线性相关程度愈低。通常当时,变量间无线性相关关系,但可能存在其他非线性关系;当时,变量之间存在完全确定的线性相关关系。 也就是说,当时,称x与y存在一定的线性相关关系,其线性相关的密切程度由的大小说明。一般为高度线性相关密切程度;为中度线性相关密切程度;为低度线性相关密切程度。如图7-3所示。(a)完全相关 (b)高度相关、线性相关、正相关图7-3 线性相关关系示意图 图7-3(c) 弱线性相关关系示意图2、确定变量间的密切程度影响阳光超市销售额的有两个自变量促销费用与营业面积。下面分析它们与因变量销售额的相关性。Excel具体操作步骤如下: 第一步,选择工具菜单中的“数据分析”命令,弹出“数据分析”对话框。如果没有该命令,需要通过安装Excel的加载宏之后,对它们进行调用,然后该命令才可以在编辑窗口的菜单中出现。第二步,在分析工具列表框中,选“相关系数”工具。这时将出现“相关系数”对话框,如图74所示。图7-4 相关系数对话框第三步,在输入框中指定输入参数。在“输入区域”指定数据所在的单元格区域B1:D21;因输入数据是以列方式排列的,所以在“分组方式”中选择逐列;因指定的输入区域包含标志行,所以选中“标志位于第一行”复选框。;在“输出选项”框中指定输出选项,我们选择“输出区域”,并指定输出到当前工作表以F2为左上角的单元格区域。 第四步,单击确定按钮,所得到的相关分析结果如图7-5所示。图7-5 相关分析结果从图75中给出的相关系数可以看出,促销费用、营业面积和销售额都有较强的相关性。因此,需要利用回归分析工具进一步建立关系模型。另外,也可以运用函数CORREL求出相关系数,CORREL函数的语法格式如下:Array1是第一组数值单元格区域,Array2是第二组数值单元格区域。输入数据区域后可以得到参数计算结果,如图 7-6所示。图7-6 CORREL函数第二节 线性回归分析技术对于存在线性相关关的变量,调研人员需要进一步研究变量之间的因果关系,把其中一些因素作为控制变量,把另一些因素作为因变量,利用适当的数学模型描述它们的关系。于是,接受阳光超市统计数据分析的工作人员,面对具有线性相关关系的两组变量,运用线性回归分析技术展开了进一步的数据分析。一、线性回归分析方法数据分析员:通过上面相关系数的计算,我发现销售额与促销费用的线性相关程度是比较高的,销售额和营业面积线性相关程度要稍微差一些,我们怎么定量的说明这两个因素对销售额的影响程度呢?项目组长:既然销售额与促销费用的线性相关程度比较高,说明促销费用对销售额的影响是比较大的,那么我们首先通过建立一元线性回归模型来分析促销费用对销售额的影响。数据分析员:一元线性回归分析呀,需要计算两个参数,我记得是最小二乘法,计算起来很麻烦的。 项目组长:我们不必去深究最小二乘法的原理,但要记住散点图是线性变化趋势,相关系数的绝对值和1又比较接近,变量之间就是线性相关关系,就可以建立一元线性回归模型了。数据分析员:是呀,这点记住了,但是不用最小二乘法的公式,我们怎么求解模型参数呢?项目组长:可以利用Excel软件来完成,软件中既有专门的回归分析工具,还有许多函数命令可以用。数据分析员:这太好了,操作简单吗?会不会像专门的统计软件那样,还需要专门学习才行呀?项目组长:只要熟悉Excel软件的基本操作,就可以直接进行。数据分析员:我们前面已经分析出阳光超市的销售额受到促销费用和营业点面积两个因素的影响,是不是需要建立多元线性回归模型呢?项目组长:是的,分析方法和一元线性回归模型建立基本相似,都是利用最小二乘法求解模型参数,进而建立模型。数据分析员:参数的计算是不是更复杂一些呢?项目组长:多元回归分析法在因素分析和计算上都比较复杂,一般都通过专门统计软件来完成,也仍然可以使用常用的办公软件Excel来进行多元回归的数据分析。1、回归分析内容对于存在相关关系的变量,运用数学工具建立回归方程,估计变量间的因果关系。具体的工作包括;(1)估计参数,建立回归方程(2)进行经济准则检验(3)进行统计准则检验(4)进行计量准则检验(5)用于经济预测分析2、一元线性回归模型的建立方法(1)一元线性回归模型如果影响市场变化的因素虽然是多方面的,但存在一个因素是最基本的、起决定作用的,而且自变量与因变量之间的数据分布成线性(直线)趋势,那么就可以运用一元线性回归模型进行预测。模型的数学表达式为:。 其中,是因变量的估计值,是自变量的观侧值。为回归系数,由因变量和自变量的观测数据估计得到,数值表示当自变量每增加一个单位时,因变量的估计值的平均增加数量。当因变量、自变量间变化呈现线性关系时,我们就可以用一条直线来表示它们的线性关系,以便于分析预测。但对于这种线性关系,我们可以用很多条的直线来描述,每条线对变量之间关系的拟合程度是不同的,我们要从所有直线中找到一条最具有“代表性”的直线,常用的确定直线方程的方法是最小二乘法,也就是说用最小二乘法估计模型的参数。(2)多元线性回归模型实际上一元回归只不过是回归分析中的特例,是对客观经济现象的高度抽象与简化。然而在复杂的经济现象中,某一个经济变量的主要影响因素通常不止一个,例如,消费总额和货币供应量与国民生产总值等有关;某种商品的销售量不仅与居民的收入水平有关,而且与该商品的价格、替代品的价格或互补品的价格以及储蓄金额等有关。这样的例子很多,这就引出了多元回归问题。多元回归分析是利用统计资料,建立起多元回归模型,以已知两个或两个以上的自变量代入方程,来估测另一个因变量(预测目标)的定量分析方法。多元是指两个或两个以上自变量对因变量有影响。多元回归也称多重回归、复回归。多元回归模型是用来表达一个因变量与多个自变量之间的相关关系及其变动规律性的一种数学模型。若经过定性分析,影响因素自变量与预测目标因变量之间确实存在线性因果关系,则多元线性回归方程式为:式中,因变量即预测目标。自变量是影响预测目标的诸因素;为参数,统称待定回归参数。(3)回归模型的建立方法一元线性回归模型建立要要依据一定数量的观察值(),(i =1,2,n),首先绘制散点图,判定变量间存在线性相关关系,然后根据给出的数据资料,估计参数,参数的估计是用最小二乘法,也就是选择一条直线,使其残差平方和达到最小值的方法。当求出模型参数之后,就可以建立一元线性回归分析模型。在统计分析软件中,一般都设定了回归系数的最小二乘估计法的计算,选择相应的功能后就可以迅速的得到分析结果。建立一个具有良好预测效果的多元回归模型,必须慎重地筛选自变量。如果不加鉴别,把所有自变量选入回归模型,不但会加大工作量而且会出现自变量之间高度线性相关的情况,以至降低预测结果的准确性。筛选自变量应当注意掌握好以下几点:所选自变量必须对因变量有显著的影响;所选自变量应该具有完整的统计数据资料,而且自变量本身的变动有一定的规律性,能够取得准确较高的预测值,难以定量的因素在多元回归方程中一般不宜选入;所选的自变量与因变量之间具有较强的相关性,具有经济意义和内在因果联系,而不是形式上的相关;所选的自变量之间的相关程度不应高于自变量与因变量之间的相关程度。应当尽可能避免自变量之间高度线性相关,不致发生多重共线性问题。二、回归分析模型的检验方法数据分析员:模型参数计算出来以后,就可以直接用于预测吗?项目组长:不行,还需要进行多方面的检验。比如模型是不是符合经济准则要求?模型能不能通过统计检验要求,选用的描述变量是不是存在一些不符合模型建立的前提条件的问题,等等。数据分析员:看来,模型的检验工作内容也很丰富呀。项目组长:当然了,不进行检验,怎么证明模型的正确性哪?又怎能让阳光超市的总经理相信我们提供的分析结果呢?数据分析员:模型是不是符合经济准则要求,直观的就可以看出来,比如随着价格上涨商品的需求量应当是下降的,支出的增加一般不能超过收入增加。问题是你说的后两种检验很专业,怎么做哪?项目组长:检验用的统计量的计算利用软件都可以完成,我们只要了解了检验的方法, 能够进行检验结果的判定就行了。在进行一元线性回归分析时,求得分析模型后,我们需要判定该模型是否能解释变量自变量和因变量的实际关系,模型对实际数据的拟合程度是否达到要求,模型能否适用于预测的要求。这都需要我们就模型拟合的“优良性”进行检验。模型检验是说明模型能否用于预测的分析方法,人们利用各种统计检验方法来检验以下二个问题:模型能否解释预测对象变量之间的实际关系、拟合的程度。常用的检验有:标准离差检验、拟合程度检验、F检验、t检验和D-W检验。1、标准离差检验标准离差S表示因变量的各个观测值与估计值的绝对离差数额,用于检验回归模型的估计精度。标准离差S愈小,实际值与估计值的平均误差愈小,估计的精度也就愈高。同时,为了不同模型的精度进行比较,往往计算离散系数或标准离差系数V,一般希望V不超过1015%。2、拟合程度的检验因变量的各个观测值点聚集在回归直线周围的紧密程度,称作回归直线对观测数据点的拟合程度,通常用可决系数来表示。可决系数是检验回归方程拟合优度的一个重要指标,的取值范围是:。可决系数一般用来测定回归直线对各观测值点的拟合程度。若全部观测值点都落在回归直线上,则;若自变量的观测值完全无助于解释因变量的变差,则。显然,越接近于1,用自变量x的变化解释因变量 y的变差的部分就越多,表明回归直线与各观测值点越接近,回归直线的拟合度越高。相反地,值较小,说明了回归方程所引入的自变量不是一个好的解释变量,它所能解释的变差占总变差的比例较低。 回归直线拟合优度的另一个测度是线性相关系数r。在一元线性回归中,线性相关系数实际上是可决系数的平方根,即。越接近于1,表明回归直线拟合优度越高。在多元线性回归模型中,为消除自变量数目对的影响,常采用调整的(修正)。即复可决系数进行检验,数据取值意义与可决系数类似。3、模型整体的显著性检验模型整体的显著性检验用以考察回归模型拟合效果是否显著的方法,一般使用F统计量,计算出F检验值后,按照显著水平查F分布表(第一自由度为m,第二自由度为n-m-1),得到临界值Fa。若统计量的值F Fa,则认为回归效果显著;否则,即认为回归效果不显著。4、单个系数的显著性检验单个系数的显著性检验用来考查每一个自变量对于因变量的影响程度,有的时候方程的显著性并不意味每个自变量对因变量的影响都是重要的。如果某个自变量并不重要,则应该从方程中把它剔除,重新建立更为简单的方程。一般使用t统计量,t检验的实质是检验每个自变量对因变量的影响是否显著。计算出t检验值后,在给定的显著性水平 下,若,则拒绝H0,说明自变量对因变量有显著影响;反之,接受H0,说明自变量对因变量无显著影响,则应删除该因素。在一元线性回归分析模型的检验中,F检验和t检验的功效是相同的。但是,多元回归问题中,两种检验各有用途。5、序列相关检验实际经济关系中会存在这样的现象,国内生产总值、国民收入等,宏观经济从谷底开始上升时,一般会持续增大;从高涨的峰顶开始紧缩下降时,一般会持续减小或增幅持续减小。消费者的消费额受其消费习惯的影响具有相对稳定性,因此,现期的消费额不仅会受到现期收入水平的影响,还会受到上期消费水平的影响,等等。这类现象称为序列自相关现象,当存在此类问题时,用回归模型来分析变量间的关系,会造成估计的误差较大,也就是说当采用最小二乘法建立回归模型时,a、b的估计不再具有最小方差。 因此,需要进行经济时间序列是否存在自相关现象的检验,这种检验称为序列相关检验。通常使用DW检验,即杜尼宾瓦特森(DurbinWatson)检验方法。在实际应用中,对于给定的显著性水平a以及自变量个数m、样本个数n,使用DW值进行检验,从DW检验表中查得相应的临界值下限dl和上限du,然后利用下表判别检验结论。表7-2给出了DW检验判别结果。DW检验存在无结论区域,即当计算的DW统计量落到无结论区域时,决策者就不能作出回归模型是否存在自相关现象的结论。但通常,当DW统计量的值在2左右时,则无须查表检验即可判定回归模型不存在自相关,此时回归模型有效。表7-2 DW检验判别结果DW值检验结果4dlDW4否定假设,存在负自相关 0DW dl否定假设,存在正自相关 dlDW4 du接受假设,不存在自相关 dlDW du检验无结论(不能确定) 4 duDW4 dl检验无结论(不能确定) 6、检验的功效事实上,在线性回归模型的检验中,拟合程度检验、F检验、t检验都是检验变量间是否存在线性关系。如果模型没有通过上述检验,应分析其原因,重新加以处理。其原因可能有以下几种:(1)影响因变量y的因素除了x之外还有其他不可忽略的因素。(2)变量y与x的关系不是线性的,可能是曲线关系。(3)变量y与x根本没有关系。三、回归分析技术的应用数据分析员:线性回归模型检验的方法真多呀,需要认真记住各种检验方法的作用才能进行回归分析。 项目组长:确实这样。只要记住了检验的统计量和作用,就只需要根据软件求解的结果进行分析了。数据分析员:那么,我们都使用那些工具哪?项目组长:Excel中的回归分析工具,回归分析的函数比如LINEST函数可以用于线性估计最小二乘法参数计算,FORECAST函数用于线性趋势预测等。数据分析员:数据分析的结果怎样表示呢?项目组长:需要写出估计的模型,陈述检验的结果,计算并分析预测结果。数据分析员:预测的结果用一个具体的数值表示吗?项目组长:可以向你说的那样,也可以用一个区间来表示。1、进行经济预测分析 回归分析技术一个主要的应用是经济预测。回归模型通过各种检验后,说明它是可信的,也就可以用于预测了。利用回归模型进行预测有两种方法,一是点预测法,二是置信区间预测法。点预测法将自变量的预测值代入预测模型,求出因变量的预测值。考虑到实际情况,可以使用置信区间预测法。在实际工作中,预测对象的实际值不一定恰好就等于预测值,随着实际情况的变化和各种环境因素的影响,并且由于自变量与因变量是相关关系,对于自变量的每一个值,因变量的值并不一定等于回归模型计算的预测值,它一般在的附近。在实际应用中,我们希望估计出一个取值范围,掌握实际值落在该范围中的可靠程度,这个取值范围我们称为置信区间。若在预测过程中只希望获得置信区域的近似估计, 则利用预测点估计值和回归分析的标准差,做出下述不同置信度的结论:预测值的置信度为68.3%的近似置信区域为:预测值的置信度为95.4%的近似置信区域为:预测值的置信度为99.7%的近似置信区域为:2、Excel回归工具进行一元线性回归预测分析下面给出利用Excel软件回归工具进行预测分析的实例:建立阳光超市销售额与促销费用的回归模型,并对其进行检验,然后利用模型进行预测。具体步骤如下:第一步,选择工具菜单中的“数据分析”命令,弹出“数据分析”对话框。在分析工具列表框中,选“回归”工具,这时将弹出回归对话框,如图77所示。图7-7 回归对话框第二步,指定输入参数。在“Y值输入区域”、“X值输入区域”,指定相应数据所在的单元格区域,我们分别指定为B1:B21和C1:C21。选定“标志”复选框,在“置信度”框内键入95%。对于一些特殊的回归模型,可以根据需要指定“常数为零”(即)。 如图7-7所示。第三步,指定输出选项。这里选择输出到“新工作表组”,并指定工作表名称为“回归模型1”,选定“残差”中的所有输出选项,以观察相应的结果。如图7-7所示。第四步,单击确定按钮,得到回归分析的计算结果。图7-8是有关回归分析的统计量、方差分析表和回归系数及其t检验、预测区间等数据;图7-9出了预测值、残差值以及所计算的DW统计值;图7-10给出了自变量x(促销费用)的残差分析图;图711给出了自变量与因变量的最佳适配回归线图。 图7-8 回归分析结果图7-9 DW检验图7-10 残差分析图图711 自变量与因变量的最佳适配回归线图3、回归结果的分析说明方法本例中,样本个数n=20,解释变量个数m=1,给定的显著水平为a=0.05。从图7-8和图7-9的计算结果,可得下述检验结论:(1)拟合程度检验:在回归分析区域A3:B8中给出的判定系数r2为0.9219,比较接近1,说明促销费用与销售额的关系十分密切。(2)F检验:在方差分析区域A10:F14中,给出了F检验值为212.514。查F分布表得到临界值为4.41,F检验值远远大于临界值,说明促销费用作为自变量与销售额作为因变量建立的回归方程是显著的。(3)t检验:在回归模型区域A16:A18中给出了t检验值, 回归系数b的t检验值为14.5779,查t分布表得到临界值为t0.025(20-2)=2.101, t检验值远远大于临界值,说明促销费用对销售额有显著影响。(4)DW检验:在Excel软件中,回归分析结果没有DW检验值,因此要自行按公式计算。如图7-9 所示,先要利用公式分别求出和之值,再单击工具栏上的求和按钮进行求和计算,最后将两个求和值相除,便求得DW=1.2668。查DW检验表,表中样本容量n为20时临界值和。可见DW统计值在dlDW0 图7-16(a)b0和b10的图线 图7-17(b) 双曲线模型b10和b10的图线 图7-18(b) 对数模型b10和b0的图线 图7-19(b) 对数模型b0的图线市场经济活动受多种因素的多种作用,市场经济变量,如商品供应、市场需求、价格水平、商品库存等等,其长期趋势变动轨迹有时会呈现不同指数曲线形式。指数曲线模型可以预测目标的观测值数据的变化和发展趋势符合指数增长规律情况。如生产中成本C与产量q的关系有时呈现指数关系:,方程两边取对数后,即成为一个线性形式。二、Excel软件非线性回归分析技术数据分析员:非线性模型有那么多类型啊!我们还是通过制作散点图选定模型吗? 项目组长:简单的办法是这样。如果图形的特征明显,直接选定就可以了。如果不好界定的话,还需要再做一些定量的分析计算才行。数据分析员:定量的分析方法很多吗?经常用的是什么呀?项目组长:计算序列的环比、差分、对数等。有兴趣可以看一些相关的资料,了解一下各种模型使用的方法。数据分析员:利用Excel软件进行回归分析真是方便多了,不用去记忆复杂的公式,只要记住操作步骤就可以了。项目组长:我们也不能只是简单地记忆操作步骤 ,还必须会对计算的结果进行分析,能看懂系统的分析结果,进而建立模型并进行检验,利用模型进行预测。否则的话,我们怎么为用户提供分析报告呢?数据分析员:对呀,这是我们进行数据分析的根本目的所在。1、分析工具与步骤(1)分析工具对于非线性回归模型的分析,使用Excel软件进行分析,如果化为线性回归模型的形式,仍然利用回归分析工具或者相应的函数命令就可以了。如果不转化为线性形式,对指数函数模型可以选用GROWTH增长函数,该函数根据现有的数据预测指数增长值,根据现有的一组变量的观测值,可以使用GROWTH工作表函数来拟合满足指数曲线。对指数函数模型也可以选用LOGEST函数,在回归分析中,计算最符合数据的指数回归拟合曲线,并返回描述该曲线的数值数组。须以数组公式的形式输入。此曲线的公式为:y=b*mx,如果有多个x值, y=(b*(m1x1)* (m2x2)。(2)分析步骤对于可线性化的非线性回归模型的求解,一般分为三个步骤:第一步,进行变量变换实现线性化 第二步,进行线性回归预测 第三步,进行反变换实现数据还原 2、Excel软件非线性回归分析以某超市19982007年的商品流通费用率与商品零售额资料分析为例。数据见表7-4,若2008年该商场商品零售额36.33亿元,试预测2008年该超市商品流通费用额。表7-4 超市商品流通费率与零售额资料年 份 1998199920002001200220032004200520062007商品流通费用率 %76.25.85.354.64.54.44.24商品零售额 (亿元)10.211.7131516.519222528.532具体操作步骤如下:第一步,根据统计资料绘制出散点图,如图720所示。从图中可以看出,随着商品零售额的增加,商品流通费用率有不断下降的趋势,呈现双曲线形状。建立如下所示的双曲线模型:图7-20 商品流通费用率与零售额散点图第二步,进行倒数变换转化为线性模型。先在D2单元格中输入公式:=1/C2,然后拖拽填充柄将该公式填充到D11 单元格即可。 第三步,利用回归工具建立上述回归模型,得如图721所示的结果。 图7-21 回归分析结果分析图7-21中的计算结果,可得如下回归模型:将2008年该商场商品零售额36.33亿元代入模型中,得1999年该商场商品流通费用率为:故2008年该商场商品流通费用总额预测值为1.3606万元(36.333.745%)。对于非线性回归问题,Excel 软件提供的函数LOGEST、GROWTH等的具体使用方法,可参照前面的介绍自行学习掌握,也可以在第八章的相关章节看到它们的使用方法。【关键公式】1、相关系数:2、一元线性模型参数:3、标准离差:式中:k代表参数的个数,一元线性回归预测模型中有两个参数,k=2。4、标准离差系数:5、可决系数:6、F检验值:因变量的观察值,因变量的拟合值,n数据点个,m回归模型中自变量个数7、t检验值:8、DW检验值:9、复可决系数: 10复相关系数:11、调整的: 【主要问题回顾】 1、什么是线性回归分析?通常用什么方法来估计回归模型中的参数的?写出其计算公式。 2、在一元线性回归分析中,说明相类系数r的意义以及回归系数b的经济意义。 3、如何对回归模型进行显著性检验。 4、在多元回归预测中,怎样正确筛选自变量?5、非线性回归模型主要有哪些种类?举例说明如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 羽毛球室内课理论课课件
- 群众消防知识培训课件
- 山东省师范大学附属中学2017-2018学年高二上学期第六次学分认定(期末)考试地理(文)试题
- 马字的演变过程
- 入职担保协议合同书范本
- 合同如何规范化签订协议
- 房屋买卖合同8份协议书
- 房屋正规的定金合同范本
- 文玩店转让出租合同范本
- 2025短视频项目短视频营销解决方案合同范本
- 租房托管班合同(标准版)
- 2025-2026学年苏教版(2024)小学数学二年级上册(全册)教学设计(附目录P226)
- 2025年甘南事业单位笔试试题(含答案)
- 2025年浪浪山小妖怪开学第一课
- 2025年安顺西秀区招聘城市社区工作者考试笔试试题(含答案)
- 2025-2026秋学生国旗下演讲稿:第1周让我们接过历史的接力棒-抗战胜利纪念日
- 2025-2026秋“1530”安全教育记录表
- 催乳相关培训知识课件
- 2025年公平竞争审查知识竞赛考试练习题库(正式版)含答案
- 全力以赴战高考乘风破浪正当时(课件)-2025-2026学年高三上学期开学第一课主题班会
- 登革热与基孔肯雅热防控指南
评论
0/150
提交评论