第九章-相关与回归分析_第1页
第九章-相关与回归分析_第2页
第九章-相关与回归分析_第3页
第九章-相关与回归分析_第4页
第九章-相关与回归分析_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析与相关分析§.1回归与相关的概念和任务§.2一元回归分析§.3Excel回归分析工具§.4多元回归分析§.1回归与相关的概念和任务一、相关关系的概念二、相关关系的种类三、回归分析与相关分析(一)函数关系(二)相关关系

现象之间的相互关系,可以概括为两种不同的类型:函数关系指变量之间存在着确定性依存关系。即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应。函数关系可以用一个确定的公式,即函数式来表示:相关关系指变量之间存在着非确定性依存关系。即当一个或一组变量每取一个值时,相应的另一个变量可能有多个不同值与之对应。相关关系,可用如下统计模型表示:例2、根据消费理论,商品需求量Q与商品价格P、居民收入I之间具有相关关系:(一)依相关关系所涉及因素的多少,分为单相关与复相关(二)依相关关系的表现形式不同,分为线性相关与非线性相关(三)根据变量之间相互关系的方向,分为正相关和负相关(四)按照变量之间相互关系的密切程度,可分为完全相关、零相关和一般相关相关关系的种类:单相关是一个因变量与一个自变量的相关。因此也称为一元相关。复相关

是一个因变量与两个或更多个自变量之间的相关因此也称为多元相关。线性相关从所拟绘的回归模型来看,若一变量表现为其它变量的线性组合,则称变量之间的关系为线性相关。非线性相关从所拟绘的回归模型来看,若一变量表现为其它变量的非线性组合,则称变量之间的关系为非线性相关。直线相关

当自变量X值每变动一个单位,因变量Y值则随着发生大致均等的变动,这就是直线相关。亦称为简单相关或一元线性相关。

曲线相关

当自变量X值每变动一个单位,因变量Y值则随之发生不均等的变化,这就曲线相关。亦称为一元非线性相关。正相关当自变量X值增加,因变量Y值也随之增加,这样的相关关系就是正相关,也叫同向相关。负相关当自变量X的值增加时,因变量Y的值随之而减少,这样的相关关系就是负相关,也叫异向相关。相关指标

反映现象相关关系密切程度的指标,称为相关指标。相关系数

一元线性相关的相关指标叫相关系数,以r表示,取其值为一1与1这一闭区间内的任一实数。复相关系数多元相关的相关指标叫复相关系数,取值亦在0与1这一闭区间范围内;完全相关以一元线性相关来说,当因变量Y的值完全随着自变量X值的变动而变动,不再具有随机性,这时相关关系就转化为函数关系,称为完全相关。此时相关系数r的绝对值等于1。完全同向相关

r=1叫完全同向相关

完全异向相关

r=-1叫完全异向相关

线性零相关

当因变量Y的值完全不随自变量X值的变动而变动,则称为线性零相关,此时r=0一般相关

当0<│r│<1,称为一般相关相关系数

相关系数是在直线相关条件下说明两个变量间相关关系密切程度的统计分析指标。计算公式为:计算相关系数的公式(了解):简捷公式掌握了平均值资料使用掌握了平均值及标准差可使用相关系数的性质

完全线性相关完全没有线性相关低度相关显著相关高度相关回归分析与相关分析(一)回归分析(二)相关分析(三)相关分析与回归分析的关系

回归分析的概念现实世界中大多数现象表现为相关关系,人们通过大量观察,将现象之间的相关关系抽象概括为函数关系,并用函数形式或模型来描述与推断现象间的具体变动关系,用一个或一组变量的变化来估计与推算另一个变量的变化。这种分析方法称为回归分析。回归方程由回归分析求出的反映变量之间关系形式的数学表达式,称为回归方程。按变量的多少,回归分析可分为一元回归分析和多元回归分析按变量之间关系的形式,回归分析可分为线性回归分析和非线性回归分析

相关分析的概念(1)确定现象之间有无相关关系,以及相关关系的表现形态。(2)确定相关关系的密切程度。(3)确定相关关系的数字模型,并进行参数估计和拟合优度检验。(4)回归预测,并分析估计标准误差。相关分析是研究一个变量(设为y)与其它变量之间相关密切程度与相关方向的一种统计分析方法。其主要内容包括:(1)两者具有互为补充关系通过回归分析可以求出一个估计的回归方程,用来反映变量之间在数量变化上的联系;相关分析通过计算出来的相关指标,反映在回归方程这种固定联系的形式下变量之间联系的密切程度。仅仅进行回归分析,回归方程的有效性便遭到怀疑,而仅仅进行相关分析,便不能由自变量来推断因变量,两者是不可偏废某一方的。1.相关分析与回归分析的联系(2)两者存在计算上的联系。回归分析和相关分析是非常相近的两种分析技术,所计算的指标不但在符号上存在联系,而且可以相互推算。2.相关分析与回归分析的区别

(1)两者在关心变量性质上的不同。在回归分析中,必须将变量分为自变量和因变量,以便建立回归方程;也必须将变量分为确定性变量和随机变量,以便研究随机变量的分布以及对其进行统计推断。区分变量的性质是回归分析的前提条件,是回归分析中首先要解决的一个问题。在一元线性相关分析中,只要求变量具有随机性,两个变量具有完全对等的关系,谁对谁相关是无所谓的,它不关心变量之间的因果关系,所关心的仅仅是两个变量联系的紧密程度,倘若改变两个变量的地位也绝不会影响它们的相关关系,因此,所表现出来的相关系数也只有一个,即(2)两者的任务和目的不同。回归分析是根据现象之间关系的特点,运用一定的办法,建立最适合于变量之间关系的回归方程,而且随着变量的变换,回归方程也会随之改变,回归方程是用来反映变量之间数量的平均变动关系,进而对因变量进行估算或预测。相关分析是通过计算相关指标,用来反映回归方程所表明变量之间依存关系的密切程度,是不能进行估算和预测的。(3)两者的使用范围不同。回归分析只限于研究数量标志之间或指标之间的数量关系,对于品质标志之间和等级之间的关系在没有数量化之前是无法研究的。相关分析研究范围比回归分析研究的范围要广泛得多。从研究的范围来看,可以说,凡是能够进行回归分析的,都能够也必须进行相关分析,而能够进行相关分析的,却不一定能够或不都需要进行回归分析,回归分析总需要相关分析的帮助,而相关分析却不一定需要回归分析的帮助,相关分析具有独立性。回归分析的主要内容回归参数估计方程拟合效果评价回归参数的推断

1.回归参数估计例如(一元线性回归模型)计算a、b两个参数(用最小平方法)由得:由此方程组可解出参数a,b例如:某种设备11台实际数据如下表。请据以建立回归方程。使用年限x维修费用(元)yx2xy2540410803520915604640162560474016296056002530005800254000670036420067603645606900365400884064672091080819720合计:58812034845760解:1、根据表中x,y数据关系判断,可拟合一元线性模型:y=a+bx;2、列表计算∑x、∑y、∑xy、∑x2,如表中蓝色数字。3、代入

计算得出:a=368.65;b=70.124、回归方程为:y=368.65+70.12x2.方程拟合效果评价

任何一组数据都可以拟合一个回归模型,但这个回归模型并不一定可以用于推断,所以还需要对所拟合的方程进行评价。人们通常使用相关系数描述现象间关系的密切程度,使用估计标准误差来描述方程拟合的程度,使用方差分析评价方程回归的效果。

3.回归参数的推断

总体的模型往往只是一种理论假设,还需要利用统计推断原理对其进行参数估计与假设检验。§.2一元回归分析

一元回归分析包括一元线性回归分析,即直线回归分析,也包括一元非线性回归分析。由于一元线性回归分析所研究的两个变量之间相关形式简单,方法易于掌握,又是多元回归和非线性回归分析的基础,所以首先介绍一元线性回归分析的理论和方法。2.1利用图表进行回归分析2.2回归方程的评价2.3Excel中的回归分析工作表函数2.4利用工作表函数进行回归分析2.1利用图表进行回归分析例:近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季度销售额的数据资料,并想根据高校的数据决策其投资规模。操作过程:①打开“简单线性回归.xls”工作簿,选择“饭店”工作表,如下图所示。②从“插入”菜单中选择“图表”选项,打开“图表向导”对话框如下图所示。在“图表类型”列表中选择XY散点图,单击“下一步”按钮。③在数据区域中输入B2:C11,选择“系列产生在——列”,如下图所示,单击“下一步”按钮。④打开“图例”页面,取消图例,省略标题,如下图所示。⑤单击“完成”按钮,便得到XY散点图如下图所示。⑥如图1所示,用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选择“添加趋势线”选项,打开趋势线对话框如图2所示。图1图2⑦打开“类型”页面,选择“线性”选项,Excel将显示一条拟合数据点的直线。⑧打开“选项”页面如图3所示,在对话框下部选择“显示公式”和“显示R平方值”选项,单击“确定”按钮,便得到趋势回归图如图4所示。图3图4观察值y值的波动性表现在两个方面:§2.2回归方程的评价做上下波动,这种波动与自变量x的变动无关;做上下波动。(1)y的取值围绕其平均数(2)y的取值围绕回归直线(1)

自变量x的变动;(2)其它因素。这种波动的原因可以归结为两个影响因素:2.2Excel中的回归分析

工作表函数(自学)截距函数INTERCEPT

功能:利用已知的x值与y值计算回归直线在y轴的截距。语法结构:INTERCEPT(known_y's,known_x's)斜率函数SLOPE

功能:返回根据known_y‘s和known_x’s中的数据点拟合的线性回归直线的斜率。语法结构:SLOPE(known_y's,known_x's)判定系数函数RSQ

功能:返回根据known_y‘s和known_x’s中数据点计算得出的Pearson积矩法相关系数的平方。语法结构:RSQ(known_y's,known_x's)估计标准误差函数STEYX

功能:返回通过线性回归法计算y预测值时所产生的标准误差。标准误差用来度量根据单个x

变量计算出的y

预测值的误差量。语法结构:STEYX(known_y's,known_x's)

2.3利用工作表函数进行

回归分析

例某企业希望确定其产品制造过程中的每月成本支出与产量之间的关系,以制定生产计划。试根据该企业选择历年的产量(吨)和成本支出(千元)的样本,计算上面四个函数值。操作过程:①打开“第11章简单线性回归.xls”工作簿,选择“成本产量”工作表,如下图所示。②在单元格A19、A20、A21和A22中分别输入“截距b0”、“斜率b1”、“估计标准误差”和“判定系数”。③在单元格B19中输入公式:“=INTERCEPT(C2:C15,B2:B15)”,单击回车键。④在单元格B20中输入公式:“=SLOPE(C2:C15,B2:B15)”,单击回车键。⑤在单元格B21中输入公式:“=STEYX(C2:C15,B2:B15)”,单击回车键。⑥在单元格B22中输入公式:“=RSQ(C2:C15,B2:B15)”,单击回车键。根据上述计算结果,得每月成本支出与产量之间的回归方程:该方程表明,每月产量每增加1吨,成本支出平均增加2940元。通过计算估计标准误差,知道实际成本与趋势值成本的平均离差为2.3688元。而判定系数告诉我们,在成本的总的变异中,其中,93.44%是可以用产量的变化来解释的。§.3Excel回归分析工具3.1回归分析工具的主要内容3.2回归分析工具的应用3.3回归分析工具的输出解释3.1回归分析工具的主要内容

回归分析工具是通过对一组观察值使用“最小平方法”进行直线拟合,以分析一个或几个自变量对单个因变量的影响方向与影响程度的方法。它是Excel中数据分析工具的一个内容。回归分析的对话框如图5所示。图53.2回归分析工具的应用例某房地产经纪人从政府部门列举的地区中随机抽取了15户居民作为样本,记录了他们的家庭住房面积及其相应的价格,他想确认一下住房面积(平方米)与价格(千元)的关系,并想据此拟合住房价格的回归方程。操作过程:①打开“第10章简单线性回归.xls”工作簿,选择“住房”工作表如下图所示。②在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示。③在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示。④在Y值输入区域中输入C1:C16。⑤在X值输入区域中输入B1:B16。⑥选择“标志”,置信度选择95%。⑦在“输出选项”中选择“输出区域”,在其右边的位置输入“D1”,单击“确定”按钮。输出结果如下图所示。Excel的回归分析工具计算简便,但内容丰富,计算结果共分为三个模块:回归统计表方差分析表回归参数

3.3

回归分析工具的

输出解释回归统计表包括以下几部分内容:MultipleR(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。上节例中:R为0.848466,表示二者之间的关系是高度正相关。RSquare(复测定系数R2):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。上节例中:复测定系数为0.719894,表明用自变量可解释因变量变差的71.99%。1.回归统计表AdjustedRSquare(调整复测定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。观测值:是指用于估计回归方程的数据的观测值个数。2.方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果。3.回归参数表如下页图所示,回归参数表是表中最后一个部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论