版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第8章 回归分析1第八章 相关与回归分析 下一页返回目录第8章 回归分析2主要内容主要内容相关分析回归分析第8章 回归分析3第一节、相关分析的意义和任务 一、相关分析的概念 二、相关分析的种类 上一页下一页返回本章首页第8章 回归分析4一、相关分析的概念现实世界中现象之间存在着两种关系现实世界中现象之间存在着两种关系函数关系函数关系 它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。 上一页下一页返回本节首页第8章 回归分析5上一页下一页返回本节首页第8章 回归分析6相关关系相关关系它反映现象
2、之间确实存在的,但关系数值不固定的相互依存关系。 这一概念表明:(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。上一页下一页返回本节首页第8章 回归分析7第8章 回归分析8相关关系与函数关系的联系和区别相关关系与函数关系的联系和区别由于有观察或测量误差等原因,函数关系在由于有观察或测量误差等原因,函数关系在实际中往往通过相关关系表现出来。在研究实际中往往通过相关关系表现出来。在研究相关关系时,又常常要使用函数关系的形式相关关系时,又常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现来表现,以便找到相关关系的一般数量表现形式。
3、形式。 2 2、相关关系是统计学的研究范围;、相关关系是统计学的研究范围; 函数关系是数学的研究范围。函数关系是数学的研究范围。第8章 回归分析9二、相关分析的种类根据相关因素的多少划分根据相关因素的多少划分 单相关:只涉及两个变量。单相关:只涉及两个变量。 复相关:涉及三个或三个以上的变复相关:涉及三个或三个以上的变量。量。3.偏相关偏相关:在涉及到三个或三个以上的在涉及到三个或三个以上的变量时,假定其它变量维持不变,只研变量时,假定其它变量维持不变,只研究其中两个变量的相关关系,这种相关究其中两个变量的相关关系,这种相关关系叫偏相关关系叫偏相关上一页下一页返回本节首页第8章 回归分析10根
4、据相关的形式不同划分根据相关的形式不同划分 线性相关(直线相关):当一个变线性相关(直线相关):当一个变量变动时,另一个变量也相应地成比例量变动时,另一个变量也相应地成比例地变动。地变动。 非线性相关(曲线相关):当一个非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变变量变动时,另一个变量也相应发生变动,但这种变动不是成比例的。动,但这种变动不是成比例的。第8章 回归分析11根据相关关系的方向划分根据相关关系的方向划分 正相关:两个变量之间的变化方正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。向一致,都是增长趋势或下降趋势。负相关:两个变量变化趋势相反,负相关:两
5、个变量变化趋势相反,一个下降而另一个上升,或一个上一个下降而另一个上升,或一个上升而另一个下降。升而另一个下降。上一页下一页返回本节首页第8章 回归分析12各类相关关系的表现形态图各类相关关系的表现形态图 第8章 回归分析13第二节相关分析方法 一、散点图和相关表 二、相关系数上一页下一页返回本章首页第8章 回归分析14一、散点图和相关表例例 近年来国家教育部决定将各高校的后近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为勤社会化。某从事饮食业的企业家认为这是一这是一 个很好的投资机会,他得到十组个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据高校人数与周边饭店
6、的季销售额的数据资料,并想资料,并想 据此决策其投资规模。据此决策其投资规模。 上一页下一页返回本节首页第8章 回归分析15操作过程:操作过程:上一页下一页返回本节首页输入数据,如下图所示。输入数据,如下图所示。相关表是一种反映变量之间相关关系的统计表。第8章 回归分析16从从“插入插入”菜单中选择菜单中选择“图表图表”选项,打开选项,打开“图表向导图表向导”对话框如下图所示。在对话框如下图所示。在“图表图表类型类型”列表中选择列表中选择XY散点图,单击散点图,单击“下一步下一步”按钮。按钮。上一页下一页返回本节首页第8章 回归分析17在数据区域中输入在数据区域中输入B2:C11,选择,选择“
7、系列产系列产生在生在列列”,如下图所示,单击,如下图所示,单击“下一步下一步”按钮。按钮。上一页下一页返回本节首页第8章 回归分析18打开打开“图例图例”页面,取消图例,省略标题,如页面,取消图例,省略标题,如下图所示。下图所示。上一页下一页返回本节首页第8章 回归分析19单击单击“完成完成”按钮,便得到按钮,便得到XY散点图如下图散点图如下图所示。所示。050100150200250051015202530上一页下一页返回本节首页第8章 回归分析20相关关系的测度(相关系数)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计
8、算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r第8章 回归分析21nyyxxyxnyyynxxxxyxx)()()(222的协方差:、的标准差:的标准差:复习:第8章 回归分析22上一页下一页返回本节首页yxxynyynxxnyyxxyyxxyyxxr22222)()()()()()(相关系数的涵义: 相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。第8章 回归分析23相关系数公式的涵义理解相关系数公式的涵义理解 (1)两个变量之间的相关程度和方向,取决于两个变量离差乘积之和 ,当它为0时,为0;当它为正时,为正;当它为负
9、时, 为负。(2)相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即 ,所以相关系数是无量纲的数量。)(yyxxrrryxyyxx和第8章 回归分析24yyxxxyyyxxxyLLLrLynyyyLxnxxxLyxnxyyyxxyyxxyyxxr22222222)(1)()(1)(1)()()()(由于:第8章 回归分析25)()()()(1)()(1(1)()()(22222222222yynxxnyxxynynyxnxyxnxyyyxxyyxxLLLrryyxxxyyxxy的计算公式:总结相关系数第8章 回归分
10、析26相关系数的意义相关系数的意义(1)r的取值在-1到+1之间。(2)r=+1,为完全正相关;r=-1为完全负相关。表明变量之间为完全线性相关,即函数关系。(3)r=0,表明两变量无线性相关关系。(4)r0,表明变量之间为正相关;r0,表明变量之间为负相关。(5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切。 第8章 回归分析27相关程度可分为以下几种情况:相关程度可分为以下几种情况: ,为无线性相关;0.3 0.5,为低度线性相关;0.5 0.8,为显著线性相关; 0.8,一般称为高度线性相关。以上说明必须建立在相关系数通过显著性检验的基础之上。 3
11、 .0rrrr相关系数的显著性检验 相关系数是根据样本数据计算的,具有一定随机性,能否真实地表现变量总体的相关情况受到随机因素和样本容量大小的影响。故需要对其进行检验。样本相关系数的检验包括两类检验:(1)对总体相关系数是否等于0进行检验;(2)对总体相关系数是否等于某一给定的不为0的数值进行检验。对总体相关系数是否等于对总体相关系数是否等于0的检验的检验 总体相关系数的检验统计上用t检验。其步骤如下:第一步,提出原假设和备择假设。假设样本相关系数r是抽自具有零相关的总体,即第二步,规定显著性水平,并依据自由度(n-2)确定临界值 ;第三步,计算检验的统计量:212rnrT第四步,做出判断。将
12、计算的统计量与临界值对比,若统计量大于或等于临界值,表明变量间线性相关在统计上是显著的,若统计量小于临界值,则说明相关关系在统计上并不显著。第8章 回归分析31例题:相关系数的计算与检验:用计算器计算相关系数例 上一页下一页返回本节首页11.262228633.18043.81105511566.113277.2135881606 .4544,880,10421454.207, 4 .36, 822xyyxnyx9697. 0104214854.20788804 .366 .454488804 .36222222yyxxnnyxxynr第8章 回归分析32用计算机计算相关系数选取“工具”-“数
13、据分析”选“相关系数”选“确定”输入“输入区域”输入“输出区域”在“分组方式”中选“逐列”选“标志位于第一行”确定出现结果如下:上一页下一页xyx1.0000y0.96971.0000返回本节首页(三)相关系数检验 提出原假设和备择假设。取显著性水平 ,根据自由度 查 分布表得 =2.4469计算检验的统计量: =9.723605. 062nt025. 02/tt229697.01289697.012rnrT由于 ,则拒绝 ,表明变量间线性相关在统计上是显著的。即产品产量与生产费用之间的相关系数是显著的。2/tT 0H第8章 回归分析35第三节回归分析 一、回归分析的概念 二、直线回归 三、曲
14、线回归 上一页下一页返回本章首页第8章 回归分析36一、 回归分析的概念 回归分析:回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。回归分析的种类:按自变量x的多少,可以分为一元回归和多元回归;按y与x曲线的形式,可以分为直线回归和曲线回归。上一页下一页返回本节首页回归分析按回归变量个数分按回归形式分一元回归多元回归线形回归非线性回归第8章 回归分析38二、直线回归简单直线回归方程的确定简单直线回归分析的特点(1)在变量之间,必须根据研究目的具体确定哪些是自变量,哪个是因变量。(2)回归方程的作用在于,在给定自变量的数值
15、情况下来估计因变量的可能值。一个回归方程只能做一种推算。推算的结果表明变量之间具体的变动关系。上一页下一页返回本节首页第8章 回归分析39(3)直线回归方程中,自变量的系数为回归系数。回归系数的符号为正时,表示正相关;回归系数的符号为负时,表示负相关。(4)确定回归方程时,只要求因变量是随机的,而自变量是给定的数值。上一页下一页返回本节首页第8章 回归分析40简单直线回归方程的确定设(x,y)为实际值,yc为估计值,采用普通最小二乘法,设拟合的直线为: 根据最小二乘原理:上一页下一页返回本节首页bxayc为最小yycQ2第8章 回归分析41xbyanyxxynbxx22可以解得:上一页下一页返
16、回本节首页0)()( 2Q0) 1()( 2Q)()(22xbxaybbxayabxayyyQc令:为最小为使第8章 回归分析42上一页下一页返回本节首页。试建立其线性回归方程,例:现有数据资料如下第8章 回归分析43上述资料可绘制如下折线图:上述资料可绘制如下折线图:图1生产费用与产量散点图0501001502000246810生产费用(万元) y上一页下一页返回本节首页第8章 回归分析44解:方法一:用计算器计算:110,55. 4, 6 .4544,880,10421454.207, 4 .36, 822yxxyyxnyx31.5155. 49 .121109 .124 .3654.20
17、788804 .366 .45448222xbyanyxxynbxx故直线方程为yc=51.31+12.9x第8章 回归分析45方法二:用Excel计算:先作散点图,然后添加趋势线。先作散点图,然后添加趋势线。 用鼠标激活散点图,把鼠标放在用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选择单,在菜单栏里选择“添加趋势线添加趋势线”选选项。项。上一页下一页返回本节首页第8章 回归分析46图2上一页下一页返回本节首页第8章 回归分析47打开打开“类型类型”页面,选择页面,选择“线性线性”选项,选项,Excel将显示一条拟合数据点的直线
18、。将显示一条拟合数据点的直线。 打开打开“选项选项”页面如下图所示,在对话框下部页面如下图所示,在对话框下部选择选择“显示公式显示公式”和和“显示显示R平方根平方根”选项,选项,单击单击“确定确定”按钮,便得到回归图如下图所示。按钮,便得到回归图如下图所示。生产费用与产量散点图y = 12.896x + 51.323R2 = 0.94030501001502000246810生产费用(万元) y线性 ( 生 产 费用(万元) y )上一页下一页返回本节首页第8章 回归分析48多元线性回归回归方程为xbxbyac2211要估计参数a、b1 、 b2手工计算较繁,可以用EXCEL数据分析功能完成。
19、上一页下一页返回本节首页第8章 回归分析49例 某地区玻璃销售量与汽车产量、建筑业产值资料如左,试建立回归模型。上一页下一页返回本节首页第8章 回归分析50操作过程在Excel中输入数据。在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示。上一页下一页返回本节首页第8章 回归分析51在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示。上一页下一页返回本节首页第8章 回归分析52在Y值输入区域中输入B1:B19。在X值输入区域中输入C1:D19。选择“标志”,置信度选择95%。在“输出选项”中选择“输出区域”,在其右边的位置输入“E1”,单击
20、 “确定”按钮。输出结果如下图所示。上一页下一页返回本节首页第8章 回归分析53上一页下一页返回本节首页回归方程的显著性检验回归方程的显著性检验 对于回归方程进行显著性检验基于以下两点: 第一,在根据样本数据拟合回归方程时,我们首先假设变量 与 变量之间存在着线性关系,但这种假设是否成立?就必须通过检验才能证实;第二,样本回归方程 中的参数是对总体回归方程中参数 的最小二乘估计值,样本回归系数 能否作为总体回归系数 的估计值,还需要对总体回归系数的显著性进行检验。回归方程的检验一般包括两个方面的内容: 一是线性关系的检验; 二是回归系数的检验。第8章 回归分析56一、离差平方和的分解1.因变量
21、 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示第8章 回归分析57离差平方和的分解(图示)y第8章 回归分析58离差平方和的分解 (三个平方和的关系)2. 两端平方后求和有第8章 回归分析59离差平方和的分解 (三个平方和的意义)1.总平方和总平方和(TSS)反映因变量的 n 个观察值与其均值的总离差2.回归平方和回归平方和(RSS)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于
22、x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和3.残差平方和残差平方和(ESS)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和第8章 回归分析60统计量与二、拟合优度22RrTSSRSSTSSRSSTSSTSSESSr12总体平方和回归平方和的特点:2r; 10)1(2 r;,回归方程拟合得越好值越接近1)2(2r度的影响。的不足:没有考虑自由2)3(r) 1( n总体平方和:自由度为k回归平方和:自由度为) 1( kn残差平方和:自由度为数。不含常数项的自变量个样本容量; :kn总体平方和残差平方和1第8章 回归分析61) 1/()
23、1/(1/12nTSSknRSSR自由度总体平方和自由度残差平方和作为拟合优度指标。用的不足,在实际应用中为克服22Rr:R2拟合优度指标第8章 回归分析62回归方程的显著性检验 (线性关系的检验 )1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(RSS)同剩余离差平方和(ESS)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系第8章 回归分析63回归方程的显著性检验 (检验的步骤)1.提出假设H0:线性关系不显著第8章 回归分析64Excel的回归分析工具计算简便,但内容丰富,计算结果共分
24、为三个模块:回归统计表 方差分析表回归参数 回归分析工具的输出解释上一页下一页返回本节首页第8章 回归分析66回归统计表包括以下几部分内容:Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。 上节例中:R为0.9468,表示解释变量与被解释变量之间的关系是:高度正相关。. 回归统计表上一页下一页返回本节首页第8章 回归分析67R Square(决定系数R2 ):用来说明用自变量解释因变量变差的程度,以衡量对观测值的拟合效果。 上例中:决定系数为0.9731,表明用自变量可解释因变量变差的97.31%。TSSRSSyyyyTSSESSRy
25、yyyyyRSSESSTSSiiiiii1)()()()()()()()(222222总平方和回归平方和残差平方和回归平方和总平方和第8章 回归分析68Adjusted R Square (调整的决定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。上一页下一页返回本节首页) 1/(1/12nTSSknRSSR)(调整的第8章 回归分析69标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量
26、,此值越小,说明拟合程度越好。1)(12knyyniii第8章 回归分析70观测值:是指用于估计回归方程的数据的观测值个数。 方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果。上一页下一页返回本节首页) 1/(/knRSSkESSF) 1,() 1/(/knkFknRSSkESSF第8章 回归分析71) 1,(knkF1) 1,(knkFF若则方程显著成立) 1,(knkFF若能通过。则方程的显著性检验不椐样本计算查表分布示意图为:则分布的概率密度函数为设FxfF),()(xfx第8章 回归分析72(3)回归参数表Intercept:截距0第二、三行:0(截距) 和1(斜率)
27、的各项指标。第二列:回归系数0(截距)和1(斜率)的值。第三列:回归系数的标准误差第四列:根据原假设Ho:0=1=0计算的样本统计量t的值。第五列:各个回归系数的p值(双侧)第六列:0和195%的置信区间的上下限。 上一页下一页返回本节首页第8章 回归分析73t统计量)1(2kntctiiii12knRSS其中75.15338.55.14666.636.10119.543.9909.3X如:右上方的资料:个元素。主对角线上的第iXXcii1)( :yx1x22803.9099.43281.55.11910.36337.56.66614.5404.55.33815.75第8章 回归分析74x)(xf221) 1(2knt) 1(2kntt若过。则变量的显著性检验通) 1(2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年东方电气集团东方电机有限公司招聘备考题库附答案详解
- 2026年徐州市泉山数据有限公司招聘备考题库及参考答案详解
- 2026年山西丰乐鑫农种业有限公司招聘备考题库及参考答案详解
- 2025年佛山市顺德区胡宝星职业技术学校面向社会公开招聘语文音乐临聘教师备考题库及一套完整答案详解
- 2026年南京大学化学学院技术管理招聘备考题库及完整答案详解一套
- 学校收支管理内控制度
- 金融营销内控制度
- 恒大内控制度
- 企业市场开发内控制度
- 财政局内控制制度
- 除夕烟火秀活动方案
- 地理中国的工业+课件-2025-2026学年初中地理湘教版八年级上册
- 压力管道安装单位压力管道质量安全风险管控清单
- 2025年广东省高中语文学业水平合格考试卷试题(含答案详解)
- 停车场道闸施工方案范本
- 2025年广东省春季高考语文试卷(解析卷)
- 2025年实验室安全事故案例
- 垃圾焚烧发电检修培训
- 城市老旧建筑改造中的结构加固与性能提升
- 全国计算机等级考试NCRE考务管理系统操作使用手册
- 铁路更换夹板课件
评论
0/150
提交评论