第八章相关与回归分析_第1页
第八章相关与回归分析_第2页
第八章相关与回归分析_第3页
第八章相关与回归分析_第4页
第八章相关与回归分析_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第六章 相关与回归分析本章的重点是:相关系数的计算与理解;如何确定线性回归方程并进行预测。第一节 相关与回归分析概述一、 相关关系的概念现象与现象之间的依存关系,从数量联系上看,可分为两种不同的类型:函数关系。指现象间的严格的依存关系,即关系值是固定的。相关关系。指现象间不严格的依存关系,即各变量之间不具有确定性的关系,关系值是不固定的,往往按某种规律在一定的范围内变化。 两者的区别与联系:区别:函数关系现象间的具体关系值是固定的,而相关关系则是一种非确定性关系。联系:对具有相关关系的现象进行分析时,则必须利用相应的函数关系数学表达式,来表明现象之间的相关方程式。相关关系是相关分析的研究对象,函数关系是相关分析的工具。 二、相关关系的种类2现象之间的相关关系可以按照不同的标志加以区分。(一) 按相关的程度分为完全相关:一种现象的数量变化完全由另一个现象的数量变化所决定;不相关:两个现象彼此互不影响,其数量变化各自独立;不完全相关 :两个现象之间的关系介于完全相关和不相关之间。这是相关分析的研究对象。(二) 按相关的方向分为正相关:当一个现象的数量由小变大,另一个现象的数量也相应由小变大;负相关:当一个现象的数量由小变大,而另一个现象的数量相反地由大变小。(三) 按相关的形式分为线性相关:两种相关现象之间的关系大致呈现为线性关系;非线性相关:两种相关现象之间近似地表现为一条曲线。(四) 按影响因素的多少分为单相关(也叫简相关):两个变量间的关系;复相关(多元相关):三个或三个以上变量之间的关系,即一个因变量对两个或两个以上自变量的相关关系偏相关:某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。 三、相关与回归分析的任务相关分析和回归分析是研究现象之间相关关系的两种基本方法。所谓相关分析 (Correlation analysis),就是用一个指标来表明现象间相互依存关系的密切程度。所谓回归分析(Regression analysis),就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。相关与回归分析的任务是:1、确定现象之间有无关系存在,以及相关关系呈现的形态。这是相关分析的前提。 2、确定相关关系的密切程度。相关分析的目的之一,就是从不严格的关系中判断其关系的密切程度。 33、确定相关关系的数学模型。4、确定因变量估计值误差的程度。 估计值和实际值是有出入的,确定因变量估计值误差程度大小的指标是估计标准误。估计标准误大,表示估计较不精确;估计标准误小,表明估计较精确。第二节 相关分析一、 表和相关图在统计中,制作相关图或相关表,可以直观地判断现象之间大致上呈何种关系的形式。相关图表是相关分析的重要方法。 二、相关系数(Coefficient of correlation)1、 相关系数的概念和特点本节所介绍的相关分析是针对单相关而言。所谓相关系数 是在线性相关 条件下,用来说明两个变量之间相关关系密切程度的统计分析指标。特点:第一,两个变量是对等的关系。 第二,只能计算出一个相关系数。 第三,相关系数有正负号,正号表示正相关,负号表示负相关。第四,计算相关系数对资料的要求是:相关的两个变量必须都是随机的。2、测定相关系数的基本方法相关系数有总体相关系数和样本相关系数之分,这里我们主要介绍样本相关系数。测定相关系数的基本方法就是积差相关系数,或者叫做乘积动差相关系数,通常用符号 表示。设( i,yi)是( ,y)的 n 组样本观测值,我们称xx =xy /xy 式(61)或 = L xy /(L xx Lyy) 式(62)为 x 与 y 相关系数。其中,Lxy = = - ( ) ( ) = nxy)(xyxnyLxx = ( ) = - ( )= nx1Lyy = = - ( )= ny)(y所以,相关系数的计算公式还可写成如下形式: = 式22)(yx(63)4 或 = 式)()( 2222ynxny(64) 的计算结果有正负之分,并且正负号是由分子的协方差符号所决定。相关系数的取值范围是:-1+1 或1。相关系数的大小反映了线性相关的两个变量的密切程度,其符号反映了两个变量的变动方向。相关系数 具体的意义是:(1)当=1 时,表示 x 与 y 之间完全线性相关(函数关系) 。(2)当 00 时,表示 与 y 为正相关;当 0,则 SSE/SST0,这时 F0.05(1,13)=4.67,所以,拒绝原假设,说明回归方程的解释能力是明显的,即收入与支出之间有着显著的线性关系。五、一元线性回归模型预测建立回归模型的目的就是为了应用,预测是回归模型最重要的应用。如果所拟合的样本回归方程经过检验,被认为具有经济意义,同时被证明有较高的拟合程度,就可以利用其来进行预测。对于预测问题,除了知道预测值外,还希望知道预测的精度。比如研究某地区小麦产量 y 与施肥量 的关系时,可建立回归方程:x = + 0当已知施肥量 = 时,要预测小麦产量是多少公斤,将 = 带入上式x x0得到 。这个 其实只是这个地区小麦产量的大概值。仅知道这一点意00义并不大,我们往往更希望能给出小麦产量一个预测范围。给一个预测值范围比只给出 更可信。这个问题也就是对于给定的显著性水平 ,找0一个区间(T1,T2) ,使对应于某特定的 的实际值 y 以 1- 的概率被区x00间(T1,T2)所包含,用公式表示,就是P(T1 y T2)= 1-0可以证明置信概率为(1-)的预测区间为:14( -S , + S ) 式0y)2,1(nF00y)2,1(nF(627 )令 = S 0y),(S = 式0y )(1202niix(628 )为 的标准差, F (1,n-2)为 F 分布表查得的临界值。0由上式可看到,对给定的显著性水平 ,样本容量 n 越大,Lxx=越大, 越靠近 ,则 越小,此时的预测精度较高。所以,niix12)(0x为了提高预测精度,样本量 n 应越大越好,采集数据 1, 2, nxx不能太集中。在进行预测时,所给定的 不能偏离 太大,否则,预测效0果肯定不好;如果给定值 = 时, 最小,这时的预测效果就好。因x0此,如果在(min ,max )范围之外作预测,精度就较差。 ii在不同的 点上( -)与( +)的图形通常如图 6-2 所示:x0000+y = + 0x0-0 xx x0图 62 预测区间示意图当样本量 n 较大,| - |较小时,我们可以近似地预测区间。这时01+1/n+ 1,F (1,n-2)与 N(0,1)的 分位点近似相等,xL20)(15其置信水平为 0.95 与 0.99 的近似预测区间分别为:( 2S, +2S)00( 3S, +3S) 回归分析方法的应用要特别注意定性分析与定量分析相结合。当现阶段的实际情况与建模时所用数据资料的背景发生较大变化时,不能仍机械地死套公式,这时就应对模型进行修改。修改包括重新收集数据,尽可能用近期数据;还包括是否增加新的自变量,因为影响某经济现象的因素可能发生了变化,可能还有一些重要的因素需要考虑等。第四节 多元线性回归分析第五节 非线性回归分析这一节主要了解可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论