相关和回归分析_第1页
相关和回归分析_第2页
相关和回归分析_第3页
相关和回归分析_第4页
相关和回归分析_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章相关与回归分析相关与回归分析是研究事物之间关系、确定事物紧密程度、揭示事物变化的具体形式和规律的统计方法,是经济分析、预测和控制的重要工具。第八章相关与回归分析的基本概念简单线性相关与回归分析多元线性相关与回归分析非线性相关与回归分析本章概述、学习目标、 变量间相关关系和相关系数的计算总体回归函数和样本回归函数之间线性回归的基本假设线性回归参数的估计和检验多元线性回归参数的估计和检验常用的非线性函数可以转化为线性回归非线性相关指数、函数关系和相关关系类别相关分析和回归分析相关表和相关图第一节是相关和回归分析、回归、函数关系和相关、函数关系的基本概念。 当一个或几个变量取某个值时,另一个变

2、量有与之对应的某个值。我们称这种关系为确定性函数关系。函数关系是由两个变量x和y构成的一对一的确定性关系,变量y随变量x而变化,并完全依赖于x,当x取某个值时,y根据确定性关系取相应的值,那么y是x的函数,表示为y=f(x),其中x称为自变量,y称为因变量。每个观测点都在一条线上。例如:商品的销售量(y)、销售量(x)和价格(p)之间的关系表示为y=px。面积和圆半径之间的关系可以表示为S=r2。原材料消耗(y)、产量(x1)、单位产量消耗(x2)和原材料价格(x3)之间的关系可以表示为y=x1,当一个或几个相关变量取某个值时,另一个变量的对应值是不确定的,但它仍然按照一定的规律在一定的范围内

3、变化。我们称这些现象之间的不精确和不确定的数量依赖为相关性。变量之间的关系不能用函数关系来准确表达;一个变量的值不能由另一个变量唯一确定;当变量x取某个值时,变量y可能有几个值;所有观测点都分布在一条直线上。商品消费(y)与居民收入(x)的关系商品消费(y)与价格(x)的关系商品销售(y)与广告费用(x)的关系每亩粮食产量(y)与施肥量(x1)的关系降雨量(x2)与温度(x3)的关系收入函数关系(确定性关系),相关关系(非确定性关系),并比较以下两种现象之间的依存关系。函数关系是变量之间严格的、完全确定的关系,即一个变量的值完全由另一个变量(或一组变量)的值决定和控制。函数关系通常可以用数学公

4、式精确表达。像函数关系这样的数学公式很难准确表达相关性。相关性与函数的区别:由于客观上观察或测量往往存在误差,在实际工作中函数关系往往通过相关性来表达。当人们对某些现象的内在规律有了深刻的理解,这种关联就可能变成一种功能关系。因此,在研究相关性时,我们经常把函数关系作为工具,用一定的函数关系来表达相关性的定量联系。相关与函数的关系、回归、相关类型、根据相关程度的划分、相关方向、自变量的数量、变量间相互关系的表现、不完全相关、完全相关、不相关、正相关、负相关、相关类型、部分相关、回归、不相关:当两种现象互不影响时,完全相关:如果一个变量的变化完全由其他变量的数量变化决定,那么变量之间的关系称为完

5、全相关。在这种情况下,相关性变成了函数关系。因此,功能关系是相关性的一个特例。不完全相关:如果变量之间的关系在不相关和完全相关之间,这被称为不完全相关。大多数相关性是不完整的,是统计研究的主要对象。根据相关程度,回报,正相关:在两个相关的现象之间,当一个变量的值增加(或减少),另一个变量的值也增加(或减少),也就是说,在同一个方向的变化。例如,随着工业总产值的增加,企业的总税收和利润也会增加;家庭消费支出随着收入的增加而增加。负相关:当一个变量的值增加(或减少)时,另一个变量的值反方向变化。例如,劳动生产率提高,产品成本降低;产品成本降低,企业利润增加等。根据相关性的方向,返回,单一相关性:两

6、个因素之间的相关性称为单一相关性。复杂相关:三个或三个以上因素之间的相关称为复杂相关,即研究涉及两个或两个以上的自变量和因变量。例如,一种商品的需求与其价格水平和收入水平之间的相关性是一种多重相关性。偏相关:当一个现象与多个现象相关时,假设其他变量不变,对两个变量之间相关性的特殊研究称为偏相关。例如,在人们的收入水平保持不变的假设下,某一商品的需求与其价格水平之间的关系是偏相关的。根据自变量的数量,返回,线性相关(或线性相关):当相关的自变量X发生变化时,因变量Y的变化大致相等,即从图像上近似呈直线的形式。这种相关性通常被称为线性相关性。曲线(或非线性)相关:在两种相关现象中,自变量X的值变化

7、,因变量y也变化。这种变化是不相等的,图像上的分布是各种曲线形式。这种相关性被称为曲线(或非线性)相关性。相关图上曲线相关的分布形式为抛物线、双曲线和指数曲线。根据变量之间关系的表达式,返回1。相关性分析,就是用一个指标来显示现象之间相互依赖的密切程度。广义相关分析包括相关分析(狭义相关分析)和回归分析。回归分析是指一种统计分析方法,它根据相关现象的具体形式,为相关现象选择合适的数学模型(称为回归方程),并用它来近似表达变量之间的平均变化关系。相关分析和回归分析,(1)概念:根据回归变量的数量,可以分为单变量回归方程和多变量回归方程。根据回归是否是线性的,可以分为线性回归方程和非线性回归方程。

8、根据回归是否存在滞后现象,可以分为自回归方程和无自回归现象的方程。相关分析研究随机变量之间相互依赖的方向和紧密程度,用相关系数表示。回归分析研究因变量和一个或多个自变量之间数据关系的变化趋势,用回归方程表示。在相关分析中,没有必要确定自变量和因变量;在回归分析中,有必要事先确定哪个是自变量,哪个是因变量,因变量只能从自变量推断,不能从因变量推断。(2)相关性分析和回归分析的区别,相关性分析不能指出变量之间关系的具体形式;回归分析能准确指出变量之间关系的具体形式,并能进行估计和预测相关分析和回归分析是密切相关的,它们不仅有共同的研究对象,而且在具体应用中必须相互补充。相关分析需要依靠回归分析来展

9、示现象量相关的具体形式,而回归分析需要依靠相关分析来展示现象量变化的相关程度。只有当变量之间存在高度相关性时,进行回归分析以找到相关性的具体形式才有意义。简而言之:1 .相关分析是回归分析的基础和前提;2.回归分析是相关分析的深化和延续。(3)相关分析与回归分析的关系,(3)相关分析的主要内容是揭示现象之间是否存在相关性。确定相关性的表达形式。确定现象变量之间的密切程度和相关方向。回归分析的主要内容是建立相关的回归方程。测量因变量的估计值和估计值之间的误差程度。(4)相关分析和回归分析的任务;(4)相关性的定性分析,确定回归方程,计算相关系数或相关指数,检验回归方程的显著性,用回归方程进行计算

10、和预测,进行置信区间估计;(5)相关分析和回归分析的步骤;(6)相关性的判断和定性分析是基于研究者的理论知识和实践经验来判断客观现象之间是否存在相关性。在定性分析的基础上,通过编制相关表、绘制相关图和计算相关系数,可以判断现象间相关性的方向、形式和密切程度。返回相关表:在定性判断的基础上,将两个相关量的具体值按一定顺序并列排列在一张表上,观察它们之间的关系;相关图:通过在直角坐标系统中逐个标记彼此对应的特定值而形成的散点图。利用相关图和相关表,我们可以更加直观形象地展示变量之间的关系。中国1978-2004年国内生产总值与出口量的相关表,回归,相关图,回归,第二节简单线性相关与回归分析,简单线

11、性相关系数及回归系数估计检验,简单线性回归模型预测,回归,简单线性相关系数及检验, 相关系数的定义相关系数的计算相关系数的特征使用相关系数测试和返回的注意事项:(1)简单相关系数:一种统计分析指标,它表示线性条件下两个变量之间的相关程度,简称相关系数。 如果相关系数是根据总体数据计算的,则称之为总体相关系数,记录如下:如果是根据样本数据计算的,称为样本相关系数,记录为r。相关系数的定义,其中Cov(X,Y)是变量X和Y的协方差;Var(X)和Var(Y)分别是变量X和Y的方差。总体相关系数是反映两个变量之间线性相关程度的一种特征值,是一个常数。总体相关系数的定义是变量x和y的协方差,变量x和y

12、的标准差,样本相关系数定义公式的实质,回归,计算相关系数的“积差法”,计算和回归相关系数,相关系数的范围是:-1 r 1 (|r| 1) | r |r|=0表示两个变量之间不存在线性相关;|r| 0.3,表示相关性非常低(弱);0.3 |r| 0.5,表示相关性低;0.5 |r| 0.8,表示中度相关;|r| 0.8,表示相关性高;R=1表示完全正相关的存在;R=-1表示完全负相关。相关系数的特性,r,返回,使用相关系数的注意事项,x和y是相互对称的随机变量,所以相关系数只反映线性相关系数不能确定变量之间的因果关系,也不能解释相关性接近于哪一条线。返回,为什么要检查?样本相关系数是随样本变化的

13、随机变量,相关系数的统计显著性有待检验。检验方法:R检验、T检验、相关系数检验、回归、对总体参数提出假设、对原始假设进行统计、给出显著性水平、检验自由度为n-2的R分布表,得到临界值;(1) R检验、判断、回归,对总体参数提出假设,并对原始假设进行统计。得到临界值、判断、(2) t检验、回归、总回归函数和样本回归函数、回归模型的基本概念、一元正态线性回归、回归、回归模型的类型、回归、基本概念,回归分析是指根据特定的相关形式,选择合适的数学模型来近似表达变量间平均变异关系的统计分析方法。(1)总体回归函数是一个随机误差项,也称为随机干扰项,它是一个特殊的随机变量,反映了方程中未包含的其他因素的影

14、响。(2)样本回归函数称为残差,在概念上,它对应于总体误差项;是样本的大小。单向正态线性回归,整体回归线未知,只有一条。根据样本数据拟合样本回归线,每组样本可以拟合一条样本回归线。假设1:误差项的期望值是0,也就是说,对于所有的I 2总是有一个假设:误差项的方差是常数,也就是说,对于所有的I 3总是有一个假设:误差项之间没有序列相关性,也就是说,协方差是0,也就是说,当ij时,有一个假设4:自变量是给定的变量,与误差项的线性无关。假设5:误差的随机项服从正态分布。满足上述标准假设的单变量线性模型称为标准单变量线性回归模型。误差项假设的基本标准,收益,回归方程估计的基本思想,最小二乘估计方法,最

15、小二乘估计的性质,几种常用的标记实例分析,单向线性回归方程的估计,收益,总体回归参数0和1是未知的,因此有必要用样本数据来估计。通过用样本统计的和替换回归方程中的未知参数0和1来获得估计的回归方程。在简单线性回归中估计的回归方程是,其中:是估计回归线在Y轴上的截距和直线的斜率,这意味着对于给定的X值,它是Y的估计值,也意味着当X变化一个单位时Y的平均变化值。回归方程估计的基本思想是,回归,使观测值和因变量的估计值之间的偏差的平方和最小以得到和。也就是说,用最小二乘法拟合的直线表示的x和y之间的关系与实际数据之间的误差小于任何其他直线。最小二乘法,最小二乘法(如图),回归系数估计的最小二乘法公式。假设偏导数将被获得并且等于零,并且可以获得:完成后,求解方程的标准方程可以得到如下:回归,最小二乘估计量的特征,1。小样本性质:线性:最小二乘估计量。无偏性:最小二乘估计量的期望值等于估计参数的真实值;有效性:在所有0和1的线性无偏估计中,最小二乘估计的方差最小。满足这三个条件的估计量称为最优线性无偏估计量。大样本性质:渐近无偏:随着样本量的增加,参数的期望值可以达到真实值。一致性:如果和之间的差的绝对值小于任意小的正数(),随着样本量的增加,概率接近1,则它是的一致估计量。下表是1992-2006年中国人均可支配收入和人均消费支出的数据(单位:元),估算了边际消费倾向和基本消

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论