第二章一元线性回归模型蓝色_第1页
第二章一元线性回归模型蓝色_第2页
第二章一元线性回归模型蓝色_第3页
第二章一元线性回归模型蓝色_第4页
第二章一元线性回归模型蓝色_第5页
已阅读5页,还剩275页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经济计量学 第二章第二章 一元线性回归模型一元线性回归模型本章介绍一元线性回归模型的概念及本章介绍一元线性回归模型的概念及一元线性回归模型所依据的理论与应用。一元线性回归模型所依据的理论与应用。一元线性回归模型只包含一个解释变量和一元线性回归模型只包含一个解释变量和一个被解释变量,是最简单的线性回归模一个被解释变量,是最简单的线性回归模型。通过一元线性回归模型的学习,可较型。通过一元线性回归模型的学习,可较容易地理解回归分析的基本理论与应用。容易地理解回归分析的基本理论与应用。第一节第一节 回归分析的相关概念回归分析的相关概念 一、回归的含义一、回归的含义 回归一词最早由回归一词最早由 F 高尔顿高尔顿 (Francis Galton)提出。在一篇研究父母身高与子女提出。在一篇研究父母身高与子女身高相互关系的论文中,高尔顿发现,虽身高相互关系的论文中,高尔顿发现,虽然有一个趋势,父母高,子女也高;父母然有一个趋势,父母高,子女也高;父母矮,子女也矮,但给定父母的身高,子女矮,子女也矮,但给定父母的身高,子女的平均身高却趋向于或者回归到全体人口的平均身高却趋向于或者回归到全体人口的平均身高。的平均身高。也就是说,当父母双亲都异常高或异常也就是说,当父母双亲都异常高或异常矮,则子女的身高有趋向于人口总体平矮,则子女的身高有趋向于人口总体平均身高的趋势。这种现象被称为高尔顿均身高的趋势。这种现象被称为高尔顿普遍回归定律。这就是回归一词的原始普遍回归定律。这就是回归一词的原始含义。含义。在现代,回归一词已演变为一种新的概念。 回归分析就是研究被解释变量对解释变量的依赖关系,其目的就是通过解释变量的已知或设定值,去估计或预测被解释变量的总体均值。 在下面的几个例子中,我们可以清晰地看到回归分析的实际意义。1高尔顿普遍回归定律。高尔顿普遍回归定律。 高尔顿的目高尔顿的目的在于发现为什么人口的身高分布有一种的在于发现为什么人口的身高分布有一种稳定性。在现代,我们并不关心这种解释稳定性。在现代,我们并不关心这种解释,我们关心的是:在给定父辈身高的情形,我们关心的是:在给定父辈身高的情形下,找到儿辈平均身高的变化规律。下,找到儿辈平均身高的变化规律。就是说,我们如果知道了父辈的身高,就是说,我们如果知道了父辈的身高,就可就可 预测预测 儿辈的平均身高。假设我们得儿辈的平均身高。假设我们得到了一组父亲、儿子身高的数据,制成到了一组父亲、儿子身高的数据,制成如下的散点图。图中按统计分组的方法如下的散点图。图中按统计分组的方法将父亲身高分为若干组。将父亲身高分为若干组。父亲身高(父亲身高( cm)儿子身高(儿子身高(cm)图图 4.1 给定父亲身高儿给定父亲身高儿子身高的分布子身高的分布 图图 4.1中对应于设定的父亲身高,儿中对应于设定的父亲身高,儿子身高有一个分布范围。随着父亲身高子身高有一个分布范围。随着父亲身高的增加,儿子的平均身高也在增加,画的增加,儿子的平均身高也在增加,画一条通过儿子平均身高的线,说明儿子一条通过儿子平均身高的线,说明儿子的平均身高是如何随着父亲身高的增加的平均身高是如何随着父亲身高的增加而增加的,这条线就是而增加的,这条线就是 回归线回归线 。2 在经济学中,经济学家要研究个人在经济学中,经济学家要研究个人消费支出与个人可支配收入的依赖关系。消费支出与个人可支配收入的依赖关系。这种分析有助于估计边际消费倾向,就是这种分析有助于估计边际消费倾向,就是可支配收入每增加一元引起消费支出的平可支配收入每增加一元引起消费支出的平均变化。均变化。3 在企业中,我们很想知道人们对企在企业中,我们很想知道人们对企业产品的需求与广告费开支的关系。这种业产品的需求与广告费开支的关系。这种研究有助于估计出相对于广告费支出的需研究有助于估计出相对于广告费支出的需求弹性,即广告费支出每变化百分之一的求弹性,即广告费支出每变化百分之一的需求变化百分比,这有助于制定最优广告需求变化百分比,这有助于制定最优广告策略。策略。4 农业工作需要预计粮食产量,需要农业工作需要预计粮食产量,需要研究粮食产量与播种面积、施肥量、降雨研究粮食产量与播种面积、施肥量、降雨量之间的依赖关系。量之间的依赖关系。这种一个变量依赖于另一个或多个变量这种一个变量依赖于另一个或多个变量的事例在经济系统中普遍存在。回归分析的事例在经济系统中普遍存在。回归分析就是要研究这种变量之间的依存关系。就是要研究这种变量之间的依存关系。二、统计关系与确定性关系二、统计关系与确定性关系如果给定一个变量如果给定一个变量 X的结果值就可确定的结果值就可确定另一个变量另一个变量 Y 的结果值,则称变量的结果值,则称变量 Y是变量是变量X 的函数,即的函数,即 X、 Y之间是函数关系。之间是函数关系。在经典物理学中,给定电阻在经典物理学中,给定电阻 ,电流电流 I 和电压和电压 V 之间的关系即为函数关系,即之间的关系即为函数关系,即。这种典型的变量关系就是确。这种典型的变量关系就是确定性关系。定性关系。 在经济系统中,在经济系统中, 这种变量之间的函数关这种变量之间的函数关系或确定性关系就很少见系或确定性关系就很少见 。常见的是变量。常见的是变量之间是一种不确定的关系,既使变量之间是一种不确定的关系,既使变量 X 是是变量变量 Y 的原因,的原因, 给定变量给定变量 X 的值也不能具的值也不能具体确定变量体确定变量 Y的值,的值, 而只能确定变量而只能确定变量 Y 的统的统计特征,通常称变量计特征,通常称变量 X 与与 Y 之间的这种关之间的这种关系为统计关系。系为统计关系。例如,企业总产出例如,企业总产出 Y 与企业的资本投入与企业的资本投入K 、劳动力投入、劳动力投入 L 之间的关系就是统计关之间的关系就是统计关系。虽然资本系。虽然资本 K 和劳动力和劳动力 L 是影响产出是影响产出 Y 的两大核心要素,但是给定的两大核心要素,但是给定 K 、 L 的值并的值并不能确定产出不能确定产出 Y 的值。因为,总产出的值。因为,总产出 Y 除除了受资本投入了受资本投入 K、劳动力投入、劳动力投入 L 的影响外的影响外,还要受到技术进步、自然条件等其它因,还要受到技术进步、自然条件等其它因素的影响。素的影响。三、回归分析与相关分析与回归分析密切相联的是相关分析。与回归分析密切相联的是相关分析。相关分析主要测度两个变量之间的线性相关分析主要测度两个变量之间的线性关联度,相关系数就是用来测度两个变关联度,相关系数就是用来测度两个变量之间的线性关联程度的。例如,吸烟量之间的线性关联程度的。例如,吸烟与肺癌、统计学成绩与数学成绩、身高与肺癌、统计学成绩与数学成绩、身高与体重等等之间的相关程度,就可用相与体重等等之间的相关程度,就可用相关系数来测度。关系数来测度。而在回归分析中,我们的主要目的在于而在回归分析中,我们的主要目的在于根据其它变量的给定值来估计或预测某一根据其它变量的给定值来估计或预测某一变量的平均值。例如,我们想知道能否从变量的平均值。例如,我们想知道能否从一个学生的数学成绩去预测他的统计学平一个学生的数学成绩去预测他的统计学平均成绩。均成绩。在回归分析中,被解释变量在回归分析中,被解释变量 Y 被当作被当作是随机变量,而解释变量是随机变量,而解释变量 X 则被看作非随则被看作非随机变量。而在相关分析中,我们把两个变机变量。而在相关分析中,我们把两个变量都看作是随机变量。量都看作是随机变量。 例如例如 ,在学生的数学成绩与统计学成,在学生的数学成绩与统计学成绩的分析中,如为回归分析,则统计学成绩的分析中,如为回归分析,则统计学成绩是随机变量,数学成绩是非随机变量,绩是随机变量,数学成绩是非随机变量,即数学成绩被固定在给定的水平上,以此即数学成绩被固定在给定的水平上,以此求得统计学的平均成绩。而在相关分析中求得统计学的平均成绩。而在相关分析中,两者处于平等地位,不存在谁为解释变,两者处于平等地位,不存在谁为解释变量,谁为被解释变量的问题,两者均为随量,谁为被解释变量的问题,两者均为随机变量。机变量。第二节第二节 一元线性回归模型一元线性回归模型一、引例一、引例假定我们要研究一个局部区域的居假定我们要研究一个局部区域的居民消费问题,该区域共有民消费问题,该区域共有 80户家庭组成户家庭组成,将这,将这 80户家庭视为一个统计总体。户家庭视为一个统计总体。我们研究每月我们研究每月 家庭消费支出家庭消费支出 Y 与与 每月每月可支配收入可支配收入 X 的关系。就是说,已知家庭的关系。就是说,已知家庭每月可支配收入,要预测家庭每月消费支每月可支配收入,要预测家庭每月消费支出的总体平均水平。为此,将出的总体平均水平。为此,将 80户家庭分户家庭分为为 10组。组。 表表 4.1给出了人为数据。给出了人为数据。X Y 每月家庭可支配收入(元)每月家庭可支配收入(元)1000150020002500300035004000450050005500每每月月家家庭庭消消费费支支出出(元(元)7007407808208609009401050107011201170122012701320137014201380144015001560162016801740180018601780184019001960202020802140220022602180224023002360242024802540260026602620268027402820290029803160290029803060314032203300338034603540332034203520362037203820392037103810391040204130423043304090420043104420453046404750合计合计 5740 109801458018180217801974022540253402814030940表表 4.1 居民收入、消费数据居民收入、消费数据从从 表表 4.1中可以看出,对于每月中可以看出,对于每月 1000元收元收入的入的 7户家庭,每月消费支出为户家庭,每月消费支出为 700元到元到 940元元不等。同样,当不等。同样,当 X=3000元时,元时, 9户家庭的每月户家庭的每月消费支出在消费支出在 2180元到元到 2660元之间。元之间。表表 4.1给出了以给出了以 X 的给定值为的给定值为条件的条件的 Y 的条件分布。的条件分布。对于对于 Y 的每一条件分布,我们能计算出的每一条件分布,我们能计算出它的条件期望,记为它的条件期望,记为 E( Y/X=Xi) ,即在,即在 X取特定取特定 Xi 值时值时 Y 的期望值。例如,的期望值。例如, X=1000时,时, Y 的期望值为:的期望值为:将将 表表 4.1中的数据在直角坐标系中中的数据在直角坐标系中描出,则得到描出,则得到 图图 4.2的散点图。的散点图。XY100020003000400050001000 1500 2000 2500 3000 3500 4000 4500 5000 5500收入收入 、 消费散点图消费散点图 图图 4.2该图表明了对应于各该图表明了对应于各 X 值的值的 Y 的条件的条件分布。虽然每个个别家庭的消费支出都分布。虽然每个个别家庭的消费支出都有异,但有异,但 图图 4.2清楚地表明随着收入的增清楚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论