计量经济学演示课件教学作者庞皓简单线性回归模型市公开课金奖市赛课一等奖课件_第1页
计量经济学演示课件教学作者庞皓简单线性回归模型市公开课金奖市赛课一等奖课件_第2页
计量经济学演示课件教学作者庞皓简单线性回归模型市公开课金奖市赛课一等奖课件_第3页
计量经济学演示课件教学作者庞皓简单线性回归模型市公开课金奖市赛课一等奖课件_第4页
计量经济学演示课件教学作者庞皓简单线性回归模型市公开课金奖市赛课一等奖课件_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 计量经济学第 二 章简单线性回归模型第1页2 从2004中国国际旅游交易会上得悉,到年,中国旅游业总收入将超出3000亿美元,相当于国内生产总值8%至11%。(资料起源:国际金融报11月25日第二版)是什么决定性原因能使中国旅游业总收入到年到达3000亿美元?旅游业发展与这种决定性原因数量关系终究是什么?怎样详细测定旅游业发展与这种决定性原因数量关系?引子: 中国旅游业总收入将超出3000亿美元吗?第2页3第二章 简单线性回归模型 本章主要讨论: 回归分析与回归函数 简单线性回归模型参数预计 拟合优度度量 回归系数区间预计和假设检验 回归模型预测第3页4第一节 回归分析与回归方程 本节基本内

2、容: 回归与相关 总体回归函数 随机扰动项 样本回归函数 第4页5 1. 经济变量间相互关系 确定性函数关系 不确定性统计关系相关关系 (为随机变量) 没相关系 一、回归与相关 (对统计学回顾)第5页62.相关关系 相关关系描述 相关关系最直观描述方式坐标图(散布图) 第6页7相关关系类型 从包括变量数量看 简单相关 多重相关(复相关) 从变量相关关系表现形式看 线性相关散布图靠近一条直线 非线性相关散布图靠近一条曲线 从变量相关关系改变方向看 正相关变量同方向改变,同增同减 负相关变量反方向改变,一增一减 不相关第7页8 3.相关程度度量相关系数 总体线性相关系数: 其中: X 方差; Y方

3、差 X和Y协方差样本线性相关系数: 其中: 和 分别是变量 和 样本观察值 和 分别是变量 和 样本值平均值第8页9 和 都是相互对称随机变量 线性相关系数只反应变量间线性相关程度,不 能说明非 线性相关关系 样本相关系数是总体相关系数样本预计值,由 于抽样波动,样本相关系数是个随机变量,其统 计显著性有待检验 相关系数只能反应线性相关程度,不能确定因果 关系,不能说明相关关系详细靠近哪条直线 计量经济学关心:变量间因果关系及隐藏在随机性后面统计规律性,这有赖于回归分析方法 使用相关系数时应注意第9页104. 回归分析回归古典意义: 高尔顿遗传学回归概念 ( 父母身高与儿女身高关系)回归当代意

4、义: 一个应变量对若干解释变量 依存关系 研究回归目标(实质): 由固定解释变量去 预计应变量平均值第10页11 条件分布 当解释变量 取某固定值时(条件), 值不确定, 不一样取值形成一定分布,即 条件分布。 条件期望 对于 每一个取值, 对 所形成分布确 定其期望或均值,称 为 条件期望或条 件均值 注意几个概念第11页12 回归线: 对于每一个 取值, 都有 条件期望 与之对应, 代表这些 条件期 望点轨迹所形成 直线或曲线,称为 回归线。回归线与回归函数第12页13 回归函数:应变量 条件期望 随解释变量 改变而有规律改变,假如把 条件期望 表现为 某种函数 这个函数称为回归函数。 回

5、归函数分为:总体回归函数和样本回归函数举例:假如已知100个家庭组成总体。 回归线与回归函数第13页14每 月 家 庭 可 支 配 收 入 X10001500250030003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每960121013101432183510682319248828563201月125913401520188520662321258729003288

6、家132414001615194321852365265030213399庭1448165020372210239827893064消1489171220782289248728533142费1538177821792313251329343274支160018412298239825383110出17021886231624232567Y190023872453261024982487271025892586900115014001650190021502400265029003150例:100个家庭组成总体 (单位:元)第14页15 1. 总体回归函数概念 前提:假如已知所研究经济现象总体

7、应变量 和解释变量 每个观察值, 能够计算出总体应变量 条件均值 ,并将其表现为解释变量 某种函数 这个函数称为总体回归函数(PRF)二、总体回归函数(PRF)第15页16 (1)条件均值表现形式 假如 条件均值 是解 释变量 线性函数,可表示为: (2)个别值表现形式 对于一定 , 各个别值 分布 在 周围,若令各个 与条件 均值 偏差为 , 显然 是随机变量,则有 或 2.总体回归函数表现形式第16页17实际经济研究中总体回归函数通常是未知,只能依据经济理论和实践经验去设定。“计量”目标就是寻求PRF。总体回归函数中 与 关系可是线性,也可是非线性。对线性回归模型“线性”有两种解释 就变量

8、而言是线性 条件均值是 线性函数 就参数而言是线性 条件均值是参数 线性函数 3.怎样了解总体回归函数第17页18 变量、参数均为“线性” 参数“线性”,变量”非线性” 变量“线性”,参数”非线性”计量经济学中: 线性回归模型主要指就参数而言是“线性”,因为只要对参数而言是线性,都能够用类似方法预计其参数。“线性”判断第18页19三、随机扰动项概念: 各个 值与条件均值 偏差 代表 排除在模型以外全部 原因对 影响。性质: 是期望为0有一定分布随机变量 主要性:随机扰动项性质决定着计量经济方法选择第19页20 未知影响原因代表无法取得数据已知影响原因代表众多细小影响原因综合代表模型设定误差变量

9、观察误差变量内在随机性引入随机扰动项原因第20页21四、样本回归函数(SRF) 样本回归线: 对于 一定值,取得 样本观察值,可计算其条件均值,样本观察值条件均值轨迹称为样本回归线。 样本回归函数: 假如把应变量 样本条件均值表示为解释变量 某种函数,这个函数称为样本回归函数(SRF)。 第21页22SRF 特点每次抽样都能取得一个样本,就能够拟合一条样本回 归线,所以样本回归线随抽样波动而改变,能够有许多条(SRF不唯一)。 SRF2SRF1第22页23样本回归函数函数形式应与设定总体回归函数函数形式一致。 样本回归线还不是总体回归线,至多只是未知总体回归线近似表现。第23页24 样本回归函

10、数假如为线性函数,可表示为 其中: 是与 相对应 样本条件均值 和 分别是样本回归函数参数 应变量 实际观察值 不完全等于样本条件均值,二者之差用 表示, 称为剩下项或残差项: 或者 样本回归函数表现形式第24页25 对样本回归了解 假如能够取得 和 数值,显然: 和 是对总体回归函数参数 和 预计 是对总体条件期望 预计 在概念上类似总体回归函数中 ,可 视为对 预计。第25页26 样本回归函数与总体回归函数关系 SRF PRF A 第26页27 回归分析目标 用样本回归函数SRF去预计总体回归函数PRF。 因为样本对总体总是存在代表性误差,SRF 总会过 高或过低预计PRF。要处理问题:寻

11、求一个规则和方法,使得到SRF参数 和 尽可能“靠近”总体回归函数中参数 和 。这么“规则和方法”有各种,最惯用是最小二乘法第27页28 第二节 简单线性回归模型最小二乘预计 本节基本内容: 简单线性回归基本假定 普通最小二乘法 OLS回归线性质 参数预计式统计性质第28页29 一、简单线性回归基本假定 1. 为何要作基本假定? 模型中有随机扰动,预计参数是随机变量, 只有对随机扰动分布作出假定,才能确定 所预计参数分布性质,也才可能进行假设 检验和区间预计 只有具备一定假定条件,所作出预计才 含有很好统计性质。第29页30 (1)对模型和变量假定如假定解释变量 是非随机,或者即使是随机,但与

12、扰动项 是不相关假定解释变量 在重复抽样中为固定值假定变量和模型无设定误差2、基本假定内容第30页31又称高斯假定、古典假定假定1:零均值假定 在给定 条件下 , 条件期望为零假定2:同方差假定 在给定 条件下, 条件方差为某个常数(2)对随机扰动项 假定第31页32 假定3:无自相关假定 随机扰动项 逐次值互不相关 假定4:随机扰动 与解释变量 不相关 第32页33 假定5:对随机扰动项分布正态性假定 即假定 服从均值为零、方差为 正态分布 (说明:正态性假定不影响对参数点预计,但对确定所预计参数分布性质是需要。且依据中心极限定理,当样本容量趋于无穷大时, 分布会趋近于正态分布。所以正态性假

13、定是合理)第33页34分布性质 因为 分布性质决定了 分布性质。 对 一些假定能够等价地表示为对 假定: 假定1:零均值假定 假定2:同方差假定 假定3:无自相关假定 假定5:正态性假定第34页35OLS基本思想不一样预计方法可得到不一样样本回归参数 和 ,所预计 也不一样。理想预计方法应使 与 差即剩下 越小越好因 可正可负,所以能够取 最小 即二、普通最小二乘法 (rdinary Least Squares )第35页36 正规方程和预计式用克莱姆法则求解得观察值形式OLS预计式: 取偏导数为0,得正规方程第36页37 为表示得更简练,或者用离差形式OLS预计式: 注意其中:而且样本回归函

14、数可写为 用离差表现OLS预计式第37页38三、OLS回归线性质能够证实:回归线经过样本均值预计值 均值等于实 际观察值 均值 第38页39 剩下项 均值为零应变量预计值 与剩下项 不相关 解释变量 与剩下项 不相关 第39页40 四、参数预计式统计性质(一)参数预计式评价标准 1. 无偏性前提:重复抽样中预计方法固定、样本数不变、经 重复抽样观察值,可得一系列参数预计值参数预计值 分布称为 抽样分布,密度函数记为 假如 ,称 是参数 无偏预计式,否则称 是有偏,其偏倚为 (见图1.2)第40页41图 1 . 2预计值偏倚 概 率 密 度第41页42前提:样本相同、用不一样方法预计参数, 能够

15、找到若干个不一样预计式 目标:努力寻求其抽样分布含有最小方差 预计式 最小方差准则,或称最正确 性准则(见图1.3) 既是无偏同时又含有最小方差预计式,称为 最正确无偏预计式。2. 最小方差性第42页43 概 率 密 度 图 1 . 3预计值第43页44 4. 渐近性质(大样本性质)思想:当样本容量较小时,有时极难找到最正确无偏预计,需要考虑样本扩大后性质一致性: 当样本容量 n 趋于无穷大时,假如预计式 依概率收敛于总体参数真实值,就称这个预计式 是 一致预计式。即 或 渐近有效性:当样本容量 n 趋于无穷大时,在全部一致预计式中,含有最小渐近方差。 (见图1.4)第44页45 概 率 密

16、度 预计值 图 1 . 4第45页46(二)OLS预计式统计性质 由OLS预计式能够看出 由可观察样本值 和 唯一表示。 因存在抽样波动,OLS预计 是随机变量 OLS预计式是点预计式 第46页471. 线性特征 是 线性函数 2. 无偏特征 (证实见教材P37) 3. 最小方差特征 (证实见教材P68附录21) 在全部线性无偏预计中,OLS预计 含有最小方差结论:在古典假定条件下,OLS预计式是最正确线性无 偏预计式(BLUE) OLS预计式统计性质高斯定理第47页48第三节 拟合优度度量本节基本内容: 什么是拟合优度 总变差分解 可决系数第48页49 一、什么是拟合优度? 概念:样本回归线

17、是对样本数据一个拟合,不一样预计方法可拟合出不一样回归线,拟合回归线与样本观察值总有偏离。 样本回归线对样本观察数据拟合优劣程度 拟合优度拟合优度度量建立在对总变差分解基础上第49页50二、总变差分解 分析Y 观察值、预计值与平均值关系将上式两边平方加总,可证得 (TSS) (ESS) (RSS) 第50页51 总变差 (TSS):应变量Y观察值与其平均值离差平方和(总平方和) 解释了变差 (ESS):应变量Y预计值与其平均值离差平方和(回归平方和) 剩下平方和 (RSS):应变量观察值与预计值之差平方和(未解释平方和)第51页52 变差分解图示第52页53 三、可决系数 以TSS同除总变差等

18、式两边: 或 定义:回归平方和(解释了变差ESS) 在总变 差(TSS) 中所占比重称为可决系数,用 表示: 或 第53页54作用:可决系数越大,说明在总变差中由模型作出了解释部分占比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观察值拟合程度越差。特点:可决系数取值范围: 随抽样波动,样本可决系数 是随抽样 而变动随机变量 可决系数是非负统计可决系数作用和特点第54页55可决系数与相关系数关系(1)联络 数值上,可决系数等于应变量与解释变量之间简单相关系数平方:第55页56可决系数与相关系数关系可决系数相关系数就模型而言就两个变量而言说明解释变量对应变量解释程度度量两个变量线性依存

19、程度。度量不对称因果关系度量不含因果关系对称相关关系取值:0,1取值:1,1(2)区分第56页57利用可决系数时应注意 可决系数只是说明列入模型全部解释变量对 因变量联合影响程度,不说明模型中每个 解释变量影响程度(在多元中) 回归主要目标假如是经济结构分析,不能只 追求高可决系数,而是要得到总体回归系数 可信预计量,可决系数高并不表示每个回归 系数都可信任 假如建模目标只是为了预测因变量值,不是 为了正确预计回归系数,普通可考虑有较高 可决系数第57页58 第四节 回归系数区间预计和假设检验 本节基本内容: OLS预计分布性质 回归系数区间预计 回归系数假设检验第58页59问题提出 为何要作

20、区间预计?OLS预计只是经过样本得到点预计,不一定等于真实参数,还需要找到真实参数可能范围,并说明其可靠性为何要作假设检验?OLS 预计只是用样本预计结果,是否可靠? 是否抽样偶然结果?还有待统计检验。区间预计和假设检验都是建立在确定参数预计值概率分布性质基础上。第59页60 一、OLS预计分布性质 基本思想 是随机变量,必须确定其分布性质才可能进行区间预计和假设检验 是服从正态分布随机变量, 决定了 也是服从正态分布随机变量, 是 线性函数,决定了 也是服从正态分布随机变量,只要确定 期望和方差,即可确定 分布性质 第60页61 期望: (无偏预计) 方差和标准误差 (标准误差是方差算术平方

21、根) 注意:以上各式中 未知,其余均是样本观察值 期望和方差第61页62 能够证实(见教材P70附录2.2) 无偏预计为 (n-2为自由度,即可自由改变样本观察值个数)对随机扰动项方差 预计第62页63在 已知时将 作标准化变换第63页64 (1)当样本为大样本时,用预计参数标准误差对 作标准化变换,所得Z 统计量仍可视为标准正 态变量(依据中心极限定理)(2)当样本为小样本时,可用 代替 , 去估 计参数标准误差,用预计参数标准误差对 作标准化变换,所得 t 统计量不再服从正态分布(这时分母也是随机变量),而是服从 t 分布:当 未知时 第64页65二、回归系数区间预计概念:对参数作出点预计

22、是随机变量,即使是无偏估计,但还不能说明预计可靠性和准确性,需要找到包含真实参数一个范围,并确定这个范围包含参数真实值可靠程度。在确定参数预计式概率分布性质基础上,可找到两个正数和( ),使得区间 包含真实 概率为 ,即 这么区间称为所预计参数置信区间。第65页66 普通情况下, 总体方差 未知,用无偏预计 去代替 ,因为样本容量较小,统计量 t 不再服从正态分布,而服从 t 分布。可用 t 分布去建立参数预计置信区间。 回归系数区间预计方法第66页67 选定,查 t 分布表得显著性水平为 ,自 由度为 临界值 ,则有即 第67页68三、回归系数假设检验1. 假设检验基本思想为何要作假设检验?

23、 所预计回归系数 、 和方差 都是经过 样本预计,都是随抽样而变动随机变量, 它们是否可靠?是否抽样偶然结果呢?还需 要加以检验。第68页69 对回归系数假设检验方式计量经济学中,主要是针对变量参数真值是否为零来进行显著性检验。目标:对简单线性回归,判断解释变量 是否是被解释变量 显著影响原因。在一元线性模型中,就是要判断 是否对 含有显著线性影响。这就需要进行变量显著性检验。 第69页70普通情况下,总体方差 未知,只能用 去代替,可利用 t 分布作 t 检验给定 , 查 t 分布表得假如 或者 则拒绝原假设 ,而接收备择假设假如 则接收原假设2. 回归系数检验方法第70页71 P用 P 值

24、判断参数显著性假设检验 p 值:p 值是基于既定样本数据所计算统计量,是拒绝原假设最低显著性水平。统计分析软件中通常都给出了检验 p 值统计量 t由样本计算统计量为:相对于显著性水平 临界值: 或注意:t检验是比较 和P值检验是比较 和 p 与 相对应 与 P 相对应第71页72 用 P 值判断参数显著性假设检验 p 值:p 值是依据既定样本数据所计算统计量,拒绝原假设最小显著性水平。 统计分析软件中通常都给出了检验 p 值。第72页73方法:将给定显著性水平 与 值比较:若 值,则在显著性水平 下拒绝原假设 ,即认为 对 有显著影响若 值,则在显著性水平 下接收原假设 ,即认为 对 没有显著

25、影响规则:当 时, 值越小,越能拒绝原 假设用 P 值判断参数显著性方法第73页74 本节主要内容: 回归分析结果汇报 被解释变量平均值预测 被解释变量个别值预测第五节回归模型预测第74页75一、回归分析结果汇报经过模型预计、检验,得到一系列主要数据,为了简明、清楚、规范地表述这些数据,计量经济学通常采取了以下规范化方式: 比如:回归结果为 标准误差SEt 统计量可决系数和自由度第75页76 二、被解释变量平均值预测1.基本思想利用计量经济模型作预测:指利用所预计样本回归函数,用解释变量已知值或预测值,对预测期或样本以外被解释变量数值作出定量预计。计量经济预测是一个条件预测: 条件:模型设定关

26、系式不变 所预计参数不变 解释变量在预测期取值已作出预测对应变量预测分为平均值预测和个别值预测对应变量预测又分为点预测和区间预测第76页77预测值、平均值、个别值相互关系 是真实平均值点预计,也是对个别值点预计个别值真实平均值点预测值第77页782 .Y 平均值点预测 将解释变量预测值直接代入预计方程这么计算 是一个点预计值 第78页79 3. Y 平均值区间预测基本思想:因为存在抽样波动,预测平均值 不一定等于真实平均值 ,还需要对 作区间预计。为对Y 作区间预测,必须确定平均值预测值抽 样分布,必须找出与 和 都相关统计量第79页80 详细作法 (从 分布分析) 已知 能够证实 服从正态分

27、布,将其标准化,当 未知时,只好用 代替,这时有第80页81显然这么 t 统计量与 和 都相关。给定显著性水平,查t分布表,得自由度n2临界值 则有Y平均值置信度为 预测区间为构建平均值预测区间第81页82三、应变量个别值预测基本思想: 既是对 平均值点预测,也是对 个别值点预测因为存在随机扰动 影响, 平均值并不等于 个别值为了对 个别值 作区间预测,需要寻找与预测值 和个别值 相关统计量,并要明确其概率分布第82页83 详细作法: 已知剩下项 是与预测值 及个别值 都相关变量,而且已知 服从正态分布,且可证实 当用 代替 时,对 标准化变量 t 为 第83页84构建个别值预测区间给定显著性

28、水平 ,查 t 分布表得自由度为临界值 ,则有 所以,一元回归时 个别值置信度为 预测区间上下限为 第84页85 应变量Y 区间预测特点 1、 平均值预测值与真实平均值有误差,主要是 受抽样波动影响 个别值预测值与真实个别值差异,不但受抽 样波动影响,而且还受随机扰动项影响 第85页862、平均值和个别值预测区间都不是常数,是随 改变而改变3、预测区间上下限与样本容量相关,当样本容 量 时个别值预测误差只决定于随机 扰动方差第86页87SRF各种预测值关系Y个别值置信区间Y均值置信区间第87页88第六节 案例分析 提出问题:改革开放以来伴随中国经济快速发展,居民消费水平也不停增加。但全国各地域

29、经济发展速度不一样,居民消费水平也有显著差异。为了分析什么是影响各地域居民消费支出有显著差异最主要原因,并分析影响原因与消费水平数量关系,能够建立对应计量经济模型去研究。 研究范围:全国各省市城市居民家庭平均每人每年消费截面数据模型。 第88页89理论分析:影响各地域城市居民人均消费支出原因有各种,但从理论和经验分析,最主要影响原因应是居民收入。从理论上说可支配收入越高,居民消费越多,但边际消费倾向大于0,小于1。建立模型: 其中:Y城市居民家庭平均每人每年消费支出(元) X城市居民人均年可支配收入(元)第89页90数据:从中国统计年鉴中得到地 区城市居民家庭平均每人每年消费支出(元) Y城市

30、居民人均年可支配收入(元) X北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北10284.607191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.9212463.929337.566679.685234.356051.066524.526260.166100.5613249.808177.6411715.606032.409189.366334.647614.366245.406788.52第90页91

31、(接上页数据表)地 区城市居民家庭平均每人每年消费支出(元) Y城市居民人均年可支配收入(元) X湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆5574.728988.485413.445459.646360.245413.084598.285827.926952.445278.045064.245042.526104.925636.406958.5611137.207315.326822.727238.046610.805944.087240.568079.126330.846151.446170.526067.446899.64第91页92预计参数详细操作:使用EViews 软件包。预计结果:假定模型中随机扰动满足基本假定,可用OLS法。第92页93表示为第93页94 1. 可决系数: 模型整体上拟合好。 2. 系数显著性检验:给定 ,查 t 分布表, 在自由度为n-2=29时临界值为 因为 t = 20.44023 说明“城镇人均可支配收入”对“城镇人均消费支出”有显著 影响。 3. 用P值检验 p=0.0000 模型检验第94页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论