版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章:经典的单方程计量经济模型:多元回归、多元线性回归模型、多元线性回归模型的参数估计、多元线性回归模型的统计检验、多元线性回归模型的其他形式的回归模型的参数约束、3.1多元线性回归模型、1多元线性回归模型、2多元线性回归模型、多元线性回归模型的基本假设、1多元线性回归模型、多元线性回归模型表明,线性回归模型中有许多解释变量。一般表达式:t=1,2.n,其中:k-1是解释变量的数量,j称为回归系数。通常,常数项被视为虚变量的系数,虚变量的样本观测值总是取1。这样,模型中解释变量的数量为(k),也称为人口回归函数的随机表达式。其非随机表达式为:当每个变量的X值固定时,方程表示Y的平均响应。j也
2、称为偏回归系数,它表示当Xj变化1个单位而其他解释变量保持不变时,Y的平均值E(Y)的变化。换句话说,J给出了Xj的单位变化对Y均值的“直接”或“净”(不包括其他变量)影响。人口回归模型的n个随机方程的矩阵表达式是,其中,样本回归函数用于估计人口回归函数,其随机表达式: ei称为残差或残差,可视为人口回归函数中随机扰动项I的近似替代。样本回归函数的矩阵表达式是:或者,其中:2,多元线性回归模型的基本假设,假设1,解释变量是非随机的或固定的,并且每个x彼此不相关(不存在多重共线性)。假设2,3,4,随机误差项具有零均值、同态性和非序列相关性,假设5,解释变量与随机项不相关,假设6,随机项满足正态
3、分布,上述假设的矩阵符号表达式为:假设1,NK矩阵x是非随机的,x=k的秩,即x满秩。假设2,3,4,假设5,e(x)=0,即假设6,向量具有多维正态分布,即多元回归具有以下两个重要假设:假设7,当样本量趋于无穷大时,每个解释变量的方差趋于有界常数,即n 或,其中:q是非奇异固定矩阵,矩阵x是由每个解释变量的偏差作为元素组成的NK阶矩阵,假设8,回归模型的设置是正确的。多元线性回归模型的估计方法是OLS、最大似然或最小均方误差、1、普通最小二乘估计* 2、最大似然估计* 3、矩估计4、参数估计的性质5、样本量问题6、估计示例、1、普通最小二乘估计。对于n组随机选取的观测值,如果已经得到样本函数
4、的参数估计值,则有:I=1,2.根据最小二乘法原理,参数估计值应为下列方程组的解,其中,因此,获得关于要估计的参数估计值的正规方程组。正规方程组的矩阵形式,也就是说,因为XX是满秩的,上述过程用矩阵表示如下:即方程组求解:因此:另一种写正规方程组的方法,对于正规方程组,那么,or,(*)或(* *)是另一种写多元线性回归模型的正规方程组的方法,(*),(*)。样本回归函数的偏差形式,I=1,2.n,其矩阵形式为,其中,在偏差形式下,参数的最小二乘估计结果为,随机误差项方差的无偏估计可以证明随机误差项方差的无偏估计是,和4。参数估计的性质,在满足基本假设的条件下,结构参数的一般最小二乘估计、最大
5、似然估计和矩估计仍然具有以下特点:线性、无偏性和有效性。同时,随着样本量的增加,参数估计量具有以下特点:渐近无偏性、渐近有效性和一致性。,1。线性,其中C=(XX)-1X 是仅与固定X,2。无偏性。这里,假设: e(x)=0,3,有效性(最小方差)。使用了,和。5。样本量问题,即所谓的“最小样本量”,是从最小二乘原理和最大概率原理获得参数估计所需的样本量的下限,无论其质量如何。(1)最小样本量。最小样本量必须不小于模型中解释变量(包括常数项)的数量,即NK,因为不存在多重共线性要求:秩(X)=k,2。对于满足基本要求的样本量,只能从统计检验的角度进行z检验:n30;在N-K8,t分布相对稳定,
6、一般经验认为:只有在n30或至少n3k.时才能满足模型估计的基本要求该模型的良好性质只能在大样本下从理论上得到证明。人均国内生产总值(1990年不变价格)。这两组数据是从1978年到2000年的时间经验数据。1.将建立以下一元回归模型。通过Eviews软件进行回归分析的结果如下表所示。6.多元线性回归模型的参数估计的例子例3.2在例3.1中,建立了中国居民人均消费的一元线性模型。这里我们将考虑建立一个多元线性模型。解释变量:人均国内生产总值:前期国内生产总值消费:消费价格指数(-1),估计区间:19792000。3.3多元线性回归模型的统计检验,1,拟合优度检验2,方程的显著性检验(F检验)3
7、,变量的显著性检验(T检验)4,参数的置信区间,1,拟合优度检验,1,可确定系数和调整后的可确定系数,然后,总偏差平方和的分解,因为,=0,有:注意:一个有趣的现象。可确定系数越接近1,模型的拟合优度越高。问:在应用过程中发现,如果在模型中增加一个解释变量,R2倾向于增加,这给人一种错觉:要使模型很好地拟合,只需要增加一个解释变量。然而,现实情况是,解释变量数量的增加引起的R2的增加与拟合质量无关,R2需要调整。嘿。调整后的决策系数(ADJUSTEDOCOFFICIENTOETERMINATION),在一定样本量的条件下,增加解释变量肯定会降低自由度,因此调整的思路是:将残差平方和和和总偏差平
8、方和除以各自的自由度,以消除变量个数对拟合优度:的影响,其中n-k是残差平方和的自由度,n-1是整体平方和的自由度。为了比较具有不同数量的解释变量的多元回归模型的拟合优度, Akaikeiinformationcriterion,AIC)和Schwarzcriterion (SC)也被普遍使用,这两者都要求仅当添加的解释变量能够降低AIC值或ACV值时,才在原始模型中添加解释变量。根据Eviews的估计结果,在中国居民消费的单一情况下,AIC=9.93AC=10.03,在中国居民消费的二元情况下,AIC=9.52AC=9.67。从这一点来看,可以说以前的人均消费消费指数(CONSP(-1)应该
9、包括在模型中。方程的显著性检验(F检验)旨在推断模型中解释变量和解释变量之间的线性关系是否普遍显著。(1)方程显著性的F检验,即检验模型Yi中的参数J=112222=1,2,n是否显著不为0。可以提出以下原始假设和替代假设:H0: 1=2=K=0H1: J不全是0,女性.f检验的思想来源于总偏差平方和的分解公式。如果这个比率很大,则X的关联对Y有很高的解释度,并且可以认为整体上存在线性关系,而整体上可能不存在线性关系。因此,从比值的大小可以推断出总体的线性关系。根据数理统计中的知识,在原假设H0为真的条件下,统计量服从带自由度的f分布(k-1,n-k)。给定显著性水平,可以获得临界值f (k-
10、1,n-k)。可以从样本中获得统计量f的值,并且可以通过ff (k-1,n-k)或ff (k-1,n-k)来拒绝或接受原始假设H0,以确定原始方程中的线性关系作为整体是否显著真实。以中国居民人均消费支出为例:一元模型:F=2857.633二元模型:F=2055.88,给定显著性水平=0.05,查分布表得到临界值:一元模型:f (1,21)=4.32二元模型:f (2,19)=3.52,显然ff (k-1,n-k)是两个模型之间的线性关系,显著建立在95%的水平上。关于拟合优度检验和方程显著性检验之间关系的讨论,可以从以下几个方面推导出来:在中国居民人均收入和消费的一元模型中,在中国居民人均收入
11、和消费的二元模型中,在中国居民人均收入和消费的二元模型中。嘿。3、变量的显著性检验(t检验),方程的整体线性关系显著,且各解释变量对解释变量的影响显著。因此,必须对每个解释变量进行显著性检验,以确定它是否作为解释变量保留在模型中。这个测试是通过变量的t测试来完成的。1,t统计,因为cii用于表示矩阵(XX)-1的主对角线上的第I个元素,所以参数估计的方差为:其中2是随机误差项的方差。在实际计算中,被它的估计所代替。因此,下面的t统计。2,t检验可以构造为设计原始假设和替代假设:h1: i0,给定显著性水平,可以获得临界值t/2 (n-k-1),可以从样本中获得统计量t的值,并且可以通过| t
12、| t/2 (n-k)或| t | t/2 (n-k)拒绝或接受原始假设H0,从而确定相应的解释变量是否应该包括在模型中。H0: I=0 (I=1,2.k)。注:在线性回归中,T检验和F检验是一致的。一方面,T检验和F检验都检验了相同的原始假设H0:1=0;另一方面,这两项统计数字之间有以下关系:在中国居民人均收入和消费支出的二元模型的情况下,应用软件计算参数的t值:给定显著性水平=0.05,找到相应的临界值:t0.025(19)=2.093。可以看出,所有计算出的T值都大于临界值,因此原始假设被拒绝。也就是说,个三个解释变量(包括常量项目)在95%水平上都是显著的,并且都通过了变量显著性检验
13、。参数的置信区间用于检查在一次采样中估计的参数值与参数的真实值有多“接近”。在变量的显著性检验中已经知道:很容易推断出I的置信区间是在(1-)的置信水平,其中t/2是显著性水平的临界值,自由度是n-k。在中国居民人均收入和消费支出的二元模型的情况下,给定=0.05,查表的临界值:t0.025(19)=2.093,计算参数的置信区间是0: (44.284,197.116).如何降低置信区间?增加样本量n,因为在相同样本量下,n越大,t分布表中的临界值越小,同时,增加样本量,也会使样本参数估计量的标准差减小;由于样本参数估计的标准偏差与残差平方和成正比,因此模型的拟合优度得到了提高。模型的优度越高
14、,残差平方和就应该越小。为了提高样本观测值的离散度,一般来说,样本观测值越离散,分母(XX)-1中的|XX|值越大,导致区间减小。对于多元线性回归模型的预测,1、E(Y0)、2和Y0的置信区间,对于模型,对于观测值x0=(1,x10,x20,xk0)的解释变量,而不是给定的sae (y0)的置信区间容易知道,容易证明,因此得到了(1-)置信水平下E(Y0)的置信区间,其中t/2是(1-)置信水平下的临界值,E(Y0)的置信区间容易证明。对于、2和Y0的置信区间,如果实际预测值Y0已知,则预测误差为:很容易证明,e0服从正态分布,即构造t统计量,在给定的置信水平(1-)下,可以得到Y0的置信区间
15、。嘿。在中国居民人均收入和消费支出二元模型的情况下:2001年人均国内生产总值:4033.1元,因此,2001年居民人均消费预测值为120.70.22134033.10.45151690.8=1776.8(元),实测值(90年价格)=1782.2元,相对误差:-0.31%,预测的置信区间:因此,E (2001)的95%置信区间是:或(1741.8,1811.7),或(1711.1,1842.4)。同样,2001年的95%置信区间是,例如,例3.3中的表格显示了1992年亚洲国家的平均预期寿命(年),按购买力平价计算的平均国内生产总值(100美元),成人识字率(%),以及一岁儿童的疫苗接种率(%)。用多元回归方法分析了亚洲国家的平均预期寿命和按购买力平价计算的平均国内生产总值。一岁儿童成人识字率与疫苗接种率的关系,并对建立的模型进行检验。作业1、下表是一家银行25家分行2002年不良贷款(亿)和各种贷款余额(亿)的数据、本年累计应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026安徽芜湖市湾沚区选聘中小学迷彩辅导员10人考试模拟试题及答案解析
- 土石方工程文明施工方案
- 2026河南洛阳理思实验学校诚聘高中部管理人员考试备考题库及答案解析
- 市政砂垫层施工方案
- 中国人口福利基金会招聘4人考试备考试题及答案解析
- 永丰县市场监督管理局2026年面向社会公开招聘2名编外工作人员考试备考题库及答案解析
- 伤员死亡协议书
- 双方签字安全协议书
- 商铺还款协议书范本
- 夫妻共同担保协议书
- 实施指南《G B-T36713-2018能源管理体系能源基准和能源绩效参数》实施指南
- 设备搬迁及安装方案
- 消防安全重点单位档案管理
- 2025年贵州省委党校在职研究生招生考试(政治经济学原理)历年参考题库含答案详解(5卷)
- 心理健康接纳自己课件
- 癫痫共患偏头痛诊断治疗
- 江西省农发种业有限公司招聘考试真题2024
- 储备土地巡查管理办法
- JJG 688-2025汽车排放气体测试仪检定规程
- 【15万吨日供水量水厂设计中反应沉淀池设计计算过程案例2300字】
- 《铁路线路养护与维修》课件 2.1.5垫板修正作业
评论
0/150
提交评论