




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教学大纲要求,本章(第二章)是课程的重要和主要内容 应占理论课时的1/3以上 基本要求:一元线性单方程计量经济学模型的基本理论与方法,运用矩阵描述、推导和证明与普通最小二乘法有关的参数估计过程和结论,应用计量经济学软件进行一元线性单方程模型的普通最小二乘估计,独立完成建立线性单方程计量经济学模型的全过程工作。,第二章 一元线性回归模型,2.1 一元线性回归模型概念基础 回归是计量经济学的主要工具,一、“回归”一词的历史渊源,Francis Galton F加尔顿,Karl Pearson K皮尔逊,回归一词最先由F加尔顿(FrancisC,alton)引入,加尔顿的普遍回归定律还被他的朋友K皮尔逊(KartPearson)证实,二、回归的现代释义,一个,解释变量,解释变量,解释变量,应变量,一 个 或 多 个,依存关系,已知,估计(或)预测,回归分析是用来研究一个变量【称之为被解释变量(explained Variable)或因变量(dependent Variable)】与另一个或多个变量【称为解释变量(explanatory Variable)或自变量(independent Variable)】之间的非确定性的相关关系.,父辈身高(cm),160 165 170 175,儿 辈 身 高,160,165,170,175, ,给定, , , ,回归线,例1.给定父辈身高的情形下找出儿辈平均身高的变化。,年龄,10 11 12 13 14,身 高,140,150,160,170, ,给定, , , ,回归线,例2.给定年龄的情形下找出平均身高的变化。, ,例3在经济学中。,个人消费支出,税后 实际个人收入,依赖关系,可估计出边际消费倾向(MPC),即:实际收入每美元价值的变化所引起的消费支出的平均变化,可以知道产品需求对价格变化的实际反应 通过这种定价实验 能估计出产品需求的价格弹性(即对价格的应变性) 从而有助于确定最有利可图的价格,价格,产出,例4,依赖关系,税后个人实际收,400 600 800 1000 1200,个 人 消 费 支 出,240,280,310,340, ,给定, , , ,回归线,例2.给定收入的情形下平均个人消费支出的变化。, ,统计关系与确定性关系,在回归分析中,我们考虑的是一种所谓统计依赖关系 我们主要处理的是随机变量 也就是有着概率分布的变量 例如 作物收成对气温、降雨、阳光以及施肥的依赖关系是统计性质的。 回归与因果关系 回归分析研究一个变量对另一(些)变量的依赖关系,但它并不一定意味着因果关系。,回归与相关 与回归分析密切相关而在概念上则迥异的,是以测度两个变量之间的线性关联力度为其主要目的的相关分析。 在回归分析中,对应变量和解释变量的处理方法存在着不对称性。 应变量被当作是统计的,随机的,也就是它有一个概率分布。 而解释变量则被看作是(在重复抽样中)取有固定值的。 但在相关分析中,我们对称地对待任何(两个)变量;应变量和解释变量之间不加区别。,术语与符号,eksdins,enddns,为了统一符号,从现在起,我们用Y代表因变量,X 代表自变量或解释变量。如果有多个解释变量,我们将用适当的下标,表示各个不同的X(例如,X1,X2,X3等等),综合来看,回归分析一般可以用来: (1) 通过已知变量的值来估计因变量的均值。 (2)对独立性进行假设检验根据经济理论建立适当的假设。 例如,对于需求函数,你可以检验假设:需求的价格弹性为-1.0;即需求曲线具有单一的价格弹性。也就是说,在其他影响需求的因素保持不变的情况下,如果商品的价格上涨1,平均而言,商品的需求量将减少1。 (3)通过解释变量的值,对因变量的均值进行预测。 上述多个目标的综合,三、线性回归模型的特征,2.1 例1 凯恩斯绝对收入消费理论的数学描述为 y=x 0 =dy/dx1 dy/dx y/x 计量经济模型为 y=x 随机方程 参数可用回归分析的方法求得,线性回归模型的特征(线性计量经济学模型的特征) 引入随机误差项将变量之间的关系用用一个线性随机方程描述,用随机数学的方法来估计参数,2.1 例2 假想一个国家的人口总体由60户家庭组成。 我们要研究每周家庭消费支出Y与每周税后或可支配家庭收入X的关系 即知道了家庭的每周收入,要预测每周消费支出的(总体)平均水平,换句话说,表21的每个纵列给出对应于给定收入水平X的消费支出Y的分布; 就是说,它给出了以X的给定值为条件的Y的条件分布(conditional distribution),求:给定X的Y的概率p(Y/X) 即Y的条件概率,当X=80美元时,有5个Y值,得到p(Y55/X80)1/5 p(Y60/X80)1/5 p(Y65/X80)1/5 p(Y70/X80)1/5 p(Y75/X80)1/5,同理,p(Y= /X=260)=1/7,?,条件均值(条件期望 ) : 对Y的每一条件概率分布,我们能算出它的均值 : 记做E(Y/X=Xi) 简写为E(Y/Xi) 并读为“在X取特定Xi值时的Y的期望值”。 计算方法: 将表2.1中的有关列乘以表2.2中的相应列的条件概率,然后对这些乘积求和便是。 如E(Y/80) 55(1/5)+60(1/5)+65(1/5)+70(1/5)+75(1/5) =65。 这样算得的条件均值列于表22的末行,图21 对不同收入水平的支出的条件分布(表21的 数据),虽然每个个别的家庭的消费支出都有变异,但图2.1仍清楚地表明随着收入的增加,消费支出平均地说也在增加。,总体回归曲线,图22 总体回归线(表22的数据),在几何意义上,总体回归曲线就是(当)解释变量取给定值时应变量的条件均值或期望值的轨迹,总体回归函数(PRF)的概念,每一条件均值E(Y/Xi)都是Xi的一个函数,用符号表示: E(Y/Xi)=f(Xi) (2.2.1),(2.2.1)被称为(双变量)总体回归函数(PRF) Population regresion fuction 或简称总体回归(PR) Population regresion,f(Xi)表示解释变量Xi的 某个函数,它仅仅表明在给定Xi下Y的分布的(总体)均值与Xi有函数关系。 换句话说,它说出Y的均值或平均响应是怎样地随x而变的。,表2.3,E(Y/X=Xi) Y的条件均值,在几何意义上,总体回归曲线就是(当)解释变量取给定值时应变量的条件均值或期望值的轨迹,2、总体回归函数 从以上讨论和图中可以看出,Y的条件均值E(Y | Xi)是Xi 的函数,一般写成如下的函数形式: E(Y| Xi)f(Xi) (2-1) 意味着Y依赖于Xi ,或称之为Y对X的回归。回归也可简单地定义为: 在给定X值的条件下Y值分布的均值。,函数f(Xi)采取什么形式? 在特殊情形 下: 如果消费支出与收入有线性关系 可假定:PRF E(Y/Xi)是Xi的线性函数,其形式是E(Y/Xi)=1+2Xi (2-2) 其中 1和2为未知然而固定的参数,称为回归系数(regression coefficients); 1和2也分别称为截距和斜率系数 在回归分析中,我们的兴趣在于估计像(2-2)那样的PRF。 就是说,根据对Y和X的观测值估计未知数1和2的值,两种解释 对变量为线性 对参数为线性,3.“线性”一词的含义,Y的条件期望值是Xi的线性函数,比如说,如同(2-2)那样。 从几何意义上说回归曲线是一条直线。 E(Y/Xi)=1+2+X2i这样的回归函数,由于变量X以幂或指数2出现,就不是线性的,Y的条件期望E(Y/Xi)是诸参数的一个线性函数 E(Y/Xi)=1+2X2i就算是一个线性回归模型 E(Y/Xi)=1+22Xi则不是,表2.3 线性回归模型,E(Y/Xi)=1+2Xi兼对参数和变量为线性,是一个线性回归模型(LRM),对参数为线性但对变量X为非线性的E(Y/Xi)=1+2X2i,也是一个LRM,“线性”回归一词总是指对参数为线性的一种回归,E(Y/Xi),随着书的价格增加,图书 的需求量平均的减少,三.随机误差项 1.PRF的误差设定,对某一个别人,某一个别人对图书的需求却不一定随书的价格增加而减少,在个别个人的购书需求与给定价格水平之间能有什么关系呢?,个别的Yi围绕它的期望值的离差(deviation)表述如下:,ui=YiE(Y/Xi),E(Y/Xi),Yi= E(Y/Xi)ui,离差ui是一个不可观测的可正可负的随机变量 ui称为随机干扰(stochastic distmbance) 或随机误差(stochastic error)项,代表相同收入水平的所有 家庭的平均需求。 被称为系统性(systematic) 确定性(detenninstic)成分,Yi= E(Y/Xi) ui 的解释,给定X水平,个别个人的需求,可表示为两个成分之和,为随机或非系统性(nonsystematic)成份,ui是所有可能影响Y的、但又未能包括到回归模型中来的、 被忽略变量的替代(surrogate)或代理(proxy)变量,假定E(Y/Xi)是对Xi为线性的 Yi= E(Y/Xi) ui 可写为 Yi 1+2 Xi ui (2.4.2),某个人的购书需求,线性地依赖于书的价格,干扰项。,例如,给定X1各家庭的消费支出可表达为: Y1451+2(1)u1 Y2461+2(1)u2 Y3471+2(1)u3 (243) Y4481+2(1)u4 Y5491+2(1)u5 Y6491+2(1)u6 Y7491+2(1)u7,Yi= E(Y/Xi) ui 两边取期望值,得到 E(Yi/Xi) EE(Y/Xi)+E(ui/Xi) E(Y/Xi) +E(ui/Xi) (2.4.4) 因为E(Yi/Xi)就是E(Y/Xi) 可推出 E(ui/Xi)0 (2.4.5) 如果E(ui/Xi)=0 则 E(Y/Xi)=1+2Xi (2.2.2)和 Yi 1+2 Xi ui (242)是等价的。,4、随机干扰项的意义,随机误差项主要受到下列因素的影响 1、在解释变量中被忽视的因素的影响 代表了未列入模型中但又影响因变量Y的种种因素 2、变量观测值的观测误差的影响 代表了测量误差。在观测过程中,由于主客观原因而引起观察或测量上的差错所造成的误差,导致变量的观测值并不等于其实际的数值。 3、模型准确率的设定误差的影响 这是由于在分析和构造模型时,对客观现实的简化而出现的误差,主要是指在模型中所设定的解释变量与被解释变量之间关系不合适,会造成误差 4、其它随机因素的影响 即使模型中包括了所有决定需求量的有关变量,需求量的内在随机性也一定会发生,这是我们无法控制的,产生并设计随机误差项的主要原因: 1)理论的含糊性; 2)数据的欠缺; 3)节省原则。,这里我们的任务就是根据样本提供的信息来估计总体回归函数,四. 样本回归函数(SRF) sample regression function,对应于给定的每个Xi只有一个Y值 (给定Xi)的每个Y都是从表21的总体中对应于同一Xi的同组Y值随机抽取的。,问题是:我们能从表2-2的样本预测整个总体中对应于选定X的平均每周消费支出Y吗?,图中的回归线称为样本回归线(sample regression lines),一般地说,从N个不同的样本会得到N个不同的SRF, 并且这些SRF不大会是一样的,我们能根据样本数据来估计总体回归函数吗?,样本关系式可写为:,读为“Y-帽”(“Yhat“或“Ycap“) =E(Y/Xi)的估计量 =1的估计量,=2的估计量,又称(样本)统计量,是指一个规则或公式或方法,告诉人们怎样用手中样本所提供的信息去估计总体参数,由估计量算出的一个具体的数值,称为估计(值)(estimate),表示(样本)残差(或剩余)(residual)项,在回归分析中的主要目的是根据SRF 来估计PRF,SRF估计出来的PRF充其量 也不过是一个近似的结果。,Yi=1+2Xi+ui (2.4.2),
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 行政法学考试时的思维方法与应变策略:试题及答案
- 敏捷开发工具选型试题及答案
- 信息技术市场竞争分析试题及答案
- 软考IP地址规划技巧试题及答案
- DevOps实践及其重要性试题及答案
- 2025关于协商工资调整合同劳动范本
- 公司效率提升与战略风险管理的协同思考试题及答案
- AI与机器学习入门试题及答案
- 2025湖南工商大学横向科研课题合同签订仪式
- 2025年VB考试新动态试题及答案
- 2025届山西省吕梁市高三第三次模拟考试英语试题(原卷版+解析版)
- utc无人机考试试题及答案
- 咖啡加工厂建设项目可行性研究报告
- 2025年人力资源管理专业知识考试试题及答案
- 仓储物流管理试题及答案
- 汉字介绍课件
- 2025年熔化焊接与热切割作业证理论考试试题(1000题)附答案
- 《基于PLC的游泳池水处理控制系统设计》15000字(论文)
- 建筑中级职称《建筑工程管理》历年考试真题题库(含答案)
- 拘留所教育课件02
- 2022年教学教材《石油裂解与乙烯》精品优秀教案
评论
0/150
提交评论