




已阅读5页,还剩85页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学第二章1元线性回归模型,2,2004中国国际旅游博览会上获悉,到2020年,中国的旅游总收入将超过3000亿美元,相当于国内生产总值的8-11%。资料来源:国际金融报2004年11月25日第二版)到2020年,中国旅游总收入达3000亿美元,这是什么决定性因素呢?旅游开发与这个决定性因素的数量关系是什么?如何具体确定旅游开发与这个决定性因素的数量关系?引进:中国旅游总收入是否会超过3000亿美元?3,需要考虑的问题: (1)作为研究对象的经济变量(例如中国旅游总收入)(2)影响研究对象变化的主要因素(例如中国居民收入增加)分析(3)各种影响因素与正在研究的经济现象的相互关系分析(确定相互联系的数学关系)(4)正在研究的经济问题与影响因素之间的具体数量关系(2)统计依赖性或相关性:研究非决定性现象的随机变量之间的关系。一、回归和相关(统计审查),一、变量之间的关系经济变量之间的关系可以分为两大类:5、变量之间的统计相关性检查主要是相关分析或回归分析非线性相关散点图接近曲线。在与变量相关的关系的变化中,正相关变量的方向的相同变化,与同减相关变量的方向相反的变化,1/2减少,8,3,相关程度的测量相关系数,X和y的总线性相关系数,其中var (x) - y的方差Cov(X, y) - x和y的协方差x和y的样例线性相关系数:Xi和Yi分别是变量x和y的样例观测值,9和x和y(变量x和y的样例值的平均值)是相互对称的随机变量,线性相关系数只反映变量之间的线性相关,不能说明非线性相关。 样本相关系数是总体相关系数的样本估计值,由于取样波动,样本相关系数是随机变量,必须检查统计重要性。相关系数仅反映线性相关性,不能确定因果关系。不能说明相关关系具体接近什么样的直线系统经济学。变量之间的因果关系和随机性背后隐藏的统计规律性取决于回归分析方法。使用相关系数时,10,线性不意味着相关。相关关系不一定意味着因果关系。回归分析/相关分析研究了一个变量对另一个(部分)变量的统计依赖性,但不一定意味着存在因果关系。相关分析对称地处理任意(两)变量,两个变量都被认为是任意的。回归分析对变量的处理方法具有不对称。也就是说,将已解释变量(已解释变量)和参数(已解释变量)分开。前者是随机变量,后者不是。,注:11,4,回归分析,回归的经典意义:高尔顿遗传学的回归概念(父母身高与子女身高的关系)回归的现代意义:解释变量对多个变量的依赖性的研究回归目的(本质):估计所解释变量平均值的固定解释变量,12,Y的条件分布Y的条件期望:对于x的每个值,Y形成的分布是Y的条件期望或条件平均值e(Y-3900;);注意一些概念,y的条件期望值e (y)将x的函数e(y)=f()称为回归函数。回归函数分为整体回归函数样本回归函数,14,例如,由100个家族组成的整体,2,总回归函数(PRF),15,2,总回归函数(PRF),1,整体回归函数的概念前提。如果有解释正在研究的经济现象的完全解释变量y和变量x的各种观测值,则完全解释变量y的条件平均值e(y390;)计算。充当解释变量x的函数此函数称为total regression function(PRF),16,2,total regression function的表示法,(1)条件平均值表示法y的条件平均值e(y-3900;)是描述变量x的线性函数,(2)在特定情况下,y的各个值表示(随机设定形式)在周围分布,使每个值与条件平均值偏差,显然,在随机变量的情况下,17,在实际经济研究中,整体回归函数通常是未知的,可以经济地解释为“测量”的目的是寻找PRF。在整个回归函数中,y和x的关系是线性的,但是非线性的。3,注意事项,18,对于变量,线性Y的条件平均值为x的线性函数参数,线性3354Y的条件平均值为参数的线性函数判断。变量,参数平均线性参数线性,变量非线性变量线性,参数非线性测量经济学的线性回归模型主要是参数线性,线性回归模型“线性”的两种解释,即19,3,随机扰动项u,概念各值和条件平均偏差表示从模型中排除的所有元素对,随机变量对特性:0期望恒定分布的重要性未知影响因素的表示无法获取数据的已知影响因素的表示许多小影响因素的复合表示模型的设置误差变量的观察误差变量的内部随机性,21,4,样本回归函数(SRF),样本返回线:x的特定值,求出y的样本观测值,得出相应的条件平均值,样本观测条件平均值样例回归函数:如果将已求解变量y的样例条件平均值表示为解释变量x的函数之一,则此函数称为样例回归函数(SRF)。Yx、22、SRF的特征,每个样品可以获得一个样品,并且可以拟合样品返回行,因此根据样品变化,可能会有多个样品返回行(SRF不是唯一的)。YSRF1SRF2X样本回归函数的函数形式必须与设置的整个回归函数的函数形式一致。样例回归线不是整条回归线,它只是整个未知回归线的近似表示。如果、23、样例回归函数是线性函数,则可以表示为:解释了相应y的示例条件平均值和示例回归函数的参数。变量y的实际观测值与样例条件平均值不完全相同。差异称为残差或残差(残差)。或样本回归函数的表示,24,对样本回归分析的理解,以及如果可以得到值,则显然是:和整体回归函数自变量和估计对整体条件的期望e(y390;)的估计,25,样本回归函数与整体回归函数的关系,SRFPRFax,26,回归分析的目的:使用样本回归函数SRF估计整体回归函数PRF。SRF始终估计PRF过高或过低,因为示例对总体代表性错误。需要解决的问题:找到SRF中的参数以及使整个回归函数的参数和尽可能“接近”的规则和方法。最常用的“规则和方法”是最小二乘法、27,2.2一元线性回归模型的最小二乘估计、使用样本估计整体回归函数的方法、除样本外,还有几个前提条件为什么以简单线性回归的基本假设为前提?只有在模型中存在随机扰动,估计的参数是随机变量,并且假定随机扰动分布的情况下,才能确定估计的参数的分布特性。或者,可以进行估计和间距估计。只有在一定的假设条件下,估计才会有较好的统计特性。28,基本假设内容,对模型和变量的假设对随机扰动项的假设1,对模型和变量的假设假定变量x为非随机或随机,但与扰动项u无关。假设解释变量x在迭代示例中是固定值。假设变量和模型没有设置错误。29,2,线性回归模型的基本假设,(1)随机误差项的零平均值假设e (ui)=0i=1,2,ne(已定义)=0 1xi (2)随机错误项目的各向同性差异假设var (ui)=u2i=1,2,nvar(已义)=U2 (3)随机错误项不相关cov (ui,uj)=0i 8800j;I,j=1,2,ncov (yi,yj)=0,30,以上假设也称为线性回归模型的经典假设或高斯假设,满足此假设的线性回归模型称为经典线性回归模型(classicalliearregressionmodel,),4,随机错误条目和解释变量x无关。cov (Xi,ui)=0i=1,2,n * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *通常对回归系数执行重要检查,u正态分布ui至n(u正态分布ui至n).n,31,2,参数的一般最小平方估算(OLS),1,一般最小平方规则的范例观测集(Xi,yi) (I=1,2,n)。样例回归函数要求尽可能好地拟合这组值。一般最小平方(Ordinaryleastsquares,OLS)决定此值差异的平方和最小值。32,方程式(*)称为一般方程式。2,一般方程式,33,记忆,上述参数估计可以用称为OLS估计量的偏差形式(deviationform)记录。3,正则方程,由34估计的回归系数的估计由最小二乘法获得,因此称为一般最小二乘估计(ordinaryleastsquaresestimators)。注意:OLS估计可以通过观测值计算。OLS估计是点估计。从范例资料取得OLS预估值后,您可以绘制范例回归线。35,仅供参考,可用,(* *)样式也称为样例回归函数的偏差格式。(* *)注意:在计量经济学中,对平均值的偏差通常用小写字母表示。36,4,样例返回线的特性,37,38,特性3:残差和等于0,即,39,40,41,3,最小二乘估计的特性,模型参数估计时是否可以表示整个参数的实际值,或者必须考虑参数估计的统计特性。,用于调查整体估计的一个是(1)线性,即是否是其他随机变量的线性函数。(2)不容忍性,即平均值或期望值是否等于整体实际值;(3)有效性,即所有线性偏转估计中是否存在最小方差。42,(4)渐近无偏,即样本容量无限时平均序列是否朝向整个振幅;(5)一致性,即样本容量无限增长时,是否在整个true值中以概率收敛;(6)渐近有效性,即样本容量达到无穷大时所有一致估计是否具有最小渐近方差。这三个标准也称为估计的小样本特性。具有这些特性的估计量称为最佳线性偏转估计(bestlinerunbisasedstimator,blue)。如果不满足小样例特性,则需要进一步调查预期的大样例或渐近特性。43,Gauss-Markovtheorem定理是给定经典线性回归的假设中的最小二乘估计,是没有最小方差的线性偏差的估计。44,一般最小平方估算(ordinaryleastSquaresEstimators)为最佳线性偏转估算(bestlinearunbiasedestination,blue),45,4,参数,2也称为总体方差。可以证明2的最小二乘估计是2的偏转估计。48,2.3一元线性回归模型的统计测试,1,拟合度检查2,变量的显著性测试3,参数的置信区间,50,回归分析通过样本的估计参数而不是整个实际参数,或使用样本返回线而不是整个返回线。如果统计上有足够多的迭代示例,则参数的估计值(平均值)与整个参数true相同,但在一个示例中,估计值不一定等于true。那么,在一个采样中,需要对参数的估计值和true值之间的差异有多大以及是否是一个重要的问题进行更多的统计测试。主要包括拟合度测试、变量显著性测试和参数的区间估计。51、1、拟合优度检查、拟合优度检查:检查样例回归线和样例观测之间拟合优度的检查。适合度测量指标:确定系数(确定系数)R2,问题:使用一般最小平方估算方法确定模型是否最适合范例观测,为何还要检查配合?52,1,样例观测集(Xi,Yi),I=1,2,被称为总偏差平方数的分解.n计算样例回归线,53最佳拟合(如果实际观测落在样例回归“直线”上)。无论“残差”如何,“偏差”都可以被视为来自回归线。54,可以通过考虑所有采样点的采样平均偏差的平方和来证明:记忆,总平方和,回归平方和,残差平方和,55,TSS=ESS RSS,Y的观测值等于平均值的总偏差(totalvariation)一部分来自返回线(RSS),另一部分来自随机力(RSS)。在给定示例中,TSS保持不变,并且实际观察点离示例返回线越近,RSS在TSS中所占的比重越大,因此适合度:回归平坦和RSS/Y的总偏差TSS,56,2,确定系数R2统计信息(R2为(示例)确定系数/确定系数(coefficientofdetermination),可确定系数值范围:0,1R2越接近1,表示实际观测点越接近取样线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电动牙刷行业研究报告及未来行业发展趋势预测
- 2025年挎包拎包休闲包行业研究报告及未来行业发展趋势预测
- 光伏发电与电池储能协同调度方案
- 光伏电站智能化管理系统方案
- 湿地生态保护知识培训
- 陕西省渭南事业单位考试模拟考试题库含答案
- 保险学原理试题与答案
- 2025年裁缝剪刀行业研究报告及未来行业发展趋势预测
- 2025年美容化妆行业研究报告及未来行业发展趋势预测
- 风电场海上安装与建设方案
- 《简爱》课本剧剧本
- 阳光晾衣房钢结构专项施工方案
- 安宁疗护服务流程
- 肿瘤科实习生入科培训课件
- 国际商务谈判英文版课件PPT
- 热分析DSC培训new
- 注塑机安全操作规程
- 运动处方(课堂PPT)
- 第2章曲柄压力机
- 数学课堂教学技能训练
- FZ∕T 60021-2021 织带产品物理机械性能试验方法
评论
0/150
提交评论