




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 回归分析原理 3·1、一元线性回归数学模型按理说,在研究某一经济现象时,应该尽量考虑到与其有关各种有影响的因素或变量。但作为理论的科学研究来说,创造性地简化是其的基本要求,从西方经济学的基本理论中,我们可以看到在一般的理论分析中,至多只包含二、三个 变量的数量关系的分析或模型。这里所讨论的一元线性回归数学模型,是数学模型的最简单形式。当然要注意的是,这里模型讨论是在真正回归意义上来进行的,也可称之为概率意义上的线性模型。在非确定性意义上,或概率意义上讨论问题,首先要注意一个最基本的概念或思路问题,这就是总体和样本的概念。我们的信念是任何事物在总体上总是存在客观规律的,虽然我们
2、无论如何也不可能观察或得到总体,严格说来,总体是无限的。而另一方面,我们只可能观察或得到的是样本,显然样本肯定是总体的一部分,但又是有限的。实际上概率论和数理统计的基本思想和目的,就是希望通过样本所反映出来的信息来揭示总体的规律性,这种想法或思路显然存在重大的问题。但另一方面,我们也必须承认,为了寻找总体的规律或客观规律,只能通过样本来进行,因为我们只可能得到样本。在前面我们已经知道,用回归的方法和思路处理非确定性问题或散点图,实际上存在一些问题,亦即只有在某些情况下,回归的方法才是有效的。因此,在建立真正回归意义上建立其有效方法时,必须作出相应的假设条件。l 基本假设条件:(1)假设概率函数
3、或随机变量的分布对于所有值,具有相同的方差 ,且 是一个常数,亦即=。(2)假设的期望值位于同一条直线上,即其回归直线为 = 等价于 这个假设是最核心的假设,它实际上表明与之间是确定性的关系。(3)假设随机变量是完全独立的,亦即3·2、随机项或误差项的含义 一元线性回归模型的一般形式为 是一随机项或误差项,它的存在表明对的影响是随机的,非确定性的。所以,对于每一个值来说,是一个概率分布,而不是一个值或几个值。正是由于的出现,使我们的方法或思路发生巨大的变化,这是我们必须充分注意的。l 那么,究竟包含了什么意义或内容呢?概括地说来主要有:(1) 模型中被忽视了的影响因素;(2) 变量的
4、测量误差,这种误差主要来自统计数据本身的误差;(3) 随机误差。社会经济现象中涉及到人的主观因素和行为,还有历史的、文化的等因素,这些因素一般来说是难以量化的、多变的;(4) 模型的数量关系误差。即数学形式所带来的误差。一般来说,模型中的常数项也可以包含某些较为固定的误差。但是值得指出的是,如果能够包含上述所有的内容,那它的分布及其性质将是十分复杂的,任意的。前面的假设条件的核心正是限制了的分布形式,因此,实际上并不能包含如此多的内容或负担。另外,上面4个方面中,我们最主要的是要第4个问题,这也正是经济学研究所要真正解决的问题。一般来说,所有的经济数学模型的误差也就是这4个方面,或者说是存在的
5、主要问题,对此我们必须要有清醒和深入的认识。 3·3、一元线性回归模型的参数估计我们已知道,总体意义上真正的回归模型是未知的,我们的任务是如何通过样本观察值给出总体真正回归模型的最好估计。我们必须理解和认识总体回归模型和样本回归模型的区别和关系,必须反反复复地去认识、体会。假设总体真正的回归直线是 它是由总体回归模型 显然,上面的模型是想象的、理论上的,实际上是找不到的,它们实际上就是所谓客观规律。而样本的回归直线为 它是来自于样本的回归模型 注意总体和样本模型的区别和联系,无限和有限,相同和不同等。下面我们同样根据最小二乘准则,建立真正回归意义上的最小二乘法:对样本模型 假设其估计
6、的回归模型为 因此,其残差则为 所以,其残差平方和为 根据前面的结果,我们有 其中 到此样本回归模型的参数就估计出来了。对于这个结果需要注意的是,这里的 , 都是的函数,而是随机变量,因此,从理论上说,随机变量,而不是一个或几个固定的值,是一个概率分布。正因为如此,回归的结果实际上也不是确定的,而是概率意义上的。接着我们关心的是,这个估计结果怎么样?是否可用样本回归模型来推断或替代总体回归模型呢?因此,我们必须进一步讨论,的性质,亦即讨论样本回归模型的性质。 34、估计值的性质(1) 估计值的线性性质。所谓线性性是指估计值,是观测值的线性函数。证明: 而 其中同理可证:= 其中 所以,是线性函
7、数(应注意线性性的意义和作用)。(2) 估计值的无偏性。所谓无偏性是指估计值,的期望值等于总体回归模型参数,的值。亦即 ,。证明:通过计算可知 , 其中所以有 同理可证 (3)有效性(或称,具有最小方差性)。所谓有效性主要是指最小二乘估计,在所有线性无偏估计中,其方差是最小的。证明的基本思路是: ,证明(略)。上面三个性质是最小二乘估计的主要性质,理论上说已达到最好的结果了。因此,满足这三条的估计也称作最优线性无偏估计。值得注意的是,这里的最优只是相对所有线性估计中而言的,而不包括非线性估计。也可以说在很多的情况下,肯定存在比最小二乘估计更好的估计值,这一点必须要认识清楚。还有一点,最小二乘估
8、计的性质实际上与其假设条件是密切相关的,没有这样假设就没有这样的性质,因此,我们还要看看其假设条件到底是什么意思,要进一步去认识假设条件。 3·5、最小二乘估计,的显著性检验与置信区间所谓显著性检验实际上就是对检验估计值与总体参数值差别大小的方法。也就是数理统计中的“假设检验”的方法一种实际应用。这里再一次指出,参数估计之所以要进行检验,是因为这里的,是随机变量。根据“假设检验”的要求,我们要想办法求出,的概率分布函数,又由于它们是的线性函数,则首先要知道的分布。因此,我们只能假设服从正态分布(根据大数定理和中心极限定理,在大样本情况下并不失一般性)。假设服从正态分布,又因,是的线性
9、函数,所以,也是服从正态分布的。只要计算出,的方差,我们就可得到 在上面的分布函数中,除了, 不可能知道外,我们必须解决未知数估计值,才可能继续进行显著性检验。1、 建立随机变量方差的估计值采用一定的办法是可以解决估计值的,下面给出其推理过程,并证明其估计值是一个无偏估计。设: 所以 而 (1) 又(2) 代入 则有 由此我们就有 因此,进一步则有 下面我们分别计算上式右边每一项的期望值: 其中 ( 注意其中 )因此,我们最终得到 如果我们定义 ,那么就是的无偏估计,亦即有 。 但是我们还不能证明 是最小方差估计,这是十分遗憾的。 2、 最小二乘估计值,的显著性检验现在我们可以开始对,检验了。
10、我们应该认识到,通过样本得到具体估计值, 只是一个值,或者说只是无穷个可能值中的一个,此时我们并不了解它们的精度和可靠性。因此,显著性检验实际上是检验,与,之间的差距和可靠性。具体的检验方法就是“假设检验”的方法。我们从数理统计中知道,一般假设检验中用来进行检验的统计量(实际上就是一种随机变量)主要有二个,即Z统计量和T统计量。(1)应用Z统计量的条件是:已知而无论样本的大小,或者未知但样本足够的大(n至少大于30)。 已知 则我们有N(0 ,1) N(0 ,1)当然如果未知,但样本数大于30,则在上式中用替代即可。(2)应用T统计量的条件:当方差未知,且样本小于30时。已知 则我们有 = t
11、(n-k) =t(n-k)这里的n是样本的个数,k是模型中变量的个数,n-k是自由度。到此假设检验的基本工作基本上做好了,需要指出的是,统计量的设计一方面是把特殊的分布函数转化成标准的分布形式,另一方面把需要检验的对象同时也明确起来了。上面统计量分子正好反映了我们检验的意义。在“假设检验”的实际应用中,一个十分重要的问题是如何确定总体意义上的,的值。我们知道“总体”概念说到底只是一个设想,一个信念而已,我们不可能知道,的具体值,但我们又要依据,具体值才能判断或检验,是否是可接受的或误差不大。这个问题或矛盾怎么解决呢?这实际上是一个深刻的方法论问题。简单地说,我们只能用假设、或者具体地说是用理论
12、假说的数量结论来替代,的具体值,也就是“假设检验”方法中作出“零假设”的主要依据;当然在把回归模型作为预测用途时,也可以把其他主观或经验的判断作为“零假设”的依据。这样我们就可看到,所谓“假设检验”中原来希望检验,与 ,之间差异的想法或思路,已经转变为检验,是否与理论假说或其他主观判断和经验相符。这一转变是深刻的和巨大的,这里,已变成了检验的标准,由被动变为主动,而理论假说或其他主观判断则变成了被检验对象。这一转变所说明是问题是很多的、深刻的,应该好好认识和体会。“假设检验”的具体过程(例子):略3、总体参数,置信区间的估计通过“假设检验”方法或显著性检验,虽然证实了估计值,的显著性,但还没有
13、说明它们就完全正确估计了真实总体参数,至多只能说明,是它们的一种可能的值,其它更多的可能性显然是存在的,或许其它的值更好或更合适,因为,只是来自一组样本的估计结果。因此,为了确定,是怎样接近真实总体的参数,我们期望构造一个区间来具体加以说明,亦即建立一个围绕估计值,的一定限制范围,来推断总体参数,在一定置信度下落在此区间。所谓置信(或称置信水平)度实际上与显著性的意义类似,只是数量的大小相反而已。例如,对于的T统计量,有 =t(n-k)先确定其置信度如95%和自由度(n-k),然后通过t分布表找出临界值的值。则我们有 即 所以,置信度是95%的置信区间为 我们可以看出,置信区间的长度与置信度的
14、大小是密切相关的,其长度与置信度的大小是成正比的。这种关系也是值得思考的。3·6、预测值问题的分析 所谓预测问题就是对于已估计的计量经济学模型来说,相对于一给定的X值,例如,其预测值的性质和效果如何?再来回顾一下我们建立回归模型的过程及其性质。根据最小二乘法我们从样本模型 找到了它的回归直线我们已对 ,作了检验并通过后,应该可以根据上式来进行预测了,亦即对于,可得到,亦即我们要具体考察性质,实际上主要是分析它的误差性质,我们可以通过不同角度的分析来进行。我们可以从两种角度来看待的误差。一是把看成是总体回归线(即)的估计值;二是把看成是(即)的估计值。下面来具体分析:(1)如果把看成是
15、总体回归线即的近似值,则有什么样的性质呢。首先可以证明的是是的无偏估计。现证明如下: 然后,我们来看看 方差的性质和具体形式: (具体计算过程参看4344页)从方差的计算结果可看出,如果离样本观测值的距离越大,则的方差也就越大。这实际上说明回归的基本思想实际上是归纳的思路,亦即我们的不能脱离样本或经验的范围太远,否则模型的预测值的方差将增大,预测将将变得更加不可靠。这个结果也许使我们对归纳法及思想的局限性或存在的问题有了一个数学上的解释。同时这个结果也把回归模型预测的类型分为两类,第一类称之为“内插检验”亦即这时的必须在样本所限定的区间内,言外之意是对经验之内的情况,回归模型的预测效果是比较可
16、靠的。第二类称之为“外推预测”,这时的是在样本区间的外面,这时的预测值的误差方差显然是较大的,亦即“外推预测”是十分不可靠的。(2)如果把看作真正总体或的预测估计值,其性质和结果又会什么变化呢?这里要注意的是,这时不仅可能有抽样误差的存在,而且还可能由随机项而引起随机误差的出现,它们将使得不同于。下面我们来具体看看这种情况下的期望值和方差: 对于给定的,有 则 取其期望值,则有 这个结论是否与上面的情形是一样的呢?是否能说是的无偏估计呢?看来是有问题的,其问题的关键是是什么?是一个随机变量?还是一个确定的值?不同的理解就会有不同的结论。再来看看此时的方差又有什么变化: =从上面的结果可清楚看出
17、,总体的与样本的估计值之间的方差,要比与总体回归线的方差大,准确地说大。这是一个十分重要的结论,可具体表示为 预测误差的方差=抽样误差的方差+随机误差项的方差这个结论表明,人为降低预测误差只能在抽样误差的方差方面作出努力,而其存在的随机误差是无法避免或改变的。通过上面的讨论和计算,我们就可以进一步对进行显著性检验和计算其置信区间。下面只介绍T统计量检验的情形,对于构造的T统计量为 t(n-k) 具有n-k个自由度具体的检验过程和置信区间的推导过程这里就省略了。值得指出地是,在进行用于预测值的检验时,与前面的假设检验是有较大区别的,这里需要关心的不是理论的假说结果,而是回归模型预测值的具体精度,是精度而不是数量的性质,亦即是量而不是质的问题。第三章 作业1、 知下列数据:有关英国车祸次数与有执照汽车数的数据 年份: 1947 48 49 50 51 52 53 5 4 55 56 57车祸
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海上风险评估与应对策略考核试卷
- 糕点烘焙店的品牌差异化考核试卷
- 篷布制造过程中的绿色生产与效率提升措施考核试卷
- 山东理工职业学院《数字电子技术》2023-2024学年第二学期期末试卷
- 天津市和平区名校2025届高三第六次月考试卷(历史试题理)试题含解析
- 武汉华夏理工学院《习近平新时代中国特色社会主义思想概论》2023-2024学年第二学期期末试卷
- 上海戏剧学院《书法书法理论与实践》2023-2024学年第一学期期末试卷
- 江苏省泰州市周庄初级中学2025年初三中考全真模拟卷(七)物理试题含解析
- 四川省达州市开江县重点达标名校2024-2025学年初三3月联考生物试题含解析
- 山东省招远市2025届初三适应性练习卷语文试题含解析
- 职业体验活动记录表
- 卫生统计学-回归与相关
- 德国政治制度简介课件
- 高考试卷命题设计的技巧 课件24张
- 合格供应商审查表
- 研究生学位论文修改情况登记表
- 水质自动在线监测系统技术协议1010审计
- DBJ04∕T 258-2016 建筑地基基础勘察设计规范
- 食品公司规章制度
- 七年级地理下双向细目表
- 网吧员工劳动合同书
评论
0/150
提交评论