版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章第二章 经典一方程计量经济学模型:经典一方程计量经济学模型:一元线性回归模型一元线性回归模型 The Classical Single Equation The Classical Single Equation Econometric Model: Simple Linear Econometric Model: Simple Linear Regression Model Regression Model 本章内容本章内容 回归分析概述回归分析概述 一元线性回归模型的根本假设一元线性回归模型的根本假设 一元线性回归模型的参数估计一元线性回归模型的参数估计 一元线性回归模型的检验一元线
2、性回归模型的检验 一元线性回归模型的预测一元线性回归模型的预测 实例及时间序列问题实例及时间序列问题2.1 2.1 回归分析概述回归分析概述(Regression Analysis)(Regression Analysis)一、变量间的关系及回归分析的根本概念一、变量间的关系及回归分析的根本概念二、总体回归函数二、总体回归函数三、随机扰动项三、随机扰动项四、样本回归函数四、样本回归函数一、变量间的关系及回归分析一、变量间的关系及回归分析的根本概念的根本概念1 1、变量间的关系、变量间的关系 确定性关系或函数关系:研讨的是确定性景象确定性关系或函数关系:研讨的是确定性景象非随机变量间的关系。非随
3、机变量间的关系。2,半径半径圆面积f 统计依赖或相关关系:研讨的是非确定性景象统计依赖或相关关系:研讨的是非确定性景象随机变量间的关系。随机变量间的关系。施肥量阳光降雨量气温农作物产量,f 对变量间统计依赖关系的调查主要是经过相关对变量间统计依赖关系的调查主要是经过相关分析分析(correlation analysis)或回归分析或回归分析(regression analysis)来完成的。来完成的。 相关分析适用于一切统计关系。相关分析适用于一切统计关系。 相关系数相关系数(correlation coefficient) 正相关正相关(positive correlation) 负相关负相
4、关(negative correlation) 不相关不相关(non-correlation) 回归分析仅对存在因果关系而言。回归分析仅对存在因果关系而言。 留意:留意: 不存在线性相关并不意味着不相关。不存在线性相关并不意味着不相关。 存在相关关系并不一定存在因果关系。存在相关关系并不一定存在因果关系。 相关分析对称地对待任何两个变量,两个相关分析对称地对待任何两个变量,两个变量都被看作是随机的。变量都被看作是随机的。 回归分析对变量的处置方法存在不对称性,即回归分析对变量的处置方法存在不对称性,即区分应变量被解释变量和自变量解释变区分应变量被解释变量和自变量解释变量,前者是随机变量,后者不
5、一定是。量,前者是随机变量,后者不一定是。2 2、回归分析的根本概念、回归分析的根本概念 回归分析回归分析(regression analysis)(regression analysis)是研讨一个是研讨一个变量关于另一个些变量的详细依赖关系的变量关于另一个些变量的详细依赖关系的计算方法和实际。计算方法和实际。 其目的在于经过后者的知或设定值,去估计和其目的在于经过后者的知或设定值,去估计和或预测前者的总体均值。或预测前者的总体均值。 两类变量;两类变量; 被解释变量被解释变量Explained VariableExplained Variable或应变量或应变量Dependent Vari
6、ableDependent Variable。 解释变量解释变量Explanatory VariableExplanatory Variable或自变量或自变量Independent VariableIndependent Variable。 回归分析构成计量经济学的方法论根底,其主回归分析构成计量经济学的方法论根底,其主要内容包括:要内容包括: 根据样本察看值对经济计量模型参数进展估计,根据样本察看值对经济计量模型参数进展估计,求得回归方程;求得回归方程; 对回归方程、参数估计值进展显著性检验;对回归方程、参数估计值进展显著性检验; 利用回归方程进展分析、评价及预测。利用回归方程进展分析、评
7、价及预测。 1二、总体回归函数二、总体回归函数Population Regression Function, Population Regression Function, PRFPRF1 1、条件均值、条件均值conditional meanconditional mean 例例2.1.1:一个假想的社区有:一个假想的社区有99户家庭组成,欲户家庭组成,欲研讨该社区每月家庭消费支出研讨该社区每月家庭消费支出Y与每月家庭可与每月家庭可支配收入支配收入X的关系。的关系。 即假设知道了家庭的月收即假设知道了家庭的月收入,能否预测该社区家庭的平均月消费支出程入,能否预测该社区家庭的平均月消费支出程度
8、。度。 为到达此目的,将该为到达此目的,将该99户家庭划分为组内收入户家庭划分为组内收入差不多的差不多的10组,以分析每一收入组的家庭消费组,以分析每一收入组的家庭消费支出。支出。表表 2.1.1 某某社社区区家家庭庭每每月月收收入入与与消消费费支支出出统统计计表表 每月家庭可支配收入X(元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 9
9、24 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 20
10、35 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 费 支 出 Y (元) 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 由于不确定要素的影响,对同一收入程度由于不确定要素的影响,对同一收入程度X,不同家庭的消费支出不完全一样;不同家庭的消费支出不完全一样; 但由于调查的完备性,给定收入程度但由于调查的完备性,给定收入程度X的消费的消费支出支出Y的分布是确定的,即以的分布是确定的,即以X的给定值为
11、条的给定值为条件的件的Y的条件分布的条件分布Conditional distribution是知的,例如:是知的,例如:P(Y=561|X=800=1/4。 因此,给定收入因此,给定收入X的值的值Xi,可得消费支出,可得消费支出Y的的条件均值条件均值conditional mean或条件期望或条件期望conditional expectation:E(Y|X=Xi)。 该例中:该例中:E(Y | X=800)=605 描出散点图发现:随着收入的添加,消费描出散点图发现:随着收入的添加,消费“平平均地说也在添加,且均地说也在添加,且Y的条件均值均落在一的条件均值均落在一根正斜率的直线上。根正斜率
12、的直线上。05001000150020002500300035005001000150020002500300035004000每月可支配收入X元每月消费支出Y元2 2、总体回归函数、总体回归函数 在给定解释变量在给定解释变量Xi条件下被解释变量条件下被解释变量Yi的期望的期望轨迹称为总体回归线轨迹称为总体回归线population regression line,或更普通地称为总体回归曲线,或更普通地称为总体回归曲线population regression curve。 相应的函数称为双变量总体回归函数相应的函数称为双变量总体回归函数population regression functi
13、on, PRF。)()|(XfXYE 2 含义:回归函数含义:回归函数PRF阐明被解释变量阐明被解释变量Y的的平均形状总体条件期望随解释变量平均形状总体条件期望随解释变量X变化变化的规律。的规律。 函数方式:可以是线性或非线性的。函数方式:可以是线性或非线性的。 例例2.1.1中,将居民消费支出看成是其可支配收中,将居民消费支出看成是其可支配收入的线性函数时入的线性函数时:为线性函数。其中,为线性函数。其中,0,1是未知参数,称是未知参数,称为回归系数为回归系数regression coefficients。XXYE10)|(三、随机扰动项三、随机扰动项Stochastic Disturban
14、ceStochastic Disturbance 总体回归函数阐明在给定的收入程度总体回归函数阐明在给定的收入程度Xi下,该下,该社区家庭平均的消费支出程度。社区家庭平均的消费支出程度。 但对某一个别的家庭,其消费支出能够与该平但对某一个别的家庭,其消费支出能够与该平均程度有偏向。均程度有偏向。 称为察看值围绕它的期望值的离差称为察看值围绕它的期望值的离差deviation,是一个不可观测的随机变量,是一个不可观测的随机变量,又称为随机干扰项又称为随机干扰项stochastic disturbance或或随机误差项随机误差项stochastic error。)|(iiiXYEY )|(XYEY
15、 例例2.1.1中,给定收入程度中,给定收入程度Xi ,个别家庭的支出个别家庭的支出可表示为两部分之和:可表示为两部分之和: 该收入程度下一切家庭的平均消费支出该收入程度下一切家庭的平均消费支出E(Y|Xi),称为系统性称为系统性systematic或确定性或确定性deterministic)部分;部分; 其他随机或非确定性其他随机或非确定性nonsystematic)部分部分i。 称为总体回归函数称为总体回归函数PRF的随机设定方式。阐的随机设定方式。阐明被解释变量除了受解释变量的系统性影响外,明被解释变量除了受解释变量的系统性影响外,还受其他要素的随机性影响。由于方程中引入了还受其他要素的
16、随机性影响。由于方程中引入了随机项,成为计量经济学模型,因此也称为总体随机项,成为计量经济学模型,因此也称为总体回归模型回归模型(PRM)。 随机误差项主要包括以下要素:随机误差项主要包括以下要素: 在解释变量中被忽略的要素的影响;在解释变量中被忽略的要素的影响; 影响不显著的要素影响不显著的要素 未知的影响要素未知的影响要素 无法获得数据的要素无法获得数据的要素 变量观测值的观测误差的影响;变量观测值的观测误差的影响; 模型关系的设定误差的影响;模型关系的设定误差的影响; 其它随机要素的影响。其它随机要素的影响。四、样本回归函数Sample Regression Function, SRF1
17、 1、样本回归函数、样本回归函数 问题:能否从一次抽样中获得总体的近似信息?问题:能否从一次抽样中获得总体的近似信息?假设可以,如何从抽样中获得总体的近似信息?假设可以,如何从抽样中获得总体的近似信息? 在例在例2.1.12.1.1的总体中有如下一个样本,能否从该的总体中有如下一个样本,能否从该样本估计总体回归函数?样本估计总体回归函数? 回答:回答:表表 2.1.3 家庭消费支出与可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本 X 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 Y 594 638 1122 1155 1408
18、 1595 1969 2078 2585 2530 能能 该样本的散点图scatter diagram): 画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线sample regression lines。 样本回归线的函数方式为:iiiXXfY10)(称为样本回归函数称为样本回归函数sample regression functionsample regression function,SRFSRF。 留意:这里将样本回归线看成总体回归线的近似留意:这里将样本回归线看成总体回归线的近似替代替代那那么么2 2、样本回归模型、样本回归模型 样本
19、回归函数的随机方式:样本回归函数的随机方式:iiiiieXYY10式中,ie称为(样样本本)残残差差(或剩剩余余)项项(residual) ,代表了其他影响iY的随机因素的集合,可看成是i的估计量i。 由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型sample regression model。 回归分析的主要目的:根据样本回归函数回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数估计总体回归函数PRF。iiiiieXeYY10iiiiiXXYEY10)|(2021.9.272.2 2.2 一元线性回归模型的根本假设一元线性回归模型的根本假设(Assumptions
20、 of Simple Linear (Assumptions of Simple Linear Regression Model) Regression Model) 一、关于模型设定的假设一、关于模型设定的假设 二、关于解释变量的假设二、关于解释变量的假设 三、关于随机项的假设三、关于随机项的假设阐明阐明 为保证参数估计量具有良好的性质,通常对模型为保证参数估计量具有良好的性质,通常对模型提出假设干根本假设。提出假设干根本假设。 实践上这些假设与所采用的估计方法严密相关。实践上这些假设与所采用的估计方法严密相关。 下面的假设主要是针对采用普通最小二乘法下面的假设主要是针对采用普通最小二乘法O
21、rdinary Least Squares, OLS估计而提出的。估计而提出的。所以,在有些教科书中称为所以,在有些教科书中称为“The Assumption Underlying the Method of Least Squares。 在不同的教科书上关于根本假设的陈说略有不同,在不同的教科书上关于根本假设的陈说略有不同,下面进展了重新归纳。下面进展了重新归纳。1 1、关于模型关系的假设、关于模型关系的假设 模型设定正确假设。模型设定正确假设。The regression model is correctly specified. 线性回归假设。线性回归假设。The regression
22、model is linear in the parameters。iiiXY10 留意:留意:“linear in the parameters的含义是什的含义是什么?么?2 2、关于解释变量的假设、关于解释变量的假设*确定性假设。确定性假设。X values are fixed in repeated sampling. More technically, X is assumed to be nonstochastic. 留意:留意:“in repeated sampling的含义是什么?的含义是什么?*观测值变化假设。观测值变化假设。X values in a given sample
23、 must not all be the same.时间序列数据作时间序列数据作样本时间适用样本时间适用 无完全共线性假设。无完全共线性假设。There is no perfect multicollinearity among the explanatory variables. 适用于多元线性回归模型。适用于多元线性回归模型。 样本方差假设。随着样本容量的无限添样本方差假设。随着样本容量的无限添加,解释变量加,解释变量X的样本方差趋于一有限常的样本方差趋于一有限常数。数。nQnXXi,/)(23 3、关于随机项的假设、关于随机项的假设 0均值假设。均值假设。The conditional
24、mean value of i is zero. 同方差假设。同方差假设。The conditional variances of i are identical.(Homoscedasticity)由模型设定正确假设推断。由模型设定正确假设推断。()0,1,2,iiEXin2(),1,2,iiVarXin能否满足需求检验。能否满足需求检验。 序列不相关假设。序列不相关假设。The correlation between any two i and j is zero. 与随机项不相关假设。与随机项不相关假设。The covariances between Xi and i are zero.
25、 ( ,)0, ,1,2, ,ijijCovX Xi jn ij cov(,)0,1,2,()0,1,2,iiiiXinE Xin4 4、随机项的正态性假设、随机项的正态性假设 在采用在采用OLS进展参数估计时,不需求正态性假进展参数估计时,不需求正态性假设。在利用参数估计量进展统计推断时,需求设。在利用参数估计量进展统计推断时,需求假设随机项的概率分布。假设随机项的概率分布。 普通假设随机项服从正态分布。可以利用中心普通假设随机项服从正态分布。可以利用中心极限定理极限定理central limit theorem, CLT进展进展证明。证明。 正态性假设。正态性假设。The s follow
26、 the normal distribution. 22(0,)(0,)iiNNID5 5、CLRM CLRM 和和 CNLRM CNLRM 以上假设正态性假设除外也称为线性回归以上假设正态性假设除外也称为线性回归模型的经典假设或高斯模型的经典假设或高斯GaussGauss假设,满足假设,满足该假设的线性回归模型,也称为经典线性回归该假设的线性回归模型,也称为经典线性回归模型模型Classical Linear Regression Model, Classical Linear Regression Model, CLRMCLRM。 同时满足正态性假设的线性回归模型,称为经同时满足正态性假设
27、的线性回归模型,称为经典正态线性回归模型典正态线性回归模型Classical Normal Classical Normal Linear Regression Model, CNLRMLinear Regression Model, CNLRM。2.3 2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计(Estimation of Simple Linear (Estimation of Simple Linear Regression Model) Regression Model) 一、参数的普通最小二乘估计一、参数的普通最小二乘估计OLSOLS 二、参数估计的最大或然法二、参
28、数估计的最大或然法(ML) (ML) 三、最小二乘估计量的性质三、最小二乘估计量的性质 四、参数估计量的概率分布及随机干四、参数估计量的概率分布及随机干 扰项方差的估计扰项方差的估计 一、参数的普通最小二乘估计一、参数的普通最小二乘估计OLSOLS1 1、最小二乘原理、最小二乘原理 根据被解释变量的一切观测值与估计值之差的根据被解释变量的一切观测值与估计值之差的平方和最小的原那么求得参数估计量。平方和最小的原那么求得参数估计量。220111()()nniiiiMinQYYYX 为什么取平方和?为什么取平方和?2 2、正规方程组、正规方程组 该关于参数估计量的线性方程组称为正规方程该关于参数估计
29、量的线性方程组称为正规方程组组normal equationsnormal equations。QQ01000)(0)(1010iiiiiXXYXY3 3、参数估计量、参数估计量 求解正规方程组得到构造参数的普通最小二乘求解正规方程组得到构造参数的普通最小二乘估计量估计量ordinary least squares estimators及及其离差方式:其离差方式:2212220)()(iiiiiiiiiiiiiXXnXYXYnXXnXYXYXXYxyxiii10214 4、“估计量估计量estimatorestimator和和“估计值估计值 (estimate) (estimate)的区别的区
30、别 假设给出的参数估计结果是由一个详细样本资假设给出的参数估计结果是由一个详细样本资料计算出来的,它是一个料计算出来的,它是一个“估计值,或者估计值,或者“点点估计,是参数估计量的一个详细数值;估计,是参数估计量的一个详细数值; 假设把上式看成参数估计的一个表达式,那么,假设把上式看成参数估计的一个表达式,那么,那么是那么是YiYi的函数,而的函数,而YiYi是随机变量,所以参数是随机变量,所以参数估计也是随机变量,在这个角度上,称之为估计也是随机变量,在这个角度上,称之为“估计量。估计量。 二、参数估计的最大似然法二、参数估计的最大似然法(ML)(ML)1 1、最大似然法、最大似然法 最大似
31、然法最大似然法(Maximum Likelihood,ML)(Maximum Likelihood,ML),也称,也称最大或然法,是不同于最小二乘法的另一种参最大或然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发开展起来数估计方法,是从最大或然原理出发开展起来的其它估计方法的根底。的其它估计方法的根底。 根本原理:当从模型总体随机抽取根本原理:当从模型总体随机抽取n n组样本观组样本观测值后,最合理的参数估计量应该使得从模型测值后,最合理的参数估计量应该使得从模型中抽取该中抽取该n n组样本观测值的概率最大。组样本观测值的概率最大。 MLML必需知随机项的分布。必需知随机项的
32、分布。2 2、估计步骤、估计步骤),(210iiXNY2102)(2121)(iiXYieYP),(),(21210nYYYPL 2102)(21)2(1iiXYnneYi的分布Yi的概率函数 Y的一切样本观测值的结合概率似然函数 2102*)(21)2ln()ln(iiXYnLL0)(0)(21012100iiiiXYXY2212220)()(iiiiiiiiiiiiiXXnXYXYnXXnXYXYX对数似然函数 对数似然函数极大化的一阶条件构造参数的ML估计量3 3、讨论、讨论 在满足一系列根本假设的情况下,模型构造参在满足一系列根本假设的情况下,模型构造参数的最大似然估计量与普通最小二乘
33、估计量是数的最大似然估计量与普通最小二乘估计量是一样的。一样的。 但是,分布参数的估计结果不同。但是,分布参数的估计结果不同。neMLi22:2:22neOLSi三、最小二乘估计量的性质三、最小二乘估计量的性质1 1、概述、概述 当模型参数估计出后,需思索参数估计值的精当模型参数估计出后,需思索参数估计值的精度,即能否能代表总体参数的真值,或者说需度,即能否能代表总体参数的真值,或者说需调查参数估计量的统计性质。调查参数估计量的统计性质。 准那么:准那么: 线性性线性性(linear),即它能否是另一随机变量的线,即它能否是另一随机变量的线性函数;性函数; 无偏性无偏性(unbiased),即
34、它的均值或期望值能否,即它的均值或期望值能否等于总体的真实值;等于总体的真实值; 有效性有效性(efficient),即它能否在一切线性无偏估,即它能否在一切线性无偏估计量中具有最小方差。计量中具有最小方差。 这三个准那么也称作估计量的小样本性质。拥这三个准那么也称作估计量的小样本性质。拥有这类性质的估计量称为最正确线性无偏估计有这类性质的估计量称为最正确线性无偏估计量量best liner unbiased estimator, BLUE。 当不满足小样本性质时,需进一步调查估计量当不满足小样本性质时,需进一步调查估计量的大样本或渐近性质的大样本或渐近性质(asymptotic (asymp
35、totic properties)properties): 渐近无偏性,即样本容量趋于无穷大时,能否渐近无偏性,即样本容量趋于无穷大时,能否它的均值序列趋于总体真值;它的均值序列趋于总体真值; 一致性,即样本容量趋于无穷大时,它能否依一致性,即样本容量趋于无穷大时,它能否依概率收敛于总体的真值;概率收敛于总体的真值; 渐近有效性,即样本容量趋于无穷大时,能否渐近有效性,即样本容量趋于无穷大时,能否它在一切的一致估计量中具有最小的渐近方差。它在一切的一致估计量中具有最小的渐近方差。10.102、高斯、高斯马尔可夫定理马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假
36、定下,最小二乘估计在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。量是具有最小方差的线性无偏估计量。 下面分别对最小二乘估计量的线性性、无偏性下面分别对最小二乘估计量的线性性、无偏性和有效性进展证明,作为不熟习的同窗的自学和有效性进展证明,作为不熟习的同窗的自学内容。内容。2 2、无无偏偏性性,即估计量0、1的均值(期望)等于总体回归参数真值0与1 证:证:iiiiiiiiiikXkkXkYk10101)(易知02iiixxk 1iiXk故iik111111)()()(iiiiEkkEE同样地,容易得出 0000)()()()(iiiiEwEwEE3 3、有有效效性性
37、(最最小小方方差差性性) ,即在所有线性无偏估计量中,最小二乘估计量0、1具有最小方差。 (1)先求0与1的方差 )var()var()var()var(21021iiiiiiikXkYk22222iiixxx221020)/1 ()var()var()var(iiiiiikXnXwYw2222222221121iiiiixxXkXnnkXkXnn22222222221iiiiixnXxnXnxxXn2证明最小方差性假设*1是其他估计方法得到的关于1的线性无偏估计量: iiYc*1其中,ci=ki+di,di为不全为零的常数那么容易证明)var()var(1*1同理,可证明0的最小二乘估计量0
38、具有最的小方差 由于最小二乘估计量拥有一个由于最小二乘估计量拥有一个“好的估计量所应好的估计量所应具备的小样本特性,它自然也拥有大样本特性。具备的小样本特性,它自然也拥有大样本特性。 )/lim()/lim()lim()lim()lim()lim(212111nxPnxPxxPPkPPiiiiiiii1110),(QQXCov四、参数估计量的概率分布及随机干四、参数估计量的概率分布及随机干扰项方差的估计扰项方差的估计1 1、参数估计量的概率分布、参数估计量的概率分布 ),(2211ixN),(22200iixnXN2 2、随机误差项、随机误差项的方差的方差2 2的估计的估计 2又称为总体方差。
39、 由于随机项i不可观测,只能从i的估计残差ei出发,对总体方差进展估计。 可以证明,2的最小二乘估计量为:222nei它是关于它是关于2 2的无偏估计量。的无偏估计量。 在最大或然估计法中,求解似然方程: 2的最大或然估计量不具无偏性,但却具有一致性。 neXYniii22102)(10)(210212*222iinXYL2.4 2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验Statistical Test of Simple Linear Statistical Test of Simple Linear Regression Model Regression Model 一、
40、拟合优度检验一、拟合优度检验 二、变量的显著性检验二、变量的显著性检验 三、参数的置信区间三、参数的置信区间 说说 明明 回归分析是要经过样本所估计的参数来替代总回归分析是要经过样本所估计的参数来替代总体的真实参数,或者说是用样本回归线替代总体的真实参数,或者说是用样本回归线替代总体回归线。体回归线。 虽然从统计性质上知,假设有足够多的反复虽然从统计性质上知,假设有足够多的反复 抽样,参数的估计值的期望均值就等于其抽样,参数的估计值的期望均值就等于其总体的参数真值,但在一次抽样中,估计值不总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。一定就等于该真值。 那么,在一次抽样中,参数的估
41、计值与真值的那么,在一次抽样中,参数的估计值与真值的差别有多大,能否显著,这就需求进一步进展差别有多大,能否显著,这就需求进一步进展统计检验。统计检验。 主要包括拟合优度检验、变量的显著性检验及主要包括拟合优度检验、变量的显著性检验及参数的区间估计。参数的区间估计。一、拟合优度检验一、拟合优度检验Goodness of Fit, Coefficient of Goodness of Fit, Coefficient of DeterminationDetermination1 1、回答一个问题、回答一个问题2 2、总离差平方和的分解、总离差平方和的分解iiXY10)(YYyiiiiiiiiiy
42、eYYYYYYy)()(Y Y的的i i个观测值与样本均个观测值与样本均值的离差值的离差由回归由回归直线解直线解释的部释的部分分 回归直线不能回归直线不能解释的部分解释的部分 离差分解为两离差分解为两部分之和部分之和 对于一切样本点,那么需思索离差的平方和:对于一切样本点,那么需思索离差的平方和:记22)(YYyTSSii总体平方和总体平方和Total Sum of Squares22)(YYyESSii回归平方和回归平方和Explained Explained Sum of SquaresSum of Squares22)(iiiYYeRSS残差平方和残差平方和Residual Residu
43、al Sum of Squares Sum of Squares TSS=ESS+RSS Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分那么来自随机权利(RSS)。 在给定样本中,TSS不变, 假照实践观测点离样本回归线越近,那么ESS在TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS3 3、可决系数、可决系数R2R2统计量统计量 是一个非负的统计量。取值范围:是一个非负的统计量。取值范围:00,11 越接近越接近1 1,阐明实践观测点离回归线越近,拟,阐明实践观测点离回归线越近,拟合优度越高。合优度越
44、高。 随着抽样的不同而不同。为此,对可决系数的随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进展检验,这将在第统计可靠性也应进展检验,这将在第3 3章中进章中进展。展。TSSRSSTSSESSR12二、变量的显著性检验二、变量的显著性检验 Testing Significance of Testing Significance of VariableVariable阐明阐明 在一元线性模型中,变量的显著性检验就是判在一元线性模型中,变量的显著性检验就是判别别X X能否对能否对Y Y具有显著的线性性影响。具有显著的线性性影响。 变量的显著性检验所运用的方法是数理统计学变量的显著性检验所运
45、用的方法是数理统计学中的假设检验。中的假设检验。 经过检验变量的参数真值能否为零来实现显著经过检验变量的参数真值能否为零来实现显著性检验。性检验。1 1、假设检验、假设检验Hypothesis TestingHypothesis Testing 所谓假设检验,就是事先对总体参数或总体分所谓假设检验,就是事先对总体参数或总体分布方式作出一个假设,然后利用样本信息来判布方式作出一个假设,然后利用样本信息来判别原假设能否合理,即判别样本信息与原假设别原假设能否合理,即判别样本信息与原假设能否有显著差别,从而决议能否接受或否认原能否有显著差别,从而决议能否接受或否认原假设。假设。 假设检验采用的逻辑推
46、理方法是反证法。先假假设检验采用的逻辑推理方法是反证法。先假定原假设正确,然后根据样本信息,察看由此定原假设正确,然后根据样本信息,察看由此假设而导致的结果能否合理,从而判别能否接假设而导致的结果能否合理,从而判别能否接受原假设。受原假设。 判别结果合理与否,是基于判别结果合理与否,是基于“小概率事件不易小概率事件不易发生这一原理的。发生这一原理的。2、变量的显著性检验、变量的显著性检验t检验检验),(2211ixN)2(1112211ntSxti用2的估计量替代,构造t统计量11St 对总体参数提出假设:H0:1=0,H1:10 由样本计算由样本计算t统计量值;统计量值; 给定显著性程度给定
47、显著性程度(level of significance),查,查t分分布表得临界值布表得临界值(critical value)t /2(n-2); 比较,判别:比较,判别: 假设假设 |t| t /2(n-2),那么以,那么以1的置信的置信度度confidence coefficient回绝回绝H0 ,接受,接受H1,阐明变量阐明变量X是显著的,即经过了变量显著性检是显著的,即经过了变量显著性检验验 ; 假设假设 |t| t /2(n-2),那么以,那么以1的置信的置信度不回绝度不回绝H0 。在例2.2.1中 可支配收入同消费之间的关系306. 25 . 092.34019. 027340:0
48、:21211101ttSHH原假设:表表 2.1.3 家庭消费支出与可支配收入的一个随机样本家庭消费支出与可支配收入的一个随机样本 X 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 Y 594 638 1122 1155 1408 1595 1969 2078 2585 2530 3、关于常数项的显著性检验、关于常数项的显著性检验 T T检验同样可以进展。检验同样可以进展。 普通不以普通不以t t检验决议常数项能否保管在模型中,检验决议常数项能否保管在模型中,而是从经济意义方面分析回归线能否应该经过而是从经济意义方面分析回归线能否应该经过原点
49、。原点。三、参数的置信区间三、参数的置信区间Confidence Interval of ParameterConfidence Interval of Parameter1 1、概念、概念 回归分析希望经过样本得到的参数估计量可以回归分析希望经过样本得到的参数估计量可以替代总体参数。替代总体参数。 假设检验可以经过一次抽样的结果检验总体参假设检验可以经过一次抽样的结果检验总体参数能够的假设值的范围例如能否为零,但数能够的假设值的范围例如能否为零,但它并没有指出在一次抽样中样本参数值究竟离它并没有指出在一次抽样中样本参数值究竟离总体参数的真值有多总体参数的真值有多“近。近。 要判别样本参数的估
50、计值在多大程度上要判别样本参数的估计值在多大程度上“近似近似地替代总体参数的真值,需求经过构造一个地替代总体参数的真值,需求经过构造一个以样本参数的估计值为中心的以样本参数的估计值为中心的“区间,来调区间,来调查它以多大的能够性概率包含着真实的参查它以多大的能够性概率包含着真实的参数值。这种方法就是参数检验的置信区间估计。数值。这种方法就是参数检验的置信区间估计。1)(P 假设存在这样一个区间,称之为置信区间; 1-称 为 置 信 系 数 置 信 度 c o n f i d e n c e coefficient, 称为显著性程度;置信区间的端点称为置信限confidence limit。2、
51、一元线性模型中、一元线性模型中 i 的置信区间的置信区间)2(ntstiiiPttt()221Ptstiii()221Ptstsiiiii()221T分布为双尾分布(1-(1-) )的置信的置信度下度下, , i i的置的置信区间是信区间是 在上述收入-消费支出例题中,假设给定 =0.01,查表得: 355. 3)8()2(005. 02tnt由于019. 01S45.440S于是,1、0的置信区间分别为: 0.6056,0.7344) -6.719,291.52 显然,在该例题中,我们对结果的正确陈说应显然,在该例题中,我们对结果的正确陈说应该是:边沿消费倾向该是:边沿消费倾向11是以是以9
52、9%99%的置信度处于的置信度处于以以0.6700.670为中心的区间为中心的区间0.6056,0.7344) 0.6056,0.7344) 中。中。 回答:回答: 边沿消费倾向等于边沿消费倾向等于0.6700.670的置信度是多少?的置信度是多少? 边沿消费倾向以边沿消费倾向以100%100%的置信度处于什么区间?的置信度处于什么区间? 由于置信区间一定程度地给出了样本参数估计由于置信区间一定程度地给出了样本参数估计值与总体参数真值的值与总体参数真值的“接近程度,因此置信接近程度,因此置信区间越小越好。区间越小越好。 要减少置信区间,需求要减少置信区间,需求 增大样本容量增大样本容量n n。
53、由于在同样的置信程度下,。由于在同样的置信程度下,n n越大,越大,t t分布表中的临界值越小;同时,增大分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的规范差减样本容量,还可使样本参数估计量的规范差减小;小; 提高模型的拟合优度。由于样本参数估计量的提高模型的拟合优度。由于样本参数估计量的规范差与残差平方和呈正比,模型拟合优度越规范差与残差平方和呈正比,模型拟合优度越高,残差平方和越小。高,残差平方和越小。Ptstsiiiii()2212.5 2.5 一元线性回归分析的运用:一元线性回归分析的运用:预测问题预测问题一、预测值条件均值或个值的一个无偏估计一、预测值条件均值或个值的一个无偏估计二、总体条件均值与个值预测值的置信区间二、总体条件均值与个值预测值的置信区间 对于一元线性回归模型 iiXY10给定样本以外的解释变量的观测值给定样本以外的解释变量的观测值X0X0,可以得到,可以得到被解释变量的预测值被解释变量的预测值0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代理操盘证券协议书
- 临时工厂租赁协议书
- 打造高绩效的乡村中级直播销售团队实施方案及建议书
- 位周边绿化合同范本
- 建筑现场CI管理实施方案详解
- 健身中心运营管理协议书范本
- 小学生信息安全意识培养活动方案
- 电梯维保安全操作规程标准
- 公务员公开选拔(遴选)面试真题及答案2025年
- 现代物流仓储信息化管理系统应用报告
- 次氯酸钠使用安全培训课件
- 【核心素养目标】Unit 3 My School Section B (1a-1d)公开课一等奖创新教学设计 人教英语七年级上册
- 家政服务员清洁家居课件
- 第二十一课 让身体保持最佳状态说课稿-2025-2026学年初中心理健康北师大版2013九年级下册-北师大版2013
- 2025年校服双送检实施方案
- 制造业质量检测流程及异常处理
- 学堂在线 临床中成药应用 章节测试答案
- 2025版海上风电场基础施工合同
- 四年级道德与法治上册:第十课我们所了解的环境污染 第1课时课件
- 小学生冬季校园安全教育
- 枣庄小区停车场管理办法
评论
0/150
提交评论