下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 经典线性回归模型:双变量线性回归模型,回归分析概述 双变量线性回归模型的参数估计 双变量线性回归模型的假设检验 双变量线性回归模型的预测 实例,从2004中国国际旅游交易会上获悉,到2020年,中国旅游业总收入将超过3000亿美元,相当于国内生产总值的8%至11%。(资料来源:国际金融报2004年11月25日第二版) 是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元? 旅游业的发展与这种决定性因素的数量关系究竟是什么? 怎样具体测定旅游业发展与这种决定性因素的数量关系?,引子: 中国旅游业总收入将超过3000亿美元吗?,1. 经济变量间的相互关系 确定性的函数关系
2、不确定性的统计关系相关关系 (为随机变量) 没有关系,一、回归与相关 (对统计学的回顾),相关关系的类型 从涉及的变量数量看 简单相关 多重相关(复相关) 从变量相关关系的表现形式看 线性相关散布图接近一条直线 非线性相关散布图接近一条曲线 从变量相关关系变化的方向看 正相关变量同方向变化,同增同减 负相关变量反方向变化,一增一减 不相关,图3 r = 0.92 图4 r = 0.99,散点图与相关系数 值的对应关系, 和 都是相互对称的随机变量 线性相关系数只反映变量间的线性相关程度,不 能说明非 线性相关关系 样本相关系数是总体相关系数的样本估计值,由 于抽样波动,样本相关系数是个随机变量
3、,其统 计显著性有待检验 相关系数只能反映线性相关程度,不能确定因果 关系,不能说明相关关系具体接近哪条直线 计量经济学关心:变量间的因果关系及隐藏在随机性后面的统计规律性,这有赖于回归分析方法,使用相关系数时应注意,4. 回归分析,回归的古典意义: 高尔顿遗传学的回归概念 ( 父母身高与子女身高的关系) 回归的现代意义: 一个应变量对若干解释变量 依存关系 的研究 回归的目的(实质): 由固定的解释变量去 估计应变量的平均值, 的条件分布 当解释变量 取某固定值时(条件), 的值不确定, 的不同取值形成一定的分布,即 的条件分布。 的条件期望 对于 的每一个取值, 对 所形成的分布确 定其期
4、望或均值,称 为 的条件期望或条 件均值,注意几个概念,回归函数:应变量 的条件期望 随解释变量 的的变化而有规律的变化,如果把 的条件期望 表现为 的某种函数 这个函数称为回归函数。 回归函数分为:总体回归函数和样本回归函数,举例:假如已知100个家庭构成的总体。,回归线与回归函数,例:100个家庭构成的总体 (单位:元),例:100个家庭构成的总体 (单位:元),例:100个家庭构成的总体 (单位:元),例:100个家庭构成的总体 (单位:元),总体回归线与回归函数,实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和实践经验去设定。“计量”的目的就是寻求PRF。 总体回归函数中
5、与 的关系可是线性的,也可是非线性的。 对线性回归模型的“线性”有两种解释 就变量而言是线性的 的条件均值是 的线性函数 就参数而言是线性的 的条件均值是参数 的线性函数,3.如何理解总体回归函数,三、随机扰动项,概念: 各个 值与条件均值 的偏差 代表 排除在模型以外的所有 因素对 的影响。 性质: 是期望为0有一定分布的随机变量 重要性:随机扰动项的性质决定着计量经济方 法的选择,未知影响因素的代表 无法取得数据的已知影响因素的代表 众多细小影响因素的综合代表 模型的设定误差 变量的观测误差 变量内在随机性,引入随机扰动项的原因,四、样本回归函数(SRF),问题:能从一次抽样中获得总体的近
6、似的信息吗?如果可以,如何从抽样中获得总体的近似信息? 例2.2:在例2.1的总体中有如下一个样本,能否从该样本估计总体回归函数PRF?,回答:能,该样本的散点图(scatter diagram):,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线(sample regression lines)。,记样本回归线的函数形式为:,称为样本回归函数(sample regression function,SRF)。,注意:这里将样本回归线看成总体回归线的近似替代,则,样本回归函数的随机形式/样本回归模型:,同样地,样本回归函数也有如下的随机形式:
7、,由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model)。,回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。,即,根据,估计,注意:这里PRF可能永远无法知道。,2.2 双变量线性回归模型的参数估计,一、双变量线性回归模型的基本假设 二、参数的普通最小二乘估计(OLS) 三、最小二乘估计量的性质 四、参数估计量的概率分布及随机干 扰项方差的估计,回归分析的主要目的是要通过样本回归函数(模型)SRF尽可能准确地估计总体回归函数(模型)PRF。 估计方法有多种,其中最广泛使用的是普通最小二乘法(ordinary lea
8、st squares, OLS)。 为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。 实际这些假设与所采用的估计方法紧密相关。,一、线性回归模型的基本假设,假设1. 解释变量X是确定性变量,不是随机变量; 假设2. 随机误差项具有零均值、同方差和无自相关: E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n,异方差,序列自相关,X,假设3. 随机误差项与解释变量X之间不相关: Cov(Xi, i)=0 i=1,2, ,n P23显示Cov的Case:即样本相关系数,假设4. 服从零均值、同方差、零协方差的
9、正态分布 iN(0, 2 ) i=1,2, ,n,如果假设1、2满足,则假设3也满足; 如果假设4满足,则假设2也满足。,注意:,以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(Classical Linear Regression Model, CLRM)。,二、参数的普通最小二乘估计(OLS),最小二乘法产生的历史,最小二乘法最早称为回归分析法。由著名的英国生物学家、统计学家道尔顿(F.Gallton)达尔文的表弟所创。 早年,道尔顿致力于化学和遗传学领域的研究。 他研究父亲们的身高与儿子们的身高之间的关系时,建立了回归分析法
10、。,最小二乘法的地位与作用,现在回归分析法已远非道尔顿的本意 已经成为探索变量之间关系最重要的方法,用以找出变量之间关系的具体表现形式。 后来,回归分析法从其方法的数学原理残差平方和最小(平方乃二乘也)出发,改称为最小二乘法。,父亲们的身高与儿子们的身高之间关系的研究,1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录 企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式 下图是根据1078个家庭的调查所作的散点图(略图),“回归”一词的由来,从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。
11、得到的具体规律如下: 如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”见1889年F.Gallton的论文普用回归定律。 后人将此种方法普遍用于寻找变量之间的规律,复习,复习,复习,最小二乘法的思路,为了精确地描述Y与X之间的关系,必须使用这两个变量的每一对观察值(n组观察值),才不至于以点概面(做到全面)。 Y与X之间是否是直线关系(用协方差或相关系数判断)?若是,可用一条直线描述它们之间的关系。 在Y与X的散点图上画出直线的方法很多。 找出一条能够最好地描述Y与X(代表所有点)之间的
12、直线。问题是:怎样算“最好”? 最好指的是找一条直线使得所有这些点到该直线的纵向距离的和(平方和)最小。,整理得:,复习,复习,复习,复习,复习,线性关系的显著性检验,复习,复习,复习,复习,复习,复习,复习,复习,复习,练习:取0.01做显著性检验,最小二乘法的思路,最小二乘法的思路,纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以称为残差、拟合误差或剩余。 将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。拟合直线在总体上最接近实际观测点。 于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小的问题。,数学形式,最小二乘法
13、的数学原理,纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以又称为拟合误差或残差。 将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。 于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小。,给定一组样本观测值(Xi, Yi)(i=1,2,n)要求样本回归函数尽可能好地拟合这组值. 普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差的平方和,最小。,得到的参数估计量可以写成:,称为OLS估计量的离差形式(deviation form)。 由于参数的估计结果是通过最小二乘法得到 的
14、,故称为普通最小二乘估计量(ordinary least squares estimators)。,例2.2.1:在上述家庭可支配收入-消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表2.2.1进行。,计量经济学与电脑,必须指出,模型的建立和实际使用,离开了电脑几乎是不可能的。 目前,已有很多计量经济学软件包,可以完成计量经济学模型的参数估计、模型检验、预测等基本运算。 几种常见计量软件SAS,SPSS,ET,ESP,GAUSS,MATLAB,MICROTSP,STATA, MINITAB,SYSTAT,SHAZAM,EViews,DATA-FIT。 本课程采用国家教委推荐的
15、EViews进行案例教学。 要求同学们掌握EViews,比较熟练地使用它,并掌握EViews与其它Windows软件共享信息。,因此,由该样本估计的回归方程为:,四、最小二乘估计量的性质,一个用于考察总体的估计量,可从如下几个方面考察其优劣性: (1)线性,即它是否是另一随机变量的线性函数;,当模型参数估计完成,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。 一个用于考察总体的统计量,可从三个方面考察其优劣性: (1)线性性(linear):即是否是另一随机变量的线性函数; (2)无偏性(unbiased):即它的均值或期望值是否等于总体的真实值; (3
16、)有效性(efficient):即它是否在所有线性无偏估计量中具有最小方差。,高斯马尔可夫定理 (Gauss-Markov theorem) 在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。,1、线性性:参数估计量是Y的线性函数,2、无偏性:参数估计量的均值等于总体回归参数真值,3、有效性:在所有线性无偏估计量中,最小二乘估计量具有最小方差。,(2)证明最小方差性,4、结论 普通最小二乘估计量具有线性性、无偏性、最小方差性等优良性质。 具有这些优良性质的估计量又称为最佳线性无偏估计量,即BLUE估计量(the Best Linear Unbiased Estimato
17、rs)。 显然这些优良的性质依赖于对模型的基本假设。,五、参数估计量的概率分布及随机干扰项方差的估计,2. 随机误差项的方差2的估计,2又称为总体方差。,由于随机项i不可观测,只能从i的估计残差ei出发,对总体方差进行估计。 可以证明, 2的最小二乘估计量为,它是关于2的无偏估计量。,2.3 双变量线性回归模型的统计检验,一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间,如果Yi=i 即实际观测值落在样本回归“线”上,则拟合最好。,对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:,TSS=ESS+RSS,记,总体平方和(Total Sum of Squares),回归
18、平方和(Explained Sum of Squares),残差平方和(Residual Sum of Squares ),变差分解的图示,Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。,在给定样本中,TSS不变, 如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS,2、判定系数R2统计量,称 R2 为(样本)判定系数/可决系数(coefficient of determination)。,判定系数的取值范围:0,1 R2越接近1,说明实
19、际观测点离样本线越近,拟合优度越高。,在例2.1.1的收入消费支出例中,,注:判定系数是一个非负的统计量。它也是随着抽样的不同而不同。为此,对判定系数的统计可靠性也应进行检验,这将在以后进行。,R2的其他表示方法,拟合优度(或称判定系数、决定系数),判定系数只是说明列入模型的所有解释变量对应变量的联合的影响程度,不说明模型中单个解释变量的影响程度。 对时间序列数据,判定系数达到0.9以上是很平常的;但是,对截面数据而言,能够有0.5就不错了。,判定系数达到多少为宜?,没有一个统一的明确界限值; 若建模的目的是预测应变量值,一般需考虑有较高的判定系数。 若建模的目的是结构分析,就不能只追求高的判
20、定系数,而是要得到总体回归系数的可信任的估计量。判定系数高并不一定每个回归系数都可信任;,二、变量的显著性检验,回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。 在双变量线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。,变量的显著性检验所应用的方法是数理统计学中的假设检验。 计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。,1、假设检验,所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。,例1:某车间用一台
21、包装机装箱,额定标准为每箱重100kg,设每箱重量服从正态分布,且=1.15,某日开工后,随机抽取10箱,测得重量为(kg):,试在水平=0.05下,检验假设,是否成立?,结论:接受H0,代入样本值计算统计量U的值u,即认为在水平=0.05下,包装机工作正常。,对给定的水平=0.05,查表知:,假设检验采用的逻辑推理方法是反证法 先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。 判断结果合理与否,是基于“小概率事件不易发生”这一原理的,:我们知道,假设检验就是先对总体的未知参数提出某种假设H0,然后再根据小概率事件是否发生作出拒绝假设H0 或是接受
22、假设H0 的。弃真错误的概率即为小概率事件发生的概率。 我们把只关心犯第一类错误而不考虑犯第二类错误的检验称为显著性检验。小概率事件发生的概率称为显著性检验水平。 下面我们学习具体的假设检验方法,复习,0 := 0 (0为已知) 是否成立,注:寻求一个含有(当H0为真时,不含任何未知参数)且分布已知的检验统计量U.,作为检验统计量。,一、方差2已知时,对总体均值的假设检验,、方差2已知时,在水平下,检验假设,对给定的检验水平,由标准正态分布上分位点的定义可知:,为临界点。,能发生的.如果发生了,我们就认为是不合理的,从而,区域W称为H0的拒绝 域,其余的便是接受域,称,由实际推断原则,小概率事
23、件在一次试验中几乎是不可,以上方法称为U检验法。,代入样本值计算统计量U的值u,当u落入拒绝域,时,则拒绝H0 。,就拒绝H0;,就接受H0;,小结:U检验法的一般步骤,(2)选定检验统量:,(4)计算检验统计量的观察值,(5)下结论,接受H0,拒绝H0,(3)对给定的显著水平,确定临界值点 ,使,例1:某车间用一台包装机装箱,额定标准为每箱重100kg,设每箱重量服从正态分布,且=1.15,某日开工后,随机抽取10箱,测得重量为(kg):,试在水平=0.05下,检验假设,是否成立?,结论:接受H0,代入样本值计算统计量U的值u,即认为在水平=0.05下,包装机工作正常。,对给定的水平=0.0
24、5,查表知:,小结:求解具体检验题目的一般步骤,(1)提出假设,(2)选定检验统量,(3)确定临界点,(4)代入样本值计算统计量的值,(5)下结论,2、方差2已知时,在水平下,检验假设,对给定的检验水平,求临界点Z使,H0 := 0 H1 : 0,哪一个成立。,代入样本值计算统计量U的值u,接受H0 .,拒绝H0;,解:与第1种情况类似,作为检验统计量.,例2 某工厂产品寿命XN(,2),正常情况下0=40, 0=2,设技术革新后方差不变,问革新后产品质量较以前是否显著提高?(=0.05),H0 :=0=40 H1 : u0= 40 哪一个成立,对给定的水平=0.05,查表知:,Z0.05=1
25、.645,1.645,拒绝H0,接受H1,即在水平= 0.05下,认为革新后的质量有显著提高.,代入样本值计算统计量的值,技术革新后,随机抽取25只,测得寿命均值,分析: 质量显著提高的含义是寿命均值40.,解:这个问题即在水平=0.05下,检验假设,作为检验统计量.,H0 := 0 H1 : 0 哪一个成立,对给定的水平,求临界点Z使,就接受H0 .,解:与1类似,代入样本值计算统计量U的值u,就拒绝H0;,3、方差2已知时,在水平下检验假设,小结:方差2已知, 对均值的假设检验, H0 := 0 H1 : 0 H0 : =0 H1 : 0 H0 : =0 H1 : 0,假设提法,检验统计量
26、,拒绝域,此方法称为U检验法,参看P143表,二、方差2未知,对均值的假设检验,与方差2已知的情况类似, H0 := 0 H1 : 0 H0 : =0 H1 : 0 H0 : =0 H1 : 0,假设提法,检验统计量,拒绝域,此方法称为T检验法,参看P143表,例1 在正常情况下,某工厂生产的灯泡的寿命X服从正态分布,今测得10个灯泡寿命为: 1490 1440 1680 1610 1500 1750 1550 1420 1800 1580 。问能否认为该工厂生产的灯泡寿命0=1600(=0.05)? (注:此题是第141页例3),H0 : = 0=1600 是否成立,由t分布表查得t0.02
27、5(9)=2.262,对给定的水平=0.05,解: 此题为在水平 =0.05下检验假设,由于方差未知,所以我们选,作为检验统计量.,即认为该工厂生产的灯泡寿命为 = 1600小时.,在水平=0.05下,由样本算得:,接受H0.,代入样本值计算统计量t的值,三、方差2的假设检验,假设的提法,第一种类型的假设检验称为双边检验,第二、三种类型的检验称为单边检验。,当H0为真时,取,(1)在水平下,检验假设,解:考虑到,作为检验统计量.,是否成立?,由于很小,故事件,代入样本值计算统计量K的值k.,是小概率事件.,检验统计量,参看P145表,例1:某种电子元件的寿命X N(,2),合格标准为: 200
28、0, 2 1302,现从一批该种元件中任抽25只,测得寿命均值为试在水平=0.05下,检验是否合格. (注:此题是第145页例6),H0: =2000 H1: 2000 哪一个成立?,拒绝域为:Tt (n1),对给定的水平= 0.05,查表知t 0.05(24)=1.7109,t= 1.689 1.7109, 应接受H0 ,即认为元件寿命不低于2000小时.,作为检验统计量.,解: 此题为在水平= 0.05下,检验假设,H0: 2 = 1302 H1: 2 1302 哪一个成立?,对给定的水平 =0.05,查表知2 0.05(24)=36.415,k36.415,,接受H0 ,即认为标准差不超
29、过130小时.,由以上说明在水平 =0.05下,认为这批元件合格.,在水平在水平 =0.05下,检验假设,作为检验统计量.,用张晓峒P274案例介绍假设检验,例1:某车间用一台包装机装箱,额定标准为每箱重100kg,设每箱重量服从正态分布,且=1.15,某日开工后,随机抽取10箱,测得重量为(kg):,试在水平=0.05下,检验假设,是否成立?,复习,结论:接受H0,代入样本值计算统计量U的值u,即认为在水平=0.05下,包装机工作正常。,对给定的水平=0.05,查表知:,复习,小结:求解具体检验题目的一般步骤,(1)提出假设,(2)选定检验统量,(3)确定临界点,(4)代入样本值计算统计量的
30、值,(5)下结论,复习,2、变量的显著性检验,定理 设两个随机变量x与h相互独立, 并且xN(0,1), hc2(n), 则,复习,推论1 设(X1,X2,.,Xn)是取自正态总体N(m,s2)的样本,复习,此推论的意义在于,复习,推论2 设X1,X2,.,Xn和Y1,Y2,.,Ym分别来自两个相互独立的正态总体N(m1,s2)和N(m2,s2), 则,复习,检验步骤:,(1)对总体参数提出假设 H0: 1=0, H1:10,(2)以原假设H0构造t统计量,并由样本计算其值,(3)给定显著性水平,查t分布表得临界值t /2(n-2),(4) 比较,判断 若 |t| t /2(n-2),则拒绝H
31、0 ,接受H1 ; 若 |t| t /2(n-2),则拒绝H1 ,接受H0 ; 对于双变量线性回归方程中的0,可构造如下t统计量进行显著性检验:,在上述收入消费支出例中,首先计算2的估计值,t统计量的计算结果分别为:,给定显著性水平=0.05,查t分布表得临界值 t 0.05/2(8)=2.306 |t1|2.306,说明家庭可支配收入在0.05的显著性水平下显著,即是消费支出的主要解释变量; |t0|2.306,表明在0.05的显著性水平下不显著,无法拒绝截距项为零的假设。,例 人均鲜蛋需求量Y与人均可支配收入X关系,回归参数的显著性检验:,H0:1 = 0; H1:1 0。在H0成立条件下
32、,,H0:0 = 0; H1:0 0。在H0成立条件下,,Prob=P | t | | t-Statistic | ,检验结果: 回归参数显著不为零。,假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。,三、参数的置信区间,要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数的区间估计。,如果存在这样一个区间,称之为置信区间(confidence interval)
33、; 1-称为置信系数(置信度)(confidence coefficient), 称为显著性水平(level of significance);置信区间的端点称为置信限(confidence limit)或临界值(critical values)。,对区间估计的形象比喻,我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计。(某甲的成绩为被估计的参数) P(1 2 )=大概的准确程度( 1-) 如:P(75 85 )=95%=1-5%,图示如下,双变量线性模型中,i (i=1,2)的置信区间:,在变量的显著性检验中已经知道:,意味着,如果给定置信度(1-),从分布表中查得自由度为(n-
34、2)的临界值,那么t值处在(-t/2, t/2)的概率是(1- )。表示为:,即,于是得到:(1-)的置信度下, i的置信区间是,在上述收入-消费支出例中,如果给定 =0.01,查表得:,由于,于是,1、0的置信区间分别为: (0.6345,0.9195) (-433.32,226.98),复习,复习,复习,复习,复习,复习,复习,复习,复习,复习,复习,复习,复习,复习,复习,由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。 要缩小置信区间,需要 (1)增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还
35、可使样本参数估计量的标准差减小;,(2)提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。 由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。,2.4 双变量线性回归分析的应用:预测问题,一、0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计 二、总体条件均值与个值预测值的置信区间-(选学内容),对于双变量线性回归模型,给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值0 ,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。,严格地说,这只是被解释变量的预测值的估计值
36、,而不是预测值。原因: (1)参数估计量不确定; (2)随机项的影响,说 明,二、总体条件均值与个值预测值的置信区间,1、总体均值预测值的置信区间,由于,于是,可以证明,因此,故,于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为,其中,2、总体个值预测值的预测区间,由 Y0=0+1X0+ 知:,于是,式中 :,从而在1-的置信度下, Y0的置信区间为,在上述收入消费支出例中,得到的样本回归函数为:,则在 X0=1000处, 0 = 103.172+0.7771000=673.84,而,因此,总体均值E(Y|X=1000)的95%的置信区间为: 673.84-2.30661.05 E(
37、Y|X=1000) 673.84+2.30661.05 或 (533.05, 814.62) 同样地,对于Y在X=1000的个体值,其95%的置信区间为: 673.84 - 2.30661.05Yx=1000 673.84 + 2.30661.05 或 (372.03, 975.65),总体回归函数的置信带(域)(confidence band)-教材P120 个体的置信带(域),对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):,(1)样本容量n越大,预测精度越高,反之预测精度越低; (2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其
38、均值,置信带越宽,预测可信度下降。,例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系,yF 的点预测与区间预测:(演示EViews操作),Y1999的点估计值:Y1999 = 10.77 + 0.005069 1863 = 20.21 Y2000的点估计值:Y2000 = 10.77 + 0.005069 1983 = 20.82,(file: li-2-1),2.5 实例:时间序列问题,一、中国居民人均消费模型 二、我国固定资产投资总额与GDP的关系,一、中国居民人均消费模型,例2.5.1 考察中国居民收入与消费支出的关系。,GDPP: 人均国内生产总值(1990年不变价) CONSP:人均居民消费(以居民消费价格指数(1990=100)缩减)。,1. 建立模型 拟建立如下双变量回归模型,采用Eviews软件进行回归分析的结果见下表,该两组数据是19782000年的时间序列数据(time series data); 前述收入消费支出例中的数据是截面数据(cross-sectional data)。,一般可写出如下回归分析结果:,(13.5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《GB-T 31297-2014 TC4 ELI钛合金板材》专题研究报告
- 《GBT 33534-2017 失业登记管理服务规范》专题研究报告
- 宜宾编制考试题库及答案
- 会计面试题集及答案解析
- 广州建筑暖通工程师面试题集
- 2025年绿色金融产品创新与发展可行性研究报告
- 2025年农业机械化推广项目可行性研究报告
- 2025年社交媒体营销效果评估平台项目可行性研究报告
- 2025年数字媒体艺术创作项目可行性研究报告
- 2025年电子政务服务平台建设项目可行性研究报告
- 广东深圳市2026届化学高三第一学期期末学业质量监测模拟试题含解析
- 电力公司考试大题题库及答案
- 国企金融招聘笔试题及答案
- 重庆市金太阳好教育联盟2026届高三10月联考(26-65C)英语(含答案)
- 成都市龙泉驿区卫生健康局下属15家医疗卫生事业单位2025年下半年公开考试招聘工作人员(18人)备考考试题库附答案解析
- 2025-2030中国光纤分布式测温系统市场需求预测报告
- 因甲方原因造成停工的联系函示例
- 急救药品物品使用规范与操作流程
- 煤矸石填沟造地综合利用项目规划设计方案
- 财税SaaS助力小微企业降本增效2025年实操指南
- 储能电站施工培训课件
评论
0/150
提交评论