




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Comment y1: 选取变量时背后有很严密的逻辑。Kidslt6 与 kidage6这两个变量的选取是为了考察其对工资是否显著Comment y2: 为什么要加上 0?(确保回归线不用非得穿过原点;水平的变化的总效应反应为 0;一般情况下如没有特殊要求,为了消除水平变化的总效应需要设定一个 0,这样没有任何坏处。2、 加 exper2是什么意思?(数学上:回归线可以不一定是线性的;经济学意义上:exper 的不可忽视的正的外在性作用,用平方比较简单明了)3、 工资前面为什么取对数?(两边求导 wage/wage= k Xk能比较容易得出增长率的变化)Comment y3: 要求命题的表述越清楚、目的越明确越好Comment y4: 此处为单调变换?1Ch1.传统观点下的多元线性回归模型回顾1. 问题的提出我们认为,要关注的结果 与 个因素有关, 。 (其中 是截距YK01,kX 01X项,一个量纲标准化的单位指标,它消除 加上常数 平移的影响,即凡是对 Y产生水平ic效应的因素都纳入到 中。 )例如:已婚工作妇女的工资 (log wage)与工作经验0XY(exper ) 、工作经验的外在性作用( ) 、受教育程度( educ) 、该妇女的年纪(age) 、2expr家庭少于 6个孩子(kidslt6)以及家庭中孩子至少 6岁以上的个数(kidage6 )有关,并建立如下的模型: 2013456log()waerducagekidsltiageu对上述模型,我们做如下说明:a. 关于命题:1. 要关注的结果 :已婚工作妇女的工资。一般的讨论工资是理论问题,而讨论已Y婚工作妇女的工资则是计量问题。计量后面可以说明说明是经济解释,它可以是多种多样的。2. 影响结果的因素 :自身的经验、教育、年令和孩子的年龄与多少,其中还有自X身经验正的外在性作用。注:1.结果与哪些因素有关不是绝对的,例如在中国影响工资的一个重要因素是所在行业,另外城市、农村和社会关系的背景也是不可忽视的,等等。命题与你的目的和知识相关,并且命题要求表述得越清楚越好。b. 关于模型:模型是命题的数学表达,是命题的深化、细化和抽象化。从命题到模型是一个不断提炼的过程。建立一个“好”的模型,取决于我们对命题认识的深入程度和相关知识的储备。一般而言,多元线性回归模型的基本框架是:假设 与 有因果关系。Y12Xk如果观测的数据来源是: ,且存在单调连续函数,使得:1,mYZ, , 。()Yf()Xg 1,()KmgZ 那么,定义多元线性回归模型: 。01k即: ,称 是关于未知参数01(),mkfZ Y的多元线性回归模型。这里 是随机误差项, 称为解释变01k 1kX量,是确定性变量,有经济含义。 称为因变量或被解释变量。Y线性模型的类型主要有:21) 多项式模型: 201kYXX或 2312例如,库兹涅茨倒 U 形曲线和拉弗曲线等。2) 对数线性模型: 01lnlnlnkY(增长率之间存在因果关系,例如生产函数。 )3) 倒数线性模型: 01kX或 01kY(因果呈反向关系,如菲利普斯曲线)4) 指数线性模型: 01lnk(原因是影响增长率的因素,例如上例)5) Logit 线性模型: 01l lnkYX(因果呈慢,快,慢的变化趋势,并有饱和)如图:6) 虚拟变量(Dummy Variable)模型:解释变量 中有些变量变化是“不均匀”的,观测数据在不同时段或不同地区1kX不同行业或不同政策等之下有明显不同的特点。在散点图上,表现为某个解释变量或整体上与因变量有跳跃或转折现象。如图:3解决办法是引入虚拟变量。它是针对某些解释变量的“不均匀”而设。设 D 是虚拟变量,则 D 描写的是一种状态,只取 1 或 0 为值。1 表示受到某种因素影响,0 表示没有受到影响。例如: 中,截距受到影响,D 对 Y 有整体影响。011kkYX又, 中, 的斜率受到了影响,即01 1lkklX lD 对 的影响导致对 的影响,影响斜率。lXY例如,在上例中对已婚妇女的工资可引入行业的虚拟变量。1 国有企业,0 非国有企业。注:1。如果 的影响是时间特征,则不宜采用虚拟变量。且虚拟变量不宜大量采用。 l2经过变换后的数据,参数 的含义是不一样的。例如 , 就是增长率变化的lnXZ边际效果,又如果 ,则 就是弹性系数。lnY3模型设定是一个非常“艺术”化的东西,准确的设定模型,合理的选择变量,能使模型反映的经济意义更细致、更明显、解释力更直接。这是一门需要在实践中不断摸索和积累的“艺术” 。以后,我们总假定从命题到模型可以标准化为如下形式,简称为基本模型: 01kYX建立该模型的基础理论我们在第二章中说明,要提醒的是,不是所有因果关系都可以写成上述的多元回归模型的形式。2. 传统观点下基本模型的假定基本模型是因果关系最简单的量化表述。形式上它由两部分构成,一部分是确定性关系,由 表达;另一部分是不确定性关系,由 表达。其中01kX 是未知参数,在不同的模型假定中有不同的内在含义。一般, 指01,k kYX的是因素 对结果 的边际贡献, 没有特定的经济含义,它是各种水平因素的总效应。kY04关于解释变量 ,传统观点假定 是确定性的变量,而且对 的1kX 1kX 1kX观测是准确的,对 没有任何随机性影响。因此,任何两个或多个解释变量之间没有线性Y相关关系,且解释变量和误差项也没有线性相关关系。这种传统观点蕴含着对解释变量是可控的,甚至样本的观测也可是预先已知的。因此,没有必要考虑估计和检验的渐近性质。假设我们可以对 观测 N 次,把所有观测排成一个 矩阵(加上常1kX 1NK数截距项) 。 11(1)kNkNKx 称 为观测矩阵。X那么,对样本观测矩阵传统观点假定, (1)秩 ,即列满秩。且(2)X。cov(,)0,1iik注:从样本意义上看,列满秩不意味样本协方差 仅是要求解释变量不是cov(,)0,ij完全线性相关的。且 不意味它们就没有其它的非线性关系。又因为 是任cov(,)0iX K意正整数,以后任意 与任意 不加区分。K1关于误差项 ,随机并不是全部无知,这里随机项反映的是环境和各种不可预料的因素对 产生的影响。因为解释变量是可控的,可以认为随机误差 不影响 ,且对 的影Y XY响是一个小量。又模型一般设定有中心化常数项,各种不可控的水平(平均)影响都可放到常数项上。故可设 , , 一般情况下是未知的。传统观点进()0E2var()02一步假定, 。所以抽样后 服从多元正态分布, 。2,iN1in 2(0,)NI关于样本统计量,对解释变量 进行 N 次观测得到的值就是样本。 的kX 1kX的抽取传统观点假定是独立的,而事实上在许多情况下,独立性往往办不到,样本有时有群集效应、层次效应、串效应,有时为了某种特殊目的会有意识的选择相关的样本,等等。这些特殊样本的问题正是计量经济学要面对的问题,数据是什么样就是什么样,是不能随意假定的。我们将从第二章开始在现代观点下介绍处理各种特殊样本的方法。显然,抽取的样本越多, 与 的关系表现得就越明显。但是若不对样本进行整理加工,大量Y1kX数据的堆积并不能看出 与 之间的因果关系。我们需要对样本做一些加工,提炼1k出某些有用的信息,这些信息称为样本统计量或样本函数。下面是一些直接常用的样本统计量。给样本值 ,定义:11(,),(,)NNxy 5(1)样本均值 1(/)niix(2)样本方差(样本标准差的平方) 221var()()niixx(3)样本协方差 1(,)()2niicovxyy样本相关系数 1/2,()xyar(4)样本 k 阶矩 1nkkiA,(5)样本 k 阶中心矩 1()nkkiiBx1,2(6)样本顺序统计量 和极差统计量(1)(2)()nx ()(1)nx(7)偏度 3AsnB(8)峰度 41(9)中位数 n 为偶数,或 n 为奇数()2x+1()2x随着问题的不断深化,特别在假设检验中,我们将引入更多的样本统计量。最后,简单提一下有关样本大数定律和几个重要分布。如果 和 分别是取自母体 的独立样本,那么当 ,由大数律,1nx 1ny ,XYn, , , ,EX()var()(,)cov(,)cvxyKkAEX等等。kkB三个与正态样本相关的统计分布是:1) 分布2()n独立,则 ;0,1iXN,in 21()niiX2) 分布nt6且两者独立,则 ;(0,1)N2()n/()nt3) 分布Fnm且两者独立,则 。2()2()n/(,)mFn3. 基本模型下的基本问题多元线性回归模型的任务是:通过样本,1)给出未知参数 和 的估计;1k 22)给出有关 及其相关线性组合和方差 的统计检验。 21.估计问题的提法任意取定观测矩阵 和因变量观测值 ,设 为样本XY1(,)ny (,)XY的函数。称 为 的拟合值, 为残差值(残差向量) ,,XY为残差平方和。问题的提法是什么样的样本函数能使得221()niiRSy残差平方和最小?即 ?(注:也用 SSR 表示残差平方和)mkRS2. 的求解1()()2(),)kYXXff:这是一个多元函数求极值的问题。欲使 RSS 极小,则一阶条件 是:()FOC。1()()0()kfff是一个 对称矩阵,且XAX1kijjia7。,1112kkktjititjtXaa1,tk。 。121 kikikiaXX 1()20kfXY, 是正定矩阵。(为什么?)()rankX。)()rkrankX可逆, 。称其为 的普通最小二乘估计,记成 。1YOLS最小二乘法 的几何意义:( o)把 理解成 N 维向量空间中的向量,向量 张成一个01,kYX 01,kX维子空间 K,最小二乘就是将 Y 投影到 K子空间上,并有 ,其中 Y, 。如图:注:用样本函数拟合 ,使残差平方和 最小只是一种标准,它的直观意义是明显的。YRS但我们也可以选择另外一种标准,如使残差绝对值的和最小,即: ,求 。1minNiy从技术上讲,我们还可以找一个多项式 ,把所有样本光滑的连接起来。但01,kPx是这个多项式的系数就没有太多的经济意义。例如给样本 则存在1,nnxy 次多项式 使得 。真正有意义的拟合和评价标准是建立在1N()Px()iiyxn概率统计意义上的, 有许多好的统计性质。OLS3. 的统计性质(1) ,根据正态分布的线11 1XYXX 性变换定理: ,则 。由 ,故得:,N:(,)AbNA:20,NI:8。1121210,()()(0,()NXNXIXX:。112 2, ,。1()()EE111122covEXXXXI是 的无偏估计,且是 的线性函数,服从正态分布。(2)记 ,则 。对 ,设 ,则 代表了 的任一线性1AXAYkNBbY估计。改写 ,kNBC那么, 。bYXCXAC。如果考虑让 是 的无偏线性估计量,则必须有EXEb,对于所有真值 都成立。其充要条件是 。因此满足C0, 就代表了 的任一线性无偏估计量。0bBYA2covbEbEbCACA , 故 。0X01111CXXC 。1222covcovb注意到 是一个半正定矩阵,所以主对角线上元素 。C 0当且仅当 时, 方差最小。 (其中 是 中对角线上第 个元2varii iv1Xi9素)这就是说,在真值 的所有线性无偏估计类 中,:,LUEbBY具有最小方差属性,即 是有效的。OLSOLS综上所述, 是无偏线性估计类中的有效估计。 (此称为高斯马尔科夫定理)注:1.对有偏的估计类, 不一定是有效的。如存在多重共线性,又不能剔除解释变量,常采用岭回归,牺牲无偏性提高有效性。2.除了无偏性、有效性外,还有一致性、稳健性等许多其他有统计意义的标准。在不同模型和要求下有特殊的意义。传统观点由于样本 固定,一般不考虑一致性。这是与现N代观点最大的区别。3 的极大似然估计在基本模型假定下就是 。 (习题) OLS4. 的无偏估计及统计性质2我们用命题的形式陈述有关未知参数 的估计和性质,已备后用。2命题 1: 是未知方差 的一个无偏估计。2 1 NiiSyK2又 称为标准差。21 iiseN证明: 1 1YXXXM ( )容易验证, 且 。 是一个对称幂等矩阵。1MIM2M有性质,特征根为 0 或 1。 。221 12 22 NN KEEtrtrtrIXtItXtrt rIK 。命题 1 得证。21EE命题 2: 服从自由度为 的 分布。N2证明:由命题 1 知 ,M10。222MM对称幂等, 。ranktrNK的特征根 1 的个数为 。又 为实对称阵的,必可正交对角化,存在正交矩阵 ,使得 成立。Q0NKIMQ令 则 。 独立服从标准正态分布。0,I:1N(1)(1)(2) ()1200NKNKIIQ 这是 个独立标准正态分布之平方和。由 分布的定义,NK。命题 2 得证。2()2NKS:命题 3: 与 的分布独立。实质是 与 独立。证明: , 。M1X与 都是 的线性函数,故 和 都服从正态分布。 由多元正态分布的性质知, 和 相互独立当且仅当 。事实上,cov,01 112 cov, 0EEMXMXI 与 独立。又 是 的连续函数, 与 独立。命题 3 得证。 把前述内容用框图示意如下:114. 关于假设检验请看例:例:假定 ,观测样本为 。,1XN:1,nx, 。令 ,0:1H0.0用 估计 ,并构造样本统计量 。x1,nSxx有 。如果命题 为真,则 。,nN0:H10,nN:查表得 。当 拒绝 ,认为 不对,否则不能拒绝 。/2/2nx0H进一步, , 未知。2,X:同样用 估计 ,x12估计 。如何构造统计量 ?221niix221,nSx2221 0, ,/ 1.1()nNnxxtn:所以,若命题 真,则统计量 。查表得临界值 。当0H0(1)xTt:/2t时,拒绝 ,否则不能拒绝 。/21xtn00H所以,假设检验问题的关键是:1) 根据问题巧妙建立模型,恰当提出假设命题;2) 寻求样本统计量,给出命题真时的统计分布或渐近分布。其实,假设检验的思想很简单,困难在于找到合适的样本统计量在命题真时的统计分布。一般情况下,假设检验的命题常常归结为某个参数为零或部分参数为零的检验或未知参数线性组合的检验。此时,我们就可以直接应用数理统计中的结论。1、为什么要检验?模型中有大量的假定,这些假定是否合理?这些假定包括,变量的选择是否合理,随机误差的设定是否恰当,还有变量与误差不相关是否成立?等等。我们可以把这些假定归结为一些对未知参数的判断,如果这些判断基本正确或错误,那么从数据中就能够反映出来。假设检验是估计完成后对模型的设定做进一步的确认。拒绝原假设,意味着命题真时犯错误的可能性可控制在一定的范围内。事后评价,模型中的假定是否合理?完成估计并不能说明模型就是正确的,需要通过估计来验证模型中的某些设定能否得到数据的支持。2、统计检验二类:1、参数检验,分为单参数检验和整体检验; 2、分布的检验(图形的检验,相对不重要) 。3、目的:有经济意义下的检验 统计检验 对参数的检验。4、 “程序”:提出命题 “文字表述” 参数的假设检验形式。其中 是参数空间, 和 是 子集。备择命题是拒绝0011:,:H01时 所在的区域。 (注意, , 的选取会影响联合分布的形式从而影响011统计量的分布。 )一般原命题 , 取确定的判断值 , ( 有内在含义。 )00013是 的否定。1H0假设检验命题需要回答:“在什么条件下拒绝 ?”0H检验的思路:如果有了估计 ,有了 的分布,如果估计准确, ;如果判断,准确, 应当是一个“小量” (即小概率事件) ,那么,小量如何测量?0注意,估计 是样本的函数,但估计 的分布则可能含有未知的参数,如, 。1XY21,()NX如果在已知 和 的前提下,能找到样本函数 (这是随机变量) ,0(,|)SXY并已知其分布,那么, 真 成立 的分布已知。于是,给一个概率H0)值 ,并由 的分布函数或密度函数求得临界值 。如图:01(,)SXY14给出标准,当 拒绝 ,单边检验。(,)SXY0H或 ,拒绝 ,双边检验。2什么意思?“从 拒绝 ”我们知道如下信息:与小量 有关的样本函数(,)SXY0 超过了临界值,且这个小概率事件发生的概率最多是 。这等价于说 P(拒绝, | 真) )(,)SXY P 值 (或 P 值 临界值 ”,拒绝 是证否的。(,)S0H基本模型 二类最重要的检验:YX1、 单参数 的检验, 是不是影响 的原因。0i iY2、 整体 和部分参数为 0 的检验,含义是整体上或部分整体上 或2.k X部分 是不是影响 的原因。X假设检验在技术上的难点:1、 命题真,构造样本统计量,并确定其分布或渐近分布(现代观点) 。2、 基于回归方法的检验。找到一种建立在回归方法基础上的检验方法,而不是直接给出样本统计量。172.基本模型下的假设检验1) 的单参数检验是否可以解释 的变化,或者说它们是不是 的原因?相应的假设检验命题是:KX YY。 ( 为截距项的参数。 )01:02,i iHiK 1,2,N其中 是 中对角线上第 个元素。iiivi1Xi。20,1ii:假设命题真 ,则 。但是 未知,这还不是一个样本统计量。i20,1iNv:2又知, ,且与 独立, 。222NKS i,iK由 t 分布的定义服从自由度为 的 分布。22/iiivTtSNK:Nt记 称为 的标准差,则 。给显著性水平 ,查表得临界值iiseSvi itK 。则 就拒绝 ,否则不能拒绝 。拒绝 意味着 在*2tNK*2itNse0H00HiX统计意义上可解释 的变化,称 统计显著。YiX注:1. 检验是基本模型必须进行的检验。不能拒绝 意味着 作为解释 的原因实际t 0iXY意义不大;但拒绝 并不意味着 作为解释 的原因意义一定就大,尤其 值较小时,0HiYP即 但接近 ,需要作进一步的分析。P2. 单参数假设检验与区间估计是联系在一起的。不能拒绝 的概率含义是:0H18。即, 的概率为 。/2 1iPtNKse* /2/2i ii iitStS1称此为置信区间。所以, 的标准差 越大,越容易接受 ,但估计精度却降低。同iise0H时,注意到,如果未知方差 是已知的,由 分布的尖峰胖尾性质,故临界值比方差已知2t时要更远离 0 点些, 更容易被接受。这说明,信息越多(方差已知) ,满足命题的要0H求越严。例如,已知 和估计 比较,估计 命题 更难被拒绝。21220H2) 的整体性检验每个 统计显著,并不意味着 整体上对 的影响显著。某些 的作用有可i 2KX YiX能相互抵消。于是我们需要检验, , 至少有某一 不为零。或0:0H 1:Hi, 至少有某一 不为零。即整体参数为 0 和部分参数为 0 的检10:0liiH 1:li验。还有,某些参数 要满足一定的制约关系。例如,生产函数一次齐次假定:i。我们需要检验 ,01212lnlnl,YKL012:H,等等。12:H我们可以把上述的检验统一归结为有关判断未知参数 的线性方程组的形式:。其中 是一个 矩阵, , 是 向量。例如推断CqrKrankCrq1,相应的 。又如推断 ,则相应的21K 0,1, 0l( )等等。01lK 1lq注:未知参数 的非线性推断和有关未知方差的推断不在讨论之列。如推断等等。22K问题:如何检验 ?01:,:HCqq显然,采用 检验的方法不行了,依假设检验问题的提法,我们需要找到当命题 真时的t 0H19样本统计量及其分布。从假设检验的理论知,要对 进行检验,先要对 有0:HCqC一个估计。自然,用 估计。C,由正态随机变量线性变换定理,12,NX:。12,covECCX命题 4: 的二次型 服从自由度为 的 分布。1covWEEr2我们一般的证明, , ,则 。,pXN:rank1nX:, 正定。 且 可逆。 。covPP1 111X 1110, 0, 0,PXNNNI :服从标准正态分布,且分量独立。 。1 12nX:将 代入立得 的二次型 服从自由度为 的 分布。,cov,EWrr的分布尽管已知,但含有未知参数 ,故还不能成为样本统计量。W2注意到命题 2, 服从自由度为 的 分布。故221NKSMNK2与 都服从 分布。若它们彼此独立,由 分布的定义,我们就可以得到2S2F一个重要的 统计量:F12cov/EErNK。12,CqXCqSrFNK :命题 5: 的二次型 与 相互独立。W2NKS20证明: 1covWEE1CC CP()(ACP,其中 。1AX又知 。22NKSM只要证 与 相互独立。又由于 与 服从正态分布,PCPCA只要证 。事实上, ,cov,0A110XIX。命题 5 得证。2,EEMPCA3. 的统计意义F假设检验 ,如果命题 真,那么模型的实质就是:0:HCq0H,于是 方法在命题真下的实质是: 。.YXstOLSmin.RSstCq我们知道,在无约束条件下的 估计为 ,那么有约束条件下的 估计 是什OL*么?采用拉格朗日乘子法: min2LYXq。20CqXCY, 代入到 中,得:11()()XY1()Cq,1 ()CqCXC ,1。11* X q为约束条件下的残差向量,*YXX 21为约束条件下的残差平方和。* 0RSX(注意: ) ,又注意到统计量 的表达式,0XYW* * S 1 111 CqCXXCCq 。再由命题 4,最后得:12XqW。*2 2/ ,/RSrWrrFNKNK :所以, 统计量的统计意义是:F命题 6:有线性约束条件下的 与无约束条件下的 的残差平方和所构成的残差*OLSOLS形式的样本函数服从 分布:。* ,/RSrFFNK:特别,当约束条件为 。意即 所选解释变量 整体230 0:H2KX与 没有因果关系。那么,原模型 实质变成: , ,YYX1YJ。 ,*1yn * 2 1niiRSJyyTS,*RSTSE, 。/1/1EKNKNR21,RNKFFNK:这就得到了传统的拟合优度(决定系数) 与 统计量的关系。可以看出, 是 的增2 2R函数,是 的减函数,且 。所以, 大致反映了原因 整体上能2,22KX否解释结果 。Y一般来讲,一个多元回归模型 可以标准化为:YX 10()() ()kseseX , , (有含时数据时用于检验序列相关性。 ) 。22 Ror2SDW22注:假设检验通过,即每个 都统计显著,且 并不能说明这就是一个好的回归模i20.6R型。甚至有可能是伪回归。 (犯第二类错误概率很大)但若某些 统计不显著, 或 统i2RF计量偏小,DW 值不接近 2,那么这个回归模型肯定有问题。 (通俗地说, “发烧”肯定病了, “不发烧”不一定就没有毛病。 )4. 检验的应用F检验有广泛的应用。这里仅举几例:1)参数 的稳定性检验设同一模型,有两组独立不同的观测:设有 N 次观测; 设有 M 次观测。11YX22YX问:不同的独立观测对参数的估计是否有影响?即,原因对结果的定量关系是否稳定。相应的假设检验问题是:即( ) , 至少有一个 。如何检验?01:,KH 1:Hii构造模型,令 ,12Y120X2得到 ,取 ,X1KKCIq则 ,且 。 得 统计量:rank10KF。11 12, ,K KCXFS 这里 是 , 。OLS2NM知: ,FK:给水平 ,查表得 ,当 不能拒绝 ,表示原因对结果的定量关系 是稳定F0H的。于是,可以将两次独立观测联合起来,构成更大的样本观测矩阵 ,从而得12X到更精确的估计 。拒绝 ,说明两组观测有差异。我们在后面的面板数据中讨论。OLS023特别,如果设定模型为:有 次观测; ; 有 次观测。11Yn LLYn构造 。 得 。L1LnnX 1L1LYX至少有某一 。01:H 1:Hj适当选取 和 ,做 检验。这就是单因素方差分析的内容。不能拒绝 意味着因素不CqF 0H同水平 对结果没有显著影响,拒绝 意味着至少有一个水平对结果有显著性影响。L 02)异常点的检验模型 中,如果残差向量 有某些分量 的残差 与其它YX1lIi 1lii的分量相比相差很大,我们就称观测 为异常点(观测) 。如何检验数据是否异常?,IXY分析:如果认为残差 很大,那么就有理由认为模型 设定不对,IIYIIIYX也就是 。故设:IIEX iii iibIY表示 中的第 行, 是常数,意味着测量中其他因素造成的一种实质性的偏离。i i将 和 按行进行适当的排列,可以构造模型:iiX。0JJIIY要判断 是不是数据异常点,相应的假设检验就是:,IX。01:0H这就归结为模型 中 的系数部分为零的检验问题。故采用 检验。这里,YF的自由度?请学生自己考虑。?CqF但这里更方便的办法是:(1) 对 做 得 和IIYXOLS*R24(2) 对 做 得 和YXOLSR然后采用 统计量的残差平方和形式, 做检验。F*SlFNK注:1.一般异常点的数据量不宜太大,新构造模型的实质是把被怀疑的观测部分作为虚拟变量处理。2.拒绝 ,认为 是异常点还要具体问题具体分析。此时要特别细心,善于从差异0H,IXY中找到问题的原因所在。3)模型设定的偏误检验建立模型时,如果加入了不必要的解释变量,可以直接通过 检验和 检验将它们排tF除。但是,模型中一些该引入而没有引入的解释变量如何知道?办法是,加入一个或一些“替代变量”到模型中去。如果这些替代变量可以通过 检验和 检验,则可判断该模型t遗漏了某些解释变量,称为 RESET 检验。“替代变量”一般选择 的拟合值 的非线性多项式或其它函数形式。这可以通过YX残差 与 的散点图来大致判定。例如:建立模型为 23121KY如果参数 和 能通过检 验和 检验。则说明模型遗漏了某些应加入的解释变量。这是12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年航空货运包机运输绿色物流服务标准合同
- 2025年电网升级改造电力设备研发与采购专项合同
- 2025年度绿色能源项目专利技术授权合同
- 2025年生物制药创新成果转化合作保障协议
- 2025年重型机械跨国运输及安装服务长期合同
- 2025年中老环保技术研发与产业合作框架协议
- 2025年绿色建筑楼体广告创意制作与环保标准执行合同
- 2025医院附属职工宿舍租赁及维修保养服务协议
- 2025年度电商行业知识产权保密合作协议范本
- 2025高性能医疗器械研发及全球分销与售后保障服务协议
- 高速考试题目及答案
- 眼内炎护理疑难病例讨论
- 门球场管理制度
- 2025年云南省中考物理模拟练习试卷(含答案)
- 理发店消防安全制度
- 食堂火灾应急预案
- 封闭式循环水工厂化养殖项目可行性研究报告模板
- 中医治疗眼病的技巧
- T-HAS 141-2024 合成超硬材料用叶蜡石
- 2025年商业物业管理授权协议书模板
- 劳务外包服务投标方案(技术标)
评论
0/150
提交评论