第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题.ppt_第1页
第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题.ppt_第2页
第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题.ppt_第3页
第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题.ppt_第4页
第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题.ppt_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 MultipleRegressionAnalysisP289多元回归分析之模型设定和数据问题 y b0 b1x1 b2x2 bkxk uSpecificationandDataProblems模型设定和数据问题 2 ChapterOutline本章大纲 FunctionalFormmisspecification函数形式误设 讨论模型误设的结果 P289UsingProxyvariablesforunobservedexplanatoryvariables对观测不到的变量使用代理变量 讨论用代理变量来减轻有偏性PropertiesoftheOLSUnderMeasurementError有测量误差的OLS性质 推导和解释MissingData NonrandomSamples andoutliers数据缺失 非随机样本和离群点 讨论额外的数据问题 3 FunctionalForm函数形式 Howdoweknowifwe vegottentherightfunctionalformforourmodel 我们如何知道模型是否得到正确的函数形式呢 P289 异方差的出现可以看成是模型的错误设定 但不影响有偏性和一致性 还可以通过WLS来减轻 本章讨论u与xi的相关性 如果相关 称xi为外生变量 为什么 当被忽略的自变量为其他变量的函数时 将产生函数形式误设这一问题 何谓函数形式误设 4 FunctionalForm continued 函数形式 续 First useeconomictheorytoguideyou首先 用经济理论的指导Thinkabouttheinterpretation考虑它的解释Doesitmakemoresenseforxtoaffectyinpercentage uselogs orabsoluteterms x影响y的更合理的方式是百分比的形式 用log形式 还是绝对量的形式 Doesitmakemoresenseforthederivativeofx1tovarywithx1 quadratic orwithx2 interactions ortobefixed x1的系数更合理的形式是随x1变化 二次形式 随x2变化 交互作用 还是固定不变 P290 2个误设案例 一个是忽略了二次项 一个是忽略了交叉项 也可能是没有用LOG形式 回顾第三章P85假设3不成立的几种情况 函数形式误设的后果P290EXP 9 1 阅读 5 FunctionalFormMisspecification函数形式误设 Amultipleregressionmodelsuffersfromfunctionalformmisspecificationwhenitdoesnotproperlyaccountfortherelationshipbetweenthedependentandtheobservedexplanatoryvariables 当一个多元回归模型不能正确地说明被解释变量和观察到的解释变量之间的关系时 此模型存在函数形式误设问题 6 FunctionalFormMisspecification函数形式误设 Misspecifyingthefunctionalformofamodelcanhaveseriousconsequences Wemayobtainbiasedorinconsistentestimatorsofthepartialeffects 误设一个模型的函数形式可能产生严重的后果 我们得到的局部效应的估计量可能有偏或不一致 Onewayout toaddquadratictermsofanysignificantvariablestoamodelandtoperformajointtestofsignificance 一种方法 向模型加入任何重要变量的二次项 进行一个联合显著性检验 加入二次项 对二次项系数联合显著性F检验通过时 显示的症状往往是误设 如误将对数模型为水平模型 另外经济数据中 二次项可以解决大部分非线性问题 P290 7 Example ModelingCrime例子 对犯罪建模 P292 Dependentvariable 被解释变量 Narr86 timesarrested 1986 1986年被捕次数 ExplanatoryVariables 解释变量 pcnvproportionofpriorconvictions以前被定罪比例avgsenavgsentencelength mos 平均判刑期限 单位 月tottimetimeinprisonsince18 mos 18岁以来的服刑时间 单位 月Ptime86mos inprisonduring19861986年的服刑时间 单位 月 解读 1 为什么加入二次项 因为水平项T检验很显著 2 加入变量的二次项后 原先的水平变量系数变化很大 同时二次项联合F显著 3 二次项加入 模型的解读变得困难 可能有更深刻的实际意义 8 Example ModelingCrime例子 对犯罪建模 Explanatoryvariables解释变量Qemp86 quartersemployed 19861986年被雇佣季度数inc86legalincome 1986 100s1986年合法收入 单位 百美元black 1ifblack如果是黑人 black 1hispan 1ifHispanic如果是西班牙裔 hispan 1First weregressthedependentvariablesontheindependentvariables withoutanysquareterms 首先 我们将被解释变量向解释变量回归 不包含任何平方项 9 regnarr86pcnvavgsentottimeptime86qemp86inc86blackhispanSource SSdfMSNumberofobs 2725 F 8 2716 26 47Model 145 390104818 173763Prob F 0 0000Residual 1864 957052716 686655763R squared 0 0723 AdjR squared 0 0696Total 2010 347162724 738012906RootMSE 82865 narr86 Coef Std Err tP t 95 Conf Interval pcnv 1332344 0403502 3 300 001 2123546 0541141avgsen 0113177 0122401 0 920 355 0353185 0126831tottime 0120224 00943521 270 203 0064785 0305233ptime86 0408417 008812 4 630 000 0581206 0235627qemp86 0505398 0144397 3 500 000 0788538 0222258inc86 0014887 0003406 4 370 000 0021566 0008207black 3265035 04541567 190 000 2374508 4155561hispan 1939144 03971134 880 000 1160469 2717818 cons 5686855 036046115 780 000 4980048 6393661 10 Plottingnarr86againstpncv绘图 narr86关于pncv 11 Plottingnarr86againstinc86绘图 narr86关于pncv 12 Plottingnarr86againstptime86绘图 narr86关于pncv 13 narr86Coef Std Err tP t 95 Conf Interval pcnv 5525236 15423723 580 000 2500892 8549579pcnvsq 7302119 1561177 4 680 000 1 036333 4240903avgsen 0170216 0120539 1 410 158 0406574 0066142tottime 011954 00928251 290 198 0062474 0301554ptime86 2874334 04425826 490 000 2006501 3742166pt86sq 0296076 0038634 7 660 000 037183 0220321qemp86 0140941 0173612 0 810 417 0481366 0199485inc86 0034152 0008037 4 250 000 0049912 0018392inc86sq7 19e 062 56e 062 810 0052 17e 06 0000122black 292296 044836 520 000 2043916 3802004hispan 1636175 03945074 150 000 0862609 240974 cons 5046065 036835313 700 000 4323784 5768347 AddingQuadratictermstosignificantVariables加入重要变量的平方项 14 Drawbacksofaddingsquaretermstodetectfunctionalformmisspecification取消加入平方项以检测函数形式误设 Theoretically wecantestjointexclusionrestrictionstoseeifhigherordertermsorinteractionsbelongtothemodel理论上 我们作排除性约束的联合检验 来看高阶项和交叉项是否属于模型 Itcanbetedioustoaddandtestextraterms Manydegreesoffreedomsmaybeused 加入和检验另外的项过程会很单调乏味且冗长 当原模型解释变量多时可能会消耗掉许多自由度 15 Drawbacksofaddingsquaretermstodetectfunctionalformmisspecification取消加入平方项以检测函数形式误设 Somenonlinearitiescannotbepickedupbyaddingquadraticterms Forexample wemayfindasquaretermmatterswhenusinglogsismoreappropriate 一些非线性关系不能通过加入二次项捕捉 例如 当我们发现平方项重要时 可能对数形式更加适合 16 Ramsey sRESETP292Ramsey回归设定误差检验 AtestoffunctionalformisRamsey sregressionspecificationerrortest RESET 一种函数形式的检验是Ramsey回归设定误差检验 RESET RESETaddspolynomialsintheOLSfittedvaluestotheoriginalregression RESET在原回归中加入OLS拟合值的多项式 没有明确的原理指出到底要加入多少个高次方的项 但是平方和立方一般是有用的 17 Ramsey sRESETRamsey回归设定误差检验 Insteadofaddingfunctionsofthex sdirectly weaddandtestfunctionsof 我们加入并检验 的多次项函数 而不是直接加入x的函数 注意 如何加入函数项的 P293So estimatey b0 b1x1 bkxk d1 2 d1 3 errorandtest所以 估计y b0 b1x1 bkxk d1 2 d1 3 error 并检验 H0 d1 0 d2 0 usingFstatisticorLMstatistic H0 d1 0 d2 0 用F统计量或LM统计量 18 Ramsey sRESETRamsey回归设定误差检验 AsignificantFstatisticsuggestssomesortoffunctionalformproblem 一个显著的F统计量说明函数形式可能存在问题 ThedistributionofFisapproximatelyF2 n k 3inlargesamplesunderthenullhypothesisandtheG Massumptions 在零假设和G M假定下 F的分布大样本近似为F2 n k 3分布 自由度的说明 减少了2个自由度P293 19 ImplementingRESETinStata在STATA中实施RESET STATAusescommandovtestafterregcommand STATA在reg命令后 使用ovtest命令 2 3 and 4areusedinstata STATA使用 2 3和 4 regnarr86pcnvavgsentottimeptime86qemp86inc86blackhispanovtestRamseyRESETtestusingpowersofthefittedvaluesofnarr86RESET检验使用narr86拟合值的幂函数项Ho modelhasnoomittedvariablesF 3 2713 4 19 Prob F 0 0058 20 ImplementingRESETinStata在STATA中实施RESET Analternativeistospecifytheoption rhs 一个替代的方法是指定选择 rhsInthiscasethepowertermsofalltheexplanatoryvariablesinsteadofthefittedvaluesareusedinthetest 在这种情况下 检验中使用所有解释变量的幂函数项 而不是拟合值的相应项 ovtest rhsRamseyRESETtestusingpowersoftheindependentvariablesRESET检验使用解释变量的幂函数项Ho modelhasnoomittedvariablesF 18 2698 9 73Prob F 0 0000 21 CautionsinUsingRESET使用RESET的注意事项 RESETisgoodatdetectingmisspecificationsintheformofnonlinearities notgeneralomittedvariables RESET在探测非线性形式的函数误设时很好用 而不是用于检测一般的遗漏变量 Wooldridge 1995 showsthatRESEThasnopowerfordetectingomittedvariableswhenevertheyhaveexpectationsthatarelinearintheincludedindependentvariables Wooldridge在1995年证明 当被遗漏变量的期望值时所包含自变量的线性函数时 RESET无法探测出遗漏变量问题 P294 对RESET作用的正确评价 1 有的认为可以检测遗漏变量和异方差 但是Wooldridge不这样认为 22 CautioninusingofRESET使用RESET的注意事项 However iftheomittedvariablehavenonlinearexpectationsinthedependentvariables asignificantRESETcanindicateomitted variableproblem 尽管如此 如果被遗漏变量的期望是自变量的非线性形式时 一个显著的RESET可以指出遗漏变量问题 AlsonoticethatthedrawbackoftheRESETtestiswhenthenullisrejected RESETdoesnotsuggestwhattodointhenextstep 也要注意到 RESET检验的一个缺陷是 当零假设被拒绝后 它并不能建议我们下一步怎么做 23 HousingPriceExample住房价格的例子 Thisexampleisusedfortwopurposes 使用这个例子有两个目的 First logformscanbebetterindealingwithnonlinearitiesthenusingthelevelvariables 首先 处理非线性问题时 log形式可能比变量原形式更好 Second asignificantRESETmayindicatenonlineareffectofomittedvariables likethevariable assess addedinlater 其次 一个显著的RESET可能指出被遗漏变量的非线性效应 比如稍后加入的变量 assess 24 HousingPriceExample住房价格的例子 Dataused hprice1 dta variables使用数据 hprice1 dta 变量assessassessedvalue 1000s 评估价 单位 千美元 pricehouseprice 1000s 房价 单位 千美元 lotsizesizeoflotinsquarefeet 土地的面积 单位 平方英尺 sqrftsizeofhouseinsquarefeet 房屋的面积 单位 平方英尺 bdrmsnumberofbedrooms 卧室数 25 HousingPriceExample住房价格的例子P293阅读 regpricelotsizesqrftbdrmsovtestRamseyRESETtestusingpowersofthefittedvaluesofprice RESET检验用拟合价格的幂函数项 Ho modelhasnoomittedvariablesF 3 81 4 26Prob F 0 0076 26 HousingPriceExample thelogforms住房价格的例子 log形式 Thelogformdonotrejectthenullofnomisspecificationat5 significancelevel Log形式的回归在5 水平上没有拒绝零假设 没有函数形式误设 结论 第二个模型即对数模型更好一些 P293reglpricellotsizelsqrftbdrmsovtestRamseyRESETtestusingpowersofthefittedvaluesoflprice RESET检验用lprice拟合值的幂函数项 Ho modelhasnoomittedvariablesF 3 81 2 45Prob F 0 0692 27 HousingPriceExample thelogforms住房价格的例子 log形式 reglpricelassessllotsizelsqrftbdrmsInthisstepvariablelassessisasignificantvariablewitht 6 89 这一步中 变量lassess显著 t 6 89ovtestRamseyRESETtestusingpowersofthefittedvaluesoflprice RESET检验使用lprice拟合值的幂函数项 Ho modelhasnoomittedvariablesF 3 80 1 11Prob F 0 3509 28 HousingPriceExample thelogforms住房价格的例子 log形式 Noticetheresultsaredifferentfromthetextbooksince 2 3 and 4areusedinstata insteadof 2 3asinthetextbook 注意这里的结果和课本上不同 因为课本上使用 2 3 这里stata用的是 2 3 和 4 Youcanreplicatethetextbookresultbyputting 2 3intothemainequation anduseFtesttotesttheirjointsignificances 你可以通过以下方法得到课本的结果 向主方程加入 2 3 使用F检验检验它们的联合显著性 29 NonnestedAlternativeTests MR非嵌套替代模型的检验 MRP294 如何检验非嵌套模型 二种方法 MR方法 DM方法 Whichofthefollowingmodelisbetter 下面哪一个模型更好 MizonandRichard 1986 Constructacomprehensivemodelthatcontainseachmodelasaspecialcaseandthentotesttherestrictionsthatledtoeachofthemodels MizonandRichard 1986 构造一个综合模型 将每个模型都作为一个特殊情况包含其中 然后检验导致每个模型变的约束 注意 第6章P199曾提出用拟合优度监测 30 NonnestedAlternativeTests非嵌套替代模型的检验 Intheaboveexample thecomprehensivemodelis在上例中 综合模型是 andtest 31 NonnestedAlternativeTests DM嵌套替代模型的检验 DM DavidsonandMacKinnon 1981 if 9 6 istrue thenthefittedvaluesfrom 9 7 shouldbeinsignificantin 9 6 DavidsonandMacKinnon 1981 如果 9 6 正确 那么从 9 7 得到的拟合值在 9 6 中应当不显著 注意 D M检验的思路 是一个t检验P294 32 NonnestedAlternativeTests DM嵌套替代模型的检验 DM Totest 9 6 wefirstestimatemodel 9 7 byOLStoobtainthefittedvalues 为了检验 9 6 我们首先通过OLS估计模型 9 7 以得到拟合值 Putthisfittedvalueasanadditionalexplanatoryvariablein 9 6 usetstatistictotestitssignificance 将得到的拟合值作为另外的解释变量放到 9 6 中 用t统计量检验其显著性 33 TheHousingPriceExample MR住房价格的例子 MR Thecompetingmodels 竞争模型是 1 reglpricebdrmscolonialassesslotsizesqrft 2 reglpricebdrmscoloniallassessllotsizelsqrftThecombinedregression 组合的回归 reglpricecolonialbdrmsassesslotsizesqrftlassessllotsizelsqrft 34 TheHousingPriceExample MR住房价格的例子 MR Testingwhether 2 istherightone 检验 2 是否正确 testassesslotsizesqrftF 3 79 2 92 Prob F 0 0392Testingwhether 1 istherightone 检验 1 是否正确 testlassessllotsizelsqrftF 3 79 3 97 Prob F 0 0108Inclusive 35 TheHousingPriceExample DM住房价格的例子 DM Testingwhether 2 istherightone 检验 2 是否正确 reglpriceassessbdrmslotsizesqrftcolonialpredictyl xbreglpricelassessllotsizelsqrftbdrmscolonialylThetablebelowshowthatylisaninsignificantvariable 下表显示yl不是一个显著的变量 36 Source SSdfMSNumberofobs 88 F 6 81 48 11Model 6 2607657361 04346095Prob F 0 0000Residual 1 7568377981 021689355R squared 0 7809 AdjR squared 0 7646Total 8 0176035287 092156362RootMSE 14727 lprice Coef Std Err tP t 95 Conf Interval lassess 6762505 33745562 000 048 00481971 347681llotsize 0119247 0419541 0 280 777 0954003 0715508lsqrft 1258866 1407801 0 890 374 4059949 1542216bdrms 0152289 0245180 620 536 0335542 0640121colonial 0243595 0397240 610 541 0546788 1033977yl 4346309 36462431 190 237 2908571 160119 cons 3062863 57372220 530 595 83524091 447813 37 Source SSdfMSNumberofobs 88 F 6 81 48 27Model 6 2654426361 04424044Prob F 0 0000Residual 1 7521608981 021631616R squared 0 7815 AdjR squared 0 7653Total 8 0176035287 092156362RootMSE 14708 lprice Coef Std Err tP t 95 Conf Interval assess 0004822 00099150 490 628 0014906 002455bdrms 0032415 0236591 0 140 891 0503157 0438326lotsize 1 48e 061 68e 060 880 381 1 86e 064 83e 06sqrft 0000404 00005820 690 489 0000753 0001562colonial 0207546 04268410 490 628 0641735 1056826ys 7382357 3435822 150 035 05461531 421856 cons 1 2247571 6193960 760 452 1 9973334 446848 Testingwhether 1 istherightone检验 1 是否正确 38 NonnestedAlternativeTests Comments嵌套替代模型的检验 注释 Theaboveexamplefavorsthelogmodel butitisoftenpossibletoseebothmodelsberejected orneithermodelberejected 上面的例子偏好log模型 但可能经常看到两个模型都被拒绝 或 没有一个被拒绝 39 NonnestedAlternativeTests Comments嵌套替代模型的检验 注释 WhenbotharerejectedMoreworkonspecificationneedstobedone However iftheeffectsofkeyindependentvariablesonyarenotverydifferent thenitdoesnotreallymatterwhichmodelisused 当两个都被拒绝需要在模型设定上花更多功夫尽管如此 如果关键解释变量对y的效应差别不是很大 那么用哪个模型关系不是很大 WhenbotharenotrejectedWecanusetheadjustedR squaredtochoosebetweenthem 当两个都未被拒绝我们可以用调整过的R2在它们之间选择 40 ProxyVariablesP295代理变量 Whatifmodelismisspecifiedbecausenodataisavailableonanimportantxvariable 如果模型误设是因为得不到一个重要解释变量的数据 怎么办 比如人的能力 是一个模糊变量 很难衡量Itmaybepossibletoavoidormitigateomittedvariablebiasbyusingaproxyvariable 可能通过使用一个代理变量避免或减轻遗漏变量偏误 Aproxyvariableissomethingthatisrelatedtotheunobservedvariablethatwewouldliketocontrolforinouranalysis 代理变量就是与我们在分析中试图控制而又观测不到的变量相关的变量 注意 引入代理变量的目的是什么 不是检测beta3 而是为了正确获取beta1和beta2 41 ProxyVariables代理变量 代理变量要与原始变量相关 P296 42 ProxyVariables代理变量 43 ProxyVariables代理变量 44 ProxyVariables代理变量P296 引入代理变量需要怎样的条件呢 45 ProxyVariables代理变量P296 46 ProxyVariables continued 代理变量 续 Whenthesetwoassumptionsaresatisfied wearerunningregressionsy b0 b3d0 b1x1 b2x2 b3d3x3 u b3v3 andhavejustredefinedintercept errortermx3coefficient 当这两个假设被满足 我们作回归y b0 b3d0 b1x1 b2x2 b3d3x3 u b3v3 只要重新定义截距项 误差项和x3系数 47 TheIQExample reglwageeducexpertenuremarriedsouthurbanblackSource SSdfMSNumberofobs 935 F 7 927 44 75Model 41 837761975 97682312Prob F 0 0000Residual 123 818521927 133569063R squared 0 2526 AdjR squared 0 2469Total 165 656283934 177362188RootMSE 36547 lwage Coef Std Err tP t 95 Conf Interval educ 0654307 006250410 470 000 0531642 0776973exper 014043 00318524 410 000 007792 020294tenure 0117473 0024534 790 000 0069333 0165613married 1994171 03905025 110 000 1227801 276054south 0909036 0262485 3 460 001 142417 0393903urban 1839121 02695836 820 000 1310056 2368185black 1883499 0376666 5 000 000 2622717 1144281 cons 5 395497 11322547 650 0005 173295 617704 48 PlottingstandardizedIQagainstStandardizedWage绘图 标准化的IQ关于标准化的工资 49 50 TheRegressionAddingIQ加入IQ的回归 reglwageeducexpertenuremarriedsouthurbanblacksdIQSource SSdfMSNumberofobs 935 F 8 926 41 27Model 43 536016185 44200202Prob F 0 0000Residual 122 120267926 131879338R squared 0 2628 AdjR squared 0 2564Total 165 656283934 177362188RootMSE 36315 lwage Coef Std Err tP t 95 Conf Interval educ 0544106 00692857 850 000 0408133 068008exper 0141458 00316514 470 000 0079342 0203575tenure 0113951 00243944 670 000 0066077 0161825married 1997644 03880255 150 000 1236134 2759154south 0801695 0262529 3 050 002 1316916 0286473urban 1819463 02679296 790 000 1293645 2345281black 1431253 0394925 3 620 000 2206304 0656202sdIQ 0535739 01492933 590 000 0242747 0828731 cons 5 536914 119208846 450 0005 3029635 770864 51 CautionsinUsingProxyVariables使用代理变量注意事项 Whenassumptionsarenotsatisfiedwecannotgetconsistentestimators Sayx3 d0 d1x1 d2x2 d3x3 v3Thenweareactuallyestimatingy b0 b3d0 b1 b3d1 x1 b2 b3d2 x2 b3d3x3 u b3v3 Biaswilldependonsignsofb3anddj当假设不满足时 我们不能得到无偏 一致的估计量比如x3 d0 d1x1 d2x2 d3x3 v3实际上 我们可以估计y b0 b3d0 b1 b3d1 x1 b2 b3d2 x2 b3d3x3 u b3v3 偏误方向将依赖于b3和dj的符号 52 LaggedDependentVariables滞后的被解释变量P302 Whatifthereareunobservedvariables andyoucan tfindreasonableproxyvariables 如果存在不可观测的变量 并且你又找不到合理的解释变量 怎么办 Maybepossibletoincludealaggeddependentvariabletoaccountforomittedvariablesthatcontributetobothpastandcurrentlevelsofy可以包含一个滞后的被解释变量 说明同时影响过去和当前y水平的被遗漏变量 Obviously youmustthinkpastandcurrentyarerelatedforthistomakesense 很显然的 我们必须认为过去和当前的y相关 才有意义 53 TheCrimeExample犯罪的例子 Variables 变量lcrmrtelog crimerateper1000persons log 以1000人为单位的犯罪率 llawexpclog lawexpenditure log 诉讼费用 lcrmrt 1lcrmrtelagged 滞后的lcrmrte unemunemploymentrate 失业率 54 TheCrimeExample WithoutLaggedDependentVariable犯罪的例子 不包含滞后的被解释变量 reglcrmrtellawexpcunemifyear 87Source SSdfMSNumberofobs 46 F 2 43 1 30Model 2719871992 1359936Prob F 0 2824Residual 4 4899821443 104418189R squared 0 0571 AdjR squared 0 0133Total 4 7619693445 105821541RootMSE 32314 lcrmrte Coef Std Err tP t 95 Conf Interval llawexpc 2033652 17265341 180 245 1448236 5515539unem 0290032 0323387 0 900 375 0942205 0362141 cons 3 3428991 2505272 670 011 82097215 864826 55 TheCrimeExample WithLaggedDependentVariable犯罪的例子 包含滞后的被解释变量 reglcrmrtellawexpclcrmrt 1unemSource SSdfMSNumberofobs 46 F 3 42 29 73Model 3 2373284631 07910949Prob F 0 0000Residual 1 5246408842 036300973R squared 0 6798 AdjR squared 0 6570Total 4 7619693445 105821541RootMSE 19053 lcrmrte Coef Std Err tP t 95 Conf Interval llawexpc 1395764 1086412 1 280 206 3588231 0796704lcrmrt 1 1 193923 13209859 040 000 92733711 460508unem 008621 01951660 440 661 0307652 0480072 cons 0764511 82114330 090 926 1 5806831 733585 56 MeasurementError测量误差P392 Sometimeswehavethevariablewewant butwethinkitismeasuredwitherror有时 我们有需要的变量 但我们认为它的测量存在误差 Examples Asurveyaskshowmanyhoursdidyouworkoverthelastyear orhowmanyweeksyouusedchildcarewhenyourchildwasyoung例子 一个调查问你在过去的一年中工作了多少小时 或当你的孩子小时 你照看孩子用了多少周 Measurementerrorinydifferentfrommeasurementerrorinxy的测量误差与x的测量误差不同 57 MeasurementErrorinaDependentVariable被解释变量的测量误差 Lety bethevariableofourinterest butyisitsreportedvalue Definemeasurementerrorase0 y y 令y 为我们感兴趣的变量 但y是它的报告值 定义测量误差为e0 y y Themodely b0 b1x1 bkxk u e0isestimated 估计的模型y b0 b1x1 bkxk u e0WhenwillOLSproduceunbiasedresults 什么时候OLS产生有偏的结果 58 MeasurementErrorinaDependentVariable被解释变量的测量误差 Ife0andxj uareuncorrelated theresultsisunbiased 如果e0和xj u不相关 结果无偏 IfE e0 0thenb0willbebiased though如果E e0 0 那么b0有偏 Whileunbiased wefacelargervariancesthanwithnomeasurementerror当无偏时 我们要比没有测量误差时面临更大的方差 见P303公式结论 1 当e与资本了相关时 导致有偏性 2 无关时 只增大方差 模型还是合适的 59 MeasurementErrorinanExplanatoryVariable解释变量的测量误差 Wewishtoestimatey b0 b1x1 u 我们希望估计y b0 b1x1 u Definemeasurementerrorase1 x1 x1 定义测量误差为e1 x1 x1 AssumeE e1 0 E y x1 x1 E y x1 Meansx1doesnotaffectyafterx1 hasbeencontrolledfor 假设AssumeE e1 0 E y x1 x1 E y x1 意思是 在x1 被控制住之后 x1不影响y 60 MeasurementErrorinanExplanatoryVariable解释变量的测量误差 二种不同的假设结果 P305 Actualmodelestimated y b0 b1x1 u b1e1 实际模型估计 y b0 b1x1 u b1e1 TheeffectofmeasurementerroronOLSestimatesdependsonourassumptionaboutthecorrelationbetweene1andx1测量误差对OLS估计量的影响依赖于我们对e1和x1相关性的假设 SupposeCov x1 e1 0第一种假设 假设Cov x1 e1 0OLSremainsunbiasedOLS无偏Since measurementerrorinxwillincreaseerrorvariancesingeneral 因为 一般来说 x的测量误差会增加误差项方差 61 MeasurementErrorinanExplanatoryVariable解释变量的测量误差 SupposeCov x1 e1 0 knownastheclassicalerrors in variablesassumption then第二种假设 CEV假设 假设Cov x1 e1 0 即经典的含误差变量假设 那么 Cov x1 e1 E x1e1 E x1 e1 E e12 0 se2x1iscorrelatedwiththeerrorsoestimatei

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论