经济学实证研究中的40个常见误区 ppt课件.pptx_第1页
经济学实证研究中的40个常见误区 ppt课件.pptx_第2页
经济学实证研究中的40个常见误区 ppt课件.pptx_第3页
经济学实证研究中的40个常见误区 ppt课件.pptx_第4页
经济学实证研究中的40个常见误区 ppt课件.pptx_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

踩雷了!经济学实证研究的40个常见误区,40个误区,我:初学时、投稿时踩雷作为审稿人:见过别人踩雷作为老师:见过学生踩雷,实证研究的六个步骤,共40个误区,Idea:4Data:5Identification:19Stata:4Writing:5Submission:3,治学问若烹小鲜,治学问若烹小鲜,菜谱:Idea&Taste食材:Data锅:Stata&Computer火候:Identification装盘:Writing上菜:Submission,菜谱:idea的四个误区,误区1:不学理论误区2:取法于下误区3:“广”与“专”的关系没处理好误区4:操之过急,Idea&Taste的四大来源,现实理论文献数据识别,误区1:不学理论,三高过后,长舒一口气!为什么理论重要?Taste:理论的高度决定实证的高度例:新农保对居民消费的影响例:省管县改革对经济增长的影响Mechanism:讲清楚机制,需要理论Publication:同时有理论和实证的论文好发,结构式估计成为理论与实证俱佳的人才,很难!,实证研究的核心使命是什么?,检验理论是否成立如果不成立,是因为什么假设条件?多种理论同时存在,哪一个成立?激发新的理论,实证是灰色的,唯有理论之树长青。,理论物理VS实验物理杨振宁、李振道宇称不守恒&吴健雄“吴健雄细心爱护与训练电子,要把电子训练得好,晶体里面没杂质,才能从它们的行为中得到数据,告诉你现实的世界是怎么回事”,怎样学理论?,学好教科书(不一定是学术模型)熟练掌握领域内的经典理论泛读领域内前沿理论文献计量经济学理论也很重要!,误区2:取法于下,不要读太多D类杂志。不然Taste变差、对计量要求也变低、甚至写作也变差古人云,“取法于上,仅得为中;取法于中,故为其下;取法于下,则无所得矣”。期刊list,误区3:“广”与“专”的关系没处理好,Developmenteconomics宏观、劳动、制度、政治、区域/城市、产业、公共、经济史一个对话引起的讨论普通人精力有限,不是DaronAcemoglu广泛训练、专业研究,误区4:操之过急,想到idea,要多思考一段时间科研考核制度每个研究者电脑里都有一长串todolist,有很多半成品思考时间足够长后,再去读文献某一线女演员:停工一年,只因没有好剧本“我宁可他们暂时把我忘了,我也不愿意他们看着一个烂戏想起我来”,食材:数据的五个误区,误区5:样本不够大误区6:样本不够长误区7:用国外数据误区8:不熟悉数据库误区9:不描述数据,误区5:样本不够大,很多同学用分省数据、时序数据。为什么样本大了好?a大数定律样本不够大,发现不了规律。即使碰巧发现了规律,standarderror会大,导致统计显著性不过关。b微观数据,可以把机制做清楚c有足够多的花样做异质性d没有功劳,也有苦劳,变量的显著性检验,的标准误如下,数大便是美,徐志摩志摩日记二则数大便是美。碧绿的山坡前几千只绵羊,挨成一片的雪绒,是美;一天的繁星,千万只闪亮的神眼,从无极的蓝空中下窥大地,是美;泰山顶上的云海,巨万的云峰在晨光里静定着,是美;大海万顷的波浪,戴著各式的白帽,在日光里动荡着,是美;爱尔兰附近的那个羽毛岛上栖息着几千万的飞禽,夕阳西沉时只见一个羽化的大空,只是万鸟齐鸣的大声,是美数大便是美。数大了似乎按照著一种自然规律,自然也会有一种特别的排列,一种特别的节奏,一种特殊的式样,激动我们审美的本能,激发我们审美的情绪。,误区5:样本不够大,如果你的研究问题有更细的数据,就不要用粗的数据。分省VS分市VS微观例:金融发展对经济增长的影响例:新农保对消费的影响我们的幸运大国大数据的时代例外:Acemoglu,AER,TheColonialOriginsofComparativeDevelopment,只有63个观测值!这很运气。稍微碰一下,显著性就没了。,误区6:样本不够长,面板数据的样本要尽量长长了才能体现出效果例:省管县改革2004年,只用2002-2005年数据,误区7:慎用国外数据,你不了解国外的月亮,熟悉制度背景是很难的,遑论找到exogeneousshock当然,国外文献还是要读,是要有比较的眼光美国著名政治学家和社会学家李普塞特“只懂得一个国家的人,他实际上什么国家都不懂”欧美的发展经济学家例外:金融学,要用美国数据。,误区8:不熟悉数据库,没有变量,巧妇难为无米之炊。没有变量,你甚至想不到idea。花时间读问卷、了解数据库里有哪些变量、了解统计年鉴吃透数据库、不要打一枪换一个地方青年同学们可以参加一两次调查。可以将所有家户问卷对着自己问一遍。我自己参加过北京大学CHARLS调查。,误区9:不描述数据,为什么要描述数据?例:省管县a发现潜在的错误、极端值b发现变量缺失值c最重要:知道x和y的variation来自哪里?-知道内生性、外生性-启发identificationstrategyd展示x和y的相关性,配合图。e配合backgroundf告诉读者数据处理过程,如何获得回归所用样本先仔细描述数据,再跑回归。将数据印在脑子里去,最重要的信息写在文章当中去。,误区9:不描述数据,如何描述?Summaryxsummaryx,detail.bysortyear:sumxtabstatx,by(year)codebookxcorrxytwoway,锅:Stata的四个误区,误区10:Stata手册式学习忌纸上谈兵误区11:不去研究helpfile常用google/bingreghdfe误区12:不写dofiledofile是为了后续的修改误区13:dofile不够细致找好的模板学习仅保留原始数据和dofile,中间过程可不要。,火候:identification的19个误区,误区14:不重视识别误区15:不重视稳健性检验误区16:依靠PSM和GMM解决内生性误区17:迷信R-square误区18:控制变量选取不当误区19:标准误不cluster误区20:只看统计显著性,不看经济显著性。误区21:交互项的误区,火候:identification的19误区,误区22:指标选取随意误区23:不细究x的variation误区24:用错虚拟变量误区25:面板数据的误区误区26:probit模型的误区误区27:工具变量的误区误区28:DID的误区误区29:RD的误区误区30:PSM的误区误区31:GMM的误区误区32:做不出结果就放弃,误区14:不重视识别,“Whatarethethreemostimportantthingsforempiricalwork?Identification,Identification,Identification.”JohnH.Cochrane(2005)识别的核心是:解决内生性问题。识别好,发得好。即使解决不完美,也应承认自己的x有内生性问题,不要遮遮掩掩。选题之初,就应考虑如何解决内生性问题。Identification导向的实证研究,误区15:不重视稳健性检验,Robustnesscheck,把审稿人能想到的都想到变换x指标变换y指标增减控制变量变换样本变换估计方法交互项/分样本展示异质性Placebotest(placeboperiod/group)验证机制排除alternativehypothesisQJE的文章长稳健性检验增加实证结果的可信度,实证文章:报告约50个回归。但是跑了不少于1000个,我的前半生:唐晶熬了数个通宵给客户计算出的评估结果,被贺涵提高了3%个点,她认为这是不符合客观条件的数据!贺涵:“你应该以你多年所学的各种方法,计算出一个人家想要的数据结论。数据是死的,拿数据怎么排列组合,得出结论,这是活的”,误区16:完全靠PSM和GMM解决内生性,OLSPSMGMMDIDIVRDD,误区17:迷信R-square,R-square的大小,在微观计量论文里通常不用理会但R-square的大小,并不是毫无作用.增加一个x,看R-sqaure的变化Probit模型,报告persudo-R-square,误区18:控制变量选取不当,Under-control:遗漏变量Over-control:过度控制例1:研究教育对收入的影响控制男女性别?控制职业?例2:省管县对GDP增长的影响,控制财政自主度、产业结构、城市化率、对外开放?控制了,系数就有不同的解读。实践中,可以逐步增加控制变量,作为稳健性检验。,误区19:标准误不cluster,随机扰动项i.i.dRobust:errorterm存在异方差,但是仍然独立Cluster:errorterm不是独立的,而是相关的。如果不cluster的话,会导致标准误有偏,通常高估了显著性。,误区19:标准误不cluster,到底cluster在哪一层级?1.横截面数据:一般是cluster在一个更高的地域范围内。多高呢?Tradeoff2.cluster的数目太少,怎么办?一般应大于423.可以多报几种cluster的方式,表明稳健性4.面板数据,至少应控制在个体层面:例省管县5.x和y不在同一level:例如省管县对企业绩效的影响6.multi-waycluster,误区20:只看统计显著性,不看经济显著性,三星拜物教!例:省管县对经济增长在1%水平下具有显著正向影响。例:省管县对经济增长具有显著正向影响,可以使县域年GDP增长率提升1个百分点。20年前,实证文章确实主要在乎统计显著性。但是现在不然。AEA旗下的期刊已经不再报告统计显著性。例:样本量很大,统计显著性三星,经济显著性很小。省管县改革使县内企业销售额增加了0.1%。,误区20:只看统计显著性,不看经济显著性,要报告s.e.,不报告t统计量。最好的状况:经济显著性和统计显著性都在!通篇统计不显著,就不好!主要结果应该能保持3星显著。经济显著性高,但是统计显著性小,怎么办?notpreciselyestimated。样本量或估计方法的原因检验异质性,比较分组回归的系数。不能只数星星,误区21:交互项的误区,x1*x2,本身也要放!如果给内生变量x1找了工具变量z1,x2是外生的,那么内生变量两个x1,x1*x2,工具变量也是两个z1,z1*x2交互项的IV平方项的IV。用了交互项,要会计算marginaleffect交互项,要用得炉火纯青!分东中西部?有意义吗?交互项与分样本:如何选择?,误区22:衡量指标选取随意,要选择常用指标要选择干净的指标政府竞争程度人均FDI官员晋升压力第二任期?逃税腐败要多选择一些,做各种稳健性检验,误区23:不细究X的variation,为什么要细究x的variation?识别,就是依靠variation知道variation来自哪个层面,横截面还是时间?知道了variation,才能帮助判断内生性数据描述+制度背景不重视Variation的常见错误:1.X的variation太小。DID时treatmentgroup内的观测值太少,比例太小!例:征地拆迁农民2.用错虚拟变量。,变量的显著性检验,的标准误如下,误区24:用错虚拟变量,过度使用虚拟变量,导致完全共线性例1:一个地级市内下辖县数量对经济增长的影响。X不随时间变化,因此不能控制地级市固定效应。例2:控制企业固定效应,同时又控制行业固定效应过少使用虚拟变量,导致遗漏变量问题不会使用两个虚拟变量的交叉项例3:省管县对经济增长的影响,可以控制什么虚拟变量?CountyFE,yearFEProvince-yearFECountyFE*yeartrendCountyFE*yearFE错!Letdummiesspeak!,误区25:面板数据的误区不清楚固定效应下的variation,面板数据固定效应和随机效应的选取通常都要用固定效应Keyx要随时间变化不随时间变化的控制变量无需放入面板数据:通常要双向固定效应。面板数据工具变量Z的寻找:Z要随时间变化公司金融领域:有面板数据,但不控制firmFE?背后的variation在哪里?,误区26:probit模型的误区:不报告边际效应,要报告marginaleffect还要区分averagemarginaleffect和marginaleffectatthemeandprobit命令,报告的是后者margins,可以报告很多种,误区27:工具变量的误区用错各种检验,要报告一阶段回归结果,尤其是Ftest。Crog-DonaldFstatisticsiids.e.K-PFtestclusters.e.WeakIV时(F10),不要放弃!Anderson-Rubintest。工具变量Z的外生性可以检验吗?SarganTest。但不能全依赖X的外生性可以检验吗?HausmanTest。但不能依赖写作时,要用文字仔细介绍工具变量的外生性、相关性。工具变量一阶段回归本身就是一个故事。OLS和IV都统计显著,但IV系数大了很多倍,怎么办?:LATEOLS和IV系数接近,OLS显著,IV不显著,怎么办?,Durbin-Wu-HausmanTestforexogeneityofx,误区28:DID的误区不做检验,检验ParalleltrendEventstudy,画图dynamiceffects,随时间变化而逐渐增强?检验事前特征平衡balancetestT-testParalleltrend检验通不过怎么办?控制更多变量,例如Luetal.JDE省管县找IV分组的制度背景要介绍非常详细。,误区29:RD的误区被Stata命令吓倒,非参:不要被吓到了LocallinearapproachGlobalpolynomialapproachRd,rdrobust可以不用精确断点用regress模糊断点用ivreg2要做Ba

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论