




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试验报告写作参考资料计量经济学学期论文的写作 选自:伍得里奇 著,费建平、林相森 译,林少宫 校. 计量经济学导论现代观点. 中国人民大学出版社,2003,p604试验报告写作参考资料01问题的提出12文献回顾23数据的收集331确定适当的数据集332 输入并存储你的数据433 检查、清理、总结你的数据44计量经济学分析55经验论文的写作751 引言752概念(或理论)框架853计量经济学模型和估计方法854 数据955 结果1056 结论1057 风格提示10小结11在这一章中,我们将以完成一篇学期论文为重点,讨论一项成功的经验实证分析的构成要素。在此,会强调在应用研究中反复出现的重要主题,还对一些题目提供建议,并给出一些经济研究的材料和数据供参考考。1问题的提出 提出一个非常确切的问题,其重要性是不容忽视的。如果没有明确地分析目标,那么你的研究将无从下手。如果因为丰富的数据集具备了广泛的适用性,你就企图在想法尚未成熟之时开始搜集资料,其结果往往适得其反。如果没有对你的假设和你将要估计的该类模型进行细致的公式化表述,那么你很有可能会忘记搜集某些重要变量的信息,或是从错误的样本空间取样,甚至会在搜集数据时对应错了时间区间。 当然,这并不是说你要凭空臆造一个问题,尤其是在做学期论文的时候,更不可能去建造空中楼阁。因此在选择题目的时候,你必须确信现有的数据来源能够让你在指定的时间里回答你的问题。 在选题时,你必须明确,你对经济学或者其他社会科学的哪一个领域感兴趣。举例来说,在完成了“劳动经济学”的课程后,你可能会发现其中的理论能够被实践所检验,或是这些理论与一些相关政策存在着联系。劳动经济学家不断地发现能够解释工资差异的新变量。 而国家或地方的公共财政研究人员则致力于研究当地的经济活动是如何依赖于经济政策变量的,这些变量包括:财产税、销售税、服务的水平和质量(如学校、消防队和警察局) 等等。研究教育问题的经济学家则对以下三个问题颇为关注(Hanushek,1986):支出如何影响求学行为,就读某类学校是否会提高受教育者的能力,以及如何确定影响私人学校选址的因素(Downes and Greenstein,1996)。宏观经济学家对各种各样的总体时间序列之间的关系兴趣十足,如国民生产总值的增长与固定资产投资的增长(如机器设备的增长)之间的关系,或是税收对利率的影响(Peek,1982)。评估的模型通常都具备可描述性,这是非常有道理的。举例来说,财产评估者利用Hedonic定价模型(见例48)对某家庭最近尚未卖出的房屋价值进行评估。它描述了房屋的价格对它的特性(大小、卧室的数量、浴室的数量等)的回归模型。若以此作为学期论文就不新奇了,因为我们不可能从中学到更多有新意的东西,而且这些分析也没有什么明显的政策内涵。可是如果把邻里犯罪率作为一个解释变量加进来分析,就能够知道犯罪率在确定房屋价格时是一个非常重要的因素。这在评估犯罪成本时会有帮助。一些关系式的估计大多是利用了描述性的宏观经济数据。例如,一个总量储蓄函数能用来判断总量边际储蓄倾向和储蓄对资产的回报(如利率)的反应。如果把时间序列数据应用在一个曾经经历过政治动乱的国家,并确定其在政治不稳定时期储蓄率是否会下降,这样的分析将会更有趣。 一旦你确定了一个研究的领域,对于所选的题目就可能有许多的方法来为论文定位。 因特网(Internet)服务使得搜寻各种题目的已发表论文更为方便。按照作者名字、主题、题目中的关键词等方式便可以广泛地搜寻几乎所有的经济学期刊。 在构思一个题目时,对以下几个问题要做到心里有数。第一,要使一个问题让人感兴趣,并不需要它具有广泛的政策内涵,相反,它可以只是当地的兴趣所在。例如在大学里,生活在社团中间会使学业成绩提高还是降低也许是你关心的问题。这一问题或许能或许不能令校外的人感兴趣,但至少会引起校内部分人的关注。另一方面,你也许只是从当地的利益出发分析问题,最后却引起广泛的影响。比方说确定什么因素会影响大学校园里的酗酒现象,以及有哪些学校规章可以对其进行制约等等。 第二,标准宏观经济总量数据来进行真正有创造性地研究究是非常困难的,尤其对于一篇要在半个学期或一个学期之内完成的论文来说说更是如此。比方说,货币增长和政府支出增长等因素是否会影响经济增长长,是专业的宏观经济学家一直以来致力研究的问题。利用现有的信息能否系统地预测股票或其他资产的回报,这一问题显然已经被研究得非常仔细。然而,这并不意味着你应该回避对宏观或经验性金融模型的估计,因为仅仅增加一些更为新近的数据也可以使我们的争论更有建设性。另外,有时你会发现对经济总量和金融回报有重要作用的新变量,这样的发现往往令人非常激动。 问题是,再多用几年的数据为美国经济或一些更大的经济社会估计一个标准的菲利普斯曲线或总量消费函数,像这样的练习,并不可能为我们带来更多新的理解,尽管它们对学生来说会有些启发。然而,你可以利用一个小国家的数据来估计静态或动态的菲利普斯曲线,或是检验有效市场假说等等。 在非宏观层面上,同样有许多被广泛研究的问题。劳动经济学家发表了许多关于教育回报率的论文。这个问题因为很重要,所以还在被研究,况且新的数据集,还有新的计量经济学方法也在发展之中。举例来说,对不可观测的能力来说,有些数据集就比其它数据提供更好的代理变量。另外,我们能得到时间序列数据或者从一个自然实验得到数据是我们得以从一个不同的方面去思考一个老问题。 再举一例,犯罪学家对研究不同的法律对犯罪的影响感兴趣。死刑是否有威慑作用,长久以来成为一个争论的话题。类似地,经济学家对税收能减少烟酒的消费量感兴趣(一如既往在其他条件不变的意义下)。随着我们掌握越来越多年的州一级数据,一个更为丰富的时间序列数据集就会产生,他能够帮助我们更好地回答大部分政策问题。另外,有一些相当新近的反犯罪革新例如社区管辖的出现它们的有效性如何可以经验性地评估出来。在把你的问题作公式化表述的时候,跟你的同学、导师、朋友讨论你的想法会有所帮助。你应该能够说服别人相信你对问题的解答是值得关注的。(当然,你是否能够有说服力地回答你的问题是另一回事,但你需要从一个值得关注的问题开始。)如果有人询问你的论文,而你的回答:“我正在进行关于犯罪的论文”或是“我的论文是关于利率的”,这极有可能说明你只确定了一个总的范围,却没有公式化表述出一个真正的问题。你应该能够说出一些“我正在研究美国的社区管辖对城市犯罪率的影响”2文献回顾 所有的论文,即使非常短,也应该包括相关的文献综述。几乎没有人会试图进行尚无发表先例的经验项目。如果你通过期刊或网络搜寻一个题目或关键词,那么你所做的正是文献检阅。如果你自行选题例如研究你们学校药用量对学业表现的影响那么可能工作起来要辛苦一些。但网络搜寻服务使这一过程简化,例如你可以通过关键词、题目中的字或者作者等等进行搜索。然后你就可以通过论文的摘要得知它们与你自己的研究有多少关系。 在进行你的文献检阅时,你应该考虑到利用少量关键词可能搜寻不到的相关题目。例如,如果你在研究吸毒量对工资或平均成绩的影响,或许你应该查阅一些关于饮酒量对这些因素影响的著作。了解如何进行彻底的文献搜寻是一种有待学会的技巧,但如果你在行动前多加思考,可能会减少不少麻烦。如何将文献检阅包含在论文中,不同的研究人员有不同的做法。有些人喜欢开辟独立的章节,叫做“文献检阅”,而其他人则倾向于将文献检阅作为一个部分包括在序言中。这主要视个人偏好而定,尽管大量的文献检阅是值得占有它独立的章节的。如果学期论文是课程的重点例如在一个高级专题或是高等计量经济学课程中你的文献检阅就有可能相当长。一篇人门课的期末论文往往较短,相应的文献检阅也要简洁一些。3数据的收集31确定适当的数据集 为学期论文搜集数据可能是富有教育意义的、令人激动的,有时也可能是相当叫人沮丧的一件事。首先你必须确定用以回答你所设定的问题的数据类型。正如我们在序言中讨论过并贯穿于本书的观点,数据集以多种形式出现。最常见的类型是横截面、时间序列、混合截面和时间序列数据集。 有些问题可以由我们介绍过的任何一种数据结构进行描述。例如,在研究是否更强的执法力度能够降低犯罪率时,我们可以利用一些城市的横截面数据,或者某个给定城市的时间序列数据,也可以选择一些城市的时间序列数据集它包含相同几个城市两年或者多年的数据。 确定搜集何种数据通常取决于该分析的性质。为了回答个人或家庭层面的问题,我们通常只需要找到单一横截面的数据;它们往往由调查取得。接着,我们要自问,是否能够获得一个足够丰富的数据集来进行在其他条件不变下的分析。举例来说,假设我们想知道是否通过个人退休账户(IRA)来储蓄的家庭这具有某些税收优势会有较少的非IRA储蓄。换言之,是否IRA储蓄不免会把其他形式的储蓄排挤出去?有些数据集,例如费者财务调查,包括了每年不同家庭样本的不同储蓄种类的信息。利用这样的数据集会产生一些问题,其中或许最重要的一个是,是否有足够多的控制变量包括收人、人口统计特性和储蓄偏好的代理变量来进行在其他条件不变下合理的分析。如果这些是我们可以获得的惟一一种数据集,就必须尽我们所能来处理它们。 在处理关于公司、城市、州县等的横截面数据时,相同的问题也会产生。在大多数情况下,我们能否利用单一横截面的数据进行在其他条件不变下的分析,这一点并不明显。例如,关于执法力度对犯罪率的作用的任何研究都必须认识到执法经费的内生性。如果利用标准的回归方法,那么无论我们有多少控制变量,或许都很难完成一个令人信服的在其他条件不变条件下的分析。(参见下节更多的讨论。) 一旦阅读了关于时间序列数据方法的较高深的章节后,你就会发现,具备两个或多个不同时点上的相同的横截面单元的数据能够让我们控制好不随时间而改变的无法观测到的效应,而正是这些效应经常把我们在单一横截面上所做的回归混杂起来。个人或家庭的时间序列数据集相对来说较难获得尽管还是有一些例子存在,如动态收入的综列研究但它们可以用于非常令人信服的渠道。公司的时间序列数据也是存在的。例如,Compustat和证券价格研究中心(CRSP)对各公司进行着大规模的财务信息的时间序列数据信息的收集。对更大的单元,如学校、城市、郡县和州来说,要获得时间序列数据则更为容易,因为这些单元不会随着时间而消失,而且政府机构会负责每年收集这些相同变量的信息。 数据以多种形式出现。一些数据集,特别是历史数据,通常仅以印刷资料的形式出现。如果数据集不大,把来源于印刷资料的数据输入在操作上是便利的。有时候,有些文章连同小的数据集一起发表特别是时间序列应用。把这些资源应用于经验研究中,也许还得用近年来的数据加以补充。 许多数据集可以在计算机磁盘或磁带中找到。前一种特别易于操作。现在,很大的数据集已经可以存放在磁盘中了。各种政府机构会出手数据磁盘,私人企业也不例外。论文作者通常愿意用磁盘的形式提供他们的数据集。 越来越多的数据集可以在互联网上找到。网络是网上数据库的丰富来源。无数包括经济和相关数据集的网站被建立一些网站包括经济学家所关注的数据集的链接;本章的附录列举了的网站。总的来说,用因特网搜寻数据资源相当简单而且在将来会更加便捷。32 输入并存储你的数据 一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可操作的形式。如果数据在磁盘里,那么它们已经具备了一定的形式,而且是有望具备广泛用途的一种形式。用磁盘形式获取数据最灵活的方法是将其作为标准的文本(ASCll)文件(text)。 所有的统计和计量经济学软件包都可以以这种方式存储原始数据。一般说来,只要该文本文件构架合理,就可以被直接读入一个计量经济学的软件。作为一般性原则,数据应该具备表格形式,每次观测占一个不同的行;而数据集的每一列则代表不同的变量。偶尔你会遇到以列代表观测次数而行代表不同变量的方式存储的数据集。这并不是理想的方式,但大部分软件包允许以这种形式读取数据,然后把它改过来。所以自然地,了解数据读人计量经济学软件之前如何组织是非常关键的。 对时间序列数据集来说,只有一种实用的方式来进行数据的输入和存储,也就是说,以时间为序,最早的时间段列为第一次观测,最近的时间段列为最后一次观测。把带有年份或(如有必要)带有季度或月份的变量包括进来通常会有所帮助。它有助于对今后模型有所改变时的估计,包括考虑到不同时间区间的季节性变化和间断。对一段时间的混合截面来说,通常最好是把最早一年的截面放在第一个观测区里,接着是第二年的截面,然后依次下去。(参见FERTILlRAW。)这种安排并不关键,但把注明年份的变量附在每一次观测上是非常重要的。 对时间序列数据来说,如果所有年份的横截面观测都是相邻的且以时间为序,就是最理想的。对于时间序列数据,让每个横截面单元具备一个独特的标识符和一个年变量是非常重要的。 如果你获得印刷资料形式的数据,就可以有多种选择将其输入电脑。首先,你可以利用标准文本编辑器(texte山t。r)创建一个文本文件。(这就是一些包括在文本中的原始数据集最初创建的方法。)一般的要求是每一行开始一次新的观测,并且每行的变量有相同的顺序特别地,每行的条目数要相等而且数值与数值之间至少需要由一个空格分开。有时候,用一个不同的分隔符,如逗号,可能会更好,但这取决于你所使用的软件。如果你缺掉了某些变量的某些次观测,你就必须决定如何将其表示出来;仅仅留下一个空格一般是不行的。许多回归软件包接受以句号为缺落数值的标志:有些人倾向于用一个数字也许是对所关注的变量来说是一个不可能的值来表示缺落数值。如果你不是非常细心的人,这样做后面要进一步讨论这个问题。 如果你有非数值数据比方说,你想把一个学院样市的名字包括进来那么你需要查询一下你将要使用的以确定输入这种变量的最佳方法(通常叫做字符串),才置在双引号或单引号中间。有的文本文件遵循严格的形式程序来读取文本文件。不过你还是要查询你的计算机软件息。 另一种普遍适用的选择是利用总分析表(spreadsheet)来输入你的数据,比方说Excel。33 检查、清理、总结你的数据 在经验分析中,熟悉你将要使用的数据集尤其重要。如果你自己输入数据,那么你就必须完全了解它的内容。但如果你从外界来源获取数据,就仍然需要花时间了解它的结构和管理。即使是广泛使用且大量存储的数据包会有缺陷,如果你使用来自某论文作者的数据集,你就必须意识到数据记得构筑方式可能会被忽略。 前面我们回顾了不同数据集存储的标准方法。你还需要知道缺失数据是如何标识的。较可取的方法是用一个非数字符号,如句号,标明是缺失数据。如果是利用诸如“999”或者“1”这些数字来作为缺失苏邹德表示,那么在利用这些观测进行统计计算时就必须非常小心。你的计量经济学软件包或许不知道某一数字实际上表示一个缺失数值:很有可能这样一次观测值会被当做有效而使用,从而产生极其错误的结果。最好的办法是把所有代表缺失数值的数字符号改为其他不会与实数数据混淆的符号(如句)。 你还必须知道数据集中变量的性质。哪些是二进制数?那些是序数(如信用评级)?变量的测量单位是什么?比方说,货币价值是用美元、干美元、百万美元还是其他什么单位测量的?变量是表示以百分比还是比例测量的比率?例如学校的退学率、通货膨胀率、参加工会率或者利率。 特别是对于时间序列数据来说,了解货币价值是名义的(当前的)还是实际的(恒常的)美元非常关键。如果这个价值是实际值,那么基年或基期又是什么? 如果你从个作者那里得到一个数据集,那么有些变量已经以一定的方法进行了变换。比方说,有时候只有变量的对数形式(如工资或薪水)出现在数据集中。 在数据集中检测错误对保持任何数据分析的完整性都是必要的。在分析中找出所有的或者至少是最显著的变量的最小值、最大值、均值和标准差通常都是有用的。举例来说,如果你发现你的样本中教育的最小值是99,你就会知道教育的输入值中至少有一个要被设为缺失数值。经过进一步检查,如果教育水平有数次观测值为99,那么你可以信心十足地说,你发现了教育的缺失数值的标志。举另一例来看,如果你发现一个城市样本的谋杀罪平均定罪率为0632,你就知道这个定罪率是以比率而不是百分比测量的。那么,如果最大值大于1,那么这有可能是一个印刷错误。 (发现数据集中大部分比率变量以百分比输入,一部分以比率输人,或者反过来,这些情况并不罕见。这样的数据标志错误难以发现,但进行这样的尝试是很重要的。) 我们在使用时间序列数据时同样要小心。如果运用月份或季度数据,我们就必须知道哪些变量,如果有的话,是经过了季节性调整的。改变数据同样需要格外小心。假使我们有每月的数据集,而且想要从中产生从一个月到下一个月的改变量。为达到这一目的,我们必须确定数据是按日历从最早的时期到最晚的时期排序的。如果出于某些原因情况并非如此,相减的结果将是无意义的。为确保数据正确排列,运用一个时间标示变量会有所帮助。对于年份数据,知道年份就足够了,但我们还必须知道年份是以4位数还是2位数输入的(比方说,1998或98)。同样,有了月份或季度数据,拥有一个或多个标示月份或季度的变量将有所帮助。对于月份数据,我们可以拥有一组虚拟变量(11个或12个)或者用一个指明月份的变量(1一12或是一个字符串变量,如jan,feb等)。 无论用不用年、月或季度标示变量,我们都可以在所有计量经济学软件包中轻易地构建时间趋势。如果标示出月份或季度,那么构建季节虚拟变量就很简单;至少,我们需要知道第一次观测的月份或季度。 操作时间序列数据更具挑战性。在第13章中,作为控制不可测影响的一般方法,我们讨论了对差分数据的混合OLS。在建立差分数据的时候,我们应该小心,不要产生幻象观测。假使我们拥有1992一1997年城市的平衡时间序列数据。即使数据在每一个横截面单元上都按时间先后排序这是在开始之前首先要做的事情一个不经心的差分也会对样本中除第一个之外的所有城市产生一个1992年的观测值。这一观测值将是1992年城市i的值减去1997年城市il的值;这显然是愚蠢的。因此,我们必须保证,对所有被取取差分的变量来说,1992年都是缺失了的。 对非平衡时间序列数据来说,情况会更曲折,因为没有一个命令是对所有横截面单元都适用的。通常对非平衡时间序列数据使用固定影响估计会更简单。4计量经济学分析 在确定了题目之后,必须选出一个合适的数据集。假定这也已经完成了,我们就必须接着决定合适的计量经济学方法。 如果你的课程着重于多元线性回归模型的普通最小二乘估计,利用的数据是横截面或者时间序列,那么对你来说计量经济学方法在很大程度上就已经确定了。这不一定有坏处,因为OLS仍然是使用最广泛的方法。当然,你还必须确定,是否需要OLS的任何一种变形例如加权OLS或时间序列回归中的序列相关的校正。 为说明OLS,你还必须给出一个令人信服的例子以说明OLS的关键假定满足你的模型。如同我们详细讨论过的,第一个问题是,随即扰动项是否与解释变量不相关。较理想的情况是,你能够控制足够多的其他变量来假定留在误差项中的因素与回归元不相关。特别是在处理个人、家庭司这一层次的横截面数据时,自我选择问题通常是需要考虑的。你还应该能够证明其他潜在的内生因素也就是,测量误差和联立性不是严重的问题。 在设定你的模型的时候,你同样需要确定采取何种函数形式。某些变量是否应该以对数形式出现?(在计量经济学应用中,答案通常是肯定的)。某些变量是否应该为水平值或平方值描绘可能正在减少的影响?定性因素怎样出现?对不同的属性和群体,仅用二值(虚拟)变量够吗?或者,需要,考虑它们与数量变量的交互作用吗? 对横截面分析来说,其次但同样非常重要的问题是,异方差是否存在、如何解决。 正如我们一再强调过的,对时间序列的应用需要格外小心。对方程的估计应使用水平值吗?如果利用水平值,是否需要时间趋势变量呢?用数据的差分是否更合适?如果是月份数据或季度数据,是否应该考虑季节因素?如果你考虑动态比方说,分布滞后动态有多少滞后因素应该被包括进去?你应该从一些基于知觉或常识因素开始,但这最终还是一个经验问题。 如果你的模型有潜在的设定错误,比方说遗漏变量,而且利用OLS,那么你应该尝试一些我们讨论过的误设分析。基于合理假定,你能够确定估计量存在着哪一方向的偏误吗? 如果你已经学习了工具变量的方法,你就知道可以用它来解决各种形式的内生问题,包括遗漏变量、变量误差和联立性。自然地,你需要仔细想想你所考虑的工具变量是否可能奏效。 经验社会科学方面的优秀论文应包含敏感度分析。宽泛地说,这意味着你首先估计一个初始模型,然后用一些看似合理的方法修改它。理想的情况是重要的结论不致改变。例如,如果你把酒精消费量的一个度量作为解释变量(如在平均成绩的方程中),或者用一个表示酒精用量的虚拟变量来替代定量的度量,这两种做法能够得到性质上相似的结果吗?如果表示用量的二值变量是显著的,而表示酒精量的数量变量不是,那么酒精用量就可能反映出某些影响着考试成绩且与酒精用量相关的不可观测的属性,但这需要根据具体情况进行考虑。 如果某些观测值与样本群体非常不同比方说,在样本中,有几个公司比其他公司大得多那么如果把这些观测值从估计中排除出去,你的结果会有很大改变吗?如果是,你就可能不得不改变函数的形式来考虑这些观测,或者证明它们从属于完全不同的一个模型。异常值问题曾在第9章中进行了讨论。 对时间序列数据的利用为我们提出了更多的计量经济学问题。假使你已经搜集了两个时期的数据,无须借助工具变量,至少也有4种方法来利用这两个时期的时间序列数据。你可以在标准OLS分析中混合这两个时期。虽然相对于一个单一截面来说,这样做或许可以扩大样本容量,但它并没有控制不随时间而变化的不可观测变量。另外,由于观测不到的影响,这样一个方程中的误差几乎总是序列相关的。只要在所有时间区间中给定解释变量的值之下,观测不到的影响有零均值,用随机效应估计法就可以纠正序列相关问题并且产生渐进有效的估计量。 当我们拥有更多年的时间序列数据时,除了老办法,还有一种新的选择。我们可以利用固定效应变换来消去不可观测因素的影响。 (只有两年的数据,变换效果和取差分一样。)我们说明了工具变量技术如何与时间序列数据变换结合,以进一步放宽外生性假定。作为一般性原则,同时运用几种合理的计量经济学方法并比较它们的结果是一种很好的想法,这通常能够帮助我们确定诸假定中的哪一个可能是错误的。 设计题目、设想模型、搜集数据并运用计量经济学方法,即使在这整个过程中你都非常谨慎,你还是很有可能至少在某些时候得到令人迷惑的结果。当这种情况发生时,很自然的想法是尝试不同的模型、不同的估计方法,或者可能不同的数据子集,直到结果与预期的更加一致。实际上所有的应用研究人员在找到“最佳”模型之前会寻找各种不同的模型。不幸的是,数据开采(data minning)的实践破坏了我们在计量经济学分析中做出的假定。OLS无偏性和其他估计量的结果以及我们为假设检验而推导的t分布和F分布,都假定了我们按照总体模型来观测一个样本并对该模型进行了一次估计。估计一个与初始模型相异的模型破坏了这一假定,因为我们在模型设定的搜索时利用了相同的数据集。实际上,通过利用这些数据来重新设定我们的模型,我们利用了检验的结果。从不同的模型设定中得到的估计值和检验值就不是互相独立的。 一些设定搜索已经被编制为标准软件包中的程序。最普通的一种是逐步回归,也就是在多元回归分析中运用了解释变量的不同组合以试图获得最优的模型。利用逐步回归可以有不同的方法,或者从一个大的模型开始,然后保留在某一显著性水平之下的变量,或者是从一个简单模型开始,然后加入p值显著的变量。有时候也用F检验来检验一组变量。不幸的是,最终的模型通常取决于变量被丢弃或添加的顺序。另外,这是数据开采的一种严格形式,而且在最终的模型中也难以解释t和F统计量。有人也许会说,逐步回归只是把研究人员在寻找不同的模型时所做的事自动化了。然而,在大部分的应用中,一个或两个解释变量是我们的主要关注所在,目标是了解这些变量的系数有多强,从而决定应该增加或丢弃其他变量,或者改变其函数形式。 原则上,把数据开采的影响包括到我们的统计推导中是可能的,但在实际操作中却是非常困难且极少完成的,特别是在复杂的经验工作中更是如此。参见利墨(Leamer,1983)对这一问题充满魅力的描述。不妨直至找到一个显著的结果,才开始寻找大量的模型或估计方法,然后仅报告这个结果,这样做我们也许可以把数据开采的弊端最小化。如果一个变量仅在诸多估计模型的一小部分中统计上显著,那么这个变量极有可能在总体中不起作用。5经验论文的写作 运用计量经济学分析来写作一篇论文是非常富有挑战性的,同时回报也是丰厚的。一篇成功的论文包括仔细而令人信服的数据分析与优秀的解释和展示相结合。因此,你必须对你的题目有很好的把握,对计量经济学方法有很好的理解,并且具备扎实的写作技巧。可是如果你发现写作经验论文非常困难,也不要灰心;大部分专业研究人员花费了多年的时间来学习如何巧妙地进行经验分析并以令人信服的形式写出其结果。 虽然写作风格各不相同,但许多论文还是遵从相同的基本轮廓的。下面的段落包括了关于章节标题的看法,并解释了每一节应该涵盖的内容。这只是一些建议,不一定要严格遵守。在期末论文中,每节都应以数字进行标识,通常从引言标识为l开始。51 引言引言阐述研究的基本目标并解释其重要性。它一般包括一个文献检阅,表明有哪些工作已经完成以及过去的工作可以怎样改进。(篇幅较长的文献检阅应自成一个独立的章节。)展示一些简单的统计表或者图表来揭示一个看似矛盾的关系,是介绍论文主题的有用方法。举例来说,假使你正在写一篇关于某个发展中国家影响生育率的因素的论文,并把重点放在妇女的受教育水平上。介绍这一主题的富于感染力的方法是创建一张表或一幅图,来显示(比方说)一段时间内生育率的下降,并简述你希望如何研究导致这一下降的因素。在这一点上,或许你已经知道,在其他条件不变的情况下,受教育水平越高的女性生育的孩子越少,而随着时间的消逝,平均教育水平提高了。大部分研究人员喜欢在引言中总结其论文的发现,这是吸引读者注意力的有效方法。例如,在一个30学时的学期课中缺掉了10个小时的课程,其影响如何?也许你会阐明你对这一影响的最佳估计值大约是l2的积点分。但总结不应该太深入,因为得到这些估计值的方法和数据都还没有介绍过。52概念(或理论)框架 在这一节中,要描述你所提问题的主要解决办法。它可以是正式的经济学原理,但在许多情况下,它只是在回答你的问题时出现的概念性问题的直觉性讨论。 举例来说,假使你正在研究经济机会和惩罚的严厉性对犯罪行为的影响。解释参与犯罪的一个方法是,在给定合法和非法的工资率、测量犯罪活动的概率以及惩罚的严厉性的变量的情况下,说明个人选择花费在合法及非法活动上的时间效用最大化的问题。这种方法的用处在于,它示意你哪些变量应包括在经验分析中;对这些变量应如何出现在模型中给出一般性指导。 通常没有必要写出一个经济理论来。对计量经济学政策分析来说,往往常识就足以设定一个模型。例如,假使你对估计“有未成年儿童家庭的救济(AFDC)”的参与对儿童在校表现的影响感兴趣。AFDC提供收入补贴,但参与其中同时使获得医药救助和其他福利更为容易。进行这样一个分析的艰难之处在于确定所要控制的一组变量。在这个例子中,我们可以控制家庭收入(包括AFDC和任何其他福利收人)、母亲的受教育水平、家庭是否居住于城区以及其他一些变量。然后引进一个AfDC参与变量就(与APDC的非收入福利。用关于应控制哪些变量的讨论以及对何提高在校表现的描述去替代正式的经济学原理。53计量经济学模型和估计方法 开辟一个章节来描述一下你所估计的并且将要在论文的结果政界中展示的那些方程式,很有好处。它可以帮助你整理思路,从而让你明确关键的解释变量是什么以及应该控制其他哪些因素。写出一些包含随机扰动项的方程式好让你考虑诸如OLS的方法是否合适的问题。 对一个模型和一个估计方法的区别应该在这一节中指出。一个模型代表了一个总体关系(广泛定义使之包括时间序列方程)。例如,我们应该写出colGPA=bo+b1*alcohol+b2*hsGPA+b*3SAT+b4*female+u来描述大学GPA和饮酒量之间的关系,同时控制方程中的些其他变量。假定这一方程代表一个总体,比方说一个大学的所有本科生。B或colGPA上没有“帽”(-),因为这是一个模型,而不是估计方程。我们没有写出B的数值,因为我们不知道(而且永远也不会知道)这些数值。以后我们会估计它们。在这一节中,不要提前进行经验结果的展示。换句话说,不要从一个一般模型一开始就说你删去一些变量,因为它们被证明是不显著的。这样的讨论应该留到结果章节中。 在说明了一个或几个模型之后,讨论估计方法就显得合适了。在大多数情况下用到的是OLS,但是,比方说在时间序列方程中,你也许会用适当的GLS来进行序列相关校正。但是,估计模型的方法与模型估计本身要明显区别开来。说诸如“一个OLS模型”这样的话是没什么意义的。普通最小二乘是一种估计方法,加权最小二乘法、科克伦奥克兰特方法等等也是。通常对任何一个模型有许多估计方法,你应该解释为什你所选择的方法是有道理的。 从一个基础的经济学模型得到一个可估计的计量经济学模型,在其中用到的任何假定都要进行清晰的讨论。例如,高中教学质量的例子,如何测量学校质量的问题是分析的中心部分。是应该建立在平均SAT分数上、人读学生的毕业比例上、学生与老师的人数比例上还是老师的平均教育水平上?抑或是这些因素的组合或者其他可能的度量? 无论理论模型是否已得到展示,我们通常都要对函数形式作出假定。如你所知,常弹性和半常弹性模型很有吸引力,因为系数易于解释(作为百分比)。如何选择函数形式没有硬性的原则,但讨论过的准则在实践中却很起作用。你不需要对函数形式进行长篇讨论,但略为提及你要估计的是弹性还是半弹性模型是有帮助的。举例来说,如果你要估计某变量对工资或薪水的影响,因变量几乎可以肯定是采用对数形式的,而且你也许从一开始就把它包括到了每一个方程中。你不需要阐述所有的,甚至只是大部分的,你将在结果章节中报告的函数形式的变化。 通常经验经济学中使用的数据是以城市或郡县为单元的。举例来说,假使总体是由小型到中型城市构成的,你想要检验这样一个假设:拥有一只小规模棒球队能导致一个城市的离婚率下降吗?在这个例子中,你必须考虑越大的城市离婚人数越多这样一个事实。考虑城市大小的一个方法是以城市或成年人为单位来度量离婚数量。因此,一个合理的模型是log(divpop)=b。+bl*mlb+b2*percath十b3*log(inclpop)+其他因数式中,mlb为一个虚拟变量,如果该城市有一支小型棒球队,变量就为l;percath为人口中天主教徒的百分数(因此它若为346则表示346)。注意(divpop)是一个离婚比率,它一般来说比离婚的绝对数易于解释。 如果你利用一个更先进的估汁方法,例如二步最小二乘,你需要就你的选择作出解释。如果你用2SLS,你需要就你对一个(或多个)内生解释变量所做的Iv选择的有效性进行详细的讨论。一个变量要成为一个好的IV需要两个条件。首先,它必须被关注方程(结构方程)所略去,并外生于该方程。这是我们必须假定的。第二,它必须与内生解释变量有某种偏相关。在利用时间序列数据时,你或许会考虑忽略变量(或者忽异质性)的问题。同样地,写出一两个方程,这个问题就易于描述了。事实上,在说明一段时间如何对方程求差分以消除不随时间而变的不可观测量时,这样做就很有用;它给出了一个可由OLS估计出来的方程。或者,你利用的是定效应估计,你只需要简单说明即可。54 数据 通常你应该用一个章节来仔细描述你在经验估计中用到的数据。如果你的数据是非标准的或是未被其他研究人员广泛使用的,这就有其必要了。原则上,你应该展示足够的信息以使读者可以获得数据并重新进行呢分析。特别是,所有适当的公共数据来源都应包括在参考书目中,而且小的数据集也应该列在附录中。如果你是通过自己调查搜集到的数据,在附录中也应该给出一份问卷。 在讨论数据来源的时候,要明确每个变量的单位。(例如,收入使用百美元还是千美元计量的?)列出一张变量定义的表格对读者来说也非常有用。在表中出现的名字应与后面的章节中用以描述计量经济学结果的名字相一致。 一张总结统计量,如最小值、最大值、均值和每个变量的标准差的表格也是满含信息的。有这样一张表使得解释后面章节的系数估计值变得更简单,而且它强调了变量的测量单位。对二值变量来说,惟一需要的统计总结是样本中取值为1的比例(等同于样本均值)。对趋势变量来说,诸如均值的统计量是不太令人感兴趣的。而对样本中的某一变量求出多年的平均增长率则常常会是有用的。 通常,你应该清楚地表明进行了多少次观测。对时间序列数据集来说,要明确你在分析中用到的年期,包括对历史上任何特殊时期(如第二次世界大战)的描述。如果你利用一个混合截面或一个时间序列数据集,一定要记录每年中有多少个横截面数据单元(人、城市等)。55 结果 结果章节应包括你在模型建立一节中的任何模型的估计。你可以从一个非常简单的分析开始。例如,假使毕业班学生进入大学的百分比(percoll)被用来度量某人就读的高中质量,那么,一个待估计的方程为 1og(wage)=b0+b1*percoll+u当然,它并未控制既决定工资又与扣percoll相关的一些其他因素。但是,一个简单的分析可以将读者带人一个更为深奥微妙的分析中并揭示对其他变量进行控制的重要性。 如果仅仅估计了几个方程,你可以用方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年编程语言实战Python编程技能面试模拟题及答案全收录
- 2025年电力系统中级火电运行值班员考试要点解析
- 甲状腺超声诊断
- 甲状腺的快速康复课件
- 职教数学复习 第3章函数 第8讲函数的单调性 课件
- 甲状腺射频消融术课件
- 田坪镇安全知识培训课件
- 用电安全知识培训课件通讯稿
- 关于萧红教学课件
- 新解读《GB-T 35873-2018农产品市场信息采集与质量控制规范》
- 中学升旗管理制度
- Odoo面试题及答案
- 2025年全国I卷英语 高考真题
- 专业公路工程知识考察试题及答案
- 陕西西安铁一中学2025届英语八下期末检测试题含答案
- 2025上半年高级软件水平考试《系统分析师(案例分析)》真题及解析
- 赃款退还协议书
- 中华护理学会团体标准|2024 针刺伤预防与处理
- 江西国泰集团股份有限公司考试真题2024
- 《电解质失衡课件讲解》课件
- 肌少症知识试题及答案
评论
0/150
提交评论