9多重假设检验方法及其在经济计量中的应用_第1页
9多重假设检验方法及其在经济计量中的应用_第2页
9多重假设检验方法及其在经济计量中的应用_第3页
9多重假设检验方法及其在经济计量中的应用_第4页
9多重假设检验方法及其在经济计量中的应用_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多重假设检验方法及其在经济计量中的应用一、 引 言复杂数据主要表现在维数高、相依、非线性与不完全观测等,在基因序列、股市和社会经济等领域中经常出现。传统的数理统计学方法在处理低维、独立、线性与完全数据时有效,但面对如此复杂的数据时,困难很多。因此,“复杂数据和复杂模型的统计推断问题”被列为“十五”期间我国统计学研究的重要领域及重点课题中的主要问题之一。(课题组,统计研究,2000)在2004年第164届美国统计学会(american statistical association)年会中,美国统计学会主席、斯坦福大学统计系教授bradley efron在致辞中指出:“计算机技术突破了曾限制经典

2、统计理论发展的计算瓶颈。与此同时,一些极其重要的问题像洪流一样涌向我们,其表现为巨型数据集合与大规模推断问题(huge data sets and large-scale inference problems)。我相信这一代统计学家将置身于一个可与fisher,neyman,hotelling和wald所处黄金时代相媲美的统计创新时代。”(efron, b., 2005)(朱钰等,2005)2005年5月25 -27日,香山科学会议召开了主题为“生物与医学中的复杂性问题”的学术讨论会。北京大学韩世辉教授认为,目前对脑成像数据的分析方法还是经典的统计方法,没有完全挖掘出数据中关于与大脑认知功能相

3、关的特性。因此应结合多学科,进一步发展脑成像数据的分析方法( “计算生物学最新进展” 的学术研讨会。与会专家们达成了共识:如何从海量的生物学数据中挖掘出最有用的信息,是对生命科学以及医药研究的巨大挑战。计算生物学是一门交叉学科,需要来自不同背景的研究人员通力合作。(http:/www.cae-以上国内外重要的学术会议都传达了如下重要信息:经典的统计方法在面对巨型数据集合与高维(大规模)统计推断问题时已显得乏力,现在急需创造出新的解决这些问题的统计理论、方法和工具。为解决巨型数据集合问题 数据挖掘(data mining)的理论、方法和技术已应运而生。而针对诸如怎样同时检验成千上万个基因中哪些基

4、因的表达水平有显著性差异之类的高维统计推断问题,以错误发现率1 false discovery rate,国内学者还有其它多种译法,如“假发现率”和“阳性发现错误率”等,本文采用“错误发现率”的翻译是沿用了单重假设检验中第i类错误 (type i error- false positive)的含义。 fdr(false discovery rate)为主要特征的多重假设检验2 本文将multiple hypothesis testing翻译成“多重假设检验”。国内学者还有其它译法,如“多检验方法”。(multiple hypothesis testing)的错误控制理论无疑为其提供了一个有效的

5、解决途径。以最近关于fdr的应用研究成果为例:2001年,天体物理学家与统计学家合作在science上发表了利用fdr方法证实宇宙起源大爆炸理论的论文(miller, c j., nichol., r c., batuski, d j. , science, 2001)。2005年,在nature上,遗传学家与统计学家合作,将fdr方法用于遗传多态现象间交互作用对基因表达的影响研究。(brem, rb., storey, jd., whittle, j. and kruglyak, l., nature, 2005) 本文以变量个数远远多于观测次数的高维复杂数据为研究对象,以多重假设检验的错误

6、控制为主线,对多重假设检验问题的错误控制理论、方法和过程及最新进展进行综述,并对多重假设检验方法在经济计量研究中的应用进行展望。二、多重假设检验国内外研究文献综述多重假设检验(multiple hypothesis testing)问题1 这与经典统计中的多重比较问题(如方差分析后多组均数的比较或多组等级分布比较后的两两比较等)不同。经典统计多重比较问题主要是基于同一组样本观测数据进行多个不同的假设检验,而本文要讨论的多重假设检验问题是对应每一个单重假设检验,都有其相对独立的样本观测数据。1,是将多个单重的假设检验作为一个整体,或称为一个检验族(family-wise),然后对这个检验族中的每

7、个假设同时进行检验的问题。我们需要讨论和解决的是:从多重假设检验族考虑,统计检验所犯的错误有多大?用什么尺度合理度量?采取何种方法有效控制? 传统的多重假设检验主要是控制族错误率(fwer :family-wise error rate)。如经典bonferroni多重检验过程和idák 过程(idák , 1967),这些过程具有简单和直观的特点。但是,因为它们将每个检验都同等对待,所以在部分检验具有强相关性时,检验过程就会显得过于保守,导致检验的功效(power)较低。holm (1979) 首先将检验p-值按小大次序排序,对经典bonferroni过程进行改进,提出h

8、olm逐步向下控制过程。随后,simes(1986), hommel (1988) 和rom (1990)在此基础上对改进的bonferroni过程进行了拓展。hochberg, y. 和 tamhane, a c. (1987)共同出版了关于多重比较过程的经典专著 multiple comparison procedures。hochberg, y.(1988)提出了hochberg逐步向上控制过程,charles, w. (1992) 也对多重假设检验的逐步向上控制过程进行了研究。在多重假设检验错误控制问题的研究过程中,具有里程碑意义的是错误发现率fdr(false discovery r

9、ate )的提出。fdr建立了一个全新的错误控制理论,1995年由以色列tel aviv 大学统计学教授yoav benjamini 和hochberg共同 提出(benjamini, y., hochberg, y., 1995) 。这篇文献现已成为多重假设检验问题理论和应用研究的必引文献。fdr的定义是在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝的原假设个数的比例的期望值。与控制fwer相比,控制fdr不仅提高了检验的功效,同时也改进了传统的多重假设检验过程过于保守的缺陷。fdr控制过程特别适用于大规模的多重比较和多重假设检验问题。现在,sas软件专门开发了多重

10、比较与多重假设检验的模块(multiple comparisons & multiple tests using the sas system)。2001年8月,在temple university 举行了“new horizons in multiple comparison procedures” 的国际会议,并出版了专集(benjamini, y. , bretz , f. and sarkar, s.,2004)。在yoav benjamini教授的个人网页(http:/www.math.tau.ac.il/ybenja/)上,yoav benjamini教授对fdr的发展历史

11、、定义、方法、控制过程和软件,以及fdr在医学、生物学、遗传学、经济学和统计决策等领域的应用做了清晰的分类和详细的总结,并列出了相关的重要文献和他本人最新的研究成果。shaffer, j p. (1995, 2002) 对多重假设检验方法进行了总结。hsu, j c. (1996) 出版了专著multiple comparisons: theory and methods。brown, l d. (2000)对统计决策中如何应用fdr方法的前景进行了展望。sandrine, d., shaffer, j p. 和 boldrick, jc. (2003)对多重假设检验中各种错误的控制方法和过程

12、进行了全面的综述。genovese, c. and wasserman, l. (2004) 在随机效用混合模型框架下研究了fdr控制的渐进过程。 从贝叶斯统计推断角度对多重假设检验错误控制进行研究,研究成果特别显著的是华盛顿大学生物统计系的john d. storey博士,他提出了pfdr的概念,给出了q-值的计算方法,并从贝叶斯统计学的角度研究了pfdr的性质和应用(storey , jd., 2003)。随后,他与多人合作发表了许多重要文章,如storey, jd., taylor, je., and siegmund, d. (2004);storey, jd., akey, jm.,

13、 and kruglyak, l. (2005);brem, rb., storey, jd., whittle, j. and kruglyak, l. (2005);leek, jt., monsen, ec., dabney, a r., and storey, jd.(2006)以及多篇工作论文(详见他的个人网页:/jstorey/)。特别是前文提到的他与brem, r b.共同合作发表在nature(2005)的成果,在学术界具有非常大的影响。其他学者,如newton, noueiry, sarkar and ahlquist

14、(2004);pounds,s. and cheng,c. (2004);broët, lewin, richardson, dalmasso and magdelenat (2004);dalmasso, c. , broet, p. , moreau, t.(2005)分别对pfdr的贝叶斯估计进行了研究。关于多重假设检验问题的研究,也受到了国际著名统计学家的高度重视,且已编入了国际统计学的教材中。erich lehmann 是美国加州大学berkley分校的名誉退休教授,美国国家科学院院士。他编著的theory of point estimation1 此书的第二版(1998)

15、已由北京大学的郑忠国教授等人翻译为中文版点估计(2005)。1和testing statistical hypotheses的是世界各国培养统计学研究生的标准教材,被世界各国的大学广泛采用。在testing statistical hypotheses(3rd ed., 2005)第i篇的第9章中,erich lehmann介绍了多重假设检验问题的基本理论和方法。2005年,lehmann 还撰文提出了k-族错误率(k-fwer)的概念(lehmann, e l., joseph , p., and romano, 2005)。另外斯坦福大学统计系教授bradley efron也对此问题做了深

16、入的研究,并在许多重要报告中介绍了fdr的应用成果。参见文献:efron, b(2001-2005)或他的个人网页(/brad/papers/)。国内目前涉及多重假设检验fdr问题研究才刚刚起步,研究文献还较少。关于fdr的研究,黄丽萍等(2003)对多检验方法fdr在脑功能磁共振成像(fmri)处理中的应用进行了研究,他们对错误发现率 (fdr)方法进行了计算机实现,将fdr方法及其他几种假设检验方法应用在模拟数据和fmri数据分析中,研究结果表明fdr方法是一种更可信的多检验方法。缪柏其(2005)和朱 钰等(2005)介绍了fdr方法

17、取得的显著成果。东北师范大学郭建华教授指导的裴艳波(2005)的硕士论文对多重假设检验问题中关于三种错误测度fwer, fdr和pfdr进行了较全面的介绍。此外,荀鹏程等(2006)对微阵列数据的多重比较进行了探讨。二、多重假设检验的错误控制问题 我们将多重假设检验问题简化,设有m重假设检验 h1,h2,hm ,其中单个假设检验hi对应着单重假设检验(h0i , h ai ) (i=1,2,m)。 当m很大(成千上万)时,需要同时对这m重假设进行检验,怎样对检验的错误进行控制?这是现代dna数据统计分析中迫切需要解决的问题。例如,在基因芯片数据统计分析中,“微阵列(microarray)”技术

18、的迅速发展,给统计学专业人员提供了大量的微阵列数据。这类资料的特点:样本含量较小(一般为十几个或数十个),而变量数(基因数)非常多(一般为几百、几千甚至几万个)。在微阵列数据的差异表达分析中,多重比较问题就显得尤为突出。(荀鹏程等,2006)经典的单重假设检验(single hypothesis testing)问题,常涉及两个假设。所要检验的假设称为原(零)假设(null hypothesis),记为h0,与h0不相容的假设称为备择假设(alternative hypothesis),记为ha 。给定了h0 和ha ,就相当于给定了一个假设检验问题(h0 ,ha)。对(h0 ,ha)进行检验

19、,就是给定一检验法则,将样本空间划分为互不相交的两个子样本空间,将其中之一称为检验的拒绝域,并作如下规定:当样本观测值落入拒绝域之内时,就拒绝原假设h0;当样本观测值落在拒绝域之外时,就不拒绝原假设h0 。(陈希孺,1999)在进行假设检验时,由于观测样本的随机性,我们可能做出正确的判断,也可能做出错误的判断。如表1所示,正确的判断是原假设h0为真时不拒绝原假设h0 ,或原假设h0不为真时拒绝原假设h0 ;而错误的判断是原假设h0为真时拒绝原假设h0 ,或原假设h0不为真时不拒绝原假设h0 。表1 单重假设检验不拒绝原假设h0(检验不显著)拒绝原假设h0(检验显著)原假设h0为真正确判断第i类

20、错误原假设h0为假第ii类错误正确判断由表1可以看出,对于单重假设检验问题,会发生两类统计推断错误:当原假设h0为真时,样本观测值却落入拒绝域之内,从而拒绝原假设。这种错误称为第i类错误(弃真,假阳性(医)(type i error: false positive)。另一类错误是,当原假设h0不为真时,样本观测值却落在拒绝域之外,从而没有拒绝原假设。这种错误称为第ii类错误(取伪,假阴性(医)(type ii error: false negative)。为了对单重假设检验错误控制,对检验法的好坏给出一个合理的评选标准,需要考察一个检验法则可能犯错误的概率。犯第i类错误的概率为: ;犯第ii类

21、错误的概率为:检验的势(功效)(power)= 1-。显然,在样本容量固定时,要减少犯第i类错误的概率,就会增大犯第ii类错误的概率;反之,若要减少犯第ii类错误的概率,就会使犯第i类错误的概率增大。即,当样本容量固定时,不可能使得犯这两类错误的概率都减少。基于这种情况,需要采取某种妥协方案。neyman 和pearson 给出了解决方案,n-p假设检验理论的基本思想就是:使得犯第i类错误的概率限制在某一个范围内,然后寻找使犯第二类错误的概率尽可能小(从而势尽可能大)的检验。限制检验犯第i类错误的概率的范围就是检验的水平(也称检验的显著性水平 significant level)。常取一个较小

22、的数,例如取0.05, 0.01等。随着计算机和统计软件的发展,目前常用的检验方法是,将p-值与显著性水平进行比较:如果p-值小于或等于,就拒绝原假设,如果p-值大于,就不拒绝原假设,因为证据不充分。所以,在单重假设检验问题中,我们主要通过控制犯第i类错误的概率(检验的显著性水平)来达到对单重假设检验统计推断的错误控制。而对于多重假设检验,再用控制犯第i类错误的概率来对多重假设检验的总体错误进行度量就会出现无效的情形。例如对于m重假设检验,若m个假设相互独立,设每一个假设检验的显著性水平(犯第i类错误的概率)均为,则在m次检验中,至少犯一次第i类错误的概率为1- (1-)m 。显然当m很大时,

23、特别是趋于无穷大时,m次检验中至少犯一次第i类错误的概率趋于1。因此,必须采用新的方法对m重假设检验的错误进行控制。三、多重假设检验的错误度量对于m重假设检验,分别对每个假设进行检验,再将所有检验结果按原假设为真和为假的条件,进行分类总结,可得表2(benjamini, y., hochberg, y., 1995)。表2 m重假设检验结果不拒绝h0(检验不显著)拒绝h0(检验显著)原假设h0为真uv(第i类错误)m0原假设h0为假t(第ii类错误)sm- m0m-rrm在表2中,我们将m重假设检验中m个原假设中为真的个数记为m0,则剩余m- m0个原假设为假。在对这m重假设进行检验后,最终检

24、验结果中有r个拒绝原假设,m-r个不拒绝原假设。对m重假设检验中的每一个假设检验,在做出统计推断时,我们会犯i类错误和ii类错误。将m个检验中所犯i类错误和ii类错误细分成四个部分:u、v、s和t。其中,u和s表示m个检验中正确检验的个数;v表示m个检验中犯i类错误检验的个数;t表示m个检验中犯ii类错误检验的个数。显然,r是一个可以观测的随机变量,而u、v、s和t都是不可观测的随机变量。同单重假设检验的思想类似,我们对m重假设检验也需重点考虑犯i类错误和犯ii类错误的情况。不同的是我们关注的是将这m次检验作为一个总体看待,犯i类错误或犯ii类错误所占的比例。下面介绍5种常用的错误度量标准。1

25、. 平均族错误率(pfer :per-family error rate)对于一个多重假设检验族(family-wise),非常自然的错误控制过程就是将m个检验分别单独考虑,控制m个检验中犯i类错误检验个数v的期望值。即控制平均族错误率(pfer :per-family error rate)= e(v)。由于v表示m重检验中犯i类错误检验的个数,是研究人员特别关心的,但是由于无法观测,所以用v的期望来控制错误是最自然的考虑。不过,平均族错误率(pfer)比较明显的弊病在于没有考虑检验的总次数,而检验的总次数与最后的错误控制密切相关。2. 平均比较错误率(pcer :per-compariso

26、n error rate)在平均族错误率(pfer)的基础上,学者给出了平均比较错误率(pcer :per-comparison error rate): pcer = e(v)/m。从定义容易看出,平均比较错误率(pcer)主要描述的是平均族错误率(pfer)在m个检验中所占的比例。平均比较错误率(pcer)的思想是基于在所有m个检验中,“错误拒绝(false rejections)”(犯i类错误)的次数v所占的百分比。对每一个假设都在显著性水平下进行检验,可以控制pcer = e(v)/m小于或等于事先给定的。平均比较错误率(pcer)控制的不足是,将m重假设检验中的每一个假设检验都在下进

27、行,而没有考虑多重假设检验问题的“总体性”,使得检验标准过于“宽松”。3. 族错误率(fwer :family-wise error rate)为了克服平均比较错误率(pcer)的不足,这时,学者将注意力放到了表2中“错误拒绝”或称为“错误发现(false discoveries)”发生的次数v上。希望通过在显著性水平范围内,控制“在m次检验中至少发生错误发现一次”的概率来控制多重假设检验整体的错误。即控制 或于是有了族错误率(fwer :family-wise error rate):fwer = p(v 1)的定义。族错误率(fwer)与pcer不同,它是一个概率值,表示的是m重检验中至少

28、犯一次i类错误的概率。对每一个假设都在显著性水平/m下进行检验,可以保证fwer = p(v 1)小于或等于事先给定的。4. 错误发现率(fdr)benjamini, y., hochberg, y.(1995) 提出的错误发现率(fdr)的定义如下其中,v表示m个检验中错误拒绝的个数, s表示m个检验中正确检验的个数,r表示m个检验中拒绝原假设的个数。定义表明:错误发现率(fdr)表示的是m重检验r次拒绝中错误拒绝(犯i类错误)个数v所占比例的期望。从fdr的定义中可以得到非常重要的两个性质:(benjamini, y., hochberg, y., 1995)(1)如果所有原假设全为真,即

29、当m0 = m时,fdr = fwer。所以控制fdr意味着弱控制条件下1 m重假设检验的错误控制假设条件主要分成两种情形:弱控制(weak control)和强控制(strong control)。弱控制是指m重假设检验中,所有的m个原假设全为真;而强控制是指m重假设检验中, m个原假设中有真有假。( shaffer,1995; dudoit et al, 2003)1 可以控制fwer。(2)当m0 < m时,fdr小于或等于fwer。所以,此时,任何控制fwer的过程同样也可以控制fdr。不过,如果一个过程只能控制fdr,这或许有些过于“严厉(stringent)”,但对于在实际检

30、验中经常遇到的原假设中有绝大部分不真的情况下,这种检验过程的势(power)会有所提高。5. 正错误发现率(pfdr :positive false discovery rate)pfdr的定义为:比较fdr和pfdr两者的定义可知,pfdr是fdr的一种特例。benjamini, y.和 hochberg, y.(1995)给出fdr的定义时,考虑了pfdr无效的情形,他们认为,当所有m个原假设均为真时,表2中的m0 = m ,那么,v= r ,则pfdr=1。在这种情形下,无法选择显著性水平,使得pfdr< 。storey(2001,2002,2003)却认为,在实际问题中,m个原假

31、设均为真的情形非常少,人们更关心的是当原假设中存在不真的情况下的假设检验问题。所有当m- m0 > 0时,pfdr定义就具有广泛的应用。三、多重假设检验的错误控制过程1. 经典bonferroni多重检验过程考虑m重假设检验 h1,h2,hm ,对于每个假设hi ,都有相对应的p-值 1 实际为调整的-p值(adjusted p-values)(shaffer,1995) pi ,于是有 p1,p2,pm 。现给定一显著性水平,将每个假设平等对待,即将显著性水平除以m,以/m为标准,在 p1,p2,pm 中,若pi /m ,则拒绝hi(i=1,m),由bonferroni不等式可得经典b

32、onferroni多重检验过程具有简单和直观的特点,由于没有分布的假设,便于应用。但是,因为它将每个检验都同等对待,所以在多重假设检验的维数m很大时,或部分检验具有强相关性时,检验标准就会过于严格,检验过程就会显得过于保守,导致检验的功效(power)较低。例如,在微阵列数据的多重比较时,要将整个检验fwer控制在0.05,每次检验的水准就必须控制得很低,如bonferoni法控制在0.05/m。在微阵列数据中,m>1000较为常见,则检验水准为,甚至更低,这样只能发现少数表达差异极大的基因(或蛋白等),导致检验效能大大降低。(荀鹏程等,2006)2. 改进的bonferroni多重检验

33、过程holm (1979) 首先将检验p-值按小大次序排序,对经典bonferroni过程进行改进,提出holm逐步向下(step-down)控制过程。即,在进行假设检验前,先将检验的p-值按小大次序排序,记为p(1) ,p(2) p(m) 。然后对所有的j=1,i ,判断p(j) /(m-j+1)是否成立,如果此式成立,则拒绝检验 h(j) 。simes(1986) 在holm检验的基础上对控制过程进行改进,对所有j=1,m ,判断p(j) j/m是否成立,如果存在一个j成立,则拒绝所有检验 h1,h2,hm 。hochberg(1988)提出了逐步向上(step-up)控制过程,以下式为标

34、准,进行检验。拒绝检验h(1),h(2),h(k)。hochberg逐步向上控制过程可用以下过程图表示:是拒绝所有原假设,检验停止。判断p(m)是否成立否不拒绝h(m),再判断p(m-1)/2是否成立是不拒绝h(m),拒绝其它原假设,检验停止。否不拒绝h(m)h(2),再判断p(1)/m是否成立是不拒绝h(m)h(2),拒绝h(1),检验停止。否不拒绝h(m)h(2), h(1), 检验停止。3. fdr多重检验过程:考虑m重假设检验 h1,h2,hm ,相对应的检验p-值为 p1,p2,pm 。benjamini, y., 和hochberg, y.(1995)在simes(1986)和ho

35、chberg(1988)的基础之上提出的b-h过程包括以下步骤:步骤1:将 p1,p2,pm 排序,设p(1) p(2)p(m),相对应,m重假设检验变换为 h(1),h(2),h(m);步骤2:令;步骤3:从p(m) 开始,按步骤2逐步向下检验;步骤4:若存在满足步骤2的k,则拒绝 h(1),h(2),h(k)。否则,不拒绝 h(1),h(2),h(m) 。在b-h过程基础上,benjamini, y.和其他学者进行了不断的改进。如benjamini和liu(1991);benjamini和yekutiel(2001)等在相依情形和与分布无关情形下对多重检验过程进行了拓展。4. pfdr多重

36、检验过程:以上错误控制过程都遵循这样一个模式:在先给定错误控制水平固定第i类错误水平的前提下,基于单个假设检验,再通过错误控制过程构造出检验的拒绝域,最后,得出检验结果。而storey(2001,2002,2003) 却提出了一种全新的假设检验新思路:凭经验先给出拒绝域,然后去估计错误率。如果这个估计能够被接受,则认为该检验是有效的;如果错误率较大,可以通过调整拒绝域使得错误率被控制在满意的水平。这种新方法无疑提高了多重假设检验的实用性。(裴艳波,2005)storey利用pfdr给出了q-值的定义和算法: 对于一个观测统计量t= t,四、多重假设检验在经济计量研究中的应用首届经济学诺贝尔奖得

37、主ragnar frisch在1933年经济计量学(econometrica)杂志首期创刊中,对经济计量学给出的定义是:“经济计量学是统计学、经济学和数学的统一体(econometrics is the unification of statistics, economic theory and mathematics.)。” 从ragnar frisch对经济计量学的定义可以很清晰地看出,将统计学放在首位,置于经济理论和数学之前,表明统计学对于经济计量学的不可替代的重要性。我们知道,建立经济模型、估计经济模型和检验经济模型是经济计量学的主要内容,而估计和检验统计推断的主要内容正是经济计量学方

38、法的核心。所以,统计学理论和方法的发展可以极大促进经济计量学研究的发展。结构方程模型 (sem ,structural equation modeling) 是一种通用的线性统计建模技术,已成为重要的多元统计分析方法,并日益受到广大研究者的重视。green s .b与babyak m.a(1997)将fdr技术应用于结构方程模型的研究。他们对结构方程模型中带约束条件的第i类错误的概率的控制进行了研究,提出了在结构性方程模型中评价带约束条件的多重检验和控制第i类错误的两种对比性的观点。green s .b与babyak m.a(1997)的研究表明,结构方程模型中一个标准策略是指在拒绝一个初始模

39、型以后实施拉格朗日乘数检验。通过这些检验控制第一类错误将模型中包含的不必要的附加参数的相似性最小化。在因子分析模型中用模拟试验数据评价第i类错误控制有三种方法:一是标准方法,即在0.05显著水平下检验每个参数;二是bonferroni方法;三是同步检验过程(stp)方法。在具体的搜索中有三个因素需要处理:因子权重、样本容量和参数个数。标准方法和stp(同步检验过程)方法分别产生极度自由的和极度保守的族误差率。但是bonferroni方法产生接近正常水平的错误率。此后,green sb, thompson ms, babyak, ma.(1998),cribbie ra(2000)对结构方程模型

40、的错误控制问题进行了更加深入的研究。在经济和金融的实证研究中,不可避免的会卷入所谓数据探察(data snooping)的困境中。经济研究显然与物理研究不同,无法设计出可以可反复再现的情形。用来分析的经济数据只能出现一次而不能重复产生。我们经常碰到的问题是,面对单一的数据集,需要做出“最佳”的决策,或者在一定基准(benchmark)下“较好”的策略。而这个基准(benchmark)可能是固定的也可能是随机的。在经济计量分析中,数据探察(data snooping)造成的错误影响受到了许多研究人员的关注。如cowles(1933), leamer (1983), lovell (1983),

41、lo and mackinley (1990), and diebold (2000) 等。在众多学者当中,国际经济计学会(econometric society)院士,美国艺术与科学院(american academy of arts and sciences)院士halbert l. white 教授成绩斐然。他在1999于 journal of finance 的论文 “data snooping, technical trading rule performance,and the bootstrap”中指出,经济计分析中数据探察(data snooping)可能造成的影响以及如何校正

42、造成的错误,并由此分析证券市场的技术交法则的表现。2000,他在 econometrica 上发表文 “a reality check for data snooping” 。该论文建了如何校正数据探察(data snooping)错误的理论基础。他所发展出来的检测方法现被称为“怀特真实性检验”(whites reality check),并成为实证分析中重要的检验工具。在此基础上,joseph p. , romano和michael wolf两位学者在2005年的econometrica上发表论文“stepwise multiple testing as formalized data sn

43、ooping”。从多重假设检验的角度对数据探察(data snooping)进行了研究。他们提出了逐步多重检验过程(stepwise multiple testing procedure),可以在给定的错误控制水平下,渐近地控制fwer。这种错误控制过程同其它单步骤检验(single step)过程相比具有更高的检验功效。 本文讨论的多重假设检验理论与方法,虽然目前主要应用于基因芯片数据的统计分析中,但是由于在社会经济等领域中,同样也大量存在类似的复杂数据,所以,多重假设检验理论、方法以及新产生的统计推断思想无疑也会在经济计量学的研究中大放光彩。 参考文献1 benjamini, y. and

44、 hochberg, y. (1995). controlling the false discovery rate: a practical and powerful approach to multiple testingj. j. roy. statist. soc. ser. b 57: 289300.2 brem, rb., storey, jd., whittle, j. and kruglyak, l. (2005). genetic interactions between polymorphisms that affect gene expression in yeastj. nature, 436: 701-703.3 cribbie ra(2000),evaluating the importance of individual parameters in structural equation modeling: the need for type i error control j. pers indiv differ 29 (3): 567-577 sep.4 efron, b.(2005). bayesians, frequentists and scientistsj. j. am. stat. assoc. 100:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论