(管理科学与工程专业论文)基于自组织数据挖掘的因果关系检验方法.pdf_第1页
(管理科学与工程专业论文)基于自组织数据挖掘的因果关系检验方法.pdf_第2页
(管理科学与工程专业论文)基于自组织数据挖掘的因果关系检验方法.pdf_第3页
(管理科学与工程专业论文)基于自组织数据挖掘的因果关系检验方法.pdf_第4页
(管理科学与工程专业论文)基于自组织数据挖掘的因果关系检验方法.pdf_第5页
已阅读5页,还剩141页未读 继续免费阅读

(管理科学与工程专业论文)基于自组织数据挖掘的因果关系检验方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于自组织数据挖掘的因果关系检验方法 管理科学与工程专业 研究生:张宾指导教师:贺昌政教授 经济时问序列分析研究的一个主要目的就是分析经济变量之问是否存在因 果关系。g r a n g e r 吲果关系检验方法是其中最重要、也是被使用最广泛的方法。 自1 9 6 9 年g r a n g e r 因果关系检验方法问世以来,各国学者傲了诸多改进发展, 然而研究表明,陔方法用于复杂系统分析究方面尚存在不足。 本文以g r a n g e r 因果关系定义的基本思想为基础,引入面向复杂系统的自 组织数据挖掘方法,建立了基于自组织数据挖掘的因果关系检验方法体系,用 于复杂系统因果关系检验。 我们首先建立了基于g m d h 的因果关系检验方法: ( 1 ) 给出了基于g m d h 的因果关系定义,设计了检验方法的算法步骤,还编制 了相应的算法程序。 ( 2 ) 通过理论分析、算例讨论和人民币汇率的实证研究三种途径对基于g m d h 的因果关系检验方法和g r a n g e r 因果关系检验方法进行了比较研究,揭示了前 者研究复杂系统因果关系的有效性。 g m d h 检验方法适用于具有确定特征的单输出( 结果) 多输入( 原因) 复杂系统。进一步,将自组织数据挖掘中的其他方法与g r a n g e r 因果关系定义 的基本思想结合,还提出并初步探讨了以下检验方法: ( 1 ) 适用于具有确定特征的多输出( 结果) 多输入( 原因) 复杂系统的参数 o s a 因果关系检验方法以及作为其延伸的基于o s a 的解释结构模型, ( 2 ) 适用于模糊的单输出( 结果) 多输入( 原因) 复杂系统的非参数f r i 因 果关系检验方法及考虑数据划分影响的基于a c 的f r i 因果关系检验方法, ( 3 ) 适用于多输出( 结果) 多输入( 原因) 复杂系统的非参数的基于o s a 思 想的f r i 因果关系检验方法。 复杂性和复杂系统的研究在经济管理中有着重要的理论意义和广阔的应用 前景。基于自组织数据挖掘的因果关系检验方法从因果关系的定义、检验技术 和检验结果等方面,发展了g r a n g e r 因果关系检验方法,在揭示复杂系统构成 的层次结构及系统的演化规律方面显示了自己的特色。 关键词:自组织数据挖掘,因果关系检验,复杂系统 c a u s a l i t yt e s t i n gb a s e do n s e l f - o r g a n i z i n gd a t am i n i n g m a n a g e m e n ts c i e n c ea n de n g i n e e r i n g p o s t g r a d u a t ez h a n gb i n a d v i s e rh e c h a n g z h e n g c a u s a l i t yb e t w e e nv a r i a b l e si so n eo ft h ef o c r i s e s1 ne c o n o m i ct i m es e t i e s a n a l y s i s g r a n g e rc a u s a l i t yt e s ti so n eo ft h em o s ti m p o r t a n ta n dp o p u l a rm e t h o d s s c i e n c ep r o p o s e di n1 9 6 9 ,t h i sm e t h o dh a sb e e ni m p r o v e do nv a r i o u sa s p e c t sb y r e s e a l c h e i si nd i f f e r e n tc o u n t l - i e s h o w e v e r , i th a sb e e nd e m o n s t r a t e dt h a tt h i s m e t h o dh a ss h o r t c o m i n g so nc o m p l e xs y s t e ms t u d y i n g f r o mt h ep o i n to fc o m p l e xs y s t e mm o d e l i n g , i ti sp r o p o s e dt h ec a u s a l i t yt e s t i n g m e t h o db a s e do ns e l f - o r g a n i z i n gd a t am i n i n g , t h o u g hc o m b i n i n gt h eb a s i ci d e ao f t h ec o n c e p to fg r a n g e rc a u s a l i t yw i t ht h ec o m p l e xs y s t e mo r i e n t e dt e c h n i q u e ,t h e s e l f - o r g a n i z i n gd a t am i n i n g , t ot e s tt h ec a u s a l i t yi nc o m p l e xs y s t e m f i r s t l y ) i ti sp r o p o s e dt h eg m d h ( g r o u pm e t h o do fd a t ah a n d l i n g ) 。b a s e d c a u s a l i t yt e s t : ( 1 ) ni se s t a b l i s h e dt h ec o n c e p t so fg m d h - b a s e dc a u s a l i t ya n dd e s i g n e dt h et e s t i n g p r o c e d u r e ( 2 ) c o m p a r e dw i t hg r a n g e rc a u s a l i t y t e s tt h o u 【g ht h e o r e t i c a la n a l y s i s ,n u m e r i c a l e x p e r i m e n ta n dt h ee x a m p l eo fr m be x c h a n 百n gr a t e ,i ti ss h o w e dt h ev a l i d i t yo f g m d h - b a s e dc a u s a l i t yt e s ti nc o m p l e xs y s t e ms t u d y i n g g m d h b a s e dc a u s a l i t yt e s ti ss u i t a b l ef o rs i n g l e - i n p u t m u l t i o u t p u tc o m p l e x s y s t e mw i t hc e r t a i r lc h a r a c t e r s 。f u n h c :m o 霹,“i sp r o p o s e df h of o l l o w i n gc 盘嚣a ! 蚵 t e s t i n gm e t h o d sb yc o m b i n i n gt h eb a s i ci d e ao ft h ec o n c e p to fg r a n g e rc a u s a l i t y w i t ho t h e rt e c h n i q u e so fs e l f - o r g a n i z i n gd a t am i n i n g : ( 1 ) p a r a m e t r i co s ab a s e dc a u s a l i t yt e s ta n dt h eo s ab a s e di n t e r p r e t a t i o ns t r u c t u r a l m o d e l i n g ,b o t hs u i t a b l ef o rm u l t i i n p u t m u l t i - o u t p u tc o m p l e xs y s t e mw i t hc e r t a i n c h a r a c t e r s , ( 2 ) n o n p a r a m e t r i cf r ib a s e dc a u s a l i t yt e s ta n di t si m p r o v e se d i t i o nb a s e do na c w h i c ht a k e st h ee f f e c t so f d a t as p l i t t i n gi n t oa c c o u n t ,b o t h s u i t a b l ef o r s i n g l e - i n p u t - m u l t i o u t p u tf u z z y ,c o m p l e xs y s t e m ( 3 ) n o n p a r a m e t r i c o s ab a s e df r i c a u s a l i t y t e s t , s u i t a b l e f o r m u l t i i n p u t m u l t i o u t p u tf u z z y , c o m p l e xs y s t e m c o m p l e x i t ya n dc o m p l e xs y s t e mr e s e a r c hh a v ei m p o r t a n tm e a n i n go nt h e o r y a n de x t e n s i v ep r o s p e c t so fa p p l i c a t i o n c a u s a f i t yt e s t i n gb a s e do ns e l f - o r g a n i z i n g d a t am i n i n ge x t e n d e dt h eg r a n g e rc a u s a l i t yt e s to nc o n c e p t s ,m e t h o d sa n dr e s u l t s , w h i c he x h i b i t si t sf e a t u r e so ni d e n t i f y i n gt h eh i e r a r c h i c a ls l p a c t u r ea n de v o l v i n gm l e so f c o m p l e xs y s t e r n k e y w o r d s :s e l f - o r g a n i z i n gd a t am i n i n g , c a u s a l i t yt e s t i n g , c o m p l e xs y s t e m 川川人学碰l 学位论史 1 绪论 1 1 研究背景 两千多年前,亚罩士多德就指出真证的科学知识是关于原因的知议。自古 以柬,探讨事物之1 日j 的因果关系就是哲学、自然科学、社会科学、医学等几乎 所有科学研究的最终目的p j 。经济活动的高度国际化及科学技术进步的加速, 使得影响社会经济发展的因素变得繁多复杂,经济发展同趋不稳定。经济系统 通常涉及众多领域、包含丁 二f 个变量和参数,它们之间相互联系、相互作用, 构成了非线性的商维系统i l i 。分析经济系统的结构和层次,进而从整体上把握 经济系统的运行规律,是研究经济问题的主要内容之一。因果关系检验是其中 重要的研究方法。虽然对斟果关系检验已有了一些常用的统计检验方法,但是 除非它们能本质地体现出经济理论,或者说能合乎己有经济理论的解释,西则 是不能从一系列简单的关系式中提取因果关系的。从理论研究的角度看,因栗 关系研究难就难在是否能提出一个能广为接受和普遍适用的因果关系定义【2 l 。 在已有的因果关系研究中p l 被普遍接受的、应用最广泛的是g r a n g e r 因 果关系定义。在w i e n e r 研究1 5 l 的基础上,c l i v e r g r a n g e r 提出的因果关系原理1 6 j 引用了条件概率理论来定义因果关系,并在检验上运用时序分析技术,通过研 究大量现象的统计数据束排除偶然性因素的影响。当这一定理被著名计量经济 学家西姆斯( c 。s h n s ) 应用于研究现金和收入之圆的关系问题f 7 j ,并由此得出引 起争议的结论时,g r a n g e r 因果关系检验开始受到广泛的关注。后来,就连对因 果关系问题很有研究的哲学界也渐渐被其简单易行的实效性所折服,由此引起 更加广泛的关注。事实上,自从g r a n g e r 因果关系检验被提出以来,其改进研 究就没有停止过。在( e c o n o m i e sl e t t e r s ) ) 上经常可以看到关于g r a n g e r 因果关 系捡验的最新改进的报道。关于g r a n g e r 因果关系检验的应用研究则大量刊登 在j o u r n a lo fi n t e r n a t i o n a lm o n e ya n df i n a n c e 、? :j o u r n a lo fe c o n o m e t r i c s ) ) 、 口t1 】耿卣闲果推断与s i m p s o n 悖论统计b 信息论坛,2 0 0 0 t 1 5 ( 3 9 ) :9 - 1 2 l j l 门1 人学艘l 学位论史 ( i n t e r n a t i o n a lj o u r n a l0 1 f o r e c a s t i n g ) ) 、( e n e r d , e c o n o m i c s ) ) 、( m a t h e m a t i c sa n d c o m p u t e r s i ns i m u l a t i o n 、( e c o n o m i cm o d e l l i n g 、u o u r n a lo f p o l i c ym o d e l i n g ) ) 、 ( ( i n t e r n a t i o n a lr e v i e wd ,e c o n o m i c sa n df i n a n c e 等杂志上。 复杂性科学是2 l 世纪的科学,对复杂问题的研究越来越受到人们的重视。 但是,g r a n g e r 因果关系检验及其后来的改进方法在分析复杂问题方面还有不 足,值得进一步对其进行改进和发展。 g r a n g e r 本人认为1 8 l 出于g r a n g e r 因果关系仅仅是一个能被应用的统计学定 义,故得出的结论有时显得过于简单,往往只能用于判定存在或不存在因果关 系,面不能在不同模型之阕做出优化选择。在实际应用中,g r a n g e r 因果关系检 验的主要不足还包括 ( 1 ) 关于多变量问题:g r a n g e r 因果关系检验适用于二元时间序列模型研究两个 序列之问的因果关系,其默认假设是不存在其它时间序列的影响。但实际经济 系统包含的变量远超过两个。 ( 2 ) 关于先验假设问题:为了满足g r a n g e r 因果关系检验对时间序列的严格假设, 需要对原始时问序列进行差分、消除趋势、b o x 4 e n k i n s “预白化”等处理但 这可能扭曲原始时间序列之间的因果关系。 ( 3 ) 关于小样本问题:通常用渐进理论确定各种有用的统计量的抽样分布,但是 在时问序列前后关系的分析上,渐进分布对小样本可能不是足够精确,而实际 问题通常是先验信息不足、样本量少的问题。 计量经济学家注意到以上不足,在沿用g r a n g e r 因果关系定义的基础上, 直致力于其改进。归纳起来,这些改进大致可以分为以下几类( 详见2 2 ) : ( 1 ) 扩展g r a n g e r 因果关系检验的应用范围,从二维问题到多维问题; ( 2 ) 提出非线性g r a n g e r 因果关系定义及检验: ( 3 ) o u t - o f - s a m p l eg r a n g e r l n 果关系检验及其改进: ( 4 ) 在g r a n g e r n 果关系检验判断是否存在因果关系的基础上,进一步判断因果 关系的强度。 以上改进分别针对g r a n g e r 因果关系检验某一方面的不足,虽然提高了这 种方法的实用性,但是都没育从复杂性角度出发考虑因果关系。实际的经济问 v t l 川人学唢i j 学位论殳 题通常是复杂的多维非线性问题,g r a n g e r 因果关系检验及其改进方法还不能同 时处理非线性性、多元性并判别因果关系的作用方式和强度。用这种方法研究 复杂问寇时,只能将复杂问题分解成简单问题、再将简单问题的研究结果叠加 得到原问题解。简单的说,这种方法首先将系统的各部分研究清楚,然后将萁 组合往一起,希望以此掌握整体的情况,即1 + 1 = 2 。理论研究表明【1 8 1 ,随着科 学越柬越深入到更小尺度的微观层次,我们对物质系统地认识越来越精细,但 对整体的认识却越来越模糊,即1 + 1 2 。现代科学表明,许多宇宙奥秘来源于 整体的涌现性( 或称突现性,w h o l ee m e r g e i c e ,指系统整体j 具有、孤立的部 允及其总和不具有的特性) l i “l 。真正的整体涌现性在整体被分解为部分时可能 已不复存在。经济系统正是复杂性问题9 1 。g r a n g e r 因果关系检验虽然可以清楚 显示两个变量间的因果关系,但当系统变量远远超过两个形成复杂系统时,即 使任意两个变量间的因果关系再清楚,也无法准确地从整体上了解系统规律。 综上所述,对于实际经济问题,需要发展适用于复杂系统的因果关系检验 方法,通过对系统整体进行研究,更深入地把握系统的层次、结构和功能。 1 2 研究目标 本文的研究问题是:如何从复杂系统建模角度出发,按照g r a n g e r 因果关 系定义中根据检验模型预测能力是否显著变化来判断因果关系是否存在的基本 思想,检验复杂系统中多维变量间因果关系及其联系方式和强弱程度,识别出 复杂系统中同时存在的多个因果关系及其相互联系,进而从整体上了解系统变 量的层次、结构和功能。其中,着重研究( 1 ) 单输出( 结果) 多输入( 原因) 问题的因果关系检验,( z ) 多重因果关系捡验,( 3 ) 因果关系联系方式与强弱程度 的议别,( 4 ) 在以上因果关系检验的基础上对系统变量的层次和结构进行分系。 研究复杂系统首先要有正确的方法论,其次要有与之楣一致的具体实现方 法。其中,我国学者钱学森先生提出的从定性劐定量的综合集成方法 ( m e t a s y n t h e s i s ) 是迄今为止最值得重视的复杂系统的研究方法论1 2 0 l 。自组织 数据挖掘的理论和方法在1 9 6 9 年被提出后,在1 9 9 0 s 经历了其第三阶段的发 主1 许圄忐等系缆科学,上爆:上海科技教育出舨社,2 0 0 0 叫川人学坝i :学位论立 展。根据自组织数据挖掘理论和方法的研究和发展工作,结合近年来在复杂性 科学领域的研究,我们认为自组织数据挖掘是复杂系统的从定性到定量综合集 成方法的有效实现技术m i 。格g r a n g e r 因果关系定义的基本思想与自组织数据 挖掘结合,有望解决或改进g r a n g e r 因果关系检验的不足。 因此,本文的研究目标就是扶复杂系统建模角度,建立适用于复杂系统的 基于自组织数据挖掘的因果关系检验方法体系,使之能从整体上研究系统的层 次结构和功能。研究目标( 如图1 1 ) 具体包括: 图1 1 基于自组织数据挖掘的因果关系检验方法体系 ( 1 ) 针对gr a n g e r 因果关系检验只适用于二元变量问题、需要严格的前提假设、 对于小样本问题检验结果不够精确、对滞后阶数的选择非常敏感、不能揭示因 果关系强度、检验结果的推广能力较弱等问题,提出基于数据分组处理方法 ( g m d h ) 的因果关系检验方法,利用g m d h 数据划分和内、外准则的配合使 用,克服复杂系统中变量多、样本少产7 的因果关系检验结果推广能力弱的问 川川人学碗 :学位论文 题,使之能较好地应用于单输出( 结果) 多输入( 原因) 问题。 ( 2 ) 针对g r a n g e r 园果关系检验与g m d h 因果关系检验只能检验单向因果关系的 不足,提出基于客观系统分圻( o s a ) 的因果关系检验方法,使之能客观划分 系统输出与输入、识别出系统中同时存在的多重因果关系。 ( 3 ) 针对o s a 因果关系检验模型不能直观地显示多个变量恤1 复杂因果关系的缺 点,提出了基于o s a 的解释结构模型,以递阶结构图的形式直观地显示出系统 变量的层次结构和多个因果关系问的相互影响。 ( 4 ) 针对模糊程度较高的复杂问题,提出基于模糊准则归纳( f r i ) 及其改进算 法的非参数因果关系检验方法,使之能够分别适用于蕈输出多输入和多输 出多输入问题。 1 3 论文结构 根摆以上研究目标,本文的结构安排如下: g r a n g e r 因果关系检验是最重要的因果关系检验方法,第2 章是对g r a n g e r 因 果关系检验的文献综述:茸先概述了g r a n g e r 因果关系的定义( 2 1 ) 、检验方法 ( 2 2 ) 和改进研究( 2 3 ) ,最后提出用于复杂系统因果关系检验的方法应该具 有的特点( 2 4 ) 。 第3 章是对自组织数据挖掘的介绍,包括自组织数据挖掘的基本思想( 3 1 ) 、 原理( 3 - 2 ) 、函数流程( 3 33 、最优复杂度模型( 3 - 4 ) 和算法分类( 3 5 ) 。其中, 对自组织数据挖掘的基本思想和函数流程的介绍是为了更好地说明基予自组织 数据挖掘的因果关系检验的实现步骤;对自组织数据挖掘的原理和最优复杂度 模型、尤其是对后者的讨论,是为了说明自组织数据挖掘的特点,这是区分 g f 姐z c r 因果关系检验与自组织数据挖掘因果关系检验、理解自组织数据挖掘因 果关系检验为什么适用于复杂问题的关键。3 6 进一步提出自组织数据挖掘是从 定性到定量综合集成方法的具体实现技术,这是基于自组织数据挖掘的因果关 系检验方法适用于复杂问题的基础。 第4 章是围绕基于g m d h 的因果关系检验展开的。首先在4 i 定义了g m d h 因果关系,并与g r a n g e r 因果关系定义作了简要对比。4 2 列出了基于g m d h 的因 州川上学硕l 。学位论文 果关系检验的实现步骤。为说明基于g m d h 的因果关系检验的特点,分别将这 种方法与g r a n g e r 因果关系检验( 4 3 ) 、基于多元回归逐步回归,非线性回归方法 的因果关系检验( 4 4 ) 和基于人工神经网络的的因果关系检验( 4 5 ) 进行了比 较。将g m d h 的谢粜关系检验应用于g 舢萨r 因果关系检验失效的数值实验( 4 6 ) 和人民币汇率的影响因素研究( 4 7 ) ,说明了这种方法研究复杂问题的有效性。 因为在搜集实际问题的观测数据时,通常会存在离杠杆点,所以数据划分对 g m d h 因果关系检验的结果有显著影响。4 8 专门讨论这种影响。进一步,4 9 提出用度量g m d h 模型有效性的指标“数据描述能力”作为因果关系检验的( 辅 助) 判断标准,n f 以增加检验结果的可信程度。最后4 1 0 总结了g m d h 因果 关系检验可以改进的g r a n g e r 因果关系检验的不足。 针对g r a n g e r 因果关系检验与g m d h 因果关系检验中系统结果( 因变量) 已 知的假设,第5 蕈提出了基于客观系统分析方法( o s a ) 的因果关系检验。在说 明基于o s a 因果关系定义( 5 2 ) 及检验步骤( 5 3 ) 后,5 4 、5 5 、5 6 分别对g r a n g e r 因果关系检验、g m d h 因果关系检验和可能的以一般联立方程为基础的因果关 系检验与o s a 因果关系检验作了比较。5 7 是应用这种方法分析中国1 9 7 8 。1 9 9 9 年经济发展中各变量间的因果关系的实例。 第6 章是对o s a 因果关系检验不能从整体上提取系统知识的改进,提出了基 于o s a 的解释结构模型。在说明基于o s a 的解释结构模型的实现原理和步骤后, 用这种方法系统地分析了中国信息化测度体系中各指标和要素问的因果关系, 得到新的、具有启发意义的结论。 以上分析都是针对建模对象的性质比较确定的问题。对于建模对象模糊的 复杂问题,g m d h 和o s a 等参数方法可能无效。因此,第7 章提出基于模糊准则 归纳( f r i ) 及其改进算法的非参数因果关系检验方法。 第8 章总结了论文的工作和解决的问题。在此基础上,提出关于自组织数 据挖掘因果关系检验值得进一步研究的问题。 6 叫川人半坂i 学位论业 2 g r a n g e r 因果关系检验综述 2 1 g r a n g e r 因果关系检验方法概述 g r a n g e r 因果关系定义利用时间序列的关系来鉴定吲果关系。g r a n g e r 所给 出的因果关系检验,依赖于使用过去某些时点上所有信息的最佳最小二乘预测 的方差。其基本的分析思路是i f l “,假设系统是出变量x 釉y 组成,如果变量y 的现在值用x 和y 的过去值预测,比只用y 的过去值预测要好,就称x 是y 的原因:如果用x 的现在值和x 、y 的过去值预测y ,比只用x 和y 的过去值 要好就称x 是y 的瞬时原因。这晕,因果性和瞬时埘聚性是独立的性质,从 吲果性推不出瞬时因果性,反之亦然。 著名华人学者、美国普林斯顿大学g c c h o w 教授对g r a n g e r 因果关系的表 示方法与检验方法作了较为全面的回顾,这里对g r a n g e r 的因果关系检验的简 要介绍主要是基于c h o w 的工作i 矧。 假设给定信息集4 ,其中至少包含( z ,誓) ,称z 是y 的g r a n g e r 原因, 如果利用置的过去比不用它时可以更好地预测y 令五 五b s t 一1 表示信息集,有以下定义: 定义2 1 :x 是】,的g r a n g e r 原因,如果o r 2 缳瓯) o - z 辑医一x ,) ,其中o - 2 瞄瓯) 是关于互的最优预测方差。 定义2 2 :x 是y 的瞬时g r a n g e r 原因,如果d 2 随,x 。) ( 仃2 医) 定义z 3 :x 和y 之间存在反馈,如果x 是y 的g r a n g e r 原因且y 是盖的g r a n g e r 原因。 为了检验包含z ,和y 的个二元时间序列模型中的因果关系,假定( 1 ) 4 仅 包含墨和y ,( 2 ) 存在变换t 和l ,使得一墨和只一l 是对线性协方差 平稳时问序列,且x ,和y ,保持x ,和r 的因果关系,比如普通差分变换、对数变 换、b o x c o x 变换( x ? 一i ) x - 1 。 为了理论上推导证明的方便,可以用石,和y ,时间序列模型的下述表示法中 注1 陈璋颤懿克莱丈。据兰杰对计鼙经济学的贡献经济亨:动态,2 0 0 3 ,( 1 ) : 坩川大学领卜位论文 的任意一种来描述g r a n g e r 因果关系: 表示法l :考虑自回归模型 眦,计臣波洮, 沼, 其中2 x 2 矩阵石犯) 的元素) 是滞后算f 的多项式,又k ,岛】是序列独立的 随机向量具有零均值和协方差矩阵。将式2 - 1 两边同乘以一个非奇异变换, 对2 - 1 没有实质影响,因此可以选择参数使成对角形。根据定义2 1 ,若y 不 是x e 的g r a n g e r 原因,则 2 ( ) 。0 ,因此万。犯k a t ,即给x t 的过去,滞后 的儿不能增加x t 的预测精度。 表示法2 :模型2 - i 的滑动平均表示法是 窿】。c 兀c 盯1 匿】2 :芝;窆茳习匿】, c 2 1 2 , 则石。:( ) ,o 等价于吼:犯) ,0 ,此时 一仍。犯h 或“( 三k ,口| , ( 2 3 ) 因此 只一吐1 犯h + 妒2 2 蝴s 妒2 1 ) 西1 k + 妒地。y h + 正 ( 2 - 4 ) 即如果y ,不是的g r a n g e r 原因ry ,关于当前和过去的的回归残差z 与将来 x t 不相关,也就是说给定当前和过去的,未来的不影响y , 表示法3 :因为 删一i f i ( l ) i 。e 浆二删, c z - 5 , 因此可以将2 - 2 写成 i f i ( l 粮m l 。k 一啊:犯峻, | n ( l ) l y ,= 哪:,( l ) ,+ 盯。( l ) 岛 ( 2 6 ) 定义如下由两个元模型组成的等价模型 捌汁卧 沼7 , 8 州川人学颂 :学位论文 则 瞄】。e :芝譬:篷;】瞵】一瞄:笼苌:茬;】 f 芋g 墨,1 _ 1 譬】- 譬兰;差;】 】 ( 2 8 ) 因此,可以用h 。和叶检验因果关系a 比如,考虑是_ y 。的g r a n g e r 原因,但y ,不 是工的g r a n g e r 原因。此时式2 4 成立,根据式2 7 有 v ri g ( l ) y rd g ( 三) y 犯k + g ( 己) 正 ( ,q ) a g ( l ) y ( ) ,( ) “,+ g ( ) f ;v ( t ) u ,+ f 其中y 犯) 是单侧的,当且汉当式2 4 中v ( l ) 是单侧的,因此通过考察咋关于,过 去、现在和将来的回归系数可以检验因果关系。同理可得 “,f ( h = | f ( ) 蹄7 ( 工) y 一+ f 犯) g r ( 2 - 1 0 ) 耳f ( l ) 矸7 ( ) g ( l ) v ,+ f ( l ) g ,主( 工) u + g ? 进一步,定义“m 和v ,之| b j 的相关系数为p 。,冰) 。令2 - 9 中t ,怛) 一罗r 2 - 1 0 中) -o j k l k 。因为坼一。是序列不相关的,因此 一掣卫“j ;2 1 l tq ;掣a 旦2 5 言;2 1 1 l ,( 2 - 1 1 ) 所以凡体) 从两个方向完全粼画了和y 。之间的g r a n g e r 因果关系- 自g r a n g e r 提出起因果关系定义以来,众多学者提出了不同的表示方法, 如g r a n g e r l 6 1 ,s i m s l 7 1 ,p i e r c ea n dh a u g h l z 4 l 。p i e r c e 和h a u g h t 2 5 】 2 6 1 在分析e 面不 屑的表示方法的基础上,证明这些表示方法是等价的。 在用计量经济方法表示出因果关系之后,器要一定的方法检验可能的原因 变量对结果变量预测效果的显著性。不同的表示方法适用不同的检验方法。如 针对表示法1 的自回归检验方法、针对表示法2 的滑动平均方法和针对表示法3 的单变量方法。 在实际应用中,最简单也是应用最广泛的g r a n g e r 因果关系检验如下: 考感两个时间序列x 和y1 笙f l ,2 ,r 期间的样本要检验t 是否是y ,的 9 明川大学顷l :学位论史 原因,可以构造以下两个模型: y ,。c + a , y ,4 + ,y 。一c + b ,x ,+ y ,。+ t , (212)ya , ya t ,吖+ 三 r 一l ,y f | c + f 一一r + z y h l “一 如果五;0 对所有t ,1 , 2 ,t 都成立,则石不会引起r 的发, :者不构成因 果关系。因此原假设 i o 为:轨一0 ,tt 1 ,2 ,r 分别对上述二式进行刚归,分 别得到残差平方和馘、脚构造统计量小篱辫,其 n 分别为置与只的滞后阶数。r 服从第一自由度为搬,第二自由度为( n - m - n 1 j 的分布。给定显著性水平a ,则有对应的临界值c 如果只ce ,则以1 - 口的 置信度拒绝h o 假设,即在g r a n g e r 意义上x 是y 的原因;否则不拒绝h o 假设。 2 2 g r a n g e r 因果关系检验的不足及英改进综述 文献f 2 5 】【2 6 】 2 7 】【2 8 】对g r a n g e r 因果关系检验的不足进行了集中分析,主要 包括以下方面: ( 1 ) g r a n g e r 果关系检验用二元时间序列模型研究两个时间序列之嘲的因果关 系,其前提是假设没有其它时间序列的影响。g r a n g e r 因果关系检验的两个最重 要假设是用原因可以预测结果和原因中包含了其它变量所没有的关于结果的信 息。但通常:一个实际问题包含的变量不会仅有2 个,造成某一结果的原因可 能不止一个,变量间会相互作用形成复杂联系,可能单个因素不包含关于结 果的特殊信息,但这些因素组合在一起就包含了决定结果的信息。出于g r a n g e r 因果关系检验没有考虑多个变量的情况以及这些变量闻的相互影响( 见4 6 中 的实证研究) ,因此不能准确揭示多个变量担j 的因果关系,不适用于多维问题f 捌。 ( 2 ) 使用g r a n g e r 因果关系检验的前提条件比较严格,它要求待检验时问序列 “、 只必须是协方差平稳的,线性投影的钱差序列 , 必须是序列不相关的。 经济系统是典型的复杂系统,经济时问序列很难满足这些条件,因此须进行变 量的变换和钱差的预白化。但是用差分、消除趋势和b o x j e n k i n s “颁白化”( 用 0 删川人掌硕卜学世论立 “,和v f 代替毒,和y ,) 等方法,有时可能歪益了原始时恻序列之间的因果关系。 ( 3 ) 通常用渐进理论确定各种有用统计量的抽样分布。在时问序列前后关系的分 析l ,渐进分白对小样本可能不是足够精确的。即使姑fg r a n g e r 因果关系检 验用剑的二元时间序列模型,由于涉及到时间滞后变量,因此需要大量数据样 本对刚归系数进行较准确的估计。但通常情况下实际可以获得数据样本是非常 有限的。比如研究1 9 9 0 年以来中国经济发展中的因果关系( 经济增长与外商直 接投资、基础建设投资、人均消费等等) ,这段时问不剑1 5 年,即数据样本是 少于1 5 的小样本,难以保证用这样的数据样本估计得到的回归系数的准确性, 也就难以保证g r a n g e r 因果关系检验的准确性。 ( 4 ) g r a n g e r 因采关系检验结果对变量滞后阶数的确定非常敏感。 例2 i :1 9 6 0 年i 季度至1 9 7 8 年j v 季度美国汽车销售( a s ) 与国库券利率( t b ) 的g r a n g e r 因果关系检验1 ”i : 取每个变量的4 个滞后,得到如下结果( 见表2 1 ) : 表2 1 取每个变量的1 2 个滞后,得到如下结果( 见表2 2 ) : 袁2 2 由例2 1 可见,不同的滞后阶数产生不同的因果关系,g r a n g e r 因果关系检 叫川凡学坝【学位论上 验对滞后的长度非常敏感。有学者建议i ”l 选择g r a n g e r 因果关系检验的滞后阶 数宁多勿少,因为这样的到的结论比较合理。但是滞后阶数的增加意味着回归 变量的增加,相应需要的数据样本也就需要增加,这又会造成上面提到的数据 样本量小与准确估计回归系数之问的矛盾。 ( 5 ) g r a n g e r 本人认为由于g r a n g e r 因果关系仅仅是一个能被应用的统计学定义, 故得出的结论有时显得过于简单,往往只能用于判定存在或不存在因果关系, 而不能识别因果关系的作用方式和强弱程度。 ( 6 ) g r a n g e r 因果关系检验的实质是通过分析两个变量之间在时间上的先导 滞后关系,从统计上推断其因果导向。如果x 是y 的g r a n g e r 原因,则x 的变 化应先于y 的变化,但其逆命题不一定成立。所以计量经济学家e d w a r dl e a r n e r 宁愿用先后关系( p r e c e d e n c e ) 一词代替这里的因果关系1 2 6 l 。 ( 7 ) g r a n g e r 因果关系定义侧重于无偏预测方差,而我们通常无法采用最佳预测 而只能用最小二乘预测( 线性) 来代替。但是经济系统是复杂的演化系统,其中包 含了上千个变量和参数,它们之间相互作用,很是高维的非线性系统。越来越 多的研究也表明,非线性模型更合适于经济系统1 3 2 1 1 3 3 1 1 3 4 1 。 改进g r a n g e r 因果关系检验的研究工作大致可以分为以下几类: 其一,将g r a n g e r 因果关系检验的应用范围从二元问题扩展到多元问题。 比较普遍的做法是用多维v a r 模型检验多个变量间的因果关系。典型如 【1 0 1 1 1 ,h s i a o 提出的针对三元问题的因果关系定义l ,y o n g h o n gc h a n 等【3 7 i 提出的条件扩展g r a n g e r 因果关系检验。多维v a r 模型一般是线性多元回归方 程。使用多元回归方程的前提是假设变量相互独立。如果影响结果变量的要素 之间相互独立,那么可以用多维v a r 模型检验因果关系。但更多的情况是复杂 系统中各变量相互影响。这时,由于基于多维v a r 模型的g r a n g e r 因果关系检 验不能考虑变量间的影响,所以其检验结果很可能是错误的。 其二,引入非线性g r a n g e r 因果关系检验。当难以判断变量之间的非线性 关系时,用非参数方法间接判断因果关系是否存在,是检验非线性g r a n g e r 因 果关系的一个主要方法。比如b a e ka n db r o c k 在概率论基础上定义的非线性 g r a n g e r 因果关系f ”1 d a v i db e l l 等提出的非参数因果关系检验。但是这类 非参数检验方法无法显示因果关系的作用方式。当事先知道因果关系的作用方 p u 川人学碘i 学位论丘 式( 检验模型的类型) 时,可以点接建立菲线性检验模型。比如a b d e l o u a h a b , b i b ia n d a l w e l lj o y e t ”提出的叔线性( b i l i n e a r ) 检验模型。可遗憾的是,事先 知道检验模型的类型只是少数情况,大多时候需要建模者选择恰当的非线性模 性,而至今尚缺乏系统的选撵非线性模型的方法和理论。事实上,如何检验模 型的预测能力,选出预测能力最好的模型,尤其是长期预铡能力最好的模型作 为g r a n g e r 因果关系检验模型,f 是当前研究的热点问题。因为一旦给定了一 个模型,怎样估计它的参数并进行假设检验就是无关痛痒的,但要决定从怎样 一个合适的模型丌始为好,卅是最为棘手的任务【3 9 l 。 其三,将i n s a m p l e 检验改进为o u t - o f - s a m p l e 检验。一般的g r a n g e r 因果关 系检验是在时侧序列数据样本t 上建模后,再在t 上计算检验模型的预测误差, 称为i n s a m p l e 检验。i n s a m p l e 捡验得到的误差已经不是严格意义上的预测误差 了。a s h l e y , g r a n g e r , a n ds c h m a l e n s e e 认为i 1 5 j 检验g r a n g e r 因果关系的一种合理 的、自然的方法是根据模型在o u t o f - s a m p l e 上的预测能力。具体实现【16 j 是将t 划分为t 1 和1 2 ,在t 1 上建模,在1 2 计算模型的预测能力。通常用d i e b o l d - - m a r i a n o 方法检验显著性l 矧。显然o u t o f - s a m p l e 检验得到的结果更合理。但 是,这里仍然没有解决模型选择问题:如果检验模型的类型选错了,无论是 i n - s a m p l e 检验还是o u t - o f - s a m p l e 检验都不可能得至o 准确结论。 其四,在g r a n g e r 因栗关系检验判断是否存在因果关系的基础上,进一步 判断因果关系的强度和作用方式。判断g r a n g e r 因果关系强度的主要方法是计 算预测效果的显著性。典型如张明玉旧等根掘改进的a i c 准则定义了因果关系 强度系数c e :c e a a i c c 。a i c c 。,a c c 俅) t t o n 吼2 + 口+ k ) ( t - k 一2 ) ) , 是改进的a i c 准则,a i c c 、a t c c 分别为用只本身和用儿与t 对y ,预测时得 到的a i c c 准则值。判断g r a n g e r 因果关系作用方式的文献有:【4 1 】将基于v a r 的因果关系检验与图论结合,用有向图表示多个变量间的作用结构;y o n t g h o n g c h e 等1 3 6 l 提出的条件扩展g r a n g e r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论