




已阅读5页,还剩49页未读, 继续免费阅读
(运筹学与控制论专业论文)高频金融时间序列波动性研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 高频金融时间序列数据样本容量大,采集周期短,包含了丰富的市场信息, 是金融市场特征的最好反映。为了更深入地探究市场微观结构,高频金融时间序 列的波动性研究与建模成为国内外计量经济学者的研究热点。a n d e r s e n 与 b o l l e r s l e v 在1 9 9 8 年提出一种新的波动率估计方法一“已实现 波动;c h r i s t e n s e n 和p o d o l s k i j 在2 0 0 5 年基于极差理论提出另一种波动率估计方法一“已实现 极 差波动;国内学者对这两种方法分别进行扩展,得到更有效的估计方法。 本文首先选取我国上证股指1 分钟交易数据进行统计分析,验证了我国沪市 高频价格序列和收益率序列具有高峰厚尾、非正态分布及波动聚集等a r c h 特征, 同时还具有长记忆性、波动率的日内“u ”型走势等性质。 而后,基于国内外学者已有的研究成果,提出赋权“已实现波动方法的改 进调整赋权“已实现 波动,理论上证明其无偏性和有效性;利用我国上证 股指高频数据计算得到不同估计方法下的积分波动的不同估计量,实证说明调整 赋权“已实现”波动方法更优化,并选取统计指标最优的对数赋权“已实现极 差波动率作为后续建模工作的研究对象;基于收益率序列的平稳性和长记忆性特 征,本文建立a r ( i ) f i g a r c h ( p , d , q ) 模型,采用聚合序列分析法和极大似然估计 法确定模型参数。 最后,给出对数赋权“已实现 极差波动率真实值与拟合值的比较图,直观 说明所建模型的拟合效果优良;计算我国上证股指1 分钟交易数据样本的高频收 益率,与a r ( o f i g a r c h ( p , z g ) 模型的预测值进行比较,说明此模型在波动性估 计及预测方面具有一定的实用价值。 关键词:高频金融时间序列,波动性,调整赋权“已实现 波动, a r ( o - f i g a r c h ( p , z g ) 模型 a b s t r a c t a b s t r a c t h i g h f r e q u e n c yf i n a n c i a ld a t ah a sl a r g es a m p l es i z ea n ds h o r ts a m p l i n gc y c l e i t c o n t a i n sa b u n d a n ti n f o r m a t i o no fm a r k e t i ti st h eb e s tr e p r e s e n t a t i o no ft h ef i n a n c i a l m a r k e t i no r d e rt or e s e a r c hd e e p l yo nt h em i c r o s t r u c t u r eo fm a r k e t ,a n a l y z i n ga n d m o d e l i n gt h ev o l a t i l i t yo fh i g h f r e q u e n c yf i n a n c i a lt i m es e r i e sb e c o m et h eh o t s p o t so f d o m e s t i ca n df o r e i g ne c o n o m e t r i cr e s e a r c h e r s i n19 9 8 ,a n d e r s e n & b o l l e r s l e v p r o p o s e dan e wm e t h o do fe s t i m a t i o n ,t h er e a l i z e dv o l a t i l i t ym e t h o d a n o t h e r m e t h o d - - r e a l i z e dr a n g e - b a s e dv o l a t i l i t yw a sb r o u g h tf o r w a r db yc h r i s t e n s e na n d p o d o l s k i j i n2 0 0 5 t h e nt h ed o m e s t i cs c h o l a r sp u tf o r w a r de f f e c t i v em e t h o d sb y e x t e n d i n gt h et w om e t h o d s i nt h i sp a p e r , w ea n a l y z et h es t a t i s t i c a lc h a r a c t e r i s t i c so fh i g h - f r e q u e n c yd a t ai nt h e s h a n g h a is t o c km a r k e t ,w h i c hi ss a m p l e dw i mt h ef r e q u e n c yo flm i n u t e t h er e s u l t v e r i f i e st h a tt h et y p i c a lc h a r a c t e r i s t i c so fh i g h f r e q u e n c yt i m es e r i e sa r er e f l e c t e di n c h i n a ss t o c km a r k e t f o re x a m p l e ,h i g hk u r t o s i s ,h e a v yt a i l ,n o n - n o r m a ld i s t r i b u t i o n , c o n g r e g a t e dv o l a t i l i t y , l o n gm e m o r yp r o c e s sa n di n t r a d a y u 一s h a p e dt r e n d b a s e do nt h er e s e a r c hr e s u l t s ,an e we s t i m a t i n gm e t h o d ,a d j u s t e dw e i g h t e d r e a l i z e dv o l a t i l i t y , i sp r o p o s e da st h ei m p r o v e m e n to fw e i g h t e dr e a l i z e dv o l a t i l i t ya n d p r o v e nt ob eu n b i a s e da n dm o r ee f f i c i e n t a c c o r d i n gt ot h e s ee s t i m a t i n gm e t h o d s ,w e w o r ko u tt h ee s t i m a t i o nv a l u e so fi n t e g r a t e dv o l a t i l i t ya n dp r o v et h ee f f e c t i v e n e s so ft h e a d j u s t e dw e i g h t e d r e a l i z e d v o l a t i l i t y t h e nl o g a r i t h m i cw e i g h t e d r e a l i z e d r a n g e - b a s e dv o l a t i l i t y i sc h o s e nt of i td a t ao w i n gt oi t sb e s ts t a t i s t i c p r o p e r t y a f t e r w a r d st h ea r ( 力一f i g a r c h 谚g ) m o d e li se s t a b l i s h e db e c a u s et h er e t u r nr a t e s e r i e sh a st h ec h a r a c t e r i s t i c so fs t a b l ea n dl o n gm e m o r y t h ep a r a m e t e r so ft h em o d e l a r ee s t i m a t e db yt h em e t h o do fp o l y m e r i z a t i o ns e q u e n c ea n a l y s i sa n dm a x i m u m l i k e l i h o o de s t i m a t i o n 7 f i n a l l y , t h ec o m p a r i s o nb e t w e e nl o g a r i t h m i cw e i g h t e dr e a l i z e dr a n g e - b a s e d v o l a t i l i t ya n di t sf i t t e dv a l u es h o w st h a tt h em o d e lh a sf a v o r a b l ef i t t i n gr e s u l t t h e nw e c a l c u l a t et h er e t u r nr a t eo ft h es a m p l e b yc o m p a r i n gi tw i t l lt h ep r e d i c t i v ev a l u e ,t h e a r ( i ) - f i g a r c h ( p ,z g ) m o d e li sp r o v e dt ob ev a l u a b l ei ne s t i m a t i n ga n df o r e c a s t i n g t t a b s t r a c t v o l a t i l i t y k e y w o r d s :h i g h f r e q u e n c yf i n a n c i a lt i m es e r i e s ,v o l a t i l i t y , a d j u s t e dw e i g h t e dr e a l i z e d v o l a t i l i t y , a r ( i ) 一f i o a r c i j ( p , 叠dm o d e l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 日期:1 胡年6 月砂日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:导师签名:t 盈妓 日期:卅年月歹日 第一章引言 1 1 选题背景及意义 第一章引言 基于统计学意义,金融时间序列是指金融市场上金融产品( 诸如股票、期权、 债券等) 的价格、收益等数据依照时间先后顺序排列而得到的数据序列值。金融 时间序列分析研究的是金融资产价格随时间变化而变化的理论和实践。金融理论 和时间序列本身都存在不确定因素,对其波动性的计量分析对探究金融市场微观 结构具有极其重要的现实意义。 成熟的国际金融市场在开市时间内是持续、高频率运作的,各种信息连续地 影响市场价格的运动过程。我国在改革开放进程中通过经济体制改革,逐步与世 界接轨,尤其是加入w t o 后,国内金融市场正飞速发展。在金融市场全球化、电 子化、虚拟化的发展过程中,金融业每天将产生海量的数据。这些数据是金融时 间序列的具体体现形式。及时有效地从这些海量数据中挖掘出高附加值的信息资 源或有用的知识为金融机构的经营管理作决策服务已成为专业人士关注的热点。 而之前的很长一段时期内,我们可获取的实际数据大都是离散并且低频率 的。金融数据的离散采集造成了市场信息不同程度的缺失,当我们利用这些数据 进行市场微观结构分析时得到的结论是不全面的。为了更深刻地理解金融市场特 征,需要对高频率的金融数据加以研究,数据采集频率越高,信息丢失则越少。 在金融计量学领域,高频时间序列通常指以小时、分钟甚至秒为频率所采集 的日内金融数据,其采样频率是等间隔的;另一类实时记录每笔交易数据的高频 时间序列称为超高频数据,对一般金融市场而言,其每笔交易发生是高频率的, 且时间间隔是随机的。较之传统的低频数据( 年度数据、周数据、日数据等) ,高频 金融数据的样本容量大,采集周期短,其中包含了丰富的市场信息,是金融市场 特征的最好反映。国内外研究者通过对成熟市场的实证研究发现,高频金融时间 序列具有高峰厚尾、非正态分布及波动聚集等a r c h 特征,同时还具有长记忆性、 波动率的日内u 型走势等性质【l 】。 计算机和通讯技术的发展,为高频率金融数据的采集、存储、检索和处理提 供了必备条件。高频数据的获取使得对市场实际价格、成交量、成交规模和平均 深度的连续观测成为可能。但利用金融高频数据进行研究时存在一些问题。例如, 电子科技大学硕士学位论文 在数据收集方面,以较长时间段为周期来对数据取样时,可能会出现偏差,描述 的并不是同一个现象。以股票指数为例,公司、企业等的合并或不动资产的转让 会影响其结构。当对股票指数的历史记录进行分析时,这种影响不易被察觉,从 而会使分析结果出现偏差。再者,以小时为取样频率的数据,会出现由于地球的 公转、自转及时区分布等造成的季节性波动影响很大,且超过其他次要的因素。 1 2 高频金融时间序列研究发展的基本动因 高频金融时间序列产生至今,对金融高频数据的分析一直是金融研究领域中 一个倍受瞩目的焦点。这可以归结为两个原斟2 】: 一个原因在于对金融高频数据本身所具有的特征的关注。通常所指的交易数 据,除了交易价格外,还包括与交易相连的询报价、交易数量、交易之间的时间 间隔、相似资产的现价等等,因此,对于金融高频数据的分析,实质上是一个关 于“以不同时间间隔观察到的、具有不规则强度、既有离散变量又有连续变量的 复杂多变量问题。这样如何从总体上来分析金融高频数据、又如何处理具体金融 交易中高频数据的特殊性,便成为众多金融领域的从业者和研究者所面临的一个 富有挑战性的课题。 另一个原因在于金融高频数据对理解市场的微观结构来说相当重要。对金融 高频数据的逐步积累和了解,不仅转变了一些陈旧的研究理念,如以前认为短期 的价格波动是不相关的噪音并且不值得去搜集,但现在我们知道高频数据中的这 种波动恰恰包含着理解市场微观结构的重要信息;而且随着对金融高频数据统计 特征认识的深化,也使先前一些关于如金融市场同质性( h o m o g e n e o u s ) 、短期价格 波动服从高斯随机游动( g a u s s i a nr a n d o mw a l k ) 的古典经济假定受到了质疑。不难 看出,在探寻金融市场微观结构的过程中,需要对基础经济理论、研究方法和计 量模型等进行不断地创新和完善,而对金融高频数据的研究正好为这些理论、方 法和模型的创新和完善提供了实证条件。 我国高频金融数据研究尚处于起步阶段。其原因一方面在于,从世界范围来 看,高频金融数据研究仍然处于起步阶段,理论研究也才刚刚起步,尚无法成功 地应用于实践。另一方面无论从商业角度还是技术角度来说,高频数据难以得到, 使得许多学者无法对高频数据展开深入研究,从而极大地阻碍了理论研究的突破 和实际应用的发展。 2 第一章弓 言 1 3 国内外研究现状和发展态势 金融时间序列是金融变量发展变化的真实记录,通过对它们的技术分析,可 以定量发现其中的规律和特征,为科学决策提供重要信息。而对其波动特性的研 究是对金融市场进行定量研究的前提,是分析资本资产定价、金融风险防范等问 题的基础。近二三十年来,如何能够更准确地刻画波动性受到国内外学者的广泛 关注,也有学者就不同的角度分析高频金融时间序列,得到一些有意义的成果: ( 一) 金融高频数据统计特征的研究 早期的研究表明,金融高频数据是不稳定的,在较短期间内有厚尾( h e a v y - t a i l ) 趋势。相比较而言,近期对金融高频数据统计特征的研究更为深入和具体。a n d e r s e n 和b o l l e r s l e v 的研究【3 悛现高频收益数据具有非正态性。随着数据频率的增加,其 数据的峰度也是随之增加的,到分钟数据,峰度就已经达到了1 0 0 以上了。a n d e r s e n 和b o l l e r s l e v 采用高频数据对美国股票市场和外汇市场的日内波动性和长记忆性进 行了研究,证明了在这些市场中存在着波动的长记忆性【4 1 。a n d e r s e n 和b o l l e r s l e v 利用高频数据对日本股票市场进行了研究,通过滤波的方法证明了波动长记忆性 的存在 5 1 。 ( 二) 金融高频数据的“日历效应”研究 “日历效应”是指波动、交易量、买卖价差、交易频率等金融变量在日内、 周内、月内表现出稳定的和周期性的运动模式。“日历效应 是对金融高频数据的 研究中最重要的发现。m c i n i s h 和w o o d 利用分钟数据发现日内波动具有“u 型 模式l 6 1 ;a d m a t i 和p f l e i d e r e r ,b r o c k 和k l e i d o n 各自给出了日内“u ”型模式的理论 解释 7 8 ;h e d v a u 对它们进行了比较网;r a h m a l l 和l e e 等利用个股交易数据对日内 “u ”型模式进行了实证研究,并发现交易量、买卖价差、交易频率也存在“u 型模式【l 川;a n d e r s e n 和b o l l e r - s l e v 系统地分析了“日历效应”,并解释了它产生的 原因,通过德国马克对美元的汇率数据拟合了“日历效应 【l l 】。a n d e r s e n , b o l l e r s l e v , c a i 利用弹性傅立叶形式回归( f l e x i b l e f o u r i e r f o r mr e g r e s s i o n ) 对日本 股票市场进行了分析,发现由于日本市场有不同于美国市场的午间休市的交易制 度,日本股票市场波动呈现日内双“u 型模式【6 】。 ( - - ) 对金融波动性测度方法的研究 金融时间序列的波动性作为一个隐含变量,不仅是资产风险的决定因素,还 是衍生证券定价中的一个关键参数,对它的估计及其相关性质的研究是计量经济 3 电子科技大学硕士学位论文 学的一个挑战。 金融波动性测度方法大致分为两类,一类是基于样本历史序列的波动性估计 方法,另一类是基于衍生证券定价模型的隐含波动率法【l 羽。第一类方法中主要是 两大类模型自回归条件异方差( a r c h ) 族模型和随机波动( s v ) 模型。第二类方 法主要是应用于金融衍生产品定价研究中,量化市场中某一衍生产品价格蕴含的 标的证券的波动率,反映市场对于标的证券价格未来波动的预期。而传统的测度 方法对高频时间序列得不到很好的分析结果,不能直接应用。文献 1 3 ,1 4 在弱 g a r c h 模型的基础上,提出了一套弱g a r c h 模型的估计检验方法。文献 1 5 ,1 6 】 提出了h g a r c h ( h e t e r o g e n e o u sg a r c h ) ,在g a r c h 模型的条件异方差项引入 时间刻度变换处理技术。 对利用高频数据计算金融波动做出贡献最大要数a n d e r s e n 与b o l l e r s l e v 两人 近年来的工作,最主要的成果是他们提出了一种叫“已实现 波动( r e a l i z e dv o l a t i l i t 3 , ) 的测量方法【3 1 。“已实现”波动是把一段时间内收益率的平方和作为波动率的估计, 这种估计方法不同于a r c h 类模型和s v 类模型,它没有模型( m o d e lf r e e ) ,不需 要进行复杂地参数估计,在多变量的情形下可以扩展为“已实现 协方差矩阵, 它不仅包括各变量自身的“已实现 波动,也包括变量之间的“已实现”相关系 数。对“已实现协方差阵可以建立向量分整自回归移动平均模型( v e c t o r a u t o r e g r e s s i v ef r a c t i o n a l l yi n t e g r a t e dm o v i n ga v e r a g em o d e l ) 。估计出v a r f m a 模 型的参数以后,就可以预测将来的波动性和相关系数,可以很方便地应用于资产 定价,资产配置等领域。 理论上,已实现波动是积分波动( i n t e g r a t e dv o l a t i l i t y ,i v ) 的一致估计量。事实 上,由于受到不连续交易、竞一要价价差等微观结构因素的影响,已实现波动是 积分波动的有偏估计量。为了提高高频数据波动率估计的准确性,文献【1 7 】提出了 另一种更有效的波动估计量,已实现极差波动( r a n g e - b a s e dv a r i a n c e ,r r v ) ,也是 无模型的。 ( 四) 对金融时间序列长记忆性的研究 长记忆性最初是由水文学家h u r s t 于1 9 5 1 年在对尼罗河潮汐数据的研究中发 现的。m a l l d e l b r o t 【1 8 】引入分数布朗运动及分形概念奠定了长期记忆分析的严格数学 基础后,长记忆性研究在流体学、气象学及地球物理学等自然科学领域引起了广 泛关注,而经济、金融时间序列的长记忆性也逐渐成为经济学、金融学领域的研 究热点。本文2 1 节介绍的很多国内外文献的实证研究中发现金融时间序列( 如证 券市场的收益率序列) 自相关函数呈现出一种缓慢的衰减模式,而非短记忆过程式 4 第一章引言 的以指数率迅速衰减,这种现象被称为长记忆性。如果一个收益序列具有长记忆 性,则说明该序列的观测值之间相互不独立,根据之前的收益率可以预测将来的 收益率。而金融市场研究的一个重要理论基础有效市场假说,强调收益率时 间序列的独立性,即资产价格基于之前的信息是无记忆或短记忆的。长记忆性的 存在意味着基于布朗运动( b r o w n i a nm o t i o n ) 、鞅过程( m a r t i n g a l ep r o c e s s ) 以及 有效市场假说所推导出的一系列模型( 如m a r k o w i t z 的现代资产组合理论、资本资 产定价模型、套利定价模型和b l a c k s c h o l e s 的期权定价理论等) 都无效。因此, 对长记忆性的研究具有一定的理论价值;且这一特性在收益序列的波动性中也有 体现,金融时间序列的波动性是否具有持续性的研究也具有重要的现实意义,对 于了解市场微观结构、预测市场的走势、分析市场风险及历史对未来变化的影响 等方面均有重要的作用。 1 4 本文主要研究内容及方法 高频金融时间序列因其丰富的信息蕴含量和明显区别于低频数据的特征已成 为计量经济学方面的研究热点,对其波动性的研究有助于我们更好地认识市场微 观结构,在风险度量方面的应用性很强。本文将以我国上证股指高频数据作为分 析样本,根据已有的波动率分析方法,结合数据样本本身的特征,改进波动率估 计方法,并试图对性质良好的估计量进行建模,预测收益率序列的走势,以此说 明模型本身的实际应用价值。具体的结构安排如下: 第一章为本文的引言,介绍选题背景,对高频金融时间序列研究的发展历程 进行简介,综述国内外已有研究成果及发展态势。 第二章介绍成熟证券市场的高频金融时间序列的特征,说明在数据分析中可 能存在的问题。选取2 0 0 7 年1 月4 日至2 0 0 7 年4 月3 0 日我国上证股指的1 分钟 交易数据进行统计分析,验证我国股市数据是否具备高频时间序列的特征,为后 面的建模分析奠定基础。 第三章介绍已有研究中总结的金融时间序列波动率的特征,综述时间序列波 动性研究领域经典的条件异方差模型及其扩展形式,及在高频时间序列的波动性 研究中特有的“已实现 波动和“已实现 极差波动方法及其建模。借助“已实 现”波动已有扩展形式的思想,对赋权“已实现”波动进行改进,提出积分波动 的新估计量,并证明它的无偏性和有效性。 第四章主要工作是实证和建模。根据我国上证指数1 分钟交易数据收益率序 5 电子科技大学硕士学位论文 列的日内“u 型走势和长记忆性等特征,结合已有的高频时间序列波动率计算方 法,计算几种积分波动的估计量,比较结果显示,基于极差理论且考虑了“日内 效应”的赋权“已实现”极差波动率为最优估计量。基于收益率序列的平稳性和 长记忆性特征,建立a r ( 0 f i g a r c h ( p ,z 碍) 模型。经过模型定价和参数估计后, 运用该模型进行了拟合值比较和收益率预测,进一步研究收益率序列的波动性质。 第五章对全文工作进行总结,并提出了高频金融时间序列波动性研究的一些 可行方向。 6 第二章高频金融时间序列 第二章高频金融时间序列 2 1 高频金融时间序列的特征 迄今为止,对国际成熟市场的高频数据实证分析已经得到一些典型的数据特 征,主要有: 1 波动率日内“u 型走势 每个交易日内的波动率一般是开盘与收盘时高,中间交易时间较低。m c l n i s h 和w o o d ( 1 9 8 5 ) t 6 】利用分钟数据发现日内波动具有“u 型模式;a d m a t i 和p f l e i d e r e r ( 1 9 8 8 ) 阴,b r o c k 和k l e i d o n ( 1 9 9 2 ) i s l 各自给出了日内“u ”型模式的理论解释, h e d v a l l ( 1 9 9 5 ) 【9 1 对它们进行了比较;r a h m a n 和l e e 等( 2 0 0 2 ) d o 利用个股交 易数据对日内“u ”型模式进行了实证研究,并发现交易量、买卖价差、交易频率 也存在“u 型模式。 2 波动率具有日历性 日历性指波动率、交易量、买卖价差、交易频率等金融指标在日内、周内、 月内表现出稳定的和周期性的运动模式 1 2 1 。a n d e r s e n 和b o l l e r s l e v ( 1 9 9 8 ) 【1 1 】系统 的分析了“日历效应 ,并解释了它产生的原因,通过德国马克对美元的汇率数据 拟合了“日历效应 ,发现“日历效应 对准确计量波动性至关重要。a n d e r s e n , b o l l e r s l e v ,c a i ( 1 9 9 8 ) 【5 】利用弹性傅立叶形式回归( f l e x i b l ef o u r i e rf o r mr e g r e s s i o n ) 对日本股票市场进行了分析,发现由于日本市场有不同于美国市场的午间休市的 交易制度,日本股票市场波动呈现日内双“u ”型模式。a n d e r s e n 和b o l l e r s l e v ( 1 9 9 7 ) m 】在研究“日历效应 与波动持续性之间的关系时,发现在对日内周期性的“u ” 型模式进行滤波处理之后,波动持续性大大的下降。 3 价格序列具有高峰厚尾性 通过实证分析发现,金融收益序列并非如之前的研究中所假设的服从正态分 布,呈现出高峰厚尾的分布特性。在其均值附近以及离均值较远的尾部,其真实 分布比标准正态分布具有更高的概率分布密度函数值。a n d e r s o na n d b o l l e r s l e v ( 1 9 9 8 ) u l 】实证表明随着日内数据频率的增加,数据序列的峰度值也随之 增加的,分钟数据的峰度就已经达到1 0 0 以上了。 4 价格序列具有负相关性 7 电子科技大学硕士学位论文 g o o d h a r ta n df i g l i u o l i ( 1 9 9 1 ) 1 9 】、m a i n i s ha n dw o o d ( 1 9 9 1 ) 实证研究了日内价格 序列是具有负的一阶相关性的,特别是出现在一些跳点的情况下。b o l l e r s l e va n d d o m o w i t z ( 1 9 9 3 ) 再次从询报价的数据中找到了这一特征。l o w a n d m u t h u s u a m y ( 1 9 9 6 ) 用5 分钟的频率数据验证序列的负相关性,并进一步证明了这 种相关性具有非线性的特征。 除了以上4 个主要的特征外,高频数据还具有一般的a r c h 特征( 如厚尾、非 正态、波动率聚集) 。a n d e r s e n 和b o l l e r s l e v ( 1 9 9 8 ) 【3 】的研究发现高频收益数据具 有非正态性。2 0 世纪9 0 年代以来,金融计量学者开始关注金融序列是否具有长记 忆性的问题。现有的国内外文献研究发现,成熟、开放的股票市场收益不存在显 著的长记忆特性,但在一些新兴的证券市场这一特征却非常显著。a n d e r s e n 和 b o l l e r s l e v ( 1 9 9 7 ) 【4 】采用高频数据对美国股票市场和外汇市场的日内波动性和长记 忆性进行了研究,证明了在这些市场中存在着波动的长记忆性。a n d e r s e n 和 b o l l e r s l e v ( 2 0 0 0 ) 【5 】利用高频数据对日本股票市场进行了研究,通过滤波的方法证 明了波动长记忆性的存在。在国内方面,汤果等( 1 9 9 9 ) t 2 0 】对上海股市日收益的 f i g a r c h 建模,以及邹新月( 2 0 0 2 ) t 2 l 】对深圳股市绝对收益序列的分析,虽然都提 及了波动长记忆性的分析方法,但没有能够在波动的意义上对得到的结果进行合 理地解释。为此,李亚静【2 2 】等通过对绝对收益和平方收益自相关函数的显著性检 验,验证了我国股市波动的长记忆效应;而王春峰和张庆翠【2 3 】从波动长记忆建模 的角度,利用f i g a r c h 模型实证了我国股市波动的记忆性特征。 2 2 金融高频数据分析中问题研究 金融高频数据的特征为认识市场微观结构提供了更为详细的信息,但也给相 关的实证研究带来了前所未有的问题。目前,理论界虽然对这些问题有了一定的 探讨并且提出了若干建议性的解决方案,但距离问题的真正解决还相差甚远。因 此在未来的研究中,这仍然是个值得关注的问题。总的来看,金融高频数据的 分析中所遇到的问题大致可以归纳为如下三类【2 】: 1 数据问题 ( 1 ) 不准确的时间( i n a c c u r a t et i m e s ) 。对每日数据来说,数据库中对每个观测 值( 如每日收盘价格) 所记录的日历时间通常是准确的。相反,日内交易的记录时 间却往往是不准确的。比如在一个采用公开喊价交易机制的金融市场中,交易数 据要等到交易者的交易卡片进入计算机系统以后才做时间标记,这当中则可能会 第二章高频金融时间序列 有几个小时的时滞。对金融高频数据来说,交易之间的间隔比较短,这种不准确 性往往会造成交易或报价被记录到一个错误的间隔中,或者交易或者报价的时间 序列不正确等问题。 ( 2 ) 不正确的交易量( i n a c c u r a t ev o l u m e s ) 。同样地,在采用公开喊价交易机制 的金融市场中由于单笔交易量较难观察到,在对其所建立的金融高频数据中,往 往采用对单笔交易估计而非精确的交易量,从而就意味着用这些数据所作的研究 是不可靠的。 ( 3 ) 失时效的价格( s t a l ep r i c e s ) 。实证研究通常需要现价时间序列,但除非价 格形成过程是连续的,否则就无法得到这样的时间序列,而需要使用失时效的价 格作为替代。所谓失时效的价格,指的是一段时间之前发生的交易价格。比如说, 要得到一个按固定间隔( 如每1 5 分钟) 观察的价格序列,因为在这样短的一段时间 内也许不会有交易或报价出现,所以就只能用最近的价格作为替代。可是如果将 这样的数据视为固定间隔取值数据的话,就会引起各种各样的偏差。比如,如果 把不等间隔的数据视为等间隔的数据的话,就会高估后者的方差,并且收益的时 间序列会表现出自相关性。 ( 4 ) 缺省值( m i s s i n gv a l u e ) 。用来计算收益的价格必须来自单独的交易或报价, 在这里如何处理缺省值问题非常重要,因为它将影响作为结果的时间序列的统计 特征。在每月或者每周数据中几乎不可能出现缺省值问题,而且对大多数金融证 券来说通常每天至少会有一个交易( 或报价) ,所以每日数据一般也不会遇到这个 问题。然而,在金融高频数据中( 如时间间隔缩短为1 分钟) 缺省值却会时常发生, 并且成为影响相关研究的一个实质性的问题。 2 日内数据带来的市场微观结构的影响 ( 1 ) 离散性( d i s c r e t e n e s s ) 。价格的离散性在取值范围很大的低频样本中不是个 重要问题,因为它可以用一个连续过程作为很好的近似。但是对日内价格运动来 说,离散性却是个严重问题,因为它可能一共只有五、六个观测值。缺少连续性 暗示了按照连续间隔状态所建立的模型不能很好地代表数据,并且会导致一系列 的统计问题,如有限依赖变量、拒绝随机性检验( 因为它可能会带来微弱的负自相 关) 、增大估计的方差、带来价格变动分布中的峰度问题等等。 ( 2 ) 季节性( s e a s o n a l i t i e s ) 。有关的实证研究已表明,在很多金融市场中都存在 交易量、收益波动性、询报价差额的“u 型趋势和收益中的日内模式及自相关关 系。由于这些现象会导致周末效应的消失、高估信息对收益波动性的影响以及会 隐藏高频数据中的a r c h 效应等,所以,对它们进行控制是相当重要的。 9 电子科技大学硕士学位论文 ( 3 ) 询报价反弹( b i d a s kb o u n c e ) 。在低频数据中询报价差额对收益计算的影响 很小。可是研究表明,在高频数据中,它却会造成收益中的负自相关关系。询报 价差额是一个交易成本,它不仅会给基于套利的定价关系带来噪音并且造成算术 收益和收益方差的高估;而且还会影响价格时间序列的动态性、价格逆转与延续 性检验的效力及增加收益的波动性。 3 统计与计量问题 ( 1 ) 缺少正态性( 1 a c ko f n o r m a l i t y ) 。根据中心极限定理所推出的“金融市场的 收益服从正态分布的结论是有争议的。对于对数形式的收益来说,每个月的对 数收益值等于这个月中每分钟收益值的总和,因而每月收益数据趋于正态分布。 但是当交易间隔变得比较短时,正态分布的论点就失去了效力。有实证研究表明, 随着交易间隔越来越短,收益的分布也会越来越偏离正态。非正态性之所以重要, 不仅因为它会令很多标准统计检验失效,而且它也是建立一些模型,如b l a c k s c h o l e s 期权定价模型和进行风险价值分析的重要基础。 ( 2 ) a r c h 效应。众所周知,在每日或更低频的收益数据中存在a r c h 效应。 关于波动性的建模和预测对金融工具的定价是很重要的。如对期权来说,e n g l e 和 b o l l e r s l e v 的a r c h 模型就是对波动一致性进行估计的成熟方法。但是对于估计 频率过高的金融数据表现出来的a r c h 效应来说,a r c h 模型的效果可能不很明 显。 2 3 我国股市高频数据统计特征分析 2 3 1 数据样本来源 本文采用的分时数据是上海证券交易所提供的上证a 股价格指数自2 0 0 7 年1 月4 日到2 0 0 7 年6 月3 0 日的每个交易日的1 分钟交易数据,剔除节假日后共有 1 1 7 个交易日,上证交易所的交易时间是上午9 :3 0 1 1 :3 0 ,下午1 3 :o o 1 5 :o o , 共4 个小时,包含2 8 0 8 0 个数据样本点。在本章的统计特征和第四章的建模实证 中,选取该样本中1 月到4 月的共1 8 7 1 9 个数据进行分析,后两月数据共9 3 6 1 个 用作第四章的预测分析。 该分时数据文件包含交易日期和时问、开盘价、最高价、最低价和收盘价等 数据项。开盘价指在时间区间刚开始时上证a 股指数的当前值;最高值是指在该 时间区间内上证a 股指数出现的最高点;最低值则指该区间内上证a 股指数的最 l o 第二章高频金融时间序列 低点;收盘价指上证a 股指数在该时间区间结束的交易时点的值。 本文对数据样本的实证分析主要利用e v i e w s 、m a t l a b 、o x m e t r i c s 等软件完成。 2 3 2 基本统计量及常用符号说明 1 叩,j 第f 个交易日第f 个时间区间的开盘价; 2 印“ 第t 个交易日第f 个时间区间的收盘价: 3 幼 第f 个交易日第f 个时间区间的最高对数价格; 4 勿 第t 个交易日第f 个时间区间的最低对数价格; 5 ,第t 个交易日第i 个时间区间的对数收益率,简称为收益率; j = l n c p f ,f h l 印f ,“ 6 1 t x序列 x t ) 的均值; 7 序列 x t ) 的标准差; 、l c r x = e ( x - u z ) 2 卢 8 偏度s 矧衡量随机变量x 围绕其均值的非对称性: c e ( x 一鲰) 3 一 一 如果概率密度函数是对称的,s 值为0 ;正的s 值说明序列分布有长的右拖尾, 即右偏;s 值为负说明序列分布有长的左拖尾,即左偏。 在统计学软件应用中,为比较正态分布和其他分布,引入偏度系数。偏度系 数越趋于0 说明越接近正态分布。 9 峰度k 2 4 峰度值k 度量凸起或平坦程度: e l x 一罅x 、f k= j ;卫 蚌 正态分布的k 值为3 ;k 值大于3 说明分布的凸起程度大于标准正态分布:k 值小于3 说明分布的凸起程度相对于标准正态分布是平坦的。 类似偏度系数,软件应用中常用峰度系数进行分布的正态性检验。峰度系数 为峰度值减去三,所以峰度系数越趋于0 说明越接近正态分布。 1 0 j a r q u e b e r a 统计量【2 4 1 检验一组样本是否能认为其来自正态总体。计算 公式: 电子科技大学硕士学位论文 ,a = 型6 卜丢( n 3 ) 2l j 4 、 7 j s 、k 分别表示偏度和峰值。在正态分布的假设下,j a r q u e b e r a 统计量服从自 由度为2 的矿分布。 1 1 尺2 统计量 2 4 1r 2 统计量衡量在样本内预测因变量值的回归是否成功。计 算尺2 的公式为: r 2 = 1 一兰 ( y - y ) ( y 一歹) 其中舍= y - x b , 歹= 乃,。r 2 值较大表明模型对因变量拟合度较好,因变 量的真实值距离拟合值更近。r 2 值为1 时说明拟合值和实际值完全相等。 1 2 调整尺2 统计量夏2 2 4 】使用r 2 作为衡量工具存在的一个问题,即在增加 新的自变量时r 2 不会减少。调整后的足2 记为页2 ,消除尺2 中对模型没有解释力的 新增变量。计算方法如下: 弘- 一( ,_ r 2 ) 舄 1 3 d u r b i n w a t s o n 统计量 刎 d w 统计量用来检验随机误差项是否存在一 阶序列相关,计算方法如下: 肼= 壹( 毒一材妻毒z 1 4 概率p r o b 在误差项为正态分布或系数估计值为渐近正态分布的假设 下,指出t 统计量与实际观测值致的概率。这个概率称为边际显著性水平或p 值。 1 5 a i c 准则 2 4 】建立计量经济模型时,为选择统计性质优良的模型,在确定 一个滞后分布的长度时,通常用a i c 准则。a i c 值较小意味着模型的滞后阶数较合 适。计算公式如下: 们= - 2 r + 2 ( 后+ 1 ) 丁 其中,值为对数似然值: z = 一冬【1 + l l l ( 2 万) + 1 n ( 舍爸r ) 】 1 6 s c h w a r z 准则2 4 1s c h w a r z 准则是a i c 准则的替代方法,它引入了对增加系 1 2 第二章高频金融时间序列 数的更大的惩罚,s c 值越小说明滞后阶数越合适: s c = - w r + ( k + 1 ) l i l t r 1 7 f 统计量和边际显著性水平【冽f 统计量检验回归中所有的系数是否为零( 除 了常数或截距) 。对于普通最小二乘模型,f 统计量由下式计算: 醇| k ,2 o - r z ) ( z - k - 一o f 统计量下的p 值,o p p r o b ( f s t a t i s t i c ) ,是f 检验的边际显著性水平。f 值相比于 f 分布临界值越大,则越有理由拒绝系数全为0 的原假设。 2 3 3 数据样本基本统计特征 为减少舍入误差,对收盘价序列 c p “) 进行取其自然对数处理,得到序列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 市场调查与竞争分析框架表格
- 日报社笔试题库及答案
- 风险防范型执法伦理研究-洞察与解读
- 池塘养鱼条件试题及答案
- 华夏银行上海市青浦区2025秋招笔试专业知识题专练及答案
- 广发银行上海市宝山区2025秋招数据分析师笔试题及答案
- 农发行张家口市赤城县2025秋招信息科技岗笔试题及答案
- 平安银行咸阳市渭城区2025秋招无领导模拟题角色攻略
- 大三模拟电路试题及答案
- 兴业银行烟台市龙口市2025秋招笔试行测高频题及答案
- 骨科围手术期的护理流程
- 不明原因肺炎病例监测、排查和管理方案2025年修订版
- 呼吸衰竭护理疑难病例讨论
- 熠星创新创业大赛
- 高考英语阅读理解1200个高频
- 2025安全生产法律法规专题知识培训
- 《狼来了》寓言故事演讲课件
- 《瑞吉欧课程模式》课件
- 特种作业电工安全培训
- DB37-T 1933-2022 氯碱安全生产技术规范
- 校园传染病防控班主任培训
评论
0/150
提交评论