基于贝叶斯分析的厚尾和杠杆SV模型:洞察中国股市波动奥秘_第1页
基于贝叶斯分析的厚尾和杠杆SV模型:洞察中国股市波动奥秘_第2页
基于贝叶斯分析的厚尾和杠杆SV模型:洞察中国股市波动奥秘_第3页
基于贝叶斯分析的厚尾和杠杆SV模型:洞察中国股市波动奥秘_第4页
基于贝叶斯分析的厚尾和杠杆SV模型:洞察中国股市波动奥秘_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于贝叶斯分析的厚尾和杠杆SV模型:洞察中国股市波动奥秘一、引言1.1研究背景与意义在金融市场的研究领域中,金融时间序列的波动性一直是核心问题之一。股票市场作为金融市场的关键组成部分,其价格的波动不仅影响着投资者的决策,还对整个经济体系的稳定运行产生重要作用。波动性的准确度量与分析,对于风险管理、资产定价、投资组合优化等方面都具有不可或缺的意义。例如,在风险管理中,精确评估股市的波动性可以帮助投资者合理控制风险敞口,避免因市场波动而遭受重大损失;在资产定价中,波动性是确定资产价格的重要因素,能够影响投资者对资产价值的判断;在投资组合优化中,了解不同资产的波动性及其相关性,有助于投资者构建更加合理的投资组合,实现风险与收益的平衡。随机波动率族(SV)模型作为描述波动性的一类重要模型,在金融研究中得到了广泛应用。它相较于传统的波动率模型,如ARCH类模型,能够更好地捕捉金融时间序列的复杂特征。SV模型假设波动率是一个随机过程,更符合金融市场的实际情况,能有效刻画金融时间序列的时变波动性、波动聚集性等特征。例如,在股票市场中,SV模型可以较好地解释股价波动在某些时间段内较为剧烈,而在其他时间段内相对平稳的现象,为投资者提供更准确的市场波动信息。然而,传统的基本随机波动率模型在描述中国股市价格序列的波动性时,存在一定的局限性。一方面,金融时间序列的无条件分布与异方差模型相对于标准正态分布的假设相比,呈现出明显的高峰厚尾特征。这意味着金融市场中极端事件发生的概率要高于正态分布的假设,而基本SV模型难以准确刻画这种厚尾现象。例如,在股市中,偶尔会出现大幅上涨或下跌的极端行情,这些极端事件对投资者的影响巨大,但基本SV模型可能无法充分反映其发生的可能性和影响程度。另一方面,资产收益率与波动率之间存在着相关性,即所谓的杠杆效应。当股票价格下跌时,波动率往往会增加;而当股票价格上涨时,波动率可能会降低。基本SV模型通常假设资产收益率与波动率相互独立,无法捕捉到这种重要的市场特征。为了克服基本随机波动率模型的上述缺陷,厚尾SV模型和杠杆SV模型应运而生。厚尾SV模型通过引入厚尾分布,能够更准确地描述金融时间序列的厚尾特征,提高对极端事件的刻画能力。杠杆SV模型则通过考虑资产收益率与波动率之间的相关性,有效捕捉到了杠杆效应,使模型更加符合金融市场的实际运行情况。在对中国股市的研究中,这两种模型具有独特的价值。中国股市作为新兴市场,具有自身的特点,如投资者结构以散户为主、市场波动较为频繁等。运用厚尾和杠杆SV模型,可以更深入地分析中国股市的波动特征,为投资者和监管部门提供更有针对性的决策依据。例如,对于投资者而言,了解股市的厚尾特征和杠杆效应,可以帮助他们更好地评估风险,制定合理的投资策略;对于监管部门来说,掌握股市的真实波动情况,有助于制定更加有效的监管政策,维护市场的稳定健康发展。1.2国内外研究现状随机波动率模型的研究最早可追溯到20世纪70年代,随着金融市场的发展和计量经济学的进步,该模型在国内外得到了广泛的研究和应用。在国外,早期的研究主要集中在基本随机波动率模型的理论推导和性质分析上。例如,Taylor在1986年提出了基本的随机波动率模型,为后续的研究奠定了基础。此后,众多学者对随机波动率模型进行了扩展和改进。Hull和White在1987年考虑了波动率的均值回复特性,使模型更加符合金融市场的实际情况。Melino和Turnbull在1990年将随机波动率模型应用于期权定价,进一步拓展了其应用领域。在厚尾SV模型方面,Kim、Shephard和Chib在1998年引入了厚尾分布来改进基本SV模型,提高了模型对极端事件的刻画能力。在杠杆SV模型的研究中,Harvey和Shephard在1996年提出了能够测定股票杠杆效应的Lsv模型,并采取伪极大似然法估计模型中的参数,为研究资产收益率与波动率之间的相关性提供了重要的方法。近年来,国外的研究更加注重模型的实证应用和比较分析。一些学者将随机波动率模型与其他模型进行对比,评估其在不同市场条件下的表现。例如,Eraker、Johannes和Polson在2003年通过实证研究比较了随机波动率模型和GARCH类模型在金融市场波动性预测中的优劣,发现随机波动率模型在某些情况下能够更好地捕捉市场波动的特征。同时,随着计算技术的发展,一些新的估计方法和算法被应用于随机波动率模型的参数估计,如马尔可夫链蒙特卡罗(MCMC)方法、变分推断等,提高了模型估计的效率和准确性。在国内,随机波动率模型的研究起步相对较晚,但近年来发展迅速。早期的研究主要是对国外理论和方法的引进和应用。例如,张世英、孟利锋在2004年使用杠杆效应SV模型对中国股票市场进行分析,得到了中国股票市场具有杠杆效应的结论,为国内相关研究提供了重要的参考。此后,国内学者开始结合中国金融市场的特点,对随机波动率模型进行改进和创新。一些研究考虑了中国股市的政策因素、投资者行为等对波动率的影响,提出了更符合中国市场实际情况的模型。如王美今、孙建军在2004年研究了中国股市收益的条件波动与风险补偿,发现中国股市存在显著的风险补偿和波动持续性,为进一步研究中国股市的波动性提供了实证依据。在基于贝叶斯分析的厚尾和杠杆SV模型研究方面,国内也取得了一定的成果。刘志丹在2009年基于贝叶斯理论对SV族模型中的基本SV模型、厚尾SV模型(SV-T模型)、杠杆SV模型进行贝叶斯分析,计算出每个模型中参数的后验分布密度函数,利用Matlab软件计算出各模型中的参数值,对上海股市和深圳股市的波动特征进行分析,同时进行两市的比较分析,对中国股市的波动性作了更为精确的描述。李忆在2021年构建了能够测定动态杠杆系数的动态杠杆随机波动(dlsv)模型,在对收益序列进行降噪之后,利用基于贝叶斯统计的MCMC方法来估计模型的参数,通过对上证指数进行实证分析后发现,上证指数收益率具有明显的波动聚集性以及尖峰后尾性,且在整个交易区间表现出明显的反杠杆效应。总体而言,国内外关于随机波动率模型的研究取得了丰硕的成果,但在基于贝叶斯分析的厚尾和杠杆SV模型对中国股市的研究方面,仍有进一步深入探讨的空间。例如,如何更好地结合中国股市的独特特征,改进模型的设定和估计方法,提高模型对中国股市波动性的刻画和预测能力,是未来研究的重要方向。1.3研究方法与创新点本研究将采用贝叶斯理论对厚尾和杠杆SV模型进行深入分析。贝叶斯理论为模型参数估计提供了一种全新的视角,它通过结合先验信息和样本数据,能够得到更为准确和合理的参数估计结果。在金融市场中,先验信息可以来源于历史数据的分析、市场经验以及专家的判断等。利用贝叶斯理论,我们可以将这些先验知识融入到模型的参数估计过程中,从而提高模型对中国股市波动性的刻画能力。例如,通过对历史数据的分析,我们可以了解到中国股市在某些特定时期的波动特征,这些信息可以作为先验知识,帮助我们更好地估计模型参数,使模型能够更准确地反映股市的实际波动情况。马尔可夫链蒙特卡罗(MCMC)方法将被用于模型的参数估计。MCMC方法在解决SV模型中的高维分布参数估计以及求解似然函数和后验分布方面具有显著优势。它通过构建马尔可夫链,从后验分布中进行抽样,从而得到参数的估计值。在实际应用中,MCMC方法能够有效地处理复杂的概率分布,克服传统估计方法在处理高维问题时的困难。以中国股市数据为例,利用MCMC方法可以对厚尾和杠杆SV模型中的多个参数进行同时估计,并且能够充分考虑参数之间的相关性,提高估计的精度和可靠性。为了选择最适合中国股市的SV模型,本研究将运用DIC准则对不同模型的模拟情况进行比较分析。DIC准则综合考虑了模型的拟合优度和复杂度,能够在多个模型中进行客观、有效的选择。在比较不同的SV模型时,DIC准则可以帮助我们确定哪个模型既能较好地拟合数据,又不会过于复杂,从而避免过拟合问题。通过DIC准则的比较,我们可以找到最能准确描述中国股市波动性的模型,为后续的分析和预测提供更可靠的基础。在模型选择方面,本研究通过运用DIC准则,综合考量模型的拟合优度和复杂度,能够从多个SV模型中精准筛选出最契合中国股市特点的模型,避免了传统方法中可能出现的主观偏差和过拟合问题。例如,在比较基本SV模型、厚尾SV模型和杠杆SV模型时,DIC准则能够客观地评估每个模型对中国股市数据的适应性,为模型的选择提供科学依据。在参数估计上,采用基于贝叶斯理论的MCMC方法,充分融合先验信息与样本数据,有效解决了SV模型中高维分布参数估计的难题。这种方法不仅提高了参数估计的精度和可靠性,还能深入挖掘参数之间的潜在关系。比如,在处理中国股市的复杂数据时,MCMC方法能够利用先验知识对参数进行约束,从而得到更符合实际情况的估计结果。在股市波动分析中,本研究运用厚尾和杠杆SV模型,全面考虑了金融时间序列的厚尾特征和资产收益率与波动率之间的相关性,这是对传统模型的重要突破。通过这两个模型,能够更深入、准确地剖析中国股市的波动特征,为投资者和监管部门提供更具针对性和实用性的决策参考。例如,在风险管理中,厚尾SV模型能够更好地刻画极端事件的发生概率,帮助投资者合理控制风险;杠杆SV模型则能准确捕捉资产收益率与波动率的相关性,为投资策略的制定提供更全面的信息。二、相关理论与模型基础2.1随机波动率族模型概述在金融市场的研究中,随机波动率族(SV)模型是一类用于描述金融资产价格波动的重要模型。其核心思想是将波动率视为一个随机过程,这与传统的波动率模型,如ARCH类模型中波动率是可观测变量的假设不同。SV模型通过引入一个不可观测的随机过程来刻画波动率的变化,能更好地捕捉金融时间序列的复杂特征,如时变波动性、波动聚集性等。在实际金融市场中,资产价格的波动并非固定不变,而是呈现出随机且复杂的变化,SV模型的这一特性使其更符合市场实际情况。例如,在股票市场中,股价的波动在不同时间段内表现出明显的差异,有时波动较为剧烈,有时则相对平稳,SV模型能够有效描述这种波动的时变特征。2.1.1基本随机波动率(SV)模型基本随机波动率模型(SV模型)由Taylor于1986年提出,是随机波动率族模型的基础。该模型假设对数波动率服从一个简单的自回归过程,其数学表达式如下:\begin{cases}y_t=\sigma_t\epsilon_t,\quad\epsilon_t\simi.i.d.N(0,1)\\\ln\sigma_t^2=\mu+\phi(\ln\sigma_{t-1}^2-\mu)+\eta_t,\quad\eta_t\simi.i.d.N(0,\sigma_{\eta}^2)\end{cases}其中,y_t表示资产收益率,\sigma_t为条件标准差,即波动率,\epsilon_t是独立同分布的标准正态分布随机变量,表示收益率的扰动项;\mu是对数波动率的长期均值,\phi为自回归系数,反映了当前波动对未来波动的影响程度,\eta_t是独立同分布的正态分布随机变量,表示对数波动率的扰动项,\sigma_{\eta}^2是对数波动率扰动项的方差。在这个模型中,资产收益率y_t依赖于时变的波动率\sigma_t,而波动率\sigma_t则由一个自回归过程决定。通过对数波动率的自回归结构,模型能够捕捉到金融时间序列中波动聚集的现象,即波动在某些时间段内相对较高,而在其他时间段内相对较低。当\phi接近1时,表明当前的高波动状态可能会持续一段时间,未来的波动率也可能较高;反之,当\phi较小时,波动的持续性较弱。然而,基本SV模型在描述股市波动性时存在一定的局限性。它假设资产收益率服从正态分布,但在实际金融市场中,金融时间序列的无条件分布通常呈现出明显的高峰厚尾特征,即极端事件发生的概率要高于正态分布的假设。在股市中,偶尔会出现大幅上涨或下跌的极端行情,这些极端事件对投资者的影响巨大,但基本SV模型难以准确刻画这种厚尾现象,可能会低估极端事件发生的概率。此外,基本SV模型通常假设资产收益率与波动率相互独立,而实际情况中,资产收益率与波动率之间存在着相关性,即所谓的杠杆效应,基本SV模型无法捕捉到这种重要的市场特征。2.1.2厚尾SV模型(SV-T模型)厚尾SV模型(SV-T模型)是对基本SV模型的改进,旨在更好地刻画金融时间序列的厚尾特征。在金融市场中,资产收益率的分布往往呈现出尖峰厚尾的形态,即与正态分布相比,具有更高的峰度和更厚的尾部,这意味着极端事件发生的概率相对较高。传统的基本SV模型假设收益率服从正态分布,无法准确描述这种厚尾现象,而SV-T模型通过将收益率的扰动项\epsilon_t假设为服从自由度为v的t分布,而非标准正态分布,有效提高了对极端事件的刻画能力。SV-T模型的数学表达式为:\begin{cases}y_t=\sigma_t\epsilon_t,\quad\epsilon_t\simi.i.d.t(v)\\\ln\sigma_t^2=\mu+\phi(\ln\sigma_{t-1}^2-\mu)+\eta_t,\quad\eta_t\simi.i.d.N(0,\sigma_{\eta}^2)\end{cases}其中,t(v)表示自由度为v的t分布。与正态分布相比,t分布具有更厚的尾部,当自由度v较小时,t分布的尾部比正态分布更厚,能够更好地反映金融市场中极端事件发生的概率。通过引入t分布,SV-T模型可以更准确地描述金融时间序列的厚尾特征,在面对极端行情时,能够更合理地评估风险,为投资者提供更可靠的风险度量和决策依据。例如,在股市出现大幅波动时,SV-T模型能够更准确地捕捉到这种极端情况,帮助投资者更好地应对市场风险。2.1.3杠杆SV模型杠杆SV模型是在基本SV模型的基础上,考虑了资产收益率与波动率之间的相关性,即杠杆效应。在金融市场中,杠杆效应是指当资产价格下跌时,波动率往往会增加;而当资产价格上涨时,波动率可能会降低。这种现象在股票市场中尤为明显,传统的基本SV模型由于假设资产收益率与波动率相互独立,无法捕捉到这种重要的市场特征。杠杆SV模型通过引入一个相关系数\rho来刻画资产收益率与波动率之间的相关性,其数学表达式为:\begin{cases}y_t=\sigma_t\epsilon_t\\\ln\sigma_t^2=\mu+\phi(\ln\sigma_{t-1}^2-\mu)+\eta_t\\\begin{pmatrix}\epsilon_t\\\eta_t\end{pmatrix}\simN\begin{pmatrix}0\\0\end{pmatrix},\begin{pmatrix}1&\rho\\\rho&1\end{pmatrix}\end{cases}其中,\rho表示收益率扰动项\epsilon_t与对数波动率扰动项\eta_t之间的相关系数,反映了资产收益率与波动率之间的杠杆效应。当\rho<0时,表示资产收益率与波动率呈负相关,即资产价格下跌时,波动率会上升,体现了杠杆效应。杠杆SV模型能够有效地捕捉到资产收益率与波动率之间的这种动态关系,使模型更加符合金融市场的实际运行情况。在分析股票市场时,杠杆SV模型可以更准确地描述股价波动与收益率之间的相互作用,为投资者提供更全面的市场信息。例如,当投资者根据杠杆SV模型预测到股价下跌可能伴随着波动率上升时,他们可以提前调整投资策略,降低风险暴露,从而更好地保护投资组合的价值。2.2贝叶斯分析理论基础2.2.1贝叶斯定理与后验分布贝叶斯定理是贝叶斯分析的核心,它为我们提供了一种在已知某些条件信息的情况下,更新和估计概率分布的方法。贝叶斯定理的基本公式为:P(\theta|y)=\frac{P(y|\theta)P(\theta)}{P(y)}其中,P(\theta|y)表示后验分布,即在给定观测数据y的条件下,参数\theta的概率分布;P(y|\theta)是似然函数,它描述了在参数\theta给定的情况下,观测数据y出现的概率;P(\theta)为先验分布,是在观测数据之前,我们对参数\theta所具有的先验知识的概率表达;P(y)是边际概率,也称为证据因子,它是一个归一化常数,用于确保后验分布的概率总和为1,其计算公式为P(y)=\intP(y|\theta)P(\theta)d\theta。在实际应用中,先验分布P(\theta)反映了我们在进行观测之前对参数的主观认识或经验判断。这种先验知识可以来源于历史数据的分析、专家的意见或理论模型的推导等。在研究股票市场波动性时,我们可以根据以往对该市场的研究经验,假设某些参数服从特定的分布,如正态分布、伽马分布等,以此作为先验分布。似然函数P(y|\theta)则基于观测数据和所设定的模型来确定,它衡量了在不同参数值下,观测数据出现的可能性。对于随机波动率模型,似然函数描述了在给定参数\theta时,实际观测到的资产收益率序列y的概率。后验分布P(\theta|y)综合了先验分布和似然函数所包含的信息,它是在考虑了观测数据之后,我们对参数\theta的最新认识。通过贝叶斯定理,我们将先验知识与样本数据相结合,实现了对参数概率分布的更新,从而更准确地推断参数的真实值。这种从先验分布到后验分布的转换,体现了贝叶斯分析的核心思想,即在不断获取新信息的过程中,逐步修正和完善我们对未知参数的认识。2.2.2在SV族模型中的应用原理在随机波动率族(SV)模型中,贝叶斯分析主要用于对模型参数进行估计。传统的参数估计方法,如最大似然估计(MLE),仅依赖于样本数据,通过最大化似然函数来确定参数值。而贝叶斯分析则充分利用了先验信息,将先验分布与样本数据相结合,得到后验分布,进而基于后验分布对参数进行推断。以厚尾SV模型(SV-T模型)为例,假设模型中的参数包括对数波动率的长期均值\mu、自回归系数\phi、对数波动率扰动项的方差\sigma_{\eta}^2以及t分布的自由度v,记为\theta=(\mu,\phi,\sigma_{\eta}^2,v)。在贝叶斯分析框架下,我们首先根据先验知识为这些参数设定先验分布P(\theta)。例如,可以假设\mu服从正态分布,\phi服从Beta分布,\sigma_{\eta}^2服从逆伽马分布,v服从伽马分布等。这些先验分布的选择并非随意,而是基于我们对金融市场的理解以及以往的研究经验。比如,根据对股市波动率长期特征的认识,我们可以合理设定\mu的先验均值和方差;对于\phi,由于其反映了波动的持续性,根据历史数据中波动持续性的表现,我们可以选择合适的Beta分布参数。然后,根据观测到的资产收益率数据y,计算似然函数P(y|\theta)。在SV-T模型中,似然函数的计算涉及到t分布的概率密度函数以及对数波动率的自回归过程。通过贝叶斯定理,将先验分布P(\theta)与似然函数P(y|\theta)相结合,得到参数的后验分布P(\theta|y)。与传统的参数估计方法相比,贝叶斯分析在SV族模型中具有显著的优势。它能够充分利用先验信息,当样本数据有限时,先验信息可以提供额外的约束,使参数估计更加稳定和准确。在对一些新兴股票市场进行研究时,由于市场发展时间较短,数据量相对较少,此时先验信息可以帮助我们更好地估计模型参数。贝叶斯分析得到的后验分布不仅给出了参数的点估计,还提供了参数的不确定性信息,即参数的分布范围。这对于风险评估和决策制定非常重要,投资者可以根据参数的不确定性来评估投资风险,制定更加合理的投资策略。2.3MCMC方法原理与应用2.3.1MCMC方法基本原理马尔可夫链蒙特卡罗(MCMC)方法是一种用于从复杂概率分布中进行抽样的计算方法,在解决高维分布问题中发挥着重要作用。在许多实际应用中,我们常常需要从一个复杂的概率分布中抽取样本,以估计分布的各种统计量,如均值、方差等。对于高维分布,直接抽样往往非常困难,甚至在理论上是不可行的,因为高维积分的计算量会随着维度的增加而呈指数级增长,这就是所谓的“维度灾难”问题。MCMC方法通过构建一个马尔可夫链来解决这一难题。马尔可夫链是一种随机过程,它具有马尔可夫性质,即下一时刻的状态只依赖于当前时刻的状态,而与过去的状态无关。在MCMC方法中,我们从一个初始状态出发,根据一定的转移概率,逐步生成一系列的状态,这些状态构成了马尔可夫链。随着链的不断迭代,链的状态会逐渐收敛到目标分布,即我们想要抽样的复杂概率分布。以贝叶斯分析中的后验分布抽样为例,假设我们要估计某个模型的参数\theta,根据贝叶斯定理,参数的后验分布P(\theta|y)由先验分布P(\theta)和似然函数P(y|\theta)决定。在高维情况下,直接计算后验分布的积分以获取参数的估计值是非常困难的。MCMC方法通过构建马尔可夫链,从后验分布中进行抽样,得到一系列的样本\{\theta^{(1)},\theta^{(2)},\cdots,\theta^{(N)}\}。随着样本数量N的增加,这些样本的统计量(如均值、方差等)会逐渐逼近后验分布的真实统计量,从而可以用这些样本的统计量来估计参数\theta。MCMC方法主要包括Metropolis-Hastings算法和Gibbs抽样算法等。Metropolis-Hastings算法是一种通用的MCMC算法,它通过接受或拒绝新的状态来构建马尔可夫链。在每一步迭代中,根据一个提议分布q(\theta^{*}|\theta^{(t)})生成一个新的状态\theta^{*},然后根据一定的接受概率\alpha(\theta^{(t)},\theta^{*})决定是否接受这个新状态。如果接受,则\theta^{(t+1)}=\theta^{*};否则,\theta^{(t+1)}=\theta^{(t)}。接受概率的设计使得马尔可夫链最终能够收敛到目标分布。Gibbs抽样算法是Metropolis-Hastings算法的一种特殊情况,它适用于条件分布容易计算的情况。在多参数模型中,假设参数向量\theta=(\theta_1,\theta_2,\cdots,\theta_d),Gibbs抽样算法通过依次从每个参数的条件分布P(\theta_i|\theta_{-i},y)中进行抽样,其中\theta_{-i}表示除\theta_i之外的其他参数。在每次迭代中,固定其他参数的值,从第i个参数的条件分布中抽取一个新的值,然后更新参数向量。通过不断迭代,最终得到的样本也能收敛到目标分布。MCMC方法在解决高维分布问题时,通过巧妙地利用马尔可夫链的特性,将复杂的抽样问题转化为一个迭代的随机过程,从而有效地克服了“维度灾难”问题,为从复杂概率分布中获取样本提供了一种可行的方法。2.3.2在SV模型参数估计中的实现在随机波动率(SV)模型的参数估计中,MCMC方法发挥着重要作用。由于SV模型中存在不可观测的波动率过程,使得其似然函数的计算非常复杂,传统的参数估计方法难以直接应用。而MCMC方法能够有效地处理这种复杂的模型结构,通过从参数和潜在波动率的联合后验分布中进行抽样,实现对SV模型参数的估计。下面以厚尾SV模型(SV-T模型)为例,详细说明利用MCMC方法估计SV模型参数的过程,其中主要涉及Gibbs抽样和Metropolis-Hastings抽样的具体步骤。在SV-T模型中,假设模型参数包括对数波动率的长期均值\mu、自回归系数\phi、对数波动率扰动项的方差\sigma_{\eta}^2以及t分布的自由度v,记为\theta=(\mu,\phi,\sigma_{\eta}^2,v),同时存在潜在的对数波动率序列h=(h_1,h_2,\cdots,h_T),观测到的资产收益率序列为y=(y_1,y_2,\cdots,y_T)。根据贝叶斯定理,参数\theta和对数波动率h的联合后验分布为:P(\theta,h|y)\proptoP(y|h,\theta)P(h|\theta)P(\theta)其中,P(y|h,\theta)是似然函数,它描述了在给定参数\theta和对数波动率h的情况下,观测数据y出现的概率;P(h|\theta)是对数波动率h在参数\theta条件下的分布;P(\theta)是参数\theta的先验分布。在利用MCMC方法进行参数估计时,首先需要对参数\theta设定合适的先验分布。对于\mu,可以假设其服从正态分布N(\mu_0,\sigma_0^2),其中\mu_0和\sigma_0^2是根据先验知识设定的均值和方差;对于\phi,由于其取值范围通常在(-1,1)之间,可以假设其服从Beta分布Beta(a,b),参数a和b决定了分布的形状;对于\sigma_{\eta}^2,一般假设其服从逆伽马分布IG(\alpha,\beta),\alpha和\beta是逆伽马分布的参数;对于t分布的自由度v,可以假设其服从伽马分布Gamma(c,d),c和d为伽马分布的参数。这些先验分布的选择并非随意,而是基于对金融市场的理解以及以往的研究经验。比如,根据对股市波动率长期特征的认识,我们可以合理设定\mu的先验均值和方差;对于\phi,由于其反映了波动的持续性,根据历史数据中波动持续性的表现,我们可以选择合适的Beta分布参数。Gibbs抽样是MCMC方法中的一种常用抽样策略,它通过依次从每个参数的条件分布中进行抽样来构建马尔可夫链。在SV-T模型中,利用Gibbs抽样估计参数的步骤如下:初始化参数:给定参数\theta和对数波动率h的初始值\theta^{(0)}和h^{(0)}。这些初始值的选择可以是随机的,也可以根据一些先验知识或简单的估计方法来确定。例如,可以根据历史数据的简单统计量来初步设定参数的初始值,使得初始值在合理的范围内,有助于加快收敛速度。抽样对数波动率:在给定参数\theta^{(t)}和观测数据y的条件下,从对数波动率h的条件分布P(h|y,\theta^{(t)})中抽样得到h^{(t+1)}。根据模型的设定,y_t=\sigma_t\epsilon_t,\ln\sigma_t^2=h_t,\epsilon_t\simi.i.d.t(v),通过这些关系以及贝叶斯公式,可以推导出h的条件分布。在实际抽样过程中,通常利用一些数值计算方法,如Metropolis-Hastings算法的特殊形式,从该条件分布中抽取样本。抽样参数:在给定对数波动率h^{(t+1)}和其他参数\theta_{-\mu}^{(t)}(即除\mu之外的其他参数)以及观测数据y的条件下,从\mu的条件分布P(\mu|h^{(t+1)},\theta_{-\mu}^{(t)},y)中抽样得到\mu^{(t+1)}。由于假设\mu服从正态分布N(\mu_0,\sigma_0^2),结合模型中的其他条件,可以得到\mu的条件分布仍然是正态分布,其均值和方差可以通过一些数学推导得到。抽样参数:在给定对数波动率h^{(t+1)}和其他参数\theta_{-\phi}^{(t)}以及观测数据y的条件下,从\phi的条件分布P(\phi|h^{(t+1)},\theta_{-\phi}^{(t)},y)中抽样得到\phi^{(t+1)}。由于\phi服从Beta分布Beta(a,b),通过贝叶斯公式和模型中的其他条件,可以推导出\phi的条件分布,然后从该条件分布中进行抽样。抽样参数:在给定对数波动率h^{(t+1)}和其他参数\theta_{-\sigma_{\eta}^2}^{(t)}以及观测数据y的条件下,从\sigma_{\eta}^2的条件分布P(\sigma_{\eta}^2|h^{(t+1)},\theta_{-\sigma_{\eta}^2}^{(t)},y)中抽样得到\sigma_{\eta}^2^{(t+1)}。由于\sigma_{\eta}^2服从逆伽马分布IG(\alpha,\beta),通过相关的数学推导,可以得到其条件分布仍然是逆伽马分布,只是参数会根据当前的h和其他参数的值进行调整,然后从调整后的逆伽马分布中抽样。抽样参数:在给定对数波动率h^{(t+1)}和其他参数\theta_{-v}^{(t)}以及观测数据y的条件下,从v的条件分布P(v|h^{(t+1)},\theta_{-v}^{(t)},y)中抽样得到v^{(t+1)}。由于v服从伽马分布Gamma(c,d),通过贝叶斯公式和模型中的条件,可以推导出v的条件分布,进而从该条件分布中进行抽样。重复步骤:重复步骤2-6,进行M次迭代,得到一系列的样本\{\theta^{(1)},h^{(1)}\},\{\theta^{(2)},h^{(2)}\},\cdots,\{\theta^{(M)},h^{(M)}\}。在实际应用中,通常会舍弃前N个样本,即进行“burn-in”过程,以确保马尔可夫链达到稳定状态,然后使用剩下的样本进行参数估计。例如,可以通过检查样本的统计量是否收敛来确定“burn-in”的长度。在某些情况下,某些参数的条件分布可能难以直接抽样,此时可以使用Metropolis-Hastings抽样作为补充。Metropolis-Hastings抽样是一种更通用的抽样方法,它通过接受或拒绝新的样本值来构建马尔可夫链。在SV-T模型中,如果某个参数\theta_i的条件分布难以直接抽样,可以按照以下步骤进行Metropolis-Hastings抽样:提议新的样本值:根据一个提议分布q(\theta_i^{*}|\theta_i^{(t)})提议一个新的样本值\theta_i^{*}。提议分布的选择有多种方式,常见的如正态分布、均匀分布等。例如,可以选择以当前样本值\theta_i^{(t)}为中心的正态分布作为提议分布,通过调整正态分布的方差来控制提议值的变化范围。计算接受概率:计算接受新样本值\theta_i^{*}的概率\alpha(\theta_i^{(t)},\theta_i^{*}),接受概率的计算公式为:\alpha(\theta_i^{(t)},\theta_i^{*})=\min\left(1,\frac{P(\theta_i^{*},\theta_{-i}^{(t)},h^{(t+1)}|y)q(\theta_i^{(t)}|\theta_i^{*})}{P(\theta_i^{(t)},\theta_{-i}^{(t)},h^{(t+1)}|y)q(\theta_i^{*}|\theta_i^{(t)})}\right)其中,P(\theta_i^{*},\theta_{-i}^{(t)},h^{(t+1)}|y)和P(\theta_i^{(t)},\theta_{-i}^{(t)},h^{(t+1)}|y)分别是在新样本值和当前样本值下的联合后验分布概率,q(\theta_i^{(t)}|\theta_i^{*})和q(\theta_i^{*}|\theta_i^{(t)})是提议分布的反向概率。接受或拒绝新样本值:从均匀分布U(0,1)中抽取一个随机数u,如果u\leq\alpha(\theta_i^{(t)},\theta_i^{*}),则接受新样本值\theta_i^{(t+1)}=\theta_i^{*};否则,拒绝新样本值,保持当前样本值\theta_i^{(t+1)}=\theta_i^{(t)}。通过不断迭代上述Gibbs抽样和Metropolis-Hastings抽样步骤,最终得到的样本可以用于估计SV-T模型的参数。例如,可以用样本的均值作为参数的点估计,用样本的方差来衡量参数估计的不确定性。通过这种方式,MCMC方法有效地实现了对SV模型参数的估计,克服了传统方法在处理复杂模型时的困难。三、中国股市数据选取与预处理3.1数据来源与选取本研究选取了具有代表性的上证综指和深证成指的日度数据作为研究对象,数据来源于Wind数据库。选择这两个指数数据的原因在于,上证综指是以上海证券交易所挂牌上市的全部股票为计算范围,以发行量为权数的加权综合股价指数,样本股涵盖了上海证券市场中最具代表性的股票,包括了各个行业的龙头企业,能较好地反映上海证券市场的整体表现以及中国大型企业的发展状况。深证成指按一定标准选出500家有代表性的上市公司作为样本股,用样本股的自由流通股数作为权数,采用派氏加权法编制而成,其样本公司涵盖多个行业,且更侧重于中小企业,能反映深圳证券市场的动态以及新兴产业的发展趋势。两者相互补充,能全面反映中国股市的整体情况。数据的时间范围从2010年1月4日至2023年12月31日。选择这一时间跨度主要基于以下考虑:2008年全球金融危机对中国股市产生了巨大冲击,市场在危机后经历了一段时间的调整与恢复,2010年之后股市逐渐趋于稳定,选择此时间点作为起始,能够避免金融危机带来的异常波动对研究结果的干扰,使数据更具代表性和稳定性。截至2023年12月31日,涵盖了近年来中国股市的多个发展阶段,包括市场的繁荣期、调整期以及政策变动期等,能充分反映中国股市在不同市场环境下的波动特征,为研究提供丰富的数据支持,有助于更全面、准确地分析中国股市的波动性。3.2数据特征分析3.2.1描述性统计分析在获取上证综指和深证成指的日度数据后,首先对其进行初步的数据清洗,以确保数据的准确性和可用性。检查数据中是否存在缺失值,若存在,则根据数据的连续性和整体趋势,采用合适的方法进行填补。对于异常值,通过设定合理的阈值范围进行识别和处理,例如,对于收益率数据,若其绝对值超过一定的阈值(如5倍标准差),则将其视为异常值进行调整或剔除。经过清洗后,对上证综指和深证成指的日度收益率数据进行描述性统计分析,计算其均值、标准差、峰度和偏度等统计量,结果如表1所示:指数样本数均值标准差峰度偏度最小值最大值上证综指35640.00030.01896.0354-0.4721-0.09670.0940深证成指35640.00040.02236.2584-0.3874-0.10940.1179从表1可以看出,上证综指和深证成指的日度收益率均值都非常接近于0,分别为0.0003和0.0004,这表明在研究期间内,两大指数的平均日收益率基本处于盈亏平衡状态,市场整体表现相对平稳,没有明显的长期上涨或下跌趋势。从长期来看,股市的涨跌相互抵消,投资者在这段时间内若持有指数基金,平均每日的收益几乎为零。标准差反映了数据的离散程度,是衡量收益率波动大小的重要指标。上证综指的标准差为0.0189,深证成指的标准差为0.0223,深证成指的标准差相对较大,说明深证成指的收益率波动更为剧烈,价格变化的不确定性更高。在某些时期,深证成指可能会出现较大幅度的涨跌,投资者面临的风险相对较大;而上证综指的波动相对较小,价格走势相对较为稳定。峰度是衡量数据分布形态的指标,正态分布的峰度值为3。上证综指和深证成指的峰度值分别为6.0354和6.2584,均远大于3,这表明两大指数的收益率分布呈现出明显的尖峰厚尾特征。尖峰意味着收益率分布在均值附近的概率比正态分布更高,即市场出现小幅度波动的情况更为频繁;厚尾则表示收益率分布的尾部比正态分布更厚,即极端事件(如大幅上涨或下跌)发生的概率相对较高。在股市中,偶尔会出现突发的重大事件,如政策调整、经济数据公布等,这些事件可能导致指数出现大幅波动,而尖峰厚尾的分布特征能够更好地反映这种市场现象。偏度用于衡量数据分布的不对称性。正态分布的偏度值为0,当偏度小于0时,数据分布呈现左偏态,即左侧尾部较长,意味着出现大幅下跌的概率相对较大;当偏度大于0时,数据分布呈现右偏态,右侧尾部较长,出现大幅上涨的概率相对较大。上证综指的偏度为-0.4721,深证成指的偏度为-0.3874,均小于0,说明两大指数的收益率分布均呈现左偏态,即市场下跌的风险相对较高,出现大幅下跌的可能性大于大幅上涨的可能性。在市场下跌阶段,投资者需要更加谨慎地控制风险,避免资产遭受重大损失。最小值和最大值反映了收益率数据的取值范围。上证综指的最小值为-0.0967,最大值为0.0940;深证成指的最小值为-0.1094,最大值为0.1179。可以看出,两大指数在研究期间内都经历了较大幅度的涨跌,投资者在市场中面临着较大的价格波动风险。在某些极端情况下,如金融危机、重大政策调整等,指数可能会出现大幅下跌,投资者的资产可能会遭受严重损失;而在市场繁荣时期,指数也可能会大幅上涨,为投资者带来丰厚的收益。3.2.2波动性特征初步观察为了更直观地观察中国股市的波动性特征,绘制上证综指和深证成指的日度收益率波动图,如图1所示:从图1中可以明显看出,上证综指和深证成指的日度收益率波动呈现出明显的聚集性特征。在某些时间段内,收益率波动较为剧烈,出现了较大幅度的涨跌,如2015年的股灾期间,两大指数的收益率波动急剧增大,市场恐慌情绪蔓延,投资者纷纷抛售股票,导致指数大幅下跌;而在另一些时间段内,收益率波动相对较小,市场表现较为平稳,如2020年疫情初期,市场在经历了短暂的恐慌后,逐渐恢复平稳,指数收益率波动较小。这种波动聚集性表明股市的波动性并非是随机的,而是存在一定的相关性和持续性,过去的波动情况往往会对未来的波动产生影响。当市场处于高波动状态时,这种高波动状态可能会持续一段时间;而当市场处于低波动状态时,也可能会维持一段时间的相对稳定。两大指数的收益率波动还表现出明显的时变性。随着时间的推移,收益率的波动程度不断变化,没有固定的规律可循。这与金融市场的复杂性和不确定性密切相关,市场受到众多因素的影响,如宏观经济形势、政策调整、投资者情绪、国际政治局势等,这些因素的动态变化导致了股市波动性的时变性。在经济增长强劲、政策利好的时期,市场信心增强,投资者积极参与,股市波动性可能相对较小;而在经济衰退、政策收紧或出现重大突发事件时,市场不确定性增加,投资者情绪波动,股市波动性可能会显著增大。上证综指和深证成指的收益率波动在整体趋势上具有一定的相似性,但在波动幅度和具体波动时间点上也存在一定的差异。由于两大指数所涵盖的样本股票不同,行业分布和市场代表性也有所差异,因此在面对相同的市场因素时,其反应程度和波动表现会有所不同。上证综指更侧重于大型企业和传统行业,对宏观经济政策和行业周期的变化更为敏感;深证成指则更侧重于中小企业和新兴产业,对科技创新和市场热点的变化更为敏感。在某些行业政策调整或新兴产业崛起的时期,深证成指的波动可能会更为明显;而在宏观经济形势发生重大变化时,上证综指的波动可能会更为突出。3.3数据预处理在进行基于贝叶斯分析的厚尾和杠杆SV模型研究之前,需要对选取的上证综指和深证成指的日度数据进行预处理,以确保数据符合模型分析的要求。对于金融时间序列分析,常用的收益率计算方法为对数收益率,其计算公式为:r_t=\ln\left(\frac{P_t}{P_{t-1}}\right)其中,r_t表示第t期的对数收益率,P_t为第t期的股票价格,P_{t-1}是第t-1期的股票价格。与简单收益率相比,对数收益率具有更好的数学性质,它能够消除价格波动的影响,更准确地反映股票价格的变化情况,在处理连续复利和多期投资时更为方便,也更符合金融理论中的一些假设。在构建投资组合模型时,对数收益率的使用可以使模型的计算和分析更加简洁和准确。通过上述公式,将上证综指和深证成指的日度收盘价数据转化为对数收益率数据。这一步骤不仅是后续模型分析的基础,还能更直观地展示股票价格的变化趋势和波动情况,为进一步分析股市的波动性提供了更合适的数据形式。在数据中,可能存在一些异常值,这些异常值可能是由于数据录入错误、市场突发事件等原因导致的,它们会对模型的估计和分析结果产生较大的影响,因此需要对其进行处理。采用基于分位数的方法来识别异常值。对于对数收益率数据,计算其第1百分位数Q_1和第99百分位数Q_99。将小于Q_1或大于Q_99的数据点视为异常值。这种基于分位数的方法能够有效地识别出数据中的极端值,同时又不会过度剔除正常的数据点。例如,在某些特殊事件发生时,股市可能会出现短暂的大幅波动,这些波动可能会导致收益率数据出现极端值,但这些极端值并不一定是异常值,基于分位数的方法可以在一定程度上区分这些情况。对于识别出的异常值,采用均值填充的方法进行处理。即对于小于Q_1的异常值,用Q_1到Q_99之间数据的均值进行替换;对于大于Q_99的异常值,用同样的均值进行替换。这种处理方法既能保留数据的整体特征,又能避免异常值对后续分析的干扰。经过对数收益率计算和异常值处理后,数据在一定程度上更加符合厚尾和杠杆SV模型的分析要求。对数收益率数据能够更好地反映股市价格的波动特征,异常值的处理则提高了数据的质量和稳定性,为后续运用贝叶斯分析方法对厚尾和杠杆SV模型进行参数估计和模型选择奠定了良好的数据基础,使模型能够更准确地刻画中国股市的波动性。四、基于贝叶斯分析的模型构建与参数估计4.1模型构建4.1.1基本SV模型的贝叶斯设定在贝叶斯分析的框架下,基本随机波动率(SV)模型的设定基于贝叶斯理论,充分考虑先验信息与样本数据的结合。基本SV模型假设资产收益率y_t与波动率\sigma_t满足以下关系:\begin{cases}y_t=\sigma_t\epsilon_t,\quad\epsilon_t\simi.i.d.N(0,1)\\\ln\sigma_t^2=\mu+\phi(\ln\sigma_{t-1}^2-\mu)+\eta_t,\quad\eta_t\simi.i.d.N(0,\sigma_{\eta}^2)\end{cases}其中,\mu为对数波动率的长期均值,\phi是自回归系数,反映当前波动对未来波动的影响程度,\sigma_{\eta}^2是对数波动率扰动项\eta_t的方差。在贝叶斯设定中,需要为模型参数\mu、\phi和\sigma_{\eta}^2选择合适的先验分布。对于\mu,通常假设其服从正态分布N(\mu_0,\sigma_0^2),其中\mu_0和\sigma_0^2是根据先验知识设定的均值和方差。例如,在对中国股市的研究中,通过对历史数据的初步分析,发现对数波动率的长期均值大致在某个范围内,可将该范围的中间值作为\mu_0,并根据波动程度设定合理的\sigma_0^2。对于自回归系数\phi,由于其取值范围通常在(-1,1)之间,且反映了波动的持续性,一般假设其服从Beta分布Beta(a,b)。参数a和b的选择至关重要,它们决定了分布的形状,进而影响\phi的取值倾向。通过对历史数据中波动持续性的观察和分析,确定a和b的值,使得先验分布能够合理地反映\phi的可能取值。对于对数波动率扰动项的方差\sigma_{\eta}^2,常假设其服从逆伽马分布IG(\alpha,\beta),\alpha和\beta是逆伽马分布的参数。这一分布的选择基于其良好的数学性质和对非负方差的有效刻画。在实际应用中,根据对股市波动率波动程度的先验认识,设定合适的\alpha和\beta值。通过这样的贝叶斯设定,将先验知识融入到基本SV模型中,为后续的参数估计和模型推断提供了更全面的信息基础。在面对有限的样本数据时,先验分布能够起到约束和指导作用,使参数估计结果更加稳定和合理。在样本数据量较少的情况下,先验分布可以避免参数估计出现过度波动或不合理的取值,从而提高模型的可靠性。4.1.2厚尾SV模型的贝叶斯设定厚尾SV模型(SV-T模型)是为了更好地刻画金融时间序列的厚尾特征而对基本SV模型进行的改进。在贝叶斯分析框架下,其设定如下:\begin{cases}y_t=\sigma_t\epsilon_t,\quad\epsilon_t\simi.i.d.t(v)\\\ln\sigma_t^2=\mu+\phi(\ln\sigma_{t-1}^2-\mu)+\eta_t,\quad\eta_t\simi.i.d.N(0,\sigma_{\eta}^2)\end{cases}与基本SV模型不同的是,厚尾SV模型将收益率扰动项\epsilon_t假设为服从自由度为v的t分布,而非标准正态分布。这一设定使得模型能够更准确地描述金融市场中极端事件发生的概率,因为t分布具有更厚的尾部,能够更好地捕捉到极端行情下收益率的异常波动。在贝叶斯设定中,除了为\mu、\phi和\sigma_{\eta}^2选择合适的先验分布外,还需要为t分布的自由度v设定先验分布。通常假设v服从伽马分布Gamma(c,d),其中c和d是伽马分布的参数。伽马分布的选择是因为它能够灵活地描述自由度v的不确定性,并且在数学上与t分布有较好的兼容性。在实际应用中,根据对金融市场极端事件发生频率和程度的先验认识,确定c和d的值。如果预期金融市场中极端事件发生较为频繁,则可以适当调整c和d的值,使v的先验分布更倾向于较小的值,因为较小的自由度会使t分布的尾部更厚,更能反映极端事件的影响。对于\mu、\phi和\sigma_{\eta}^2的先验分布选择,与基本SV模型类似。\mu通常假设服从正态分布N(\mu_0,\sigma_0^2),\phi服从Beta分布Beta(a,b),\sigma_{\eta}^2服从逆伽马分布IG(\alpha,\beta)。这些先验分布的参数设定同样基于对金融市场的先验知识和历史数据的分析,以确保模型能够充分利用先验信息,提高对金融时间序列厚尾特征的刻画能力。4.1.3杠杆SV模型的贝叶斯设定杠杆SV模型在基本SV模型的基础上,考虑了资产收益率与波动率之间的相关性,即杠杆效应。在贝叶斯分析框架下,其模型设定如下:\begin{cases}y_t=\sigma_t\epsilon_t\\\ln\sigma_t^2=\mu+\phi(\ln\sigma_{t-1}^2-\mu)+\eta_t\\\begin{pmatrix}\epsilon_t\\\eta_t\end{pmatrix}\simN\begin{pmatrix}0\\0\end{pmatrix},\begin{pmatrix}1&\rho\\\rho&1\end{pmatrix}\end{cases}其中,\rho为收益率扰动项\epsilon_t与对数波动率扰动项\eta_t之间的相关系数,用于刻画杠杆效应。当\rho<0时,表示资产收益率与波动率呈负相关,即资产价格下跌时,波动率会上升,体现了杠杆效应。在贝叶斯设定中,除了为\mu、\phi和\sigma_{\eta}^2设定先验分布外,还需为相关系数\rho选择合适的先验分布。由于\rho的取值范围在(-1,1)之间,通常假设其服从截断正态分布TN(-1,1,\rho_0,\sigma_{\rho}^2),其中\rho_0是先验均值,\sigma_{\rho}^2是先验方差,截断范围为(-1,1)。这一先验分布的选择能够合理地反映\rho的取值范围和不确定性,并且在数学上便于处理。在实际应用中,根据对金融市场中杠杆效应的先验认识,确定\rho_0和\sigma_{\rho}^2的值。如果以往研究表明中国股市中杠杆效应较为明显,且相关系数大致在某个范围内,则可以将该范围的中间值作为\rho_0,并根据不确定性程度设定合适的\sigma_{\rho}^2。对于\mu、\phi和\sigma_{\eta}^2的先验分布,与基本SV模型和厚尾SV模型类似。\mu服从正态分布N(\mu_0,\sigma_0^2),\phi服从Beta分布Beta(a,b),\sigma_{\eta}^2服从逆伽马分布IG(\alpha,\beta)。通过这样的贝叶斯设定,杠杆SV模型能够充分利用先验信息,准确地捕捉资产收益率与波动率之间的相关性,为金融市场的分析和预测提供更有力的工具。4.2参数估计过程4.2.1先验分布设定在基于贝叶斯分析的厚尾和杠杆SV模型中,合理设定先验分布是至关重要的环节,它直接影响到模型参数估计的准确性和可靠性。参考相关研究以及结合中国股市的实际情况,对各模型参数进行如下先验分布设定。对于基本SV模型、厚尾SV模型和杠杆SV模型中对数波动率的长期均值\mu,假设其服从正态分布N(\mu_0,\sigma_0^2)。在设定\mu_0和\sigma_0^2时,充分考虑中国股市的历史数据特征。通过对过去多年上证综指和深证成指对数波动率的统计分析,发现其长期均值大致在-3到-2之间波动,因此将\mu_0设定为-2.5,以反映对数波动率的平均水平。同时,为了体现一定的不确定性,将\sigma_0^2设定为1,使得先验分布能够覆盖可能的取值范围。自回归系数\phi反映了波动的持续性,其取值范围通常在(-1,1)之间,假设其服从Beta分布Beta(a,b)。在确定a和b的值时,深入研究中国股市波动的持续性特点。通过对历史数据的相关性分析,发现中国股市波动的持续性较强,即当前的高波动状态往往会延续一段时间。基于此,将a设定为10,b设定为2,这样的Beta分布使得\phi的取值更倾向于较大的值,符合中国股市波动持续性较强的实际情况。对数波动率扰动项的方差\sigma_{\eta}^2假设服从逆伽马分布IG(\alpha,\beta)。在确定\alpha和\beta时,综合考虑中国股市波动率的波动程度。通过对历史波动率数据的分析,发现其波动较为稳定,但仍存在一定的不确定性。因此,将\alpha设定为3,\beta设定为0.1,使得逆伽马分布能够合理地描述\sigma_{\eta}^2的分布特征,既体现了波动率的相对稳定性,又考虑到了可能的波动变化。在厚尾SV模型中,t分布的自由度v假设服从伽马分布Gamma(c,d)。在设定c和d时,考虑到中国股市收益率分布的尖峰厚尾特征以及极端事件的发生概率。通过对历史收益率数据的拟合分析,发现自由度v大致在3到5之间,因此将c设定为4,d设定为1,使得伽马分布能够较好地反映自由度v的可能取值,从而准确刻画中国股市收益率的厚尾特征。在杠杆SV模型中,相关系数\rho假设服从截断正态分布TN(-1,1,\rho_0,\sigma_{\rho}^2)。在确定\rho_0和\sigma_{\rho}^2时,参考中国股市的实证研究结果以及市场实际情况。已有研究表明中国股市存在明显的杠杆效应,且相关系数大致在-0.3左右。因此,将\rho_0设定为-0.3,以反映资产收益率与波动率之间的负相关关系。同时,为了体现一定的不确定性,将\sigma_{\rho}^2设定为0.1,使得截断正态分布能够合理地描述\rho的分布特征。通过以上先验分布的设定,充分结合了中国股市的实际情况和已有研究成果,为后续利用MCMC方法进行参数估计提供了合理的先验信息基础,有助于提高模型对中国股市波动性的刻画能力。4.2.2MCMC抽样过程实现利用Matlab软件强大的计算和编程功能,通过Gibbs抽样和Metropolis-Hastings抽样来实现MCMC方法对模型参数的估计。Matlab提供了丰富的函数和工具包,能够方便地进行数值计算、矩阵运算以及概率分布的抽样等操作,为MCMC抽样过程的实现提供了有力支持。在MCMC抽样过程中,首先进行初始化操作。对于厚尾SV模型和杠杆SV模型,给定参数\theta=(\mu,\phi,\sigma_{\eta}^2,v)(对于杠杆SV模型,\theta=(\mu,\phi,\sigma_{\eta}^2,\rho))和对数波动率h=(h_1,h_2,\cdots,h_T)的初始值\theta^{(0)}和h^{(0)}。初始值的选择对MCMC算法的收敛速度和结果的准确性有一定影响,因此在选择初始值时,参考历史数据的统计特征和已有研究的经验。可以根据历史数据中对数波动率的均值和方差来初步设定\mu和\sigma_{\eta}^2的初始值,根据波动持续性的大致情况设定\phi的初始值。对于厚尾SV模型中的v和杠杆SV模型中的\rho,也可以参考相关研究中类似市场条件下的取值范围来设定初始值。接着,进行Gibbs抽样。以厚尾SV模型为例,在给定参数\theta^{(t)}和观测数据y的条件下,从对数波动率h的条件分布P(h|y,\theta^{(t)})中抽样得到h^{(t+1)}。根据模型的设定,利用Matlab中的相关函数和算法,通过对条件分布的数学推导和计算,实现从该条件分布中抽取样本。在计算h的条件分布时,涉及到t分布的概率密度函数以及对数波动率的自回归过程,Matlab的统计工具箱提供了计算t分布概率密度的函数,通过合理运用这些函数以及模型中的参数关系,能够准确计算出h的条件分布,并从中抽样得到h^{(t+1)}。在抽样参数\mu时,在给定对数波动率h^{(t+1)}和其他参数\theta_{-\mu}^{(t)}以及观测数据y的条件下,从\mu的条件分布P(\mu|h^{(t+1)},\theta_{-\mu}^{(t)},y)中抽样得到\mu^{(t+1)}。由于假设\mu服从正态分布N(\mu_0,\sigma_0^2),结合模型中的其他条件,通过数学推导可以得到\mu的条件分布仍然是正态分布,Matlab的随机数生成函数可以方便地从正态分布中抽样,从而得到\mu^{(t+1)}。同样地,对于参数\phi、\sigma_{\eta}^2和v,也按照类似的方法,从各自的条件分布中进行抽样。在某些情况下,某些参数的条件分布可能难以直接抽样,此时使用Metropolis-Hastings抽样作为补充。以杠杆SV模型中的相关系数\rho为例,如果其条件分布难以直接抽样,则按照以下步骤进行Metropolis-Hastings抽样。首先,根据一个提议分布q(\rho^{*}|\rho^{(t)})提议一个新的样本值\rho^{*},在Matlab中,可以选择以当前样本值\rho^{(t)}为中心的正态分布作为提议分布,通过调整正态分布的方差来控制提议值的变化范围。然后,计算接受新样本值\rho^{*}的概率\alpha(\rho^{(t)},\rho^{*}),接受概率的计算公式为:\alpha(\rho^{(t)},\rho^{*})=\min\left(1,\frac{P(\rho^{*},\theta_{-\rho}^{(t)},h^{(t+1)}|y)q(\rho^{(t)}|\rho^{*})}{P(\rho^{(t)},\theta_{-\rho}^{(t)},h^{(t+1)}|y)q(\rho^{*}|\rho^{(t)})}\right)在Matlab中,通过计算联合后验分布概率和提议分布的反向概率,利用上述公式计算出接受概率。最后,从均匀分布U(0,1)中抽取一个随机数u,如果u\leq\alpha(\rho^{(t)},\rho^{*}),则接受新样本值\rho^{(t+1)}=\rho^{*};否则,拒绝新样本值,保持当前样本值\rho^{(t+1)}=\rho^{(t)}。Matlab的随机数生成函数可以方便地从均匀分布中抽样,从而实现接受或拒绝新样本值的操作。通过不断迭代上述Gibbs抽样和Metropolis-Hastings抽样步骤,进行M次迭代,得到一系列的样本\{\theta^{(1)},h^{(1)}\},\{\theta^{(2)},h^{(2)}\},\cdots,\{\theta^{(M)},h^{(M)}\}。在实际应用中,通常会舍弃前N个样本,即进行“burn-in”过程,以确保马尔可夫链达到稳定状态,然后使用剩下的样本进行参数估计。可以通过检查样本的统计量是否收敛来确定“burn-in”的长度,在Matlab中,可以绘制样本的迹线图(traceplot)和自相关图(autocorrelationplot),观察样本的收敛情况。当样本的统计量(如均值、方差等)在一定范围内波动且自相关系数逐渐减小并趋近于0时,表明马尔可夫链已经收敛,此时可以停止“burn-in”过程,使用剩余的样本进行参数估计。利用Matlab软件实现MCMC抽样过程,通过合理的初始化、Gibbs抽样和Metropolis-Hastings抽样步骤,以及有效的收敛性判断,能够准确地估计厚尾和杠杆SV模型的参数,为后续对中国股市波动性的分析提供可靠的参数估计结果。4.3参数估计结果分析利用MCMC方法对基本SV模型、厚尾SV模型和杠杆SV模型进行参数估计后,得到各模型参数的估计值,具体结果如表2所示:模型参数估计值标准差95%置信区间下限95%置信区间上限基本SV模型\mu-2.35620.0431-2.4405-2.2719\phi0.90250.02130.86070.9443\sigma_{\eta}^20.12560.01540.09540.1558厚尾SV模型\mu-2.38740.0452-2.4763-2.3085\phi0.91030.02210.86650.9541\sigma_{\eta}^20.13240.01620.10060.1642v4.12560.32143.49584.7554杠杆SV模型\mu-2.36850.0440-2.4556-2.2814\phi0.90870.02190.86530.9521\sigma_{\eta}^20.12890.01580.09780.1600\rho-0.28760.0356-0.3574-0.2178从参数估计结果来看,各模型中对数波动率的长期均值\mu的估计值较为接近,基本SV模型中\mu估计值为-2.3562,厚尾SV模型为-2.3874,杠杆SV模型为-2.3685,都处于对数波动率长期均值的合理范围内,且在95%置信区间内显著不为0,说明对数波动率存在明显的长期均值水平,反映了中国股市波动性在长期内具有相对稳定的平均状态。自回归系数\phi的估计值都接近1,基本SV模型中\phi为0.9025,厚尾SV模型为0.9103,杠杆SV模型为0.9087,且在95%置信区间内显著不为0,表明中国股市的波动具有较强的持续性,当前的高波动状态往往会延续到未来一段时间,市场波动在时间上存在较强的相关性。对数波动率扰动项的方差\sigma_{\eta}^2的估计值也较为相近,基本SV模型中为0.1256,厚尾SV模型为0.1324,杠杆SV模型为0.1289,且在95%置信区间内显著不为0,说明对数波动率的波动程度在各模型中相对稳定,虽然存在一定的波动,但波动的方差在合理范围内。在厚尾SV模型中,t分布的自由度v的估计值为4.1256,且在95%置信区间内显著不为0,表明中国股市收益率分布具有明显的厚尾特征,t分布能够较好地刻画这种特征,相比于正态分布,t分布更能反映金融市场中极端事件发生的概率。在杠杆SV模型中,相关系数\rho的估计值为-0.2876,且在95%置信区间内显著不为0,说明中国股市存在明显的杠杆效应,资产收益率与波动率之间呈现显著的负相关关系,即资产价格下跌时,波动率会上升,这与实际市场情况相符,当股市下跌时,投资者的恐慌情绪往往会加剧市场的波动。通过比较不同模型参数估计结果可以发现,厚尾SV模型和杠杆SV模型在参数估计上与基本SV模型存在一定差异。厚尾SV模型通过引入t分布,更准确地刻画了收益率的厚尾特征,使得对数波动率的长期均值、自回归系数和对数波动率扰动项的方差等参数的估计值与基本SV模型略有不同。杠杆SV模型考虑了资产收益率与波动率之间的相关性,其相关系数\rho的估计值显著不为0,体现了杠杆效应,这是基本SV模型所无法捕捉到的市场特征,也导致了其他参数估计值的相应变化。这些差异表明,厚尾SV模型和杠杆SV模型在描述中国股市波动性方面具有独特的优势,能够更全面、准确地反映市场的实际情况。五、中国股市波动特征分析与模型比较5.1中国股市波动特征分析5.1.1基于厚尾SV模型的分析根据厚尾SV模型的参数估计结果,深入分析中国股市的厚尾特征对波动的影响。厚尾SV模型中,收益率扰动项\epsilon_t服从自由度为v的t分布,t分布具有厚尾特性,能够更准确地刻画金融市场中极端事件发生的概率。从参数估计值来看,t分布的自由度v估计值为4.1256。自由度v的值越小,t分布的尾部越厚,极端事件发生的概率相对越高。与正态分布相比,t分布在尾部的概率密度更大,这意味着在厚尾SV模型下,中国股市出现极端事件的可能性被更合理地估计。在实际市场中,当出现重大政策调整、国际经济形势突变等事件时,股市可能会出现大幅上涨或下跌的极端行情。厚尾SV模型能够更好地捕捉到这些极端事件的发生概率,为投资者提供更准确的风险评估。通过厚尾SV模型,可以进一步计算不同置信水平下的风险价值(VaR)。VaR是一种常用的风险度量指标,它表示在一定的置信水平下,投资组合在未来一段时间内可能遭受的最大损失。在厚尾SV模型下,由于考虑了收益率的厚尾特征,计算得到的VaR值会比基于正态分布假设的模型更能反映实际风险。在95%的置信水平下,基于厚尾SV模型计算得到的VaR值可能会大于基于基本SV模型(假设收益率服从正态分布)计算得到的VaR值,这表明厚尾SV模型能够更保守地估计风险,提醒投资者更加关注极端事件带来的风险。厚尾SV模型还可以用于分析极端事件发生的频率和持续时间。通过对历史数据的模拟和分析,可以发现中国股市中极端事件的发生并非完全随机,而是存在一定的聚集性。在某些时间段内,极端事件可能会频繁发生,且持续时间较长,这对投资者的决策和风险管理提出了更高的要求。厚尾SV模型能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论