随机理论及Zipf定律的研究及其在金融中的应用-金融数学硕士论文_第1页
随机理论及Zipf定律的研究及其在金融中的应用-金融数学硕士论文_第2页
随机理论及Zipf定律的研究及其在金融中的应用-金融数学硕士论文_第3页
随机理论及Zipf定律的研究及其在金融中的应用-金融数学硕士论文_第4页
随机理论及Zipf定律的研究及其在金融中的应用-金融数学硕士论文_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文随机理论及Zipf定律的研究及其在金融中的应用Study on Stochastic Theory and Zipfs law and Its Application in Finance作者:郭亚龙导师:王 军北京交通大学2011年5月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名: 导师签名:签字日期: 年 月 日 签字日期: 年 月 日中图分类号:O211.9UDC:学校代码:10004密级:iv北京交通大学硕士学位论文随机理论及Zipf定律的研究及其在金融中的应用Study on Stochastic Theory and Zipfs law and Its Application in Finance作者姓名:郭亚龙学 号:09122141导师姓名:王 军 职 称:教授学位类别:理 学 学位级别:硕 士学科专业:概率论与数理统计研究方向:金融数学北京交通大学2011年5月致谢本论文的工作是在我的导师王军教授的悉心指导下完成的,王军教授严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来王军老师对我的关心和指导。两年来,无论是在研究生的课程学习当中,还是在论文的选题,研究和定稿当中,王老师自始至终给了我无私的关怀和大力的帮助。两年的研究生生活之中,王老师渊博的知识,严谨的治学态度和认真负责的工作态度使我受益匪浅,并将受益终身。而跟随王老师学习以及课题研究也为我以后工作的发展打下良好的基础。在此,向王老师表示衷心的感谢。感谢我的父母对我多年的教育与培养,在我遇到各种困难时,他们总是在积极地鼓励我,支持我,给与我精神上的支持和物质上的帮助,使我能够全身心的投入到课题研究中去。在撰写论文期间,潘活泼、余峣等同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。感谢我同门的师兄师姐和师弟师妹,和他们共同学习的过程中,收获颇多。另外也感谢我的朋友们,他们的理解和支持使我能够在学校专心完成我的学业。感谢各位学者,专家在百忙之中审阅我的文章,并给出批评意见。中文摘要摘要:本文研究了语言统计学中的Zipf定律,阐述了与之相关的基本理论及相关知识。在此及基础上,结合随机理论和金融学的有关知识,构造了新的证券价格波动模型和-Zipf模型。在新的证券价格波动模型中,我们引入了三个参数:Zipf指数,时间尺度,预期收益率。针对不同参数,我们给出了价格上涨,价格下跌,价格稳定的绝对频率和相对频率,并进一步分析了中国证券投资者的心理行为特征。通过MATLAB以及SPSS编程,我们对上证综合指数的单日收益率序列进行了Zipf分析,通过计算Zipf指数找出大盘与个股之间,不同时间尺度之间价格波动的差异,并通过KS检验对其进行了正态性分析。在-Zipf模型中,我们引入了两个新的参数:字母子序列长度,字母序列所含不同字母个数。我们讨论了当取2和3时,不同下的中国证券指数和国际主要证券指数价格波动情况。通过计算每个股指的Zipf指数,我们发现了中国证券市场与国际主要证券市场的价格波动差异。此外,我们还对上证综合指数的单日及5日的各种不同收益序列进行了R/S分析,借此分析了上证综合指数的长期记忆性问题。我们发现,不管是单日还是5日收益,上证综合指数均存在着长期记忆性。另外,通过计算上证综合指数及其50支权重股的分形Zipf指数和Hurst指数,我们找出了中国证券市场两者之间的数学关系,从而将一个非时间序列与时间序列联系起来,有其一定的参考意义。关键词: Zipf指数;收益率;相对频率;绝对频率;H指数;-Zipf分类号:0211.9ABSTRACTABSTRACT:In this paper,we study the Zipf law in language statistics,and introduce the basic and relative knowledge on Zipf law.On the basic of Zipf law,we construct a new price fluctuation of stock model and -Zipf model,which applies the theories about stochastic process and finance.In the new price fluctuation of stock model,we give three parameters:the Zipf exponent,the time scale,the expected rate of return. For different time scales and expected rates of return,we estimate the relative frequencies and absolute frequencies of prcies up,prices down and prcies stable.Moreover,we also analyze the psychological behavior of Chinese investors.We apply the computer simulate the daily return series of Shanghai Composite Index by Zipf analysis.By estimating the Zipf exponent,we find the ties and differences between broader market and individual stocks.In -Zipf model,we give two new parameters:the length of sub-sequence of alphabet sequence,the number of different alphabets of alphabet sequence.We discuss the price fluctuation of Chinese main stock index and the international main stock index when and ,and study the difference between them by estimating the Zipf exponent.In addition,we study the different return series of Shanghai Shanghai Composite Index by R/S analysis,and study the long-term memory of price fluctuation based on this.We find that the Shanghai Shanghai Composite Index exsit the long-term memory whatever daily return or 5-day return.Moreove,we find the mathematical relationship between Zipf exponent and H exponent by analyzing the Shanghai Shanghai Composite Index and its fifty heavyweight stocks,so that we can link the non-time series with the time series.KEYWORDS:Zipf exponent;return;relative frequency;absolutef requency;H exponent;-ZipfCLASSNO.:0211.9目录中文摘要iiiABSTRACTiv1 绪论71.1 引言71.2 选题背景81.2.1 金融数学的发展81.2.2 股票指数介绍91.2.3 幂律与肥尾101.3 随机过程与时间序列111.4 收益和风险121.4.1 收益率131.4.2 收益率过程141.4.3 风险的度量142 利用Zipf理论构造股市波动过程及理论分析162.1 Zipf定律162.2 模型构造182.3 模型的实证研究202.4 非随机预期收益率下的Zipf分布232.5证券收益率的Zipf实证研究242.5.1 KolmogorovSmirnov检验242.5.2一日收益率的Zipf分析252.5.3 不同时间尺度的收益率的Zipf分析273 基于(m,k)-Zipf分析的证券市场统计特征293.1 -Zipf模型的构造293.2 -Zipf的实证研究294 中国股市分形结构研究344.1 分形理论344.1.1 分形布朗运动344.1.2 时间序列的长期记忆性344.2 RS分析方法354.2.1 经典RS分析方法354.2.2 修正R/S分析方法374.3 证券市场的R/S分析384.4 分形的Zipf指数与赫斯特指数间的关系405 结论42参考文献43作者简历46独创性声明471 绪论1.1 引言在经济不断发展的今天,随着经济及科学技术的迅猛发展,在全球经济一体化不断加速以及市场经济的不断完善的今天,数学被越来越多的应用的经济金融领域。尤其是在我国加入WTO后,金融市场得到了迅猛发展,数学思想在证券、期货、基金、保险等领域得到了广泛的应用,并形成了金融数学这一门学科。金融数学又称数理金融学、数学金融学、分析金融学,是指采用高等数学的方法研究金融资产及其衍生资产定价、复杂投资技术与公司金融政策的一门交叉学科。要求我们利用数学工具研究金融,进行数学建模、理论分析、数值计算等定量分析,以求找到金融内在规律并用以指导实践。金融数学也可以理解为现代数学与计算技术在金融领域的应用,是目前十分活跃的前沿学科之一。由于金融市场的不确定性,金融市场上的价格波动现象可归结为随机数学的问题,如我们常常假设证券市场中证券价格的波动服从某一个随机过程,像几何布朗运动,然后进行随机分析。在对金融市场的统计特性进行分析时,我们采用的最多是利用时间序列来对金融市场的大量数据进行数学建模和分析,而在本文中,我们将引入一种新的分析方法Zipf(齐普夫)分析。近些年来,尤其是20世纪90年代以后,源于语言统计学的Zipf定律被广泛的应用到金融市场中来,以H.E. Stanley、N.Vandewalle、M.Ausloos为首的学者在这方面做了大量工作,见文献1-6。通过Zipf分析,我们将时间序列转换成离散的非时间序列。本文为了研究国内证券市场与西方发达国家证券市场在价格波动方面的异同,我们以证券市场每天的收盘价为研究对象,应用Zipf定律与随机函数及分形理论的结合,构造不同的价格波动模型,着重对Zipf指数进行分析。根据1991年4月至2010年月各股指的大盘收盘价,应用MATLAB(文献78)及SPSS(文献9)对构造的随机模型进行分析。1.2 选题背景1.2.1 金融数学的发展金融数学是一门方兴未艾的交叉学科,是通过数学的理论以及方法来研究金融市场运行规律的一门新兴学科。金融数学也可以看做是现代数学方法与计算机技术在金融领域中的应用,其研究的主要问题包括资资产定价问题、证券投资组合问题、证券市场价格波动及预测问题等等。金融数学的历史可以追溯到20世纪初, 法国学者Louis Bachelier在他的博士论文投机理论中详细讨论了数学在金融中的应用问题, 这也宣告了金融数学作为一门学科的诞生。这篇论文把股票价格的变动描述为布朗运动, 这也是第一次给布朗运动以严格的数学描述, 这一理论为金融数学的发展以及现代期权理论的建立奠定了基础。到了20世纪50年代,与数学理论相结合的现代金融理论正式形成。1952年,随着Markowitz的资产组合的风险模型(文献10)推出,数理工具被第一次运用于金融研究中的定量检验和预测。Markowitz的风险模型是假设投资者的预期效用函数是包含均值和方差两个变量的函数。Markowitz也因此获得了1990年诺贝尔经济学奖。到了20世纪60年代,在Markowitz工作的基础上,Sharpe、Mossin、Lintner也分别年独立地对任一证券组合收益与某个共同参数的关系进行了研究,从而得到了资本资产定价模型(Capital Asset Pricing Model,CAPM)。其中主要运用了带参数的随机二次规划理论,并研究在一定风险水平下达到最佳收益的投资组合问题。这一时期,另一个影响深远的理论是Samuelson与Fama在1965年提出的有效市场假说(Efficient Market Hypothesis,EMH),其中包括理性投资者、随机游走和有效市场等三个方面。该假说表明了证券价格不可能通过历史价格和其他信息来预测,另外一个信息机制和功能完备的资本市场的资产价格动态规律可以用鞅来进行描述。有效市场假说对于套利定价理论、期权定价公式、资产组合理论等证券投资理论的证明有着极其重要的意义。20世纪70年代,金融理论的研究重点转移到对金融衍生产品诸如期权期货的定价问题。在1973年,Black和Scholes建立了期权定价模型,该模型利用了概率空间上的Ito过程,导出了随机微分方程,从而得到了标的资产价格过程。期权定价理论对金融市场的繁荣有着重要意义,大量的金融衍生品被创造出来进入投资市场,金融市场得到了前所未有的发展。Black也因此获得了1997年的诺贝尔经济学奖。此后,Ross又建立套利定价理论,研究了多时期证券市场的均衡定价,非对称信息下的金融市场问题。到了20世纪80年代,现代金融理论和市场得到了迅猛发展,在此期间诞生了四个重要的金融工具,即期权交易、互换交易、票据发行便利和远期利率协议,而金融工程的出现也为金融市场的繁荣注入了新的活力,成为了金融市场创新的最新潮流和主要方向。随着对金融工程理论研究的深入,金融工程已经成为了金融理论的重要组成部分,在国际金融市场中占有极其重要的位置。20世纪90年代至今,随着全球经济发展一体化和国际金融市场一体化的情况,新的金融工具被不断开发出来为金融发展服务。整个国际金融市场随着金融创新理论的不断发展以及金融工具的持续创造得到了巨大的效益和发展。金融工程也逐渐从金融学中独立出来成为一门交叉新兴学科。金融工程从广义上讲,金融工程将工程思维引入金融领域,综合地采用各种工程技术方法(主要有计算机仿真模拟、网络图解、数学建模、数值计算等)设计、开发和投入新型金融产品,创造性地解决各种金融问题。而狭义角度,是就技术层面而言,指明了金融工程的最核心部分,即风险管理的工具和技术。金融与数学的结合,是当今金融学发展的一个趋势,它对金融定量研究的深入发展有着关键性的作用。新兴的金融工程则是金融与数学结合的产物,其必将对金融的发展起到巨大的推动作用。1.2.2 股票指数介绍股票指数全称为股票价格指数,是由证券交易所或金融服务机构编制的一种旨在表明股票市场波动的指示数据。它仅仅是一种参考值。由于股票价格走势不定,投资者将面对股票价格风险。对于单一的股票价格变化,投资者可以比较容易掌握,但对于很多种股票的价格的综合变化,这是不容易做到的。为了能满足这个要求,一些金融服务机构就利用自己的业务知识和熟悉市场的优势,编制了股票价格指数,公开发布,作为股票市场价格的变动的指标。投资者可以依据股票指数来检验自己投资的结构,并用它来自我预测股票市场可能的动向。同时社会各界,例如公司领导人,各级政府领导人等等,都可以以此来,观察并预测经济发展的形势。股票价格指数是描述股票市场总的价格水平变化的指标。它是通过选取一组有代表性的股票,把它们的价格加权,通过特定的计算方法计算。股票指数的在具体选股和计算方法都是有所不同的。一般计算股票指数,要考虑三个因素:一是抽样,即在众多股票中抽取少数具有代表性的成分股;二是加权,按单价或总值加权,或不加权平均;三是计算程序,计算算术平均数、集合平均数,或兼顾价格与总值。中国股票市场中,上海证券交易所综合指数(上证综指)和深圳证券交易所成份股价指数(简称深证成指),是中国证券市场中两个最重要的股票指数。它们能比较全面的反映中国上海和深圳的股票市场情况。对于了解这中国证券市场的情况,是一个很好的参考。上证综指是指上海证券交易所从1991年7月15日起编制并公布的、以全部上市股票为样本、以股票发行量为权数,按加权平均法计算的股价指数。它以1990年12月19日为基期,基期指数定位100点。指数计算:以样本股的发行股本数为权数进行加权计算,计算公式为:报告期指数=报告期成份股的总市值/基期*基期指数;其中总市值=所有股票个数*(相应市价*发行股数)。深证成指是深圳证券交易所的主要股票。它是按一定标准选出40家有代表性的上市公司作为成份股,用成份股的流通数作为权数,采用综合法进行编制而成的股价指标。从1995年5月1日起开始计算,基数为1000点。其基本公式为:股价指数=现实成份股总市值/基期成份股总市值*1000。在本文中,将对中国股票指数和国际主要股票指数进行对比研究,并对上证综指进行多方面的分析和研究,通过其统计现象,进一步了解证券市场价格波动的统计规律。1.2.3 幂律与肥尾近年来,学者们对金融市场的价格波动做了大量的研究工作。高频金融时间序列的一些统计特征被揭露,比如收益分布的肥尾现象,对数收益率的幂律分布。见参考文献11-16。金融市场是一个包含大量相互作用单元的复杂系统,并且受到各种外部因素的影响,各个组成单元的的性质和相互作用的规律相当复杂,而各种外部因素(如与资产有关的信息)在很大程度上也都是不可预测的,这些原因都导致了金融市场的随机性和复杂性。因此,人们很早就开始尝试用概率和统计的方法来研究这一类系统。其中关于金融资产收益率分布的研究在理论和应用两方面都具有重要意义。20世纪50年代后,随着计算机技术的发展,对于金融资产收益率的研究有了迅速的发展。一些经济学家假设:金融资产对数价格变化而非价格的绝对变化是独立分布的随机变量。幂律(power law)的最显著特征就是,等级越高则越不均衡。其数学原理很简单幂律描述的是这样一组数据,其第n个位置的秩(rank)是第1个位置的秩的1/n。对于一个纯幂律分布,第一位与第二位之间的差距要大于第二位与第三位之间的差距,以此类推。以维基百科的文章编辑为例,你可以料到排名第二的最活跃用户的编辑量只及第一名编辑量的一半,而排名第10的只做了后者的1/10。这也是所谓“80/20法则”背后的形态按照现代金融理论的观点(文献17),由于市场参与者如此众多并有理性,根据中心极限定理,收益率序列的分布函数应当渐进为正态分布。由于信息具有非滞后性,序列应当呈现不相关性或独立性。但现实中的证券市场具有肥尾的特征,分布的非正态性和序列的非独立性。分形市场理论和行为金融理论可解释这一现象。密度函数为肥尾性和非正态性有两种解释:一种认为是由于信息的成堆出现引起价格的巨大波动;另一种解释认为投资主体对信息的处理是非线性的,信息并非马上在当前的价格中反映出来,信息的累积效应使得价格大幅波动,从而导致肥尾现象的产生,因此收益率分布的非独立性部分源于信息的滞后效应和累积效应。从社会学的观点来说,人们都存在群体归宿感和基于此产生的安全感,因此面对不确定性和潜在损失,特别是经济政策的非连续性、经济周期、制度变迁等外部因素加大金融市场的不确定性时,投资者会产生集体性的行为,也即心理学中的从众心理或羊群效应,这些都会放大市场信息,导致正反馈效应。从风险管理的角度来看,肥尾意味着在小概率情况下存在着相对于正态分布而言更高的风险值。风险产生的原因在于市场的不确定性,当噪声交易者主导市场而产生噪声交易风险时,理性投资者的投资起点从长期投资转化为短期投机行为,两异质的投资主体有相同的投资起点,市场的流动性降低,市场处于不稳定和高风险中。因此,当一个市场由投机者即噪声交易者主导时,泡沫产生,投资主体处于高风险中。1.3 随机过程与时间序列参考文献1819,我们给出以下定义:定义1-1设是给定的概率空间,为一指标集,对于任意,都存在定义在上,取值于的随机变量与它相应。则称依赖于的一族随机变量为随机过程,简记为。对于任一个时间,随机过程的数学期望定义为:随机过程的方差:定义1-2对于随机序列,如果对任意的,有(1)(2)(3),对任意的则称为白噪声序列。即互不相关的离散时间序列。定义1-3设为一个时间序列,且符合,如果为白噪声序列,则称为随机游走序列。由于所以;定义1-4如果随机过程满足(1);(2)有平稳独立增量;(3)对于每一个,有,则称为Brown运动。1.4 收益和风险1.4.1 收益率在证券市场里,价格和收益率都是投资者衡量某一证券业绩的指标。但收益率比价格作用更加明显:首先,相对于一般投资者而言,金融市场更接近于一个完全竞争的市场,因为投资者的投资规模不会影响价格变化。收益率由于没有涉及到度量尺度,所以是对投资机会是一个很好的说明。其次,在理论和实践应用中,与价格相比较,收益率也有更好的统计性质和特征。收益率主要分为绝对收益率和相对收益率。绝对收益率是期末价格减去期初价格的差值。由于绝对收益率不便于相互比较,所以很少使用。相对收益率是单位化的收益率,一般包括百分比收益率和对数收益率。(文献2021)百分比收益率假设一个证券在时刻的价格为,那么从时刻到的百分比收益率为:则可以计算出从时刻到时刻共个单期总收益乘积,即百分比收益率虽然直观,容易计算。但是它却存在一些缺陷。第一,百分比收益率有时候并不满足正态分布假设。因为投资者的损失最多限于自己的资金投入,那么收益率的变化范围为。这与正态分布是不一致的。第二,即使单期收益率服从正态分布,多期收益率也不服从正态分布。因为多期收益与单期收益是乘积的关系,而正态随机变量乘积是不服从正态分布的。这在金融模型数据处理中会遇到很多问题。因此,产生了另一种收益率的度量方法。对数收益率对数收益率也称为连续复合收益率,经常被定义为其中,。由于自然对数函数的性质,当是无穷小量的时候,和是等价无穷小量。在上述公式下,同样可以计算出从时刻到时刻共个单期总收益乘积,即使用对数收益率的优势:第一,即便在有限原则之下,对数收益率的理论值也在之间。第二,多期收益计算也比较简洁,而且其算术形式下也仍为正态分布,便于数学模型应用。1.4.2 收益率过程参考文献22,我们接着给出收益率过程的定义。定义:设表示某一只股票在时刻的股票价格过程(或者股票指数),表示某一股票时刻的收益率,并对所有的,令其中令,那么定义,称为的收益率过程,也称为收益过程。若令价格函数的初始值为,我们可以推出价格过程与收益过程的关系如下:根据前式有在下面模型构造中,我们将建立收益过程,再通过上述两者的关系得到价格或指数过程。1.4.3 风险的度量 在投资过程中,风险受到投资者的关注。但如何衡量风险呢?风险是实际收益对期望收益的偏离,是收益的不确定性,那么风险就可以用概率来度量。金融风险可以进一步表述为“用概率度量的进入资产收益的不确定性”,它表现为实际收益与期望收益的偏离,实际收益与期望收益可能发生地偏离越大,相应的金融风险也越大。在这样的定义下,风险可以用金融资产收益的方差或标准差来度量,标准差越大,收益的离散程度越大,相应的风险就越大。我们先求出期望收益,用符号表示,因此,风险的度量公式可以写为,或因此,我们就得到了风险和收益的表达式,理论上已经证明,只要收益服从正态分布,使用方差可以很好的度量风险。但是在实际生活中,获得投资的收益率分布往往是不太可能的。因为投资者不可能得到所有相关的信息的。那么人们就必须能估计出一个可靠的收益分布。利用历史数据来预测收益和方差,是一个常用的办法。因为历史数据还是比较容易获得的,所以用历史数据来预测收益率和度量风险是可行的。那么计算收益率和方差的公式可写为,或其中,是历史收益率的个数,是第期的收益率。2 利用Zipf理论构造股市波动过程及理论分析2.1 Zipf定律Zipf是由美国学者G.K.齐普夫于20世纪40年代提出的词频分布定律(文献2324)。是一个在情报学和数理统计有着广泛应用的经验定律。指的是在物理和社会科学中的很多数据研究都近似于一个Zipf分布。这个定律用第一个提出该定律的美国哈佛大学学者George Kingsley Zipf命名。尽管在这之前,J.B. Estoup已经注意到这一规律。其主要的理论基础是:如果把一篇较长文章中每个词出现的频次统计起来, 按照高频词在前, 低频词在后的递减顺序排列, 并用自然数赋予这些词顺序值, 即频最高的词顺序值为1, 频次次之的词顺序值为2, . 若用表示频次, 表示顺序值, 则有(为常数,取决于文集). 在Gorge Kingsley Zipf的工作基础上, 后人又提出了修正式, 1936年美国语言学家Joose提出了双参数分布律: , 其中都是参数, 随着文集中词数的增多而变大.由, 有, 做出对的图像, 此图像呈一条斜率为的直线.设序列是随机变量的个观察值,对这个观察值从大到小进行排序, 记排序后的顺序统计量为。做出对的图像, 这就是Zipf图像。在文献23中,G.K. Zipf指出词频的Zipf指数为1,即在一篇文章中,每个单词出现的频率,从高到低满足:。对于该结论,我们有如下证明:假设某文章使用了N个不同的词,这N个词出现的频率依从大到小的顺序依次为,那么根据信息论的有关定义,可以认为,这N个词的平均信息量为:,显然,尽量使这N个词传输的平均信息量较大也是撰文著述者遵循的一个原则。由此,我们希望 (1.1.1)应较大。式(1.1.1)中为各词的平均序号。由于式(1.1.1)有约束条件,由拉格朗日乘数法可知,欲使R最大,须: (1.1.2)令,可将式(1.1.2)转化为:,即,所以: (1.1.3)从而有:,得出,将其代入(1.1.3)得到,即 (1.1.4)令,则有:成立。该式有唯一的正根,由此,(1.1.4)可以转化为: (1.1.5)由对数透视原理: (1.1.6)其中为“对数透视系数”。因此式(1.1.5)应变更为 (1.1.7)令,则2.2 模型构造为了研究原油价格的波动趋势,有关原油价格动力学的模型在文献2526中提出,并给出了预期收益的概念。在本部分论文中我们将考虑简建立一个随机环境下的证券价格波动模型,并用Zipf方法来研究该模型下不同时间尺度的概率分布,绝对概率以及相对概率。我们用来表示股票日收盘价的时间序列,然后将这一时间序列映射为一个字母序列(文献27),如下图为一定时间内某支股票的涨跌情况,我们用“u”表示上涨,用“d”表示下跌(当价格处于不变的时候,我们将其视为上涨)。则下图可以表示成字符序列uudddddududuudu。uudddddududuudu即:令为给定的时间尺度,我们可以定义在时间尺度下的股票对数收益率,定义如下: 其中,。接下来我们考虑建立一个在时间尺度下及随机环境下的对数价格变动模型。令是概率空间上的一个非负的随机变量,我们将称之为这个模型中的一个随机阈值。例如,可以是区间上的一个均匀分布,也可以等同于随机变量,其中服从正态分布等等。这样,就得到了一个源于原始的股票价格时间序列的新的时间序列,具体定义如下:其中,分别表示“价格上涨”,“价格稳定”以及“价格下降”。在这个模型中,随机阈值表示股票投资者的预期收益率。现实中,股票市场中的大量信息将会对投资者对股票市场预期产生影响,包括投资者的股票买入点,股票卖出点等等。在目前的中国证券市场,证券市场的交易规则以及管理系统正在发生着巨大的变化。比如,股价每日的涨跌受到限制,现在是每天涨跌不超过10%,股份制改革,在香港股市直接投资,设立诸如期货和期权等金融衍生产品等。另一方面,股票价格的估值,市场上的正面和负面新闻,趋势,历史数据,当前的经济形势,可预见的未来信息,政治事件和经济政策等方面也可能影响市场参与者的投资态度。这就意味着投资环境会随着时间的变化而变化。考虑到这些,我们构造了上述的股票价格模型。然后,我们将针对不同的参数和,对时间序列的波动特征(绝对频率和相对频率)进行研究。令,和分别表示价格上涨,价格稳定以及价格下跌等三种情况出现的频率,然后我们给出时间序列在这三种情况下的绝对频率,如下所示:其中,。在证券市场,股票价格出现较大幅度波动的概率往往是比较小的。考虑到这个特点,上面定义的各种情况出现的概率依赖于概率分布。接下来,我们定义时间序列的相对概率,即:在上面对相对概率的定义上,我们不考虑价格稳定是的相对概率,因此和分别衡量价格上涨和价格下降两种情况下的相对概率。接下来,我们将考虑当两个参数和取不同的值时,相对概率和绝对概率的统计特征。2.3 模型的实证研究在本节中,我们选取上证综合指数2000年1月4日至2009年11月20日的每日收盘价对3.1模型中的绝对频率和相对频率进行实证研究。我们对和取不同的值,并在MATLAB中对上述模型进行模拟,计算出对应的绝对频率和相对频率,并在图3-1和图3-2中给出了相应的曲线图。在图2-1和图2-2中,横坐标表示随机预期收益率,纵坐标表示时间序列的绝对频率(相对频率)。从图3-1(a)和图3-1(b)我们可以发现价格上涨函数和价格下降函数随着递增而递减。并且对于两个不同的时间尺度和,当时,曲线总处于曲线的上方,同样价格下降函数曲线也存在相同的特征。但是对于价格稳定函数 ,图3-1(c)显示其存在着前面两者相反的趋势特点,也就是说,会随着的递增而递增。图3-1显示,对于给定的时间尺度,绝对频率函数曲线会随着值的增加而达到一个拐点。另外,当时间尺度增加时,相应的值(即绝对频率函数拐点处的值)也会变大。除此之外,我们也可以发现,当时,相应的拐点值(横坐标)明显远大于当时的拐点值。表3-1给出了绝对频率函数曲线和相对频率函数曲线达到拐点时的具体数值。我们可以发现时,价格上涨和价格稳定在上不会出现拐点。图3-2给出了不同时间尺度和不同预期收益率下相对频率的分布曲线。从图中可以发现,当时,相对频率的散点大体集中在0.5附近;而当()变大时,相对频率的散点会迅速地从0.5附近向两端发散。再联想到中国股市的股价每日波动是有限制的,即当天股价变动在-10%到10%之间,反映到本文章中,即。通过上面的论述,由于相对频率的散点当时会集中在0.5附近,也就是说当时,相对频率的变化相对稳定,我们可以得出是一个低风险的预期收益率这样一个结论。而市场参与者如果希望获得比0.1这一收益率更大的收益,他也将面对一个较高的投资风险。(a)价格上涨的绝对频率 (b)价格下降的绝对频率(c)价格稳定的绝对频率图2-1:上证综合指数在随机预期收益率下的不同时间尺度的绝对频率分布(a)价格上涨的相对频率 (b)价格下降的相对频率图2-2:上证综合指数在随机预期收益率下的不同时间尺度的相对频率分布表2-1:绝对频率和相对频率的拐点值0.0990.0890.0990.0890.0890.2120.1630.2120.1630.1630.3500.2490.3500.2490.2490.6470.4000.6470.4000.4001.1730.5431.1730.5430.5430.7090.7090.7092.4 非随机预期收益率下的Zipf分布在本节中,我们研究当预期收益率不是随机的时股票收益的绝对频率。假设,比如。接着我们研究价格上涨和价格下降的Zipf分布。同样对于不同的时间尺度,我们计算并画出了相应的Zipf分布图。图3-3给出了绝对频率的Zipf分布图,对图中的曲线进行拟合得出了相应的Zipf指数,并在表3-2中计算出了的具体值。通过表3-2我们发现,除了当时的曲线斜率小于1外,图中的其他五个时间尺度下的Zipf曲线的斜率均大于1。由于一年的交易数据大概就是250个,所以可以看做是年收益率,这就是说当投资期限是一年或者长于一年,证券价格上涨预期的波动会低于短期投资,即。由于这种现象的存在,我们定义短期投资期限,即和长期投资期限,即或者。我们也注意到,在短期投资期限内,随着时间尺度的增加,投资风险也会增大,因为随着的增加,标准差也在逐渐增加。 (a)价格上涨的Zipf分布(b)价格下降的Zipf分布图2-3:上证综合指数绝收益率对频率的Zipf分布表2-2:绝对频率Zipf分布的统计特征1.86552.22292.01371.46091.21020.62850.03010.04900.07550.10300.12370.09471.57641.98181.85631.39741.04620.58890.02680.04240.06080.08310.09800.13082.5证券收益率的Zipf实证研究2.5.1 KolmogorovSmirnov检验单样本KS检验是用于比较某个变量观测值的累积分布函数与指定的理论分布间是否存在差异(文献2829)。指定的理论分布包括正态分布、均匀分布、Poisson分布及指数分布,是非参数检验的单样本检验方法。KS检验的检验方法是以样本数据的累积频数分布与特定理论分布比较,若两者的差距很小,则推定该样本取自某特定分布族。下图是一幅100个随机数的正态累计频数分布及理论正态分布函数图。KS检验是通过考察图中两条曲线间的最大距离和最小距离来检验观测值的累积分布函数是否服从正态分布。图2-4 样本数据的累积分布和正态分布图:某变量的观测值服从指定的理论分布;:某变量的观测值不服从指定的理论分布;表示理论分布的分布函数,表示一组随机样本的累积频率函数。KS检验的统计量定义如下:结论:当实际观测值(表示样本容量为,显著性水平为时,的拒绝临界值),则拒绝,反之则接受假设。2.5.2一日收益率的Zipf分析为了研究我国证券市场中单一个股的价格波动同大盘价格波动的关系。我们运用Zipf定律对上证综合指数(SSE)及在上海证券交易所上市的五只权重股即浦发银行(PFYH)、宝钢股份(BGGF)、华能国际(HNGJ)、中国石化(SINOPEC)和方正科技(FZKJ)进行分析。选取它们从2005年1月4日到2009年11月20日间的每日收盘价作为研究数据,运用MATLAB及SPSS得出Zipf曲线、Zipf指数及相关统计量。从而验证证券市场的长尾现象,并通过KS统计量考察证券收益同正态分布的相关性。图2-5:上证综指及五支权重股单日收益率的Zipf分布图图2-5给出了上证综指和五支权重股单日收益率的Zipf分布图。从图中可以看出上证综指及五支权重股收益率分布的走势大致一致,但上证综指的走势相对五支权重股要平缓一些,而五支权重股的走势基本重合;说明在中国证券市场,权重股在大盘的涨跌中扮演了重要角色,大盘的涨跌与权重股的涨跌基本一致。同时,六者的第10位到第100位间的收益率分布曲线大致和斜率为-1的直线平行。另外,大的收益率对应的数据点较少,而在所有曲线的尾部集中了大部分的数据点,从而验证了证券市场普遍存在的“长尾”现象。表2-3:上证综指及五支权重股的Zipf指数及有关统计量上证综指浦发银行中国石化华能国际宝钢股份方正科技样本量118511301147114211461170期望0.01480.02420.02190.02150.02050.0246标准差0.01420.02280.02070.01980.02070.02321.00341.00391.00371.00391.00371.0037KS检验量5.1045.0274.9164.6905.4344.931绝对距离0.1480.1500.1380.1220.1610.144P值000000表2-3给出了经过多项式拟合的上证综指及五支权重股的Zipf指数的值,以及KS检验的结果。我们可以发现,各支股票的值基本接近或者相同,上证指数的值最小,为1.0034。这一结果与图2-5各股票的走势是一致的。上证指数的值最小使我们可以猜想在数据足够多的情况下,大盘的波动比个股的波动要略小一些,但是从大盘的波动也基本可以看出个股的波动情况。值得注意的是,Zipf指数所体现的波动情况并不代表每一股票或者指数的整体波动情况,比如浦发银行和华能国际的Zipf指数均为1.0039,但是两者的标准差并不一样。这是因为我们所求的Zipf指数并不是对于整个样本而言,而是对于集中了大部分的样本点的区间的;而标准差则是对整个样本而言的。另外,从表中的KS检验的相关统计量可以看出,上证综指及五支权重股的收益率分布大致是服从正态分布的。这也进一步的解释了证券市场的“长尾”现象:在证券市场中,除尾部外,证券的收益分布是大致服从正态分布的。2.5.3 不同时间尺度的收益率的Zipf分析在2.1的定义中,在证券市场,不同时间尺度对应的对数收益率被定义为:。通过选取上证综合指数从2000年1月4日至2009年11月20日的每天股市收盘价,我们上证综指收益率在不同时间尺度下的Zipf分布。并且在图2-6中给出了时的对应Zipf分布曲线。通过曲线拟合,我们在表2-4中得出了对应的Zipf指数。实证表明,当时间尺度取短期投资期限即时,Zipf指数基本接近于1。而当时间尺度取长期投资期限即时,Zipf指数()相对于短期投资期限来说要远大于1。这种情况说明,在上证综指里,长期投资期限收益率的Zipf分布在某种程度上与短期投资期限收益率的Zipf分布相背离。表2-4:不同时间尺度的上证综指收益率的Zipf指数1.08220.95450.89900.92411.02841.18830.01250.02620.05290.11310.21910.5076事实上,图2-6和表2-4中所反映出来的特性是符合当下中国证券市场的特点的。中国证券市场相对于西方发达国家的证券市场来说,是一个正在发展当中的且历史较短的金融市场。在20年地改革以及开放资本市场后,现在金融市场在中国的国民经济中扮演着非常重要的角色。中国的风险投资市场吸引着全世界的投资者,特别的是中国的股市有着极其庞大的散户投资者,他们往往对他们能否在短时间内获得较高收益极其关注,但对长期投资却关注甚少。在中国,由于投资资金全球范围内的流转以及大的股价波动伴随着大的成交量。我们常常能看到股市大涨或者大跌的情况。投资者的这种“羊群行为”在中国证券市场更为明显。这些现象也就支持了我们上述实证研究所得出的结论:时的收益率Zipf分布在某种程度上不同时的收益率Zipf分布相似。图2-6:上证综合指数不同时间尺度下的收益率的Zipf分布3 基于(m,k)-Zipf分析的证券市场统计特征3.1 -Zipf模型的构造定义:设是一个时间序列,按照3.1的原则将序列映射成为含有个字母的相应的字母序列。将序列等分成长度为的N个子序列,其中。然后再对序列进行Zipf分析。这样的Zipf分析我们称之为-Zipf分析。从上面的定义中我们可以发现,(m,k)-Zipf是一种基于分形思想的Zipf分析方法,见参考文献303132。根据上述定义,我们可以构造出一个证券收盘价的-Zipf分析模型。假设,即将证券收盘价时间序列映射成字母序列后只出现两个字母,我们用“u”和“d”来表示,如果数据足够多,那么映射后的字母序列存在个不同的子序列。对于子序列,我们定义它的相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论