分位数回归理论及其应用.pdf_第1页
分位数回归理论及其应用.pdf_第2页
分位数回归理论及其应用.pdf_第3页
分位数回归理论及其应用.pdf_第4页
分位数回归理论及其应用.pdf_第5页
已阅读5页,还剩104页未读 继续免费阅读

分位数回归理论及其应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

天津大学 博士学位论文 分位数回归理论及其应用 姓名 关静 申请学位级别 博士 专业 管理科学与工程 指导教师 史道济 20080501 中文摘要 分位数回归是给定回归变量五估计响应变量y 条件分位数的一个基本方法 它不仅可以度量回归变量在分布中心的影响 而且还可以度量在分布上尾和下尾 的影响 因此较之经典的最小二乘回归具有独特的优势 本文主要对分位数回归 的理论 C o p u l a 分位数回归 极端分位数以及分位数回归在各个领域的应用进 行了深入研究 论文的主要工作如下 1 论文介绍了极值的基本理论 为以后的各章提供了理论基础 并选取 l o g i s t i c 分布 应用二元超阈值模型和二元点过程模型度量沪深股市收益率的尾 部相关性 结果表明 沪深股市收益率在尾部具有很强的相关性 并且这两种模 型都不失为一种很好的建模方法 2 论文构建线性条件分位数回归模型 分析澳大利亚西部F 玎e m a n t l e 港地区 在1 8 9 7 1 9 8 9 年间年最高海平面高度与时间及年平均南方涛动指数之间的线性变 化趋势 并与经典的最小二乘回归拟合进行比较 结果表明 在不同分位数下年 最高海平面高度与时间及南方涛动指数之间所呈现的线性趋势是不同的 分位数 回归比经典的最小二乘回归能够提供更多的信息 因此对于我们进行预测和防范 具有十分重要的意义 3 论文研究了C o p u l a 分位数回归 推导出几种常见C o p u l a 的分位数曲线 并应用模拟研究的方法说明分位数回归估计方法的精确性 在此基础之上 选取 C l a y t o nC o p u l a 应用C 0 p u l a 非线性分位数回归模型度量沪深股市收益率在不同 分位数下的风险相关性 并与由极值理论方法得到的结果进行比较 结果表明 在不同分位数下沪深股市具有不同的相关关系 比普通的回归方法能更全面的描 述不同区域的风险相关关系 而极值理论方法侧重于极端情况下尾部指标的估 计 4 论文通过研究极端分位数的估计方法及渐近性质 把极端分位数所具有 的行为特征应用到V I R 的研究中 建立上海股市收益率的条件分位数模型 描 述其在极端分位数下的变化趋势 并选取适当的尾部模型 在此基础之上应用外 推法预测非常极端分位数下的条件 服 并与直接由分位数回归模型预测的结果 进行比较 结果表明 两种方法得到的结果变化趋势都是一致的 由外推法预测 的结果相对小一些 关键词 分位数回归极值理论相关结构函数尾部相关性极端分位数风险 度量 A B S T R A C T 沁锄t i l er e g r e s s i o n i sab a s i ct o o lf 0 r e s t i m a t i I 毽c o n d i t i o n a lq u a n t i l e so fa r e 8 p o n s eV 撕a b l eyg i V e naV e c t o ro fr e g r e s s o r sZ I tc a nb eu s e dt om e a s u r en l ee 虢c t o fr e 伊e s s o r sn o to I l l yi nm ec e n t e ro f ad i s t r i 鼬i o 玛b u ta l s oi nt h eu p p e ra n dl o w e r t a i l S oi th a sm u c hm o r ea d V 锄t a g e s 也a n 也ec l a s s i c a ll e a s ts q l l a r er e g r e s s i o n T h e t l l 巧o fq 删1 er e g r e s s i o 玛C o l aq u a n t i l er e g r e s s i o 玛c 仃e I n a lq u a 蚯l e s 锄d 印p l i c a t i o 璐o fq u a m i l er e g r e s s i o ni nn l l n yf i e l d Sa r ed i s c u s s e di I l 廿l i sp a p 既T h e n l a i na c M e v e m e n t so f l i sw o f ka r el i s t e da sf o l l o w s 1 n l eb a s i ce x 缸e m eV a l u em e o 巧i si n l d u c e d w 1 1 i c hi s 也eb a s i so f0 廿1 e r c h 印衄 s W bc h 0 0 s el o g i s t i cd i s 臼曲u 如na n du 8 eb i v 撕a t ee x c e s st l l r e s h o l dm o d e l 趾db i v a r i a t ep o mp r o c e s sm o d e lt 0m e a s u r et l l e 僦d 印e r l d e n c eo fS h a n 班1 a i 柚d S h e n 出e I lS t o c km a r k e t n l er e 8 u n ss h o wm a t 也e 咖r a t e so fS h a n 曲a ia n d S h e m 出e nS t o c km a r k e t sk l v es 仃o n gt a i ld 印e n d e n c ea I l d 也et w om o d e l sa r ee x c e l l e n t f o ra p p l i c a t i o n 2 硼1 e1 i I l e a r 仃e n do ft h ea n 玎u a lm a x i m u ms e al e v c la tF r e m a n t l eP 嘣 W e s t e r n A u s 僦i a r e l a t e dw i mt i I n e 觚dS o u 廿1 e mO s c i a t i o n 砌e xd 证n g18 9 7 19 8 9i s a n a l y z e db yl i n e a rc o n m t i o n a lq 啪t i l er e g r e s s i o n 皿1 0 d e l A n d 蚀 er e s u l ti sc o m p a r e d w i t l l m to ft h ec l a s s i c a ll e a s ts q u a r er e g r e s s i o n T h er e l 湖t ss h o wt l l a t 硼 d c rd i 侬黔m q u a n t i l e s 也el i n e a r 慨do fm e 锄m l a lm a i n m ms e al e v e lr e l a t e dw 砒lt i I n ea n d S o u 廿1 锄O s c i l l 撕o nI m e xi sd i 妇陪f e m 锄dq u a m i l er e g r e s s i o nc a np r o i d em u c h m o r ei n f o n l 豫t i o n l a nt 1 1 ec l a s s i c a ll e a s t 双l u a r e r e g r e s s i o n S o i so f 目 e a t s i g n i f i c a r l c ef o rp r e d i c t i o na I l dp r e V 咖i o n 3 T h e 也e 0 巧o fC o p u l aq 啪t i l er e g r e s s i o ni ss t I J d i e d 锄dt 1 1 eq u a 矾1 ec u n e so f s e v e m lc o m m o nC o p u l a sa r eo b t a h l e d T h ea c c u r a c yo fq u a I I t i l er e 母 e s s i o ne s t i 玎1 a t i o n i sS h o w nb ys i I I l u l a t i o nr c s e a r c h W ec h o o s ec l a y t o nC o p u l a 锄du s eC o p u l an o n l i I l e a r c o n d i t i o I l a lq u a m i l er e g r e s s i o nm o d e lt 0m e a s u r et h et a i la r e ad s kd 印e n d e l l c ei I l S h 锄曲a i 锄dS h e n z h e I ls t o c km a r k e t s 气n dt 1 1 e nt l l er e s u ho fn l i sa p p r o a c hi s c o m p a r e dw i mt h et a i ld 印e 1 1 d e l l c em e a 鲫r eb ye x 愉n ev a l u em e t h o d T h er e s u n s s h o wm a tS h a I l 曲a ia n dS h e I l 疝e ns t o c km a r k e t sh a v ed i 鼬r i s kd 印e n d e n c eu n d e r d i a e r c n tq u 枷l e sa n de X 仃e m eV a l u et h e o 巧m e t h o do I 蚵f o c u s e so nn l ees t i m a t i o no f t a i ld 印e n d a l c e 4 B y 咖d y i I 培t 1 1 ee S t i m 撕0 nm e 1 0 d 锄d 蛔 n p 跏cb e h a 访o r 8o fe x 仃c 柚a 1 q u 觚t i l e s w ea p p l yi t sb e h a V i 邮t 0 血er e s e a r c ho fV 撼T h ec o n d i t i o m l 畔嘣l e r c g r e s s i o nm o d e lo fr e t u l mr a t e so fS h a n g h a i s t o c km r k e ti se 鼬1 i s h e d w l l i c h d e s c r i b e st h e 臼e n do fr a t e su n d e re x 仃e r n a lq 啪t i l e s C o n d i t i o n a l a Ri nv a ye x 胁e q 啪t i l e si sp r e d i c a t e db yu s i n ge X 仃a p o l a t i o nm e m o d su n d e r 山ep r o p e rt a i lm o d e l C o m p a r i s o nw i mt h ep r e d i c t i o no f 也eo r d i n a D rq u 枷l er e 黟e s s i o nm o d e li sa l s 0 g i v e n T h er e 团n t ss h o wt h a t 也et e n d e n c i e so ft l l e 铆op r e d i c d o n sa r es i I I l i l a ra n dt h e v a l u ee s t i l l l 砷e db y 也ee x 订a p o l a t i o nm e t l l o d si sr e l a 吐V e l ys m a U K E Y W o I m S q 砌咀t i l er e g r e s s i 吗e X 仃锄eV a l u e 也e o C 叩u l a 伽d e p e n d e n c e e 炳伽1 a lq 啪t i l e s V a R 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果 除了文中特别加以标注和致谢之处外 论文中不包含其他人已经发表 或撰写过的研究成果 也不包含为获得丕鲞盘堂或其他教育机构的学位或证 书而使用过的材料 与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意 躲羔够 期 加嗡年 m 学位论文版权使用授权书 本学位论文作者完全了解苤盗盘堂有关保留 使用学位论文的规定 特授权墨鲞基堂可以将学位论文的全部或部分内容编入有关数据库进行检 索 并采用影印 缩印或扫描等复制手段保存 汇编以供查阅和借阅 同意学校 向幽家有关部门或机构送交论文的复印件和磁盘 保密的学位论文在解密后适用本授权说明 日 导师签名 叟勘 产 f 签字同期 枷口分年6 月y 日 天津大学博士学位论文 1 1 论文研究背景 第一章绪论 1 1 1 分位数回归理论的演进 1 8 7 0 年 英国的高尔顿在研究人类身高的遗传规律时发现 父母是高个子的 其子女的身高有低于父母身高的趋势 相反 父母是矮个子的 其子女的身高却往 往有高于父母身高的趋势 从全局来看 高 矮个子人的子女都有 回归 于一 般人身高的趋势 这就是统计学上 回归 的最初涵义 1 8 8 6 年 高尔顿正式提 出了 回归 的概念 经过他的学生皮尔逊多年的进一步发展 这个出于生物统 计学领域的概念 便被推广为一般统计方法的重要概念 回归分析具有悠久的历史 其中以经典的最小二乘回归应用最为广泛 原因 是最小二乘回归的解释与人们的直观想象一致 并且该方法易于计算 特别当假 设误差是正态分布时 它具有无偏性 有效性等优良性质 但是在实际问题中 应 用最小二乘回归需要满足较严格的条件 如等方差性 随机误差间两两不相关等 条件 当需要对回归系数的显著性进行推断时 通常还要假定随机误差的正态性 等 当数据分布是重尾或有异常值时 结果的稳健性较差 特别是对于大量的数 据 应用最小二乘回归法只能得到一条回归曲线 而一条曲线所能提供的信息毕 竟是有限的 因此 人们在使用经典的回归分析同时 也在不断地探索更新更好 的方法 1 9 7 8 年 K o 即k e r 和B a s s e 仕 1 首次提出了分位数回归的概念 他们是在1 8 1 8 年L a p l a c e 2 提出的中位数回归 最小绝对偏差估计 理论的基础上 把中位数回 归推广到了一般的分位数回归 分位数回归相对于最小二乘回归应用的条件更为 宽松 挖掘的信息更丰富 它不仅可以度量回归变量在分布中心的影响 而且还 可以度量回归变量在分布上尾和下尾的影响 即捕捉整个条件分布的特征 特别 当误差为非正态分布时 分位数回归估计量比最小二乘估计量更有效 因此它弥 补了最小二乘回归的不足 分位数回归理论在近二 三十年的发展过程中 K o e I l l e r B a s s 甜 P o w e l l c h e m o z h u k o v 等都作出了非常重大的贡献 1 9 7 8 年 K D e n k e r 和B 勰s 鲋 3 提出分 位数回归概念 把响应变量看作是其它变量的线性函数 推导出分位数回归系数 的渐近分布 从而发展了线性分位数回归理论 1 9 8 2 年 他们又研究了分位数 第一章绪论 回归的线性假设检验以及异方差的稳健性检验 为分位数回归的应用提供了保证 刚 5 1 9 8 6 年 B a S s e n 等 6 研究了回归分位数的强相合性等性质 随着线性分位 数回归的发展 同年P o w e l l 7 基于删失模型提出了非线性分位数回归 鼬m 和 W h i t e 8 研究了非线性分位数回归估计量的一致性等性质 l9 8 7 年 K o e n k e r 等 9 提出了线性模型的L 估计法 并且 同年K o e l l l e r 等 l0 提出了关于分位数回归的 有效算法 B u c b l l 1 2 1 3 在1 9 9 5 年和1 9 9 8 年分别讨论了分位数回归模型渐 近协方差矩阵的估计方法 以及分位数回归最新的一些发展 并应用它分析了美 国女性薪水结构的变化情况 2 0 0 0 年 K o e n l e r 和z h i i i eX i a 0 1 4 懈决分位数回归 过程中存在的特定推断问题 同年飚m 和M u l l e r 1 5 关于两步分位数回归的渐近特 性进行了研究 2 0 0 1 年 T 勰c h e 1 6 J 研究了分位数回归的无偏性 2 0 0 2 年 K 0 e n k 饼 等 1 7 又讨论了线性异方差模型的L 估计法 在此基础之上 C h e m o z h u k o v 和H a nH o n g 1 8 提出了研究删失分位数回归的 三步评估方法 吴建南和B r e t s c l l I l e i d e r 等 1 9 用蒙特卡罗 M o m eC a l l o 方法产生 1 0 0 个随机数据集合来比较显著加权分析方法与分位数回归的优劣 K 0 t t a s 和 l o 和 瓯 使得 h m P 鱼吐 工 日 x 工 R 2 2 成立 其中日0 是非退化的分布函数 那么日必属于下列三种类型之一 I 型分布 日l 力 唧 一 啊 z U m 型分布 妒口 功 三三爱删 其中I 型分布称为G 硼曲e 1 分布 I I 型分布称为F r 6 c h e t 分布 I I I 型分布称为W e i b l l l l 分布 这三种分布统称为极值分布 e x 骶m ev a l u ed i s t r i b u t i o n 当口 1 时 致协1 皿 础 分别称为标准F r 6 c h e t 分布和标准W e i b u l l 分布 在实际应用中 我们通常选择其中某一种分布 然后对其参数进行估计 但 是这就存在一个问题 对于现有的数据哪一个分布更适合 为了解决这个问题 对以上三种类型的极值分布进行改进 得到一个统一的分布 即 1 日 葛 口 孝 e x p 1 善型 了 l 占竺兰 o 2 3 盯仃 其中 善 R 盯 o 称作位置参数 1 0 c a t i o n p a 阳me t I 神 仃称作尺度参数 s c a l e p a r a 加e t e r 孝称作形状参数 s h a p ep 踟e t 神 日称作广义极值分布 g e I l 洲i z e d e X 臼 伽n eV a l u ed i s 劬而 吣 简记为G E V 分布 形状参数的取值决定了极值分布的类型 1 当善 o 时 日 仃 善 表示极值I 型分布 位置参数和尺度参数不变 2 当孝 o 时 取口 1 善 日心声 仃 善 表示极值n 型分布 位置参数为丘一阳 尺度参数为阳 3 当毒 o 和溉 使得 F 口 x 屯 F 工 2 4 则称分布函数F x 是最大值稳定的 m a X s t a b l e 由此可证明三种极值分布都是最大值稳定分布 并且由定理2 1 和定义2 1 可以进一步得到结论 一个分布函数 工 是最大值稳定分布 当且仅当F x 是三 种极值分布类型之一 2 1 2 极值分布分位数与重现水平 定义2 2 称分布函数F x 的反函数 F 1 p i 1 1 f 工 R F x p 0 p l 2 5 第二章极值统计理论 为它的分位数函数 而毛 F 一 p 称为分布函数F 的p 分位数 由定义2 1 可知 广义极值分布的p o p o 和溉 则最大值的极限分布一定是极值分布 定义2 3 设五 咒是独立同分布的随机变量序列 分布函数为F 工 对于 由 2 1 式定义的五 如果存在常数列概 O 和蛾 使得 y 一 l i m P r C 尘L 兰 x l i m P 吒x 玩 日 功 4 口n 一 成立 则称随机变量x 或x 的分布函数F 属于极值分布日 力的最大值吸引场 m a i n l 啪d o m a i l l o f a t 仃a c t i o n 记作x 四H 日 或F 坦功 奶 在研究极值分布的最大值吸引场问题时 V 0 nM i s e s 函数起了重要作用 定义2 4 设F 是分布函数 上端点 o o 若存在某个z 使得F 可以表 示成如下形式 一 1 户 功 c e X p 1 4 三j 疵 z x o 2 1 0 则称x 服从广义P a r e t o 分布 简记为G P D 或G P 分布 其中 R 为位置参数 仃 o 为尺度参数 f E 尺为形状参数 类似于广义极值分布 形状参数有时用口来表示 令口 l 善 得到广义P a r e t 0 分布的另一种表达形式 f 兰 G l 似 砷 1 一P 9 工 o 工 o I o x 0 x p G G 2 G 3 分别称为P a r e t oI 型 型和 型分布 当 础 口 1 时 称为标 准G P D 相应的分布简记为G 0 孝 或G l 功 G 口 和G 3 似口 图2 1 给出了当 口 o 5 口 1 和口 2 时 标准P 锄加I 型 I I 型和I I I 型分布的密度函数曲线 图2 l 标准G P D 密度函数图 下面我们讨论广义P a r e t o 分布的一个重要性质 P O T p e a ko v e rn l I e s h o l d 稳定性 即某一分布 对于给定阈值的超出量经过规范化后的渐近分布仍然是它 本身 下面给出严格的定义及性质 定义2 6 对于给定的分布函数 力 如果存在常数气 包 使得对任何实数 x 都有 E 吼x 吃 以力 其中层 z P x 一 x 陋 是 2 8 式所定义的超出量分布函数 则称分布函数 功具有P O T 稳定性 p o t 鼬i l i 够 或称分布函数F 工 是P O T 稳定分布 性质2 1 广义P a r e t 0 分布是P O T 稳定分布 常数气 吃可取为 气 1 孝兰兰吃 一 1 孝兰坐 天津大学博士学位论文 定义2 7 设随机变量彳的分布函数F z 为尸 x 支撑的上端点 石超过阂 值 的超出量分布为E x 如果存在广义P a r e t o 分布G 工 使得 E 功 G 劝 则称石 或分布函数以工 属于广义P a r e t o 分布G 工 的P O T 吸引场 一 广义极值分布和广义P a r e t o 分布之间存在着非常密切的关系 性质2 2 广义极值分布属于广义P a r e t o 分布的P O T 吸引场 性质2 3 广义P a r e t o 分布属于广义极值分布的最大值吸引场 2 2 多元极值理论 对于某些比较简单的问题 应用一元极值理论进行分析就足够了 然而实际 中许多问题依赖于多个因素的影响 这就迫切需要多元极值理论的发展 多元极 值理论目前已成为极值理论中较新且发展迅速的领域 并且形成了区组最大值模 型 超阈值模型以及点过程模型等 多元极值分布广泛地应用于气象 水文 环 境 工程 金融等领域 为了简便 我们只讨论二元极值模型 在研究二元极值 分布时 若变量之间是相互独立的 则可以直接把二元极值问题转化为一元极值 问题 若变量之间存在着某种相关性 则我们引入相关结构函数C 0 p u l a 来描述 它们之间的相关关系 2 2 1 相关结构函数及其性质 C o p u l a 描述了多元随机变量的一维边缘分布与联合分布之间的函数关系 其严格的数学定义如下 定义2 8 如果定义在集合 0 1 0 1 上的一个二元函数C 满足以下条件 1 C 的定义域为 O 1 0 1 2 C 满足边界条件 C 0 C 0 O C 1 C 1 1 v 3 C 是二增 2 面c r e a s i I l g 函数 即对任意 l 2 l 吃 O 1 且 l 2 y l 1 2 有 C 2 吃 一C 2 一C l V 2 C l V 1 O 则称函数C 为C o p u l a 定理2 2 s k l a r 定型7 伽 设随机向量 x D 的联合分布函数为F x y 边缘分 布函数分别为E x 和最 少 则对于任意的 工 y R 2 R 表示实数集合 一定 存在一个C o p u l aC 使得 第二章极值统计理论 F 五少 C 鼻 x E y 2 1 1 若E x E y 都是连续分布函数 则C 是唯一的 否则 c 在啪 呲上 是唯一的 反之 如果C 是一个相关结构函数 E 和最是一元分布函数 则由 2 1 1 式定义的函数 也y 是一个边缘分布为互和E 的二元联合分布函数 定理2 2 是C o p u l a 的存在性定理 同时也是已知联合分布 后 求C o p u l a C 的理论依据 令U 互 x y 最 它们都是服从区间 0 1 上的均匀分布 则 厂 y 的联合分布函数为 C v P r y 1 F E 叫 E 1 v 2 1 2 所以C o p u l aC 可以看作是边缘分布为区间 0 1 上均匀分布随机向量 U 矿 的联 合分布函数 因为C o p u l a 实质上是一个二元分布函数 如果对应的概率密度函数c 存在 则c 可以由下式得到 c m y 丝丝堕 a z 咖 利用C 0 p u l a 与联合分布函数只边缘分布函数E 最的关系式 2 1 1 得 X D 的联合密度函数为 x J c 互 功 E 石 曲以 y 2 1 3 其中Z x 五 y 分别表示随机变量X 的概率密度函数 C 0 p u l aC 具有如下基本性质 性质2 4 7 1 对于任意 功 0 1 2 都有形 D C D 鲋 D 其中 M 功 m i l l 缸 嵋 矽 D m a x 劬 1 一1 都是C 0 p u l a 称M v 和形 1 分别为F r 6 c h e t H o e 尉i I 坞上 下界 特别地当U y 是区间 0 1 上服从均匀分布的随机变量时 若它们的联合分布 函数是M 则P r U V 1 称U 矿完全正相关 主对角线 若它们的联合分 布函数是形 则P 州 V 1 l 称U y 完全负相关 次对角线 完全正相关 和完全负相关分别对应于一个变量是另一个变量的单调递增与单调递减函数 性质2 5 设连续随机向量 X 的C o p u l a 为o y 则石与 相互独立当且 仅当o y v 删 并称该C o p u l a 为乘积C 0 p u l a 记作n 性质2 6 设连续随机向量 X 聊的C o p u l a 为q 1 则口 X 与 y 都是严 格单调递增函数 则 C z r H 叻 Q J x y M v 天津大学博士学位论文 即在严格单增变化下 随机变量间的C o p u l a 保持不变 如果口 X 厦y 都是严 格单调递减函数 则 C 口 工 y V V l C x r 1 一 1 一V 如果口 X 严格单调递增 严格单调递减 则 q x M V 掰一C 石 y 1 一V 如果口 彳 严格单调递减 觑y 严格单调递增 则 巴 J 艄 甜 功 V G y 1 一 y 性质2 8 令c 是一个C o 叫a 则对任意的s l s 2 f 0 1 5 l J 2 有 C J l f C s 2 f C f s 1 C f s 2 即关于每个变量非降 对任意 I 2 1 l 吃 O 1 且 l 2 H 吃 有 l C 2 屹 一C l 1 1 l I 2 一 lI l 吃一h 即满足L i p s c l l i t z 条件 性质2 9 令c 是一个C o p u l a 则C 关于掰 的偏导数存在 且 o 导c v 1 o 导c 1 口 C 性质2 1 0 令q C 2 是两个C o p u l a 口 0 1 是权重系数 则 1 一口 C l 仍 是一个C o p u l a 即C o p u l a 的线性组合仍是一个C o p u l a 定义2 9 设随机向量 Z y 的联合分布函数为F 瓴y 对应的C o p u l a 为c 则称联合生存函数F 五y P r X 五 J 对应的C 0 p u l a 为生存C o p u l a 翻l n i v a lC o p u l a 记作C 毛y C 互 x 最 y 2 1 5 生存C o p u l a 也是c o p u l a 这是因为仑 f o e o f f o l c 1 一f 1 o C f 1 C 1 f f 1 一l C 1 一f O f 满足定义3 1 的边界条件 对任意的 l 2 1 l 吃 O l 上l l 2 V 1 屹 有 C 2 屹 一C 2 M 一C l 屹 C l M C 1 一 2 1 一吃 一C 1 一 2 l V 1 一C 1 一 1 一屹 C 1 一 l l V 1 0 满足2 增性 同C o p u l a 是连接边缘分布函数与联合分布函数的桥梁一样 生存 C 0 p u l a 是连接边缘生存分布与联合生存分布的桥梁 生存C o 叫a 与原C o p m a 之间的关系为 第二章极值统计理论 C 一1 C 1 一 l D 2 一1 6 定义2 1 0 设C C 2 是两个C o p u l a 如果对于任意的 v 0 1 2 都有 q D Q 1 则称c l 小于C 2 记为C l q 一称为相关序 根据C o p u l a 的性质3 1 对于任意C o p u l a 都有矿 C M 说明F r 6 c h e t H o e 衄i I 培下界矽是所有相关结构函数中最小的 而上界M 是最大的C o p u l a 2 2 2 常见C o p u l a 族 在这一节主要介绍椭圆型C o p u l a 以及阿基米德C o p u l a 椭圆型C o p u l a 1 二元正态C 叩u l a c 似V 加P P 赤e 叶高舡 倍 其中m 1 为标准正态分布的反函数 p 为Z 之间的线性相关系数 且 一1 p 1 由于金融数据大多呈现尖峰厚尾 而二元正态C 叩u l a 具有对称性 两尾比较薄 因此无法捕捉金融市场之间的相关关系 2 二元f C o p u l a c 唧 P P 南 l 筹 导蛐 2 1 8 其中f 1 表示自由度为D 的f 分布的逆函数 p 为疋 之间的线性相关系数 且一l p 1 类似于二元正态C 叩u l a 二元fC o p u l a 也具有对称性特点 因此 这两个C o p u l a 都无法捕捉到变量间的非对称的相关关系 在金融风险分析中 由于二元正态C o p u l a 尾部是渐近独立的 如果把相关 变量用正态C o p u l a 描述 则会降低风险 有时出于计算上方便的考虑 用fC 0 p u l a 描述两个变量的相关性 尽管它也具有对称性 但是它所描述的是随机变量的尾 部渐近相关性 在风险度量上 比正态C o p u l a 有所改进 阿基米德C o p u l a 阿基米德C o p u l a 是C o p u l a 族中最重要的一类 它具有许多特点 1 构造 非常简单 可以由生成元矿来构造 2 许多C o p u l a 族都属于这类C o p u l a 3 这类C o p u l a 具有许多特点 如联合非对称性 厚尾性等 由于阿基米德C o p u l a 具有建模需要的良好性质 它已在越来越多的模型中被应用 天津大学博士学位论文 定义2 1 1 若连续严格单调递减函数缈 O 1 专 0 叫满足伊 1 0 则伊的拟 逆函数Q s e u d o i l w e r s c 矿 1 1 定义为 扩 妒 舌竺竺 并且 1 1 的定义域D D m 9 q 1 o 叫 值域尺册 伊卜1 1 o 1 所有的二元阿基米德C 0 p u l a 都可以写成下列形式 C 2 伊卜u 矿 I 烈 2 l 2 O 1 2 1 9 其中函数缈 称为生成元 g e I l e r a t I D r 满足以下三个条件 1 在 0 1 上连续 严 减 2 矿 1 O 3 下凸的 即妒1 O 如果驴 0 称伊为严格生成元 有矿卜1 1 矿 每个阿基米德C o p u l a 都有一个独有的生成元 当9 O 时 伊为 非严格生成元 由于非严格生成元在建模中得到的结果不是很明确 我们仅考虑 严格生成元情形 此时有 尹 C M 矿 缈 1 因此 阿基米德C 0 p u l a 可表示为 C 力 尹 1 矽 f 烈V 称为严格阿基米德C 0 p u l a 下面从相关性角度讨论几种常用的阿基米德C 0 p u l a 1 G u m b e lC o p u l a C v 们 e x p 一 一l n p 一l n l 9 口 2 2 0 其中1 p 佃 当9 1 时 阢y 相互独立 当秒一佃时 阢y 完全正相关 G u I n b e lC o p u l a 具有非对称性 它对于变量在分布上尾处的变化十分敏感 因此 能够很好的捕捉金融市场中上尾相关性的变化 2 C l a y t o nC o p u l a C v 口 材 一 厂9 1 一1 7 护 2 2 1 其中O 目 O 时 U 矿正相关 当秒 0 时 矿负相关 当 9 一 时 C v 国 圳 表明两变量相互独立 F r a n kC 0 p u l a 函数的性质类似 第二章极值统计理论 于正态C o p u l a 其分布的尾部渐近独立 且具有对称相关性 对于变量间尾部 的相关变化不太敏感 4 C 1 a y t o n J o eC 叩u l a C V 口 回 1 一 1 一 1 一 1 一 占 前 1 一 1 一功占 埘一1 一1 坩 1 借 2 2 3 其中O p 佃 1 占 比I G y 乃 2 2 4 存在且非零 零 则称X 和y 上尾渐近相关 上尾渐近独立 若极限 厶 l 姆P F x J G y 五 2 2 5 存在且非零 零 则称x 和y 下尾渐近相关 下尾渐近独立 并分别称乃和五为 上尾和下尾相关系数 9 8 1 2 2 4 和 2 2 5 式表示一个变量是极值条件下 另一个变量也是极值的概率 如果这个概率为零 则称两个变量渐近独立 区分变量在极值水平上是相关还是 独立 对金融风险分析和管理是非常重要的 渐近相关意味着极端事件可以同时 出现 如两市场 或两资产 同时出现暴涨或暴跌的情况 如果将渐近相关模型 天津大学博士学位论文 用于分析渐近独立的金融数据 必将导致过高地估计同时出现暴涨或暴跌的概 率 如果将渐近独立模型用于分析渐近相关的金融数据 必将导致过低得估计同 时出现暴涨或暴跌的概率 由于二元正态分布 叫在线性相关系数小于1 时 尾部是渐近独立的 因此 在应用二元正态分布描述具有尾部渐近相关的变量时 它会低估变量之间同时出 现极端情况的概率 对于连续型随机变量 尾部相关系数实际上与边缘分布无关 仅仅由C o p u l a 来确定 如果用c 表示连续型随机向量 Z 即的C 0 p u l a 则可以得到 一1 一l 一2 C b l n 二二 二 u 洲一二 1 2 2 6 l i m 里幽 其中e 如 2 1 6 式所定义 以及 五 l 唤旦盟 2 2 7 川 比 因此 由 2 2 6 和 2 2 7 式 我们可以计算得到以下几种C o p u l a 的尾部相关 系数 1 二元正态C o p u l a 的尾部相关系数为 乃 五 2 1 i 理 工 1 p 1 一p o 夕 o 吃 1 2 使得当刀专佃时 P 丝 监 五丝 鱼 y 一日 工 y 2 2 8 口 一口 成立 其中日是非退化的分布函数 假设日的边缘分布是标准F r 6 c l l e t 分布 则 日具有如下形式 日 五J e X p 一y J 工 0 y O 2 2 9 其中 m f 一号 半煳毗 2 3 0 矿为指数测度 是一l 阶齐次函数 1 唧 满足 y 甄缈 口 1 y 五y 墨笋是 o 1 上均值为圭的分布函数 满足 1 f 础 纠 f 1 一国 承 功 2 3 1 并且称日 x 少 为二元极值分布 二元极值分布与区间 0 1 上满足 2 3 1 式的分布函数K 2 一一对应 由于K 不具有有限参数形式 因此二元极值分布不能用有限参数形式表示 另外 K 可 以可微 也可以不可微 当K 可微时 设密度为七 有 y f 一 詈 半撇训戗 同样矿O 也可以写作 啪尺 f t 嚣 等拟州国 令 天津大学博士学位论文 彳 f m a X 国 1 f 1 一国弦 d K 国 2 3 2 其中4 f 称作P i c k a I l d s 相关函数 满足彳 0 彳 1 l 且m a X f 1 一f 彳 f 1 0 s f 1 贝0 有 矿 戈 力 三 与么内 x yx 七y 因此二元极值分布也可以写作 j 了 工 少 c p 一二 土 4 一 2 3 3 y 工一ry 随机变量X 和 之间的相关关系完全由彳 f 决定 2 3 2 二元超阈值模型 设随机向量 X y 的分布为F 工 y 五 Z l 1 力是取自它的样本 对 于充分大的阈值 y F y 的边缘尾部近似为广义P a r e t o 分布 参数分别为 幺 吒 妥 和 q 菇 其中f P r x F 作变换 贾 1 g 1 一炙 1 羔譬 l 惕 I x 叱 2 3 4 贾 1 0 9 1 一炙 1 玉 兰也 圳厶 一 x 叱 2 3 4 和 矿 一 1 g 1 一f 1 兰d 三二二二兰 r 易 一 y o y 则j 穸分别近似为标准的F r 6 c h e t 分布 设j 矿的分布函数为户 由 2 3 5 式及y 的负一阶齐次性 有 j 歹 F j 已夕 2 3 5 当 z 较大时 唧 一y 戈 刀 夕 z e X p 一y i 夕 可见户 贾 歹 日 曼 夕 其中舅 夕分别由 2 3 4 和 2 3 5 式定义 因此在 工 y 的 尾部有 F 工 y 聋 夕 e x p 一矿 戈 夕 x 蚝 y 2 3 6 在二元超阈值模型中 求似然函数较为复杂 主要是不仅要考虑两个变量同 时超过阈值的情况 还要考虑其中一个变量超过阈值 而另一个变量没有超过阈 值的情况 因此给出以下符号表示 民 o 咱 棚 墨 o 佃 一a o y 一2 3 第二章极值统计理论 R l o D 佃 R l 佃 沁 佃 为了能够充分利用数据中所包含的极值信息 考虑变换 职 五J I m x 以 工 m a x 以 少 2 3 7 应用经 2 3 7 式变换后得到的新数据进行统计推断 对于墨 中的点 即两个变量 同时超过阈值的情况 用 2 3 6 式作为其分布函数的近似 对于墨 中的点 即只 有变量x 超过阈值 而y 小于阈值 因此我们只考虑x 提供的极值信息 而不考 虑J 的极值信息 用下式 郴 户乱 来作为分布的密度 对于其它R J 上的点 采用同样的方法处理 由此可以得到二元超阈值模型的似然函数 三 口 五 乃 咒 兀p 口 葺 乃 2 3 8 f I l 其中秒 或 嘭 艿 色 六 吒 和嘭 彭 q 岛 分别是边缘分布的参数 艿 为相关函数彳或指数测度矿中的参数 而 p p x y 矧 如果 小 乱 如果 圳叽 孔 如果 训峨 F 虬 y 如果 x 少 R o 对于上式中的尸由 2 3 6 式可近似得到 因此对似然函数取极大值就可得到 目的极大似然估计 2 3 3 二元点过程模型 点过程方法在多元极值理论中占有重要地位 分量最大值模型与二元超阈值 模型都可归结为某种形式的点过程模型 因此下面介绍基于点过程的二元极值建 模方法 文献 5 6 1 0 l 1 0 2 1 0 3 都对此进行了深入的讨论 假定 x I f l 拧是来自分布 工 J 的样本 其边缘分布为标准F r 6 c h e t 分布 在 0 o o 上定义点过程 天津大学博士学位论文 圮 乏o 一t 乃 如果F M D A 那么当 z 专o D 时 在不包含原点 O O 的区域上 有M 山 其中 是 0 叫 0 上的非齐次P o i s s o n 过程 而且在拟极坐标 x y 国 二 2 3 9 x y 变换下 的强度密度函数为 纵 妫 缓 功 2 O 缈 0 2 4 0 其中 为径向变量 缈为角度变量 K 与二元极值分布日的关系如定理2 4 所述 经 2 3 9 式变换后 表示M 中的点 X 聊到原点的距离 仞表示一个角度 2 4 0 式说明极限过程 的强度函数可以分解为径向变量和角度变量的乘积 或 者说 角度的分布由K 决定 与距离 无关 如果K 可微 彩表示x y 之间的相 对大小 则尼 妫表示不同相对大小的 置功出现的频率 如果极值几乎独立 表 示当X y 其中一个较大时 另一个也许出现小值 则表示后 动在国 O 或国 1 附 近较大 其余地方较小 反之 如果极值相关性很强 则表示出现相似值的概率 较大 尼 纠在国 1 2 附近较大 选择区域么 工 y x y 让 充分大 以保证彳的边界远离原点 使 得非齐次P o i s s o n 过程 是圮的合理近似 此时人 句具有比较简单的形式 有 人 彳 窘援 砌 f 軎f 缎 功 2 这里 援 国 2 是由于尼 动 2 是 o 1 上的分布函数 假定K 可微 密度为后 则可得似然函数 回 e x p 一A 彳 兀兄 玉 刀 咒 z o C 兀七 q 2 4 1 其中q 五 薯 乃 葺 乃 么 扛1 彳 彳 为落入区域么中的点数 万 是模型的相关参数 2 3 4 沪深股市尾部相关性度量 本节通过实例来说明二元阈值模型和二元点过程模型的建模方法 选取上证 综合指数和深圳成份指数的日收盘指数作为样本 数据来自巡型 窭望 k 墨墼堑曼Q 班 假设 表示每日收盘指数 则定义X y 分别为上海和深圳日收盘指数对数收益 率 有Z l o g P 一l o g 晕 样本区间从2 0 0 0 年1 月4 日至2 0 0 6 年7 月2 1 第二章极值统计理论 日 共1 5 3 4 组有效数据 下面采用两种方法度量上海 深圳两股票市场波动的尾部相关性 即一个变 量取大值时 另一个变量是否也有取大值的趋势 在2 2 3 节中 我们给出了尾 部度量的指标 而在这一节中 为了便于说明我们引入新的符号Z 孑表示 设 X 的联合分布函数为F 边缘分布函数分别为互和互 相关结构函 数为C 对于0 I 最 聊 1l o g C l o g 则有Z l i m 洲 o Z 且O Z 1 Z 同样表示上尾相关性 对渐近相关随机变 量 尾部相关性越强 则Z 值越大 可见 当两随机变量渐近相关时 Z 提供了 较好的相关性度量 但对渐近独立随机变量 即Z 0 没有提供这种情况下的 相关性信息 即不能用Z 度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论