(概率论与数理统计专业论文)大维样本协方差矩阵的线性谱统计量的中心极限定理.pdf_第1页
(概率论与数理统计专业论文)大维样本协方差矩阵的线性谱统计量的中心极限定理.pdf_第2页
(概率论与数理统计专业论文)大维样本协方差矩阵的线性谱统计量的中心极限定理.pdf_第3页
(概率论与数理统计专业论文)大维样本协方差矩阵的线性谱统计量的中心极限定理.pdf_第4页
(概率论与数理统计专业论文)大维样本协方差矩阵的线性谱统计量的中心极限定理.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(概率论与数理统计专业论文)大维样本协方差矩阵的线性谱统计量的中心极限定理.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 近二、三十年来,随着现代科技的发展和大型并行计算机的出现,尤其是l i n u x 微机机 群的出现和普及,人们开始对大维海越数据的大规模科学工程计算越来越感兴趣对于大维 海量数据,为了揭示关键变量的内部关系,人们自然想利用参数或非参数回归分析和典型相关 分析:为了探索和预报数据的时空变化情况,同时也会采用时间序列分析及神经网络手法;另 外,为了减小计算机时及内存消耗,在最短时间内完成海量数据可视化,也会用到主成份分析 和因子分析然而,在处理大维数据时,许多经典的统计方法都不适用了,有的甚至会导致严 重的误差我们应该发展和运用新的方法来处理大维数据相关问题j 如中长期天气预报、航探 数据可视化、地震数据处理、航天飞行器数值化等 以上诸多方面在做估计和假设检验过程中,无不用到大维随机矩阵的处理,尤其是大维样 本协方差矩阵的相关性质? 因为多元分析中许多重要的统计量都可以表示成样本协方差矩阵 的函数但是由于经典的大样本理论都是假定维数很小是固定的,故而经典极限理论并不适宜 解决大维随机数据问题,很多多元问题的模型参数估计、模型检验的统计量已有的结果对大维 海萱数据并不能平凡推广因此大维随机矩阵理论,尤其协方差矩阵相关性质的研究就成为 非常重要且迫切需要解决的课题 在大维海量数据处理中,大维随机矩阵的谱分析非常关键也很重要在找到大维随机矩 阵经验谱分布瓦( z ) 的极限谱分布f ( x ) 后,相应的线性谱统计量j f ( x ) d f ( z ) 的极限形 式可以容易得到,为了更进一步的统计推断,求出大维随机矩阵线性谱统计量的极限分布是非 常关键的 关于经验谱分布收敛到极限谱分布的收敛速度问题,一般的猜想是d ( n 1 ) 如果真是 这样,我们考虑经验过程g 。( z ) = 礼 r ( z ) 一f ( z ) 的渐近性质似乎是自然的但不幸的 是,大量证据显示经验过程g 。( z ) 在任何度量空间中都不收敛自然,遇一步地,我们转向寻 找经验过程g 。( z ) 的线性谱统计量g 。( ,) = ff ( x ) d g n ( z ) 的极限分布本文主要运用 b e r n s t e i n 多项式逼近、s t i c l t j e s 变换方法以及鞅的中心极限定理等手法在适当的矩条件 下,当核函数f ( x ) 属于c 4 时,我们证明了大维随机协方差矩阵的线性谱统计量的中心极限 定理基于这类谱统计量的极限分布:我们可以做更有效的统计推断,如假设检验、构造置信 i 区间。置信区域等具我们结果中核函数的限制的改进准则,可以对大维样本协方差矩阵的经 验谱分布的渐近性质有一个更进一步的理解 关键词:大维随机矩阵;大维海量数据:样本协方差矩阵;经验谱分布;线性谱 统计量;经验谱过程 a b s t r a c t i nl a s tt w oo rt h r e ed e c a d e s ,w i t ht h er a p i dd e v e l o p m e n to ft h em o d e r ns c i e n c e a n dt e c h n o l o g y , m o r ea n dm o r es c i e n t i s t sa r ef a c i n gt oa n a l y z el a r g ed i m e n s i o n a l a n dm a s s i v ed a t a ,c a l c u l a t i o n sa n di n f e r e n c e so nl a r g e s c a l es c i e n c ea n de n g i n e e r - i n g f o rl a r g e - s c a l em a s s i v ed a t as e t s ,t oa n a l y z et h ei n t e r i o rr e l a t i o n s h i po fd a t a , n a t u r a l l y ,o n ec a nu s ep a r a m e t r i co rn o n p a r a m e t r i cr e g r e s s i o na n dc a n o n i c a lc o r - r e l a t i o na n a l y s i s f u r t h e r m o r e ,t h es p a c e - t i m ev a r i e t yo fd a t ac a l lb ee x p l o r e d a n df o r e c a s t e db j vm u l t i v a r i a t et i m es e r i e sa n a l y s i sa n dn e u r a ln e t w o r k o nt h e o t h e rh a n d ,p r i n c i p a lc o m p o n e n ta n a l y s i sa n df a c t o ra n a l y s i sc a 4 1b eu s e dt or e - d u c ec a l c u l a t i n gt i m e s ,t of i n i s ht h ev i s u a l i z a t i o no fl a r g e - s c a l ed a t a h o w e v e r ,i t i sf o u n dt h a tw h e nd e a l i n gw i t hl a r g ed i m e n s i o n a ld a t a ,m a n ) - c l a s s i c a ls t a t i s t i c a l p r o c e d u r e si n d u c el a r g e ,e v e ni n t o l e r a b l ee r r o r s t h u s ,i ti si m p o r t a n tt od e v e l o p n e wa p p r o a c h e st od e a lw i t hl a r g ed i m e n s i o n a ld a t a ,f o re x a m p l e ,f o r e c a s t i n gl o n g t i m ec l i m a t e s ,p e r f o r m i n gv i s u a l i z a t i o no ft h ea c r o e x p l o r i n gd a t a ,e v a l u a t i n gt h e e a r t h q u a k ed a t a ,m a k i n gd i g i t a l i z a t i o no fs p a c ep r o b e sa n d s oo n f o rt h e s ei m p o r t a n ta n dp r a c t i c a lp r o b l e m s s a m p l ec o v a r i a n c em a t r i xi sa n i m p o r t a n ts t a t i s t i cb e c a u s em a n yi m p o r t a n ts t a t i s t i c sa r ef u n c t i o n a l so fi t w h e n w cm a k es t a t i s t i c a li n f e r e n c e s ,s u c ha se s t i m a t i o n sa n d o rh y p o t h e s i st e s t s ,t h e s a m p l ec o v a r i a n c em a t r i c e sm u s t b ei n v e s t i g a t e d h o w e v e r ,f o rt h el a r g ed i m e n - s i o n a ld a t a ,t h es a m p l ec o v a r i a n c em a t r i xi sn o tag o o de s t i m a t o ro ft h ep o p u l a t i o n c o u n t e r p a r t m a n ym e t h o d so fp a r a m e t r i ce s t i m a t i o n sa n dt e s t sf o rm u l t i v a r i a t e s t a t i s t i c a lp r o b l e m sc a nn o tb es i m p l yu s e dt od e a lw i t hl a r g ed i m e n s i o n a ld a t a i nc o n t r a s t ,t h et h e o r yo fl a r g ed i m e n s i o n a lr a n d o mm a t r i c e s ,e s p e c i a l l y , t h a to f t h el a r g es m n p l ec o v a r i a n c em a t r i c e sb e c o m ea 、ws i g n i f i c a n ta n dp o w e r f u lm a t h - c l n a t i c a 1t o p i c w h e nw ed e a lw i t ht h el a r g ed i m e n s i o n a la n dm a s s i v ed a t a ,s p e c t r a la n a l - y s i so fl a r g ed i m e n s i o n a lr a n d o mm a t r i c e s ( l d r m ) p l a y sa ni m p o r t a n tr o l ei n i i i l a r g ed i m e n s i o n a ld a t aa n a l y s i s a f t e rf i n d i n gt h el i m i t i n gs p e c t r a ld i s t r i b u t i o n ( l s d ) f ( x ) o ft h ee m p i r i c a ls p e c t r a ld i s t r i b u t i o n 只( z ) ( e s di e t h ee m p i r i c a l d i s t r i b u t i o no ft h ee i g e n v a l u e s ) o fl d r m ,o n ec a nd e r i v et h el i n f i to ft h ec o r r e - s p o n d i n gl i n e a rs p e c t r a ls t a t i s t i c s ( l s s ) ff ( x ) d f n ( 丁) t h e n ,i no r d e rt oc o n d u c t f u r t h e rs t a t i s t i c a li n f e r e n c e ,i ti si m p o r t a n tt of i n dt h el i m i t i n gd i s t r i b u t i o no fl s s o fl d r m a g e n e r a lc o n j e c t u r ea b o u tt h ec o n v e r g e n c er a t eo fe s d t ol s dp u t si ta tt h e o r d e ro fo ( n - 1 ) i ft h i si s t r u e ,t h e ni ts e e m sn a t u r a lt oc o n s i d e rt h ea s y m p t o t i c p r o p e r t i e so ft h ee m p i r i c a lp r o c e s sg n ( z ) = 礼( r ( z ) 一f ( z ) ) u n f o r t u n a t e l y ;m a n y l i n e so fe v i d e n c es h o wt h a tt h ep r o c e s sg nx ) c a nn o tc o n v e r g ei na i 黟m e t r i cs p a c e a sa na l t e r n a t i v e ,w et u r n e db a c kt of i n dt h el i m i t i n gd i s t r i b u t i o no ft h el s s g ( ,) i nt h i st h e s i s ,u s i n gt h eb e r n s t e i np o l y n o m i a la p p r o x i m a t i o n js t i e l t j e st r a n s f o r m m e t h o da n dt h ec e n t r a ll i m i tt h e o r e m ( c l t ) o fm a r t i n g a l e ,u n d e rs u i t a b l em o m e n t c o n d i t i o n s ,w ep r o v et h ec l to fl s sg 竹( ,) w i t hag e n e r a l i z e dr e g u l a rc l a s sc 4 o ft h ek e r n e lf u n c t i o n sf o rl a r g ed i m e n s i o n a ls a m p l ec o v a r i a n c em a t r i c e s t h e s e a s y m p t o t i cp r o p e r t i e so fe m p i r i c a ls t a t i s t i c ss u g g e s tt h a tm o r ee f f i c i e n ts t a t i s t i c a l i n f e r e n c e s 。s u c ha sh y p o t h e s i st e s t i n g ,c o n s t r u c t i n gc o n f i d e n c ei n t e r v a l so rr e g i o n s , e t c ,o nac l a s so fp o p u l a t i o np a r a m e t e r s ,a r ep o s s i b l e t h ei m p r o v e dc r i t e r i ao n t h ec o n s t r a i n tc o n d i t i o n so fk e r n e lf u n c t i o n si no u rr e s u l t ss h o u l da l s op r o v i d ea b e t t e ru n d e r s t a n d i n go ft h ea s y m p t o t i cp r o p e r t i e so ft h ee s do fl a r g ed i m e n s i o n a l s a m p l ec o v a r i a n c em a t r i c e s k e yw o r d s :l a r g ed i m e n s i o n a lr a n d o mm a t r i x ;l a r g ed i m e n s i o n a la n dm e “s s i v e d a t a ;s a m p l ec o v a r i a n c cm a t r i x ;e m p i r i c a ls p e c t r a l d i s t r i b u t i o n ;l i n e a rs p e c t r a l s t a t i s t i c s ;e m p i r i c a ls p e c t r a lp r o c e s s i v 独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所 取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人 已经发表或撰写过的研究成果对本人的研究做出重要贡献的个人和集体,均已 在文中作了明确的说明本声明的法律结果由本人承担 学位论文作者签名:孟垫燕 学位论文版权使用授权书 学位论文使用授权书本学位论文作者完全了解东北师范大学有关保留、使用 学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅本人授权东北师范大学可以采用 影印、缩印或其它复制手段保存、汇编本学位论文同意将本学位论文收录到中 国优秀博硕士学位论文全文数据库( 中国学术期刊( 光盘版) 电子杂志社) 、中 国学位论文全文数据库( 中国科学技术信息研究所) 等数据库中,并以电子出版 物形式出版发行和提供信息服务 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:丑! :墓指导教师签名: 日 期:1 坌垒旦:! 至:! 半 日 期:2 壁q 辱f 王:! 兰 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话 邮编 东北师范大学博士学位论文 第一章引言 1 1 大维随机矩阵的应用意义及背景知识 随机矩阵是由h s u 和w i s h a r t 等人于2 0 世纪3 0 年代提出并加以研究的随 着科技的飞速发展,人们处理数据也越来越庞大,自然对随机矩阵的维数要求也越 来越大自5 0 年代,w i g n c r ( 1 9 5 5 ,1 9 5 8 ) 首次把随机矩阵与核物理联系起来,并发 现了著名的半圆律,大维随机矩阵的研究引起了许多概率统计学家与数学家非常 大的兴趣大维随机矩阵发展到今天,其应用领域已经远远不止在核物理方面了, 其应用不乏有大量的重大且急需解决的问题,如中期天气预报要求2 4 小时内完成 较准确的4 8 小时后天气预测数值模拟( 自然会面临大维数据时间序列分析问题) , 此时至少需要计算6 3 5 万个网格点,数据实施在线存取,计算性能要求高达2 5 万 亿次j 秒再如为了实现全球海洋大气环境全三维数值化,美国在1 9 9 6 年开始实旌 a s c i 计划? 要分4 个阶段,逐步实现万亿次、1 0 万亿次、3 0 万亿次和1 0 0 万亿次 的大规模数据处理当然该计戈最终也应用于核物理流体力学、天体物理、航探、 地震数据处理、燃料燃烧、工业制造、图像处理等领域,也有一些近年来世人都非 常关心的问题,如高速城市交通设计,臭氧层空洞数字解剖、金星图像分析、信号 密码破译技术等等这些领域无不涉及大维数据的处理尤其在处理这些大维海量 数据变量关系时,更是不可避免面临大样本协方差矩阵的处理以处理海洋数据为 例,为了揭示全球海洋大气各关键量( 海浪高度、海浪速度,方向、海平面大气压 力、海平面湿度、海水面温度、海面风速、海面风向,旋度等等) 的关系:我们必须 处理大维海量数据的回归关系以最简单的多元回归模型为例 1 ;= f ( x t ) + 仃( x 0 已, ( 1 1 ) 这里( x 1 ,m ) ,( k ,k ) 为随机样本,盯2 ( 义f ) 为条件方差v a r y i x = x t 】我们 为了寻求k 与托的回归关系,采用非参数的局部线性和局部二次多项式回归中 1 东北师范大学博士学位论文 (篓;至:兰;篓;至!量 c d t ! c o y c o y y l 1 乞 : 髟 k 二 l 二 ( 1 2 ) 参见w a n g ,j i a n g ,y i n ( 2 0 0 9 a ) 随着样本量的增加,自然会出大维随机矩阵问题, 由于海洋、大气、石油等实际数据邻近区域或者邻近时刻的数据具有相关性,所以 该矩阵并不是稀疏矩阵 再比如为了实现较短时间内对大维海量数据进行可视化,我们对数据进行主 成份分析和因子分析时:都会遇到大维随机矩阵的处理,尤其是大维随机矩阵的谱 分析问题( 但是在现实应用中,由于超大型矩阵的运算消耗计算机内存太大:在处 理大维随机矩阵的运算时一般都要求优化算法才能在相对可接受的时闻内完成数 据分析任务) ( 参见v a n g ,j i a n g ,y i n ( 2 0 0 9 b ) ) 由于大维数据问题经典的极限定理 并不能保证,所以有诸多多元统计推断结果并不能平凡推广到大维数据中鉴于此, 大维随机矩阵理论不仅有很强的应用背景,同时也给我们带来了诸多挑战 1 2 大维随机矩阵的一些基本结果和研究现状 在大维随机矩阵理论的研究中,大维随机矩阵的谱分析具有很重要的地位下 面我们先给出矩阵谱分布的定义 定义1 1 【经验谱分布l 设a 是一个礼竹的矩阵,其特征根为,j = 1 ,2 ,n 如果所有的特征根都是实数( 例如a 是对称矩阵或者复的h e r m i t i a n 矩阵) ,我们 可以定义一个一维的分布函数: f 以( z ) = 砉集合 j n ,z ) 中的元素个数 _ n = i 1 z ) , 称为矩阵a 的经验谱分布j 其中 ) 代表示性函数 2 东北师范大学博士学位论文 如果,j = l ,2 ,n 不全是实的,我们可以定义一个矩阵a 的二维的经验 谱分布函数: f a ( z ,y ) = 元1 集合 j 礼:孵e ( ) z ,3 m ( ) 中的元素个数 :磊1 n 五 吸e ( ) x , 3 m ( a j ) 剪) , j = 1 这里及本文其他地方,册e ( ) 和:j m ( a j ) 都分别表示复数的实部和虚部 对于大维随机矩阵谱分析理论的研究最早起源于2 0 世纪5 0 年代的核物理 在量子力学系统中,量子的能级不能被直接观测到:但是可以通过一些物理观测值 组成的矩阵的特征根反映出来而且,多数原子核都有上千个能级,特征根的值没 有一个显示的表达式从此,许多物理学家和统计学家就对大维随机矩阵的谱分析 产生了浓厚的兴趣,目前也做出了许多漂亮的结果许多关于大维随机理论及其在 量子力学和相关领域的应用在文献m e h t a ( 1 9 9 0 ) 的( ( r a n d o mm a t e i c e s ) ) 一书中有 详尽的介绍 对于多元统计推断:大维随机矩阵的谱分析的重要性在于许多多元统计中的重 要的统计量都可以表示成某些随机矩阵的谱分布的函数具体的例子,读者可以参 阅文献b a i ( 1 9 9 9 ) 在大维随机矩阵谱分析理论中,主要关心两个方面,一是对于给定的一个矩阵 序列 a 。) ,它的谱分布序列 f ) 的极限谱分布是什么;二是找到了极限谱分布 后,自然要关心该谱分布序列收敛到极限谱分布的收敛速度通常情况下,谱分布 序列的极限都是非随机的,我们称其为矩阵 a 。) 的极限谱分布在本章的以下部 分,我们将综述关于寻找极限谱分布和提高收敛速度的已有的结果 1 2 1 大维随机矩阵的极限谱分布 定义1 2l w i g n e r 矩阵】w i g n c r 矩阵w 名,又名标准高斯矩阵,是礼扎对称阵, 其对角线元素是独立同分布( i i d ) 的正态n ( 0 :2 ) ;上三角元素是i i du ( 0 :1 ) 的 3u 东北师范大学博士学位论文 随机变量w i g n c r 矩阵的广义定义,仅仅要求矩阵是对称阵( 或者复的h e r m i t i a n 矩阵! 对角线元素和上三角元素都足相互独立的随机变量 w i g n e r 矩阵以著名物理学家( 1 9 6 3 年诺贝尔物理奖得主) e u g e n ew i g n c r 的 名字命名w i g n e r 矩阵不仅在核物理中有很重要的位置( 参见m c h t a ( 1 9 9 0 ) ) ,在 多元统计中也具有很重要的统计意义,因为它是标准w i s h a r t 矩阵的极限 大维w i g n e r 矩阵的谱分析的研究可以追朔到e u g c n cw i g n e r ( 1 9 5 5 ,1 9 5 8 ) 的 著名的半圆律他证明了n n 的标准高斯矩阵w 名:乘以标准化因子( 1 v 何) ,其 经验谱分布f 而的期望收敛到半圆律f ,其密度函数为: 耿加 1 时,在原点有点测度1 一l y 其中a = 0 - 2 ( 1 一扣) 2 ,6 = 盯2 ( 1 + 厕2 ; 常数y 是维数和样本量的比值 定理1 6 中的极限谱分布就是人们熟知的参数为秒和仃的m a r c e n k o p a s t u r 律如果参数盯2 = 1 ,则该m p 律称为标准的m p 律 下面的定理1 7 是把上述定理1 6 的结果推广到样本协方差矩阵元素不独立 同分布的情形具体证明读者可以参阅b a i ,s i l v e r s t e i n ( 2 0 0 6 ,4 6 页) 定理1 7 【b a i ,s i l v e r s t e i n ( 2 0 0 6 ) 1 设对每个自然数n ,= z 协1 is p ,1 j n 】- 中的元素是相互独立的复随机变量,但它们具有共同的均值z 和共 同的方差盯2 若p n _ y 且对任意的7 7 0 , l i m 脚1 7 k - 驯2 删叼何) = 。, 则样本协方差矩阵的经验谱分布f 风以概率1 收敛到参数为y 和矿2 的m p 律 对于两个矩阵乘积的谱分布的研究起源于以下两个方面一个是为了研究来 自总体的协方差矩阵丁不是单位阵或者单位阵的倍数的样本协方差矩阵s t ;二 是为了研究多元f 矩阵,f = s - s 1 ,它是一个样本协方差矩阵乘以另一个与其独 立的样本协方差矩阵的逆 y i n 和k r i s h n a i a h ( 1 9 8 3 ) 考察了w i s h a r t , 矩阵s 和一个正定矩阵t 的积矩阵 的极限谱分布b a i ,y i n ,k r i s h n a i a h ( 1 9 8 6 ) 研究了其他形式的积矩阵s i l v c r s t c i n 和b a i ( 1 9 9 5 ) 证明了一类矩阵b = a + 鲁x 丁x 的极限谱分布的存在性b = 6 东北师范大学博士学位论文 a + 1 。x t x 这种形式的矩阵虽然来源于核物理,但它在多元统计中也有广泛的应 用 关于f 矩阵,w a c h t e r ( 1 9 8 0 ) 首先考虑了当研和是相互独立的w i s h a r t 矩阵时的f 矩阵的极限谱分布y i n ,b a i ,k r i s h n a i a h ( 1 9 8 3 ) 证明了多元f 矩阵极 限谱分布的存在性后来,b a i ,y i n ,k r i s h n a i a h ( 1 9 8 6 ) 还证明了当s 的分布是各向 同性时j 极限谱分布的存在性b a i ,y i n 和k r i s h n a i a h 和s i l v e r s t e i n ( 1 9 8 5 a ) 推导 出了多元f 矩阵极限谱分布的具体表达式 5 1 2 2 最大最小特征根的极限 在多元分析中,许多统计量可以表示成关于某些随机矩阵的经验谱分布的积分 的函数当极限谱分布知道以后,应用h e l l y - b r a y 定理( 参见l 0 6 v e ( 1 9 7 7 ) p 1 8 4 1 8 6 ) ,可以得到该统计量的近似值为了应用h e l l y - b r a y 定理我们必须证明随机矩 阵的最大和最小特征根分别有上下界 最大最小特征根的性质不仅在上述方面非常重要,也在许多其他方面有广泛的 应用j 例如:信号处理,模式识别,边晃探测,数字模拟等在这方面,g c m a n ( 1 9 8 0 ) 首先证明了在矩的增长速度满足下列条件: 存某个m 0 ,( v 0 使得对所有的后23 有 e l x l l l k m 南僦, 当p n _ y ( 0 ,。) 时,大维样本协方差矩阵的最大特征根趋于b = ( 1 + v 石) 2 这一结果在四阶矩存在的条件下,被y i n ,b a i ,k r i s h n a i a h ( 1 9 8 8 ) 进一步推广后 来,b a i ,s i l v e r s t e i n y i n ( 1 9 8 8 ) 证明 e 5 z l l l 4 = 。兮l i ms u p a m “= 0 0a s 这就验证了四阶矩条件是大维样本协方差矩阵的最大特征极限存在的必要条件 s i l v e r s t e i n ( 1 9 8 9 ) 证明了大维样本协方差矩阵的最大特征弱收敛的充分必要条件 是e x l l = 0 和礼2 p ( 1 义1 l l 侗一0 b a i ,y i n ( 1 9 8 8 ) 给出了w i g n e r 矩阵最大特征根几乎处处收敛的充分必要条件 7 东北师范大学博士学位论文 。j i a n g ( 2 0 0 4 ) 证明样本相关矩阵的最大特征根和样本协方差矩阵的最大特征具有 相同的极限 相对困难的是找大维样本协方差矩阵的最小特征的极限注意这里及本文的 后续部分,样本协方差矩阵的最小特征都指的是样本协方差矩阵的最小的不为0 的 特征根y i n ,b a i ,k r i s h n a i a h ( 1 9 8 3 ) 证明当p n y ( 0 :1 2 ) 时、w i s h a x t 矩 阵的最小特征根的下极限有一个正的下界s i l v e r s t e i n ( 1 9 8 4 ) 把这个工作推广到 y ( 0 ,1 ) 他后来( 1 9 8 5 b ) 证明了当p n _ y ( 0 ,1 ) 时,标准的w i s h a r t 矩阵的 最小特征根趋于n = ( 1 一可) 2 但是,他的方法很难应用到其他矩阵,因为他的证 明方法很大程度上依赖分布的正态假设突破l 生的工作是b a i 和y i n ( 1 9 9 3 ) 完成 的他们用了一个统一的方法:在四阶矩存在的条件下,同时得到了样本协方差矩 阵的最大和最小特征的强极限,事实上、他们证明了样本协方差矩阵的最小特征的 极限是a = ( 1 一、历) 2 1 2 3 谱分布的收敛速度 找到极限谱分布后? 经验谱分布收敛到极限谱分布的收敛速度具有很强的实际 意义,然而怎样估计经验谱分布的收敛速度却悬而未决几十年原因在于,在找极 限谱分布的时候,当时流行的有效的方法是矩方法,但是矩方法不能提供任何收敛 速度的信息, 第一个突破性的工作应归功于b a i ( 1 9 9 3 a ) 的结果在这篇文章中,他给出了 一个b c r r y e s s e e n 型的b a i 不等式:这个不等式利用两个分布的s t i c l j e s 变换来 信计这两个分布的距离这个强有力的工具开辟了估计经验谱分布的收敛速度的 道路b a i ( 1 9 9 3 a ) 证明了w i n g e r 矩阵的经验谱分布的期望收敛到半圆率的收敛 速度是0 ( n 一专) 利用这个强有力的工具,b a i m i a o ,t s a y ( 1 9 9 7 ) 首次证明了在四 阶矩条件下,w i g n e r 矩阵的经验谱分布自身依概率收敛到半圆律的收敛速度也是 o ( n 一音) 后来jb a i :m i a o :t s a y ( 1 9 9 9 ) 把收敛速度改进到o p ( n 一言) 2 0 0 2 年,他 们在8 阶矩条件下,进一步改进w i g n e r 矩阵的经验谱分布的期望的收敛速度为 ( ) ( n 一壹) ,经验谱分布本身收敛速度为纯( 竹一音) 8 东北师范大学博士学位论文 对于大维样本协方差矩阵,在四阶矩有限条件下,1 9 9 3 年,b a i 利用b e r r y - e s s e e n 型的b a i 不等式,证明了,若y n = 詈( 0 ,e ) ii l e f b “( z ) 一e 。( z ) | i = o ( n 一号) ( 0 0 e 1 或1 0 e o o ) li l e f b “( z ) 一毛。( z ) i l = o ( n 一蠢) ( 其它) 在1 9 9 7 年,b a i ,m i a o 和t s a y 证明了经验谱分布本身依概率收敛速度与上述其期 望的收敛速度一样 后来,b a i ,m i a o ,和y a o ( 2 0 0 3 ) 在8 阶矩条件下,又改进了收敛速度 若骱= 等不靠近0 或l , e f b “( z ) 一r ,。( z f b t 。( z ) 一日。( z ) i f b n ( z ) 一,k ( z ) i i = o ( n 一专) j = o p ( n 一言) : = 0 口。( 扎一+ 卵) 有趣的是j 若靠近1 ,在各种收敛意义下的收敛速度都是o ( n 一吾) 然而,对于样 本协方差矩阵和w i g n e r 矩阵,精确的收敛速度和最佳的矩条件还是个悬而未决的 公开性问题 1 2 4 线性谱统计量的中心极限定理 正如前面所说,许多多元统计中的重要的统计量可以表示成一些随机矩阵的经 验谱分布的函数事实上,若我们关心的一个总体的参数0 为: 护= f y ( z ) d f ( z ) 令r ( z ) 是随机矩阵的经验谱分布,且其极限谱分布为f ,则为了对0 做统计 推断:我们自然会用下列积分 舀= 八州r ( z ) 可以作为0 的一个估计,这里舀被称为线性谱统计量,r 是由数据集算出的经验 谱分布 9 东北雨范大学博士学位论文 经验谱分布的强相合性也不足以做进一步的统计推断:例如假设检验,构造目 的置信区间等因此,我们需要知道伊的极限分布,即 厂 g 。( 厂) = a 。( 0 一拶) = f ( x ) d g 。( z ) j 其中g n ( z ) = q 。( 只。( z ) 一f ( z ) ) :口。一。是一个适当的标准化因子( 刻画收敛速 度) ,使得g 。( 厂) 收敛到一个非退化的分布 人们自然会想到直接寻找经验谱过程g 。( z ) = 0 = 。( e 。( z ) 一f ( z ) ) 的极限过程 附以s k o r o k h o d 度量g 。( z ) 可以看做是函数度量空间c 空间或者d 空间的一个 随机元若存在o z 竹,使得g t 。( z ) 收敛到一个极限过程g ( z ) ,则其线性谱统计量的 极限分布便可以推导出来但是不幸的是许多结果表明g ,;( f ) 不能在任何度量空 间中收敛。在b a i ,s i l v e r s t e i n ( 2 0 0 4 ) 中表明对任意的口。,g ,“z ) 都不弱收敛这种 现象也出现在别的随机矩阵中,读者可参见d i a c o n i s ,e v a n s ( 2 0 0 1 ) 因此,我们只能转而寻找适当的标准化因子o 。和核函数。,研究g 。( j r ) 本身的 收敛性由h e l l y - b r a v 定理知,g 。( z ) 弱收敛等价于对任意有界连续的,有g 。( ,) 收敛:故我们只能缩小,的范围 数字模拟结果表示n n = ( = ) ( n ) ,一般地,大家都考虑a 。= 礼j o n s s o n ( 1 9 8 2 ) 在f ( x ) = x ,样本协方阵为w i s h a r t 矩阵时,证得了线性谱统计量g ( 厂) 的中心 极限定理关于w i g - h e r 矩阵类似的结果被s i n a i ,s o s m i k o v ( 1 9 9 8 ) 证得后来 j o h a n s s o n ( 1 9 9 8 ) 在密度假设下,证明了w i g n e r 矩阵的线性谱统计量的中心极限 定理 b a i ,y a o ( 2 0 0 5 ) 证明了,当,是包含区间 一2 ,2 的复区域上的解析函数时, w i g n e r 矩阵的线性谱统计量g n ( 厂) 收敛到高斯过程g ( ,) b a i ,w a n g 和z h o u ( 2 0 0 9 ) 把该结果推广到f c 4 的情形关于其他矩阵的中心极限定理,可参见 a n d e r s o n ,z e i t o u n i ( 2 0 0 6 ) b a i ,s i l v c r s t e i n ( 2 0 0 4 ) 证明了,当,是包含区间f n ,b 的复乎面上的解析函数 时,样本协方差矩阵的线性谱统计量收敛到高斯过程然而核函数,解析的条件似 乎有些苛刻,许多实际中的函数并不是解析函数为了更广泛的应用,本文考虑核 函数是定义在包含 a ,b 的实轴上的四阶连续可导的函数我们证明了,c 4 时, 线性谱统计量瓯( ,) 弱收敛到高斯过程g ( 厂) ,并且给出了该极限过程的均值茵数 和协方差函数的显式表达式 1 0 东北师范大学博士学位论文 以上我们简要介绍了关于大维随机矩阵的一些主要研究结果,读者通过参阅 b a i ( 2 0 0 6 ) ,m e h t a ( 1 9 9 0 ) ,g i r k o ( 1 9 9 0 ) 等关于大维随机矩阵的书籍可以了解更详 细,更丰富的内容 1 3 本文研究内容和结构安排 本文的研究内容与结构安排如下: 第一章”引言”,介绍大维随机矩阵尤其是大维样本协方差矩阵的意义及我们 面临的困难阐明了当今现代科技许多重大问题都急需大维随机矩阵理论去支持 另外给出了关于大维随机矩阵的文献综述,简要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论