(概率论与数理统计专业论文)用主成分回归分析森林中蝙蝠活动数据.pdf_第1页
(概率论与数理统计专业论文)用主成分回归分析森林中蝙蝠活动数据.pdf_第2页
(概率论与数理统计专业论文)用主成分回归分析森林中蝙蝠活动数据.pdf_第3页
(概率论与数理统计专业论文)用主成分回归分析森林中蝙蝠活动数据.pdf_第4页
(概率论与数理统计专业论文)用主成分回归分析森林中蝙蝠活动数据.pdf_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

册iiii iii i i111 1i i iiiii 、t18 0 5 6 9 1 独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作 所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集 体,均已在文中作了明确的说明。本声明的法律结果由本人承担。 学位论文作者签名:抽望型壬 日期:丝左:笸z 学位论文使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定, 即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和 电子版,允许论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段 保存、汇编本学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:盘竺竺呷 指导教师签名: e t 期:丝21 :舌7 e t 期: 学位论文作 工作单位: 通讯地址: 者毕业后去向: 出孕箜短笔复譬丝 茎碰垒f 塑! 三善 电话:壁趔o 邮编:么兰趁丝 摘要 对于经典回归分析模型来说,人们一般都是假定其响应变量为连续型变量。但在对 实际的问题分析过程中,常常会遇到响应变量可能是以离散计数的方式描述的离散型变 量。分析这种离散计数响应变量的影响因素的模型被称为计数模型( c o u n tm o d e l ) 。解 决这种模型的方法有p o i s s o n 回归模型、负二项回归模型、p a n e l 方法和仿最大似然法 等。其中,基于p o i s s o n 分布的p o i s s o n 回归模型是在研究计数模型问题中应用的非常 广泛。有时,影响这种离散计数响应变量的解释变量个数较多,势必会增加分析问题的 复杂性。如何能在基本保证原始解释变量信息的基础上,使分析的复杂程度降低? 本文先以在统计分析中常用的降维手段一主成分分析( p c a ) 为基础,把原始的多 个解释变量用较少的几个综合变量来代替,在保证原始解释变量的信息基本不变的基础 上,减少了变量的个数,把高维的解释变量降低了维数。然后对离散型的响应变量与这 几个综合的解释变量,所构成的计数模型,利用p o i s s o n 回归做拟合,建立响应变量的 最终预测的模型。这样,即保证了原始解释变量的信息基本不变,又使原来较复杂的回 归分析过程,得到了一定的简化。 关键词:计数模型;主成分分析;p o i s s o n 回归:应用 a b s t r a c t r e g a r d i n gt h ec l a s s i c a lm o d e l so fr e g r e s s i o na n a l y s i s ,p e o p l eg e n e r a l l ya s s u m et h a ti t s r e s p o n s ev a r i a b l ei st h ec o n t i n u a lv a r i a b l e b u ti nt h ep r o c e s so ft h ea c t u a lp r o b l e ma n a l y s i s , w ea l w a y sm e e tt h a tt h er e s p o n s ev a r i a b l ep o s s i b l yd e s c r i p t sv a r i a b l ed i s p e r s a n c yi nt h ew a y o fs e p a r a t e dc o u n t i n g a n a l y z i n gt h i sk i n do fm o d e lo ft h ei n f l u e n c i n gf a c t o ro fs e p a r a t e c o u n t i n gv a r i a b l ei sc a l l e dt h ec o u n tm o d e l ( c o u n tm o d e l ) t os o l v et h i sm o d e l ,t h e r ea r e m e t h o d so fp o i s s o nr e g r e s s i o nm o d e l ,t h en e g a t i v eb i n o m i a lr e g r e s s i o nm o d e l ,t h ep a n e l m e t h o d , t h em a x i m u ml i k e l i h o o dm e t h o da n ds oo n a n d ,r e g r e s s i o nm o d e lb a s e d0 1 1t h e d i s t r i b u t e dp o i s s o ni si n w i d e s p r e a du s ei nt h er e s e a r c ho fc o u n t i n gm o d e lq u e s t i o n s o m e t i m e s ,t h ee x p l a n a t o r yv a r i a b l ew h i c ha f f e c tt h i sk i n do fs e p a r a t ec o u n t i n gv a r i a b l ei ss o m a n yt h a ti n e v i t a b l yi n c r e a s et h ec o m p l e x i t yo fa n a l y z i n gt h eq u e s t i o n h o wt oc a u s et h e c o m p l e xd e g r e eo fa n a l y s i st or e d u c ei nt h eb a s i cg u a r a n t e eo fp r i m i t i v ee x p l a n a t o r y v a r i a b l e i n f o r m a t i o nf o u n d a t i o n ? t h i sa r t i c l ef i r s tt a k i n gt h ec o m m o nd i m e n s i o n a l i t yr e d u c t i o nm e t h o do fs t a t i s t i c a l a n a l y s i s - p r i n c i p a lc o m p o n e n t sa n a l y s i s ( p c a ) a saf o u n d a t i o n , r e p l a c e s t h e p r i m i t i v e e x p l a n a t o r yv a r i a b l ew i t ht h ef e ws e v e r a la g g r e g a t ev a r i a b l e s ,i nt h eg u a r a n t e eo fp r i m i t i v e e x p l a n a t o r yv a r i a b l e si n f o r m a t i o nb a s i ci n v a r i a b l ef o u n d a t i o n ,r e d u c i n gt h ev a r i a b l ei n t e g e r , r e d u c e st h ed i m e n s i o nt h eh i g hu y g u r se x p l a n a t o r yv a r i a b l e t h e nc o m b i n i n gt h ed i s p e r s a n c y r e s p o n s ev a r i a b l ew i t ht h e s ec o m p r e h e n s i v ee x p l a n a t o r yv a r i a b l e ,f i n a l l ye s t a b l i s h e sm o d e l w h i c ht h er e s p o n s ev a r i a b l ef o r e c a s t t h u s ,i tn a m e l yh a sg u a r a n t e e db a s i ci n v a r i a b l eo ft h e p r i m i t i v ee x p l a n a t o r yv a r i a b l ei n f o r m a t i o n , a l s oc a u s e so r i g i n a l l yt h ec o m p l e xr e g r e s s i o n a n a l y s i sp r o c e s s ,o b t a i n i n gc e r t a i ns i m p l i f i c a t i o n k e yw o r d s :c o u n tm o d e l ;p r i n c i p a lc o m p o n e n t sa n a l y s i s ;p o i s s o nr e g r e s s i o n ; u s i n g i i 中文摘要 英文摘要 目 录 引言 第一章回顾主成分分析的方法 第二章用主成分回归分析森林 结语 参考文献 后记 i i i 东北师范大学硕士学位论文 引言 多元统计分析是数理统计学近几十年来迅速发展起来的一个分支。它是运用数理统 计的方法来研究多变量问题的理论和方法,是一元统计学的推广。回归分析方法是多元 统计分析的各种方法中应用最广泛的一种,它是处理多个变量间相互依赖关系的一种数 理统计方法。多元回归分析是在众多相关的变量中,根据实际问题的需要,考查其中某 一个变量( 常称为响应变量或因变量) 与其余多个变量( 称为解释变量或自变量) 的相 互依赖关系。 在对实际的问题分析过程中,常常会遇到响应变量可能是以离散的计数的方式描 述。如发生交通事故的次数;一届奥运会上某个国家获得的奖牌数等,这些都是以整数 计数的形式出现的。分析这种离散计数响应变量的影响因素的模型被称为计数模型 ( c o u n tw o d e l ) 。习 该数据模型是人们通过试验、调研等得到一组代表响应变量的数字,如0 ,3 ,5 ,4 , 2 ,以及相应的解释变量的观察值。由于在一般的计数模型中的绝对值较小的数据频 繁出现,而且数据的离散特性非常明显。应用经典回归分析的方法很难对所有解释变量 的值提供最好的分析。因此,很多学者在对计数数据模型的处理方面,提出了一些方法。 这其中包括g i l b e r t 在1 9 7 9 年提出了p o i s s o n 回归模型;h a u s m a n ,h a l l 和g r i l i c h e s 在1 9 8 4 年提出了负二项回归模型和p a n e l 方法;g o u r i e r ,m o n f o r t 和t r o g o n o n 在1 9 8 4 年提出了仿最大似然法。口1 计数模型中的响应变量有很多机会取o 值,所以不能对它取对数,一个有效的方法 是将期望值模型化为一个指数函数: e ( yi 墨,置,j 1 ) = e x p ( p o + 届x 1 + 屈x 2 + + 屏以) 由于e x p ( ) 总是正的,所以上式确保了】,的预测值也总是正的。我们可以再对上式两边 取对数: l n e ( rx l ,x 2 ,x i ) 】= p o + 屈x l + 展x 2 + + 展叉i 上式表明j ,的条件期望的对数是线性的,并且: z k g ( y ix ) p jix e ( yi 义) 。7 这就表明给定x ,提高一个单位,e ( ylx ) 变化为fx 1 0 0 。如果x t 为非连续变量,如 何解释x 。的变化对e ( yx ) 的偏效应? 保持除x 。外所有的解释变量不变,令肆为其初 东北师范大学硕士学位论文 始值,x :其变化后的取值,于是: i n e ( rx l ,x 2 ,x :) l - l n e ( rx l ,x 2 ,x ? ) 】= 屈从i h l i 黜e ( y o i = 展峨lx ) j 当赵。= x :一x := l 时 墨到塑:轳咄 e ( r ox ) 竺型望:口展咄一1 e ( 】,ix ) a e ( r lx ) :p 晟- 1 e ( yix ) 这样,我们就建立了计数数据模型。h 对于在某个时间、空间等范围之内事情发生的计数数据,一般都认为其近似服从 p o i s s o n 分布,因此基于p o i s s o n 分布建立的p o i s s o n 回归分析方法在计数模型中应用 非常广泛。该模型的初始方程是p o i s s o n 分布的概率密度函数: ,七 p ( 】,= 七1 - 竺p 以j i = o ,l ,2 , 、 七! 其中,e ( r ) = 允,r a r ( r ) = 五。七表示事件实际观测到的发生次数。 p o i s s o n 回归模型的研究可以从其概率密度方程中的参数五着手。所考察的事件在一定 范围内平均发生的次数( 五) ,受到解释变量x 的影响,因此参数是变化的,经过对数 变换,就可以得到p o i s s o n 回归模型。 有时,影响离散计数响应变量的解释变量个数太多,并且彼此之间存在着一定的相 关性,因而使得所观测到的数据在一定程度上反映的信息有所重叠。而且当变量个数较 多时,在高维空间中研究样本的分布规律比较复杂,会增加分析问题的复杂性。因此, 我们希望用较少的综合变量来代替原来较多的变量;而这几个综合变量又能够尽可能多 地反映原来变量的信息,并且彼此之间互不相关。主成分分析法是一种有效的降维方法。 啼3 所以,对于解释变量较多的计数模型,我们可以考虑先用主成分分析把多个解释变量 用较少的综合变量来代替,再结合响应变量做p o i s s o n 回归分析。 本文第一章对主成分分析进行了回顾,给出主成分的基本思想及计算方法;并对 p o i s s o n 回归进行阐述,从理论上给出了研究问题的前提条件。第二章给出了用主成分 回归分析具体实例。 2 东北师范大学硕士学位论文 第一章回顾主成分分析的方法和p o i s s o n 回归模型 第一节主成分分析的基本思想 主成分分析又称主分量分析或主轴分析。是将多指标化为少数几个综合指标的一种 统计分析方法。当某一数据中有多个指标时,我们并不对这些指标个别处理,而是在力 保数据信息丢失最少的的原则下,对这种多指标的数据进行最佳综合简化,也就是说, 对高维变量空间进行降维处理。它是一种基于相关系数矩阵对信息进行处理、压缩和提 取的有效方法。主成分这个概念由k a r lp e a r s o n 在1 9 0 1 年首先引入,后来被h o t e l l i n g 在1 9 3 3 年推广到了随机变量中。嘲 1 主成分的几何意义:【7 】 假如有一个二维数据表,表中数据点的分布如图( a ) 所示,呈椭圆形,重心是g , 很明显,在沿“,轴的方向上,数据的离差最大,因此,所反映的数据信息也最多,这个 方向被称为数据变异的最大方向。如果将原点平移到g ,并作旋转变换,即得到一个正 交坐标系“倒,可以看出,若省略“,轴,将数据点在“,轴上投影,就会得到一个简化 的一维数据系统。因此,降维处理的核心思想,就是省却变异不大的变量方向。又如, 一个三维数据群点的分布是球形的,如图( b ) 。假设这个球是饼形的,其变异较大的方 向为“,“,而“,方向的变异很小,即在该方向各样本点取值没有很大差别,就可以不 考虑“,方向。若以“,g u :作为新坐标系,则原三维空间的数据点就可以在二维平面上得 以显示,如图( c ) 所示。 设 jl u 2 r :_ ?:。、 、屯:o l : :g 二:一, x l ( a ) ( b ) 0 是未知参数, 当盯2 = 1 时,我们便得到p o i s s o n 方差假定; 当仃2 1 时,方差对所有x 都大于均值,此时方差比p o i s s o n 形式的方差大,被称为过 分分散; 当盯2 7 0 9 6 ,所以选择前七个主成分就可以了。 9 东北师范大学硕士学位论文 变量c o m p lc o m p 2 c o m p 3c o m p 4 c o m p 5c o m p 6 c o m p 7 x 1- 0 1 4 9 0 0 3 - 0 2 1 5 5 4 70 2 1 6 6 9 10 3 4 1 9 7 30 0 3 6 7 1 20 1 0 4 3 4 6- 0 0 6 8 9 1 1 x 2 - 0 1 6 7 5 1 8- 0 2 3 7 0 9 90 1 9 9 1 4 00 2 7 5 3 1 50 0 5 6 8 6 10 1 2 9 3 3 3- 0 0 8 0 7 4 0 x 30 0 4 0 1 1 0- 0 0 4 8 7 5 40 1 4 2 9 3 4 0 3 8 4 8 0 6 - 0 0 8 7 0 8 8- 0 1 2 5 0 9 30 0 5 0 7 0 1 x 4- 0 1 7 5 2 8 8 0 1 2 9 1 7 00 2 1 0 3 8 90 3 0 7 3 2 50 0 3 0 6 0 00 2 4 2 3 7 9 - 0 1 0 6 9 8 6 x 50 0 4 7 2 1 0 0 0 2 1 9 8 10 0 4 1 3 0 40 1 1 4 6 4 10 3 3 9 3 7 8- 0 0 2 2 6 0 4- 0 1 7 4 5 5 0 x 6 0 2 5 9 8 7 4- 0 2 4 6 4 1 20 1 9 2 7 3 50 1 4 4 7 9 40 0 4 3 8 3 40 1 2 2 3 1 20 0 9 2 4 4 2 x 70 3 0 0 9 9 4- 0 0 2 0 6 2 5- 0 2 0 3 7 1 00 0 2 0 7 6 20 1 4 1 1 3 60 0 3 9 1 0 80 2 4 1 8 9 8 x 80 1 2 8 8 5 4o 3 1 0 6 6 1- 0 0 5 2 6 6 10 1 6 9 3 6 6- 0 1 7 5 0 6 10 2 6 4 7 6 4- 0 1 7 2 0 0 1 x 90 2 2 9 8 6 40 0 9 0 9 3 9 - 0 1 6 6 1 6 80 2 7 0 6 8 9o 1 1 5 0 3 0 0 1 0 4 7 0 8 0 2 7 8 8 9 9 x l o 0 2 9 9 1 5 5- 0 1 4 5 4 0 40 0 7 6 5 2 6o 2 2 1 7 8 1- 0 0 3 8 9 7 00 0 1 4 6 1 30 1 8 7 2 3 2 x 1 1 0 2 6 7 5 8 8- 0 1 7 6 1 8 5一o 2 1 0 4 9 90 1 8 4 3 8 30 0 0 5 1 8 20 1 9 4 8 0 30 0 6 8 2 6 8 x 1 20 0 2 5 0 9 00 3 4 0 3 5 50 2 6 4 8 6 20 0 4 6 7 0 90 0 7 7 5 4 90 2 5 6 7 3 50 1 2 4 8 1 0 x 1 30 0 0 5 4 7 40 3 6 3 7 7 30 1 2 5 3 2 60 1 9 2 4 2 3- 0 0 2 1 4 6 4一o 2 1 2 1 1 60 1 0 2 4 6 0 x 1 40 0 1 2 7 6 20 3 2 7 4 4 1- 0 0 6 2 1 9 50 1 6 1 6 4 5- 0 1 7 2 7 9 90 3 0 7 5 3 4- 0 1 1 3 3 3 3 x 1 50 0 0 3 7 5 30 0 2 3 8 4 10 3 4 2 5 8 4 - 0 0 8 0 7 0 80 2 9 0 6 1 50 0 4 5 3 4 90 1 8 2 2 7 2 x 1 60 1 2 0 2 2 2o 0 9 1 7 5 60 2 8 6 2 7 3 - 0 0 9 2 9 1 50 3 8 6 0 1 20 0 1 0 5 4 40 2 4 6 6 7 7 x 1 7 - 0 3 0 0 3 2 30 1 6 7 2 3 l- 0 1 3 5 0 8 50 0 5 5 3 0 4o 1 8 1 0 3 3o 1 1 2 6 1 90 0 4 4 0 3 6 x 1 8- 0 1 9 1 5 2 80 2 5 1 9 3 70 0 6 3 3 8 3- 0 2 3 3 9 1 80 0 4 3 9 1 20 0 1 7 7 8 10 1 5 7 9 8 8 x 1 9- 0 2 9 9 4 4 20 0 1 3 6 7 0- 0 1 9 9 7 4 20 0 3 3 5 2 80 1 3 2 7 3 80 0 7 3 5 4 80 2 4 7 2 9 2 x 2 0- 0 0 0 0 1 6 90 0 0 5 5 0 1- 0 2 9 0 2 7 20 0 0 5 3 9 80 3 5 4 5 9 2- 0 1 3 4 0 2 8- 0 3 0 0 3 5 9 x 2 l- 0 1 6 3 3 9 10 2 0 6 8 6 60 1 6 6 6 6 00 1 1 0 9 8 1- 0 0 4 2 4 2 2- 0 2 4 5 4 4 40 。3 5 7 7 7 9 x 2 2- 0 1 7 0 3 8 80 2 4 7 1 7 3- 0 1 1 5 8 3 60 1 7 3 9 9 40 1 7 0 3 3 40 2 3 8 0 0 90 2 3 7 4 3 6 x 2 30 2 1 1 9 4 20 0 5 8 0 0 00 0 7 4 7 6 3- 0 1 3 9 5 2 9 o 3 9 1 7 5 90 0 5 7 4 3 0- 0 1 7 7 8 7 0 x 2 4- 0 3 5 5 5 3 90 0 2 4 1 1 0- 0 1 2 4 4 3 7 0 0 0 7 6 0 4- 0 0 8 9 4 2 1- 0 0 6 5 5 9 70 0 4 9 3 4 0 x 2 50 0 1 2 9 9 00 0 6 6 9 5 6o 3 0 1 5 7 7 0 0 0 5 6 1 0- 0 3 3 4 3 4 70 1 6 9 8 2 70 0 3 6 1 5 2 x 2 6- 0 2 0 7 2 0 80 0 6 2 9 4 1 0 1 6 1 3 9 1 - 0 0 5 2 0 2 30 0 9 6 8 7 50 1 8 2 0 2 40 1 9 5 0 5 0 x 2 7- 0 0 3 6 8 2 60 1 8 2 0 8 8- 0 1 7 1 6 7 9o 1 1 7 4 2 10 0 1 5 7 4 8- 0 4 1 8 2 5 50 1 3 5 9 1 7 x 2 8- 0 0 4 9 9 7 70 1 2 0 4 9 2 0 2 0 1 9 6 7 0 1 9 3 6 2 70 1 4 2 7 0 0- 0 0 7 6 8 7 4 - 0 3 0 1 1 5 2 x 2 90 1 3 4 8 3 80 1 7 8 9 2 50 0 0 6 7 8 3- 0 1 1 0 8 8 5 0 0 5 2 1 1 0 0 3 3 8 6 9 3 0 1 5 3 1 2 0 x 3 00 0 4 9 7 4 80 0 8 7 5 8 40 0 5 2 5 0 8- 0 2 7 7 8 6 3 - 0 1 4 0 7 8 20 1 8 8 9 8 10 1 6 8 5 9 5 表3 2 表3 - 2 给出了前7 个主成分的载荷系数( x l x 3 0 分别代表标准化的原始数据中的“昆虫 总数量”到“月相 ) ,据此可以写出由标准化变量所表达的各主成分的关系式,并分析 主成分的含义。 c o m 0 1 = - 0 1 4 9 0 0 3 x 1 - 0 1 6 7 5 1 8 x 2 + 0 0 4 0 11 0 x 3 0 1 7 5 2 8 8 x 4 + + 0 ,1 3 4 8 3 8 x 2 9 + o 0 4 9 7 4 8 x 3 0 1 0 东北师范大学硕士学位论文 c o m p 2 = - o 2 1 5 5 4 7 x l 一0 2 3 7 0 9 9 x 2 0 0 4 8 7 5 4 x 3 0 1 2 9 1 7 0 x 4 + + o 1 7 8 9 2 5 x 2 9 0 0 8 7 5 8 4 x 3 0 c o m p 3 = 0 2 1 6 6 9 1 x i + 0 1 9 9 1 4 0 x 2 + o 1 4 2 9 3 4 x 3 + o 2 1 0 3 8 9 x 4 + + o 0 0 6 7 8 3 x 2 9 + 0 0 5 2 5 0 8 x 3 0 c o m p 4 = 0 3 4 1 9 7 3 x i + 0 2 7 5 3 1 5 x 2 + 0 3 8 4 8 0 6 x 3 + o 3 0 7 3 2 5 x 4 + 一0 i i 0 8 8 5 x 2 9 0 2 7 7 8 6 3 x 3 0 c o m p 5 = 0 0 3 6 7 1 2 x i + 0 0 5 6 8 6 1 x 2 0 0 8 7 0 8 8 x 3 + 0 0 3 0 6 0 0 x 4 + + o 0 5 2 1 1 0 x 2 9 0 1 4 0 7 8 2 x 3 0 c o m p 6 = 0 1 0 4 3 4 6 x i + 0 1 2 9 3 3 3 x 2 0 1 2 5 0 9 3 x 3 + o 2 4 2 3 7 9 x 4 + + 0 3 3 8 6 9 3 x 2 9 + 0 1 8 8 9 8 1 x 3 0 c o r a p 7 = 一0 0 6 8 9 1 1 x i 一0 0 8 0 7 4 0 x 2 + 0 0 5 0 7 0 1 x 3 0 1 0 6 9 8 6 x 4 + 一0 1 5 3 1 2 0 x 2 9 + o 1 6 8 5 9 5 x 3 0 主成分1 ( c o m p l ) 是x 1 ,x 2 ,x 3 ,x 4 ,x 2 9 ,x 3 0 的线性组合,组合系数就是载荷,也 是解释变量的权重,是表2 - 2 中的第1 列,按照绝对值从大小排列, x 2 4 ,x 7 ,x 1 7 ,x 1 9 ,x i o ,x i i ,绝对值大的x 值对主成分1 重要程度大,忽略绝对值 小于0 1 的小量,则系数绝对值大小几乎都在o 1 5 到o 4 之间,符号的不同说明与主成 分的正负相关性,如当x 2 4 ,x 7 ,x 1 7 ,x 1 9 减少,x l o ,x 11 增加时主成分1 ( c o m p l ) 增加, 所以主成分反映了变量x 2 4 ,x 7 ,x 1 7 ,x 1 9 负相关与x l o ,x l l 正相关的一个量,x 2 4 是坡度 x 7 是灌木树x 1 7 是灌溉x 1 9 是亚乔数,而x i o 是乔高,x 1 1 是冠下高,灌木木越密集的 地方乔木可能不会多,乔高也不会很高,我们可以推测出c o m p l 是反映的是偏矮树木的 稀疏程度和偏高树木的密集程度。说明c o m p l 越大,树木可能高且稀疏。 对于主成分2 ( c o m p 2 ) ,我们去掉权重系数即载荷较小的量,我们得到是关于解释 变量x 1 3 ,x 1 2 ,x 1 4 ,x 8 ,x 1 8 ,x 2 2 ,x 2 1 的一个线性组合:而x 1 3 东西冠,x 1 2 指的是南 北冠,x 1 4 指的是亚乔数量,x 8 指的是灌木高,x 1 8 指的是乔木数,x 2 2 是郁闭度,x 2 1 是倒木数,我们知道主成分2 与x1 3 ,x 1 2 ,x 1 4 ,x 8 ,x 2 2 ,正相关,与x 1 8 是负相关。 可以猜测出主成分说明反映的是树木的密集程度。c o m p 2 越大,说明树木矮且密集。 对于主成分3 ( c o m p 3 ) ,同样去掉载荷系数较少的自变量,我们可以得到x 1 5 ,x 2 5 , x 2 0 ,x 1 6 ,x 1 2 ,x l 这些解释变量,x 1 5 指的是草高,x 2 5 指的是坡向,x 2 0 指的是s i m p o n ,x 1 6 指的是草盖,x 1 2 指的是南北冠,x 1 指的是昆虫总数量,可以看出主成分3 ( c o m p 3 ) 与x 2 0 正相关,与x 1 5 ,x 2 5 ,x 1 6 ,x 1 2 ,x l 负相关,由于s i m p s o n 指的是物种多样性, 故可推测出c o m p 3 反映的是草地和昆虫数目的稀疏程度。c o m p 3 越大,说明草地和昆虫 数越少。 对于主成分4 ( c o m p 4 ) ,我们也把载荷系数较少的解释变量去掉,我们可以得到x 3 , x 1 ,x 4 ,x 3 0 ,x 2 ,x 9 ;x 3 指的是膜翅目数量,x 1 指的是昆虫总量,x 4 指的是昆虫 s i m p s o n ,x 3 0 指的是月相,x 2 指的是鳞翅目树木,x 9 指的是树干周长,x 3 指的是鞘翅 目的数量。主成分4 与x 3 ,x 1 ,x 4 ,x 2 ,x 9 正相关,与x 3 0 负相关,可以推测出主成 分4 反应的是昆虫数目的大小,可以这样说,昆虫数目越多,c o m p 4 越大。 主成分5 ( c o m p 5 ) 的载荷是表2 2 中的第5 列,按照绝对值从大小排列, x 2 3 ,x 1 6 ,x 2 0 ,x 5 ,x 2 5 ,x 1 5 ,忽略绝对值小的量,符号的不同说明与主成分的正负相 关性,如当x 2 3 ,x 1 6 ,x 2 0 ,x 5 增加,x 2 5 ,x 1 5 减少时主成分增加,所以主成分5 反映了变 量x 2 3 ,x 1 6 ,x 2 0 ,x 5 ,x 1 5 与x 2 5 相反的个量,x 2 3 代表海拔,x 1 6 代表草盖,x 2 0 代表 s i m p s o n ,x 5 代表昆s i m p s o n ,x 2 5 坡向,x 1 5 草高,也就是c o m p 5 与海拔,草盖,物种间 多样性s i m p s o n 指数,昆虫多样性s i m p s o n 指数,草高成正相关,与坡向成负相关,由 1 1 东北师范大学硕士学位论文 于草的覆盖程度广,则草就有可能高,昆虫的多样性就高,所以物种的多样性就高,而 坡向越陡峭,则物种的多样性就可能受到限制,又海拔越高,就越可能坡向陡峭,所以 推测主成分5 是物种多样性与海拔的和,表示海拔越高多样性越高的量。 对于主成分6 ( c o m p 6 ) ,同样去掉载荷系数较少的解释变量;我们可以得到x 2 7 , x 2 9 ,x 1 4 ,x 8 ,x 1 2 ,x 2 1 ,x 4 ,x 2 7 指的是风速,x 2 9 指的是湿度,x 1 4 指的是亚乔数量, x 8 指的是灌木高,x 1 2 指的是南北冠,x 2 1 指的是倒木数,x 4 指的是膜翅目数目。主成 分6 与x 2 7 ,x 1 2 ,x 2 1 是负相关,与x 2 9 ,x 1 4 ,x 8 ,x 4 正相关。可以推测出主成分6 是反映天气的指标,当c o m p 6 越大时,可以推测出湿度越大,风速小。 主成分7 ( c o m p 7 ) 的载荷是表2 - 2 中的第7 列,按照绝对值从大小排列, x 2 1 ,x 2 8 ,x 2 0 ,x 9 ,x 1 9 ,x 1 6 ,o ,忽略绝对值小的量,符号的不同说明与主成分的正负相 关性,如当x 9 ,x 1 9 ,x 1 6 增加,x 2 1 ,x 1 2 8 ,x 2 0 减少时主成分增加,所以主成分7 反映了 变量x 9 ,x 1 9 ,x 1 6 与x 2 1 ,x 1 2 8 ,x 2 0 相反的一个量,x 2 1 代表倒木数,x 2 8 代表温度,x 2 0 代表s i m p s o n ,x 9 代表树干周长,x 1 9 代表亚乔树,x 1 6 草盖,也就是c o m p 5 与倒木数, 温度,物种问多样性s i m p s o n 指数成正相关,与树干周长,亚乔树,草盖成负相关,由 于温度越高,则物种多样性就可能越多,倒树木可能越多,而树干周长越长,则可能越 茂盛,草盖就越广,亚乔树越多,所以推测主成分7 是温度产生的多样性与植被茂盛程 度的差,显然温度很高的热带雨林和同样温度很高的沙漠,植被茂盛程度的不同,多样 性相差很大。 下面给出了主成分1 到5 的自变量载荷图: 硝6脚 埒,2 5 图3 2 主成分前面的载荷图 从图3 - 2 中可以清楚的看出主成分与解释变量的相关性,如c o m p l 与变量 x 2 4 ,x 7 ,x 1 7 ,x 1 9 负相关与x l o ,x ll 正相关,这五个变量与主成分相关系数的绝对值有微 弱的递减趋势,并且大体相同,说明主成分1 中这五个解释变量的作用比较大,互相的 1 2 j叫,挈翻,副j酬,副刮掣1刮 东北师范大学硕士学位论文 作用几乎相同,解释变量不同在主成分因子中作用是不同的,如x 2 4 在主成分1 中所占 的比重较大,但在其他的主成分中所占比重较小。 对数据x 1 ,x 3 0 线性变换为主成分c o r n p 1 ,c o m p 7 的数据: c o m p 1c o m p 2c o t n p 3 c o m p 4 c o m p 5c o m p 6c o m p 7 1 ,- 0 3 4 9 4 3 1 9 2 7 4 4 8 3 5 0 2 0 5 7 7 0 3 2 9 7 6 6 5 7 0 5 93 5 2 5 9 3 5 1 2 6 0 3 4 8 1 1 0 4 9 0 2 4 1 0 2 。 1 4 3 0 9 2 6 6 3 1 8 4 9 8 9 6 28 6 7 4 4 9 2 6 2 0 9 7 7 9 03 6 9 1 4 1 8 1 1 4 2 5 3 4 1 9 3 7 8 6 6 0 6 3 3 , - 1 3 2 5 3 9 5 3 7 - 4 1 3 7 7 2 1 3 - 3 5 5 0 0 0 5 7 1 4 1 3 8 7 2 5 3 63 4 4 8 2 1 4 1 3 5 0 6 8 8 2 2 7 5 8 7 6 3 7 6 4 , 2 5 2 7 8 4 7 , t 2 21 6 9 0 4 7 5 4 511 5 2 1 7 9 2 4 2 0 4 9 4 6 5 1 9 35 2 2 7 2 5 8 2 3 9 4 7 2 9 1 3 9 2 2 0 6 1 4 9 5 , 8 8 5 3 9 4 6 2 6 - 2 4 7 1 4 8 6 6 - 6 5 1 1 0 4 1 7 1 6 6 5 7 6 0 3 1 14 4 4 4 1 8 1 - 2 0 1 5 4 0 7 1 2 2 9 3 7 3 3 4 2 1 6 , - 4 0 3 4 4 7 6 3 8 - 5 4 7 4 2 5 64 6 0 7 9 6 1 7 7 5 8 5 6 0 0 3 04 5 4 8 1 7 8 - 1 4 4 2 3 5 2 1 1 9 4 5 7 6 4 0 9 7 。 - 2 1 6 2 8 8 6 7 51 1 9 1 2 7 7 1 5 7 6 4 9 6 9 0 , t 3 5 2 4 9 7 9 54 6 6 1 8 5 5 - 1 4 3 2 3 3 32 4 2 7 4 4 9 0 0 4 8 , - 4 7 3 4 7 0 3 3 2 3 2 0 3 6 4 46 1 7 8 9 1 2 57 8 9 3 3 3 3 0 34 4 0 1 6 5 5 - 1 7 0 7 7 9 2- 0 0 4 5 8 7 9 51 9 , - 7 4 7 7 3 6 4 8 3 - 4 3 5 0 0 8 8 3 5 2 8 9 0 1 91 7 1 8 3 6 3 5 0 34 3 4 11 , t 5 1 4 5 7 4 6 6 1 9 0 0 0 9 0 5 7 3 1 0 , - 7 1 7 3 8 7 8 2 71 1 6 9 8 5 8 2 92 2 0 2 1 0 6 0 5 3 6 9 5 2 8 9 2 83 5 9 6 9 2 5 - 2 0 5 2 6 3 7 7 9 9 0 2 5 4 8 6 3 1 l , - 4 3 8 8 3 9 1 2 61 3 7 8 0 7 2 6 22 7 9 9 4 9 4 0 9 - 2 9 3 9 8 2 0 5 3 33 8 4 4 6 1 0 - 1 2 3 5 4 7 3 1 2 9 5 5 4 2 7 7 7 7 t 2 , - 1 6 1 8 4 4 7 0 1 1 - 3 3 5 8 8 8 7 58 7 6 3 9 3 0 81 2 0 3 7 2 3 9 6 03 5 6 4 5 7 9 - 1 2 6 5 1 1 0 6 6 6 9 0 3 6 3 1 9 i t 3 。 - 1 2 9 1 4 7 2 3 1 52 3 4 2 6 4 0 61 4 1 6 1 1 4 0 8 4 9 6 6 2 1 5 9 33 5 7 4 4 4 4 - 1 5 6 4 3 4 27 3 5 1 3 9 5 0 5 4 1 4 , - 1 7 0 。0 2 5 4 7 8 3 - 4 1 7 9 5 7 7 97 0 1 1 9 6 7 1 1 6 2 4 3 6 4 4 3 03 4 6 1 7 6 0 1 2 0 8 8 2 74 7 6 9 6 3 0 5 9 7 1 5 , - 1 1 1 1 9 8 2 1 0 8 5 3 0 9 3 9 86 4 3 1 4 1 8 31 4 0 4 5 9 3 3 4 03 6 3 8 8 6 7 - 1 7 9 4 5 7 34 3 3 5 1 3 6 9 0 6 1 6 , - 1 1 9 4 1 7 6 9 4 6 - 4 9 8 9 7 6 7 22 1 4 0 4 6 5 5 1 0 8 1 5 7 0 2 9 43 9 5 1 2 7 5 1 1 4 9 6 7 77 8 0 3 6 1 5 1 0 6 c 1 7 , - 1 2 7 9 3 1 0 5 6 8 - 1 7 8 4 4 6 1 04 0 5 7 4 4 6 21 7 0 1 6 3 0 3 8 03 5 5 0 9 7 1 1 5 8 0 1 2 3 2 8 6 3 3 7 3 9 7 7 1 8 ,2 7 0 4 0 6 3 8 0 - 2 6 0 4 4 6 3 3 - 1 0 4 5 9 7 1 21 0 0 9 5 2 6 9 3 94 3 9 7 9 8 1 1 7 9 1 5 0 2 7 1 3 5 8 7 1 5 7 7 1 9 。 3 4 5 8 9 8 3 8 5 - 3 9 6 8 1 9 7 7 - 11 0 5 4 4 4 82 7 8 7 2 6 2 0 7 , t 6 0 1 5 2 4 1 4 2 4 9 1 5 - 4 3 4 2 9 5 4 7 4 0 2 0 。7 1 7 5 9 3 6 9 - 5 7 1 9 6 7 5 4 - 4 3 5 3 8 8 9 71 5 2 8 7 9 5 4 9 64 3 3 6 2 5 0 1 6 6 5 9 7 6 8 4 5 6 8 4 0 1 3 4 2 l , - 1 4 7 4 5 7 4 5 7 2 5 4 3 8 6 8 71 3 4 3 9 5 5 6 51 2 0 7 2 2 5 8 5 63 7 4 3 3 1 0 1 5 7 0 5 4 01 0 3 1 9 8 5 1 7 0 3 r 2 2 。 - 1 7 7 4 8 3 8 6 1 2 - 3 8 5 2 1 3 7 48 7 7 8 8 2 1 01 8 8 1 6 1 4 9 1 63 6 2 8 1 6 0 1 2 6 3 9 5 6 8 1 4 0 0 6 9 3 2 3 2 3 。 - 1 7 5 4 6 7 0 1 7 6 - 3 3 6 1 2 7 8 19 5 7 5 9 4 8 21 7 6 3 9 7 4 3 0 43 6 5 5 6 8 3 - 1 3 4 5 4 0 5 8 7 9 8 4 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论