




已阅读5页,还剩97页未读, 继续免费阅读
(生态学专业论文)应用svm预测杜鹃属rhododendron+l在中国的潜在分布中心.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 杜鹃属( r h o d o d e n d r o nl ) 是中国种子植物中最大的属,其现代分布和分化中 心是我国西南部的横断山区和东喜马拉雅地区。我国西部、西南部的云南、四 川、西藏等地共有杜鹃达4 5 0 种,仅特有种就有约3 0 0 种。对杜鹃属分布的深 入研究是横断山区生物多样性保护不可缺少的重要部分。 由于物种分布与环境因子之间存在着紧密的联系,利用环境因子作为预测 物种分布模型的变量是当前最普遍的建模思路。但是绝大多数物种分布预测模 型都遇到了难以解决的“高维小样本一问题一一模型在标本数据不足时无法给 出合理的预测,或者模型无法处理大量的环境变量。机器学习领域的理论和实 践已经证明,基于结构风险最小化原理的支持向量机( s u p p o nv e c t o rm a c h i n e , s v m ) 算法非常适合“高维小样本 的分类问题。为了探索其应用在物种分布预 测问题上的可能性,本文创新性的实现了基于s v m 算法的物种分布预测系统。 然后,本文以3 0 个杜鹃属( r h o d o d e n d r o nl ) 物种为检验对象,利用其标本数据 和1 1 个l k m 的栅格环境变量图层作为模型变量,预测其在中国的潜在分布区。 本文通过全面的模型评估专家评估,r o c ( r e c e i v e ro p e r a t o rc h a r a c t e r i s t i c ) 曲线和曲线下方面积a u c ( a r e au n d e rt h ec u r v e 卜珠比较模型的性能。试验 结果表明,我们所实现的以s v m 为核心的物种分布预测系统无论在计算速度还 是预测效果上都远远优于当前广泛使用的g a r p ( g e n e t i ca l g o r i t h mf o rr u l e s e t p r e d i c t i o n ) 预测系统。 之后,本文进一步探讨了s v m 预测系统预测效果与环境变量维数和标本点 个数的关系。试验结果表明,对于只有少量标本点的物种s v m 的预测结果仍然 具有相当的合理性。由此可见,s v m 预测系统很好的解决了以前众多模型无法 克服的稀有种和标本点稀少的物种的潜在分布区模拟问题。同时本文发现大的 环境维数( 高维) 对于物种潜在分布区的预测有着决定性的作用,因此模型处 理高维问题的能力显得至关重要。 最后,我们使用中国所有可获取的杜鹃属标本数据,以及8 3 个l k m 的栅格 环境变量图层,对4 0 0 种杜鹃属物种的潜在分布区进行预测。根据预测出来的 物种潜在分布区,我们得到了中国杜鹃属物种潜在多样性分布格局,特有物种 潜在多样性分布格局,濒危杜物种潜在的分布格局,各亚属物种潜在分布格局, 应用s v m 预测杜鹃属( r h o d o d e n d r o nl ) 在中国的潜在分布区 以及不同生活型物种潜在多样性分布格局。这些分布区图不仅可以对杜鹃属起 源研究提供分析验证的条件,还能为其引种、保护和新种的搜寻提供有利的空 间依据。 关键词:杜鹃属舭棚l ) ;物种潜在分布区预测i 物种多样性分布图; 支持向量机( s u p p o r tv e c t o rm a c h i n e ) ;g a r p ( g e n e t i ca l g o r i t h mf o rr u l e - s e t p r e d i c t i o n ) ;r o c ( r e c e i v e ro p e r a t o rc h a r a c t e r i s t i c ) i i l j 线;曲线下方面积。 i i a b s t r a c t p r e d i c tr h o d o d e n d r o nl p o t e n t i a ld i s t r i b u t i o nc e n t e r i nc h i n ab ys v m w e n y u nz u o ( e c o jo g y ) dir e c t e db yk e pin gm aa n dy u yin gg e n g a b s t r a c tr h o d o d e n d r o nli st h eb i g g e s tg e n u so fs p e r m a t o p h y t ei nc h i n a i t s c u r r e n td i s t r i b u t i o na n dd i f f e r e n t i a t i o nc e n t e ri st h es o u t h w e s to fc h i n a ,i n c l u d i n g h e n g d u a nm o n t a i na n de a s t e r nh i m a l a y a s i nw e s ta n ds o u t h w e s to fc h i n a , y u n n a n p r o v i n c e ,g u i z h o up r o v i n c ea n ds i c h u a np r o v i n c e ,t h e r ea r em o r et h a n4 5 0s p e c i e so f r h o d o d e n d r o nl a n da b o u t3 0 0o ft h e ma r ee n d e m i cs p e c i e so fc h i n a t h e r e f o r e ,i ti s i m p o r t a n tt os t u d yf u r t h e r d i s t r i b u t i o n o fr h o d o d e n d r o nlf o r b i o d i v e r s i t y c o n s e r v a t i o no fh e n g d u a nm o n t a i n t h em o s tc o m m o nm e t h o dt ob u i l dap r e d i c t i v em o d e io fs p e d e sp o t e n t i a l d i s t r i b u t i o ni st ou s ee n v i r o n m e n t a lf a c t o r s ,b e c a u s et h e yt i g h t l ya f f e c tt h es p e c i e s d i s t r i b u t i o n u n f o r t u n a t e l y ,m o s tp r e d i c t i v em o d e l ss u f f e rf r o mt h e “h i 【g hd i m e n s i o n s m a l ls a m p l es i z e ”p r o b l e m - - c a n n o tg i v es a t i s f a c t o r yr e s u l tw h e nt h e r ei so n l y l i m i n t e ds p e c i m e nd a t a , a n dc a n n o th a n d l el a r g en u m b e ro fe n v i r o n m e n tf a c t o r s s u p p o r tv e c t o rm a c h i n e ( s 坳,w h i c hi sb a s e do ns t r u c t u r a lr i s km i n i m i z a t i o n p r i n c i p l e ,h a sb e e np r o v e dt ob ee s p e c i a l l ys u i t a b l ef o rs u c hk i n do fd a t ab yb o t h t h e o r ya n da b a n d o na p p l i c a t i o n si nm a c h i n el e a r n i n gd o m a i n h e r e ,w ei m p l e m e n ta n e wp r e d i c t i v es y s t e mo fs p e c i e sp o t e n t i a ld i s t r i b u t i o nb a s e do ns v mm e t h o d i n o r d e rt oi n v e s t i g a t et h ee f f e c t i v e n e s so ft h em e t h o d ,w ep e r f o r mac o u n t r y s c a l ec a s e s t u d yu s i n g3 0s p e c i e so fr h o d o d e n d r o nl i nc h i n aw i t ht h e i rs p e c i m e nd a t aa n d1 1 l a y e r s o fl k md i g i t a le n v i r o n m e n t a lg r i d d a t a t h r o u g he x p e r te v a l u a t i o na n d r e c e i v e ro p e r a t o rc h a r a c t e r i s t i c ( r o c ) c u r v e ,ic o m p a r es v mw i t ht h ec o m m o n l y u s e dg e n e t i ca l g o r i t h mf o rr u l e s e tp r e d i c t i o n ( g a r p ) o u re x p e r i m e n ts h o w st h a t a l ls v m sp r e d i c t i o n sa r ec o n s i s t e n t l yb e t t e rt h a ng a r p si nt e r m so fe x p e r t s e v a l u a t i o n f o rt h es t a t i s t i c a la n a l y s i so fr o cc u r v e ,a l m o s ta l lt h ea r e au n d e rt h e i i i 应用s v m 预测杜鹃属( r h o d o d e n d r o nl ) 在中国的满在分布区 曼曼詈! 詈詈詈! ! 置詈量置量皇皇置詈曼曼! 鼍詈暑! 詈皇鼍皇曼! 鼍詈詈詈詈! ! 皇苎! 皇! ! ! ! 詈! 皇皇曼詈皇置鼍葛! 皇曼i i 詈曼! 詈詈皇詈詈詈晕詈皇詈皇皇皇暑 c u r v e ( a u c ) o fs v m a r eb e t t e rt h a nw h a to fg a r p f u r t h e r m o r e ,s v m sp r e d i c t i o n s p e e di s m u c hf a s t e rt h a ng a r p s t h r o u g ho u re x p e r i m e n t , c o m p r e h e n s i v e e v a l u a t i o n sp r o v et h a ts v mi sm u c hb e t t e rt h a ng a r pi nt e r m so fb o t l lp e r f o r m a n c e a n da c c u r a c y i na d d i t i o n , if u r t h e ri n v e s t i g a t es v m sp e r f o r m a n c ew i t hd i f f e r e n tn u m b e ro f e n v i r o n m e n t a ll a y e r sa n ds p e c i m e np o i n t s ip r o v et h a t , e v e nf o rr a r es p e c i m e n s p e c i e s ,s v mc a l lp r o d u c er e a s o n a b l ep o t e n t i a ld i s t r i b u t i o nm a p s t h e r e f o r e ,i ti s p r o v e dt h a ts v mc a l ls o l v et h el o n gt e r mp r o b l e mo fh o wt op r e d i c tp o t e n t i a l d i s t r i b u t i o no ft h er a r cs p e c i e so rr a r es p e c i m e n s s p e c i e s f i n a l l y ,ip r e d i c t4 0 0s p e c i e s p o t e n t i a ld i s t r i b u t i o no fr h o d o d e n d r o nl i nc h i n ab y t h es v mp r e d i c t i o ns y s t e m ,w i t ha l la v a i l a b l ec h i n e s es p e c i m e n s d a t ao f r h o d o d e n d r o nla n d8 3l a y e r so fi k md i g i t a le n v i r o n m e n t a lg r i d - d a t a b a s e do n t h e s es p e c i e sp o t e n t i a ld i s t r i b u t i o n , w ef i g u r eo u tp o t e n t i a ld i s t r i b u t i o no fs p e c i e s b i o d i v e r s i t y ,e n d e m i cs p e c i e sb i o d i v e r s i t y , e n d a n g e r e ds p e c i e sb i o d i v e r s i t y ,s u b g e n u s s p e c i e sb i o d i v e r s i t y ,a n dd i f f e r e n tl i f es t y l e ss p e c i e sb i o d i v e r s i t yo fr h o d o d e n d r o nl i nc h i n a t h e s ed i s t r i b u t i o nm a p so fb i o d i v e r s i t yn o to n l yo f f e ru s e f u le v i d e n c ef o r s t u d y i n go r i g i n a lc e n t e ro fr h o d o d e n d r o nl ,b u ta l s op r o v i d eh e l p f u ls p a t i a l e v i d e n c ef o rs p e c i e s i n t r o d u c t i o n , c o n s e r v a t i o n ,a n dn e w s p e c i e s d i s c o v e r y k e yw o r d s :r h o d o d e n d r o nl ;p r e d i c t i o n o f s p e c i e sp o t e n t i a ld i s t r i b u t i o n ; d i s t r i b u t i o nm a po fs p e c i e sb i o d i v e r s i t y ;s u p p o r tv e c t o rm a c h i n e ( s v m ) ;g e n e t i c a l g o r i t h mf o rr u l e s e tp r e d i c t i o n ( g a r p ) ;r e c e i v e ro p e r a t o rc h a r a c t e r i s t i c 限o c ) c u r v e ;a r e au n d e rt h ec u r v e ( a u c ) i v 关于学位论文使用授权的说明 本人完全了解中国科学院植物研究所有关保留、使用学位论文的 规定,即:植物研究所有权保留送交论文的复印件,允许论文被查阅 和借阅;学校可以提供目录检索以及公布论文的全部或部分内容,可 以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后遵守此规定) 学位论文作者签名:声阐 勾 加年月日 一缮艚教辅薏:本擎磷- 支属手磲密j 。在珲薜蓄髓甫 本授权书。 指导教师签名:学位论文作者签名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: jj171 “。 m 7 一 内部5 年( 最长5 年,可少于5 年) 秘密1 0 年( 最长l o 年可少于1 0 年) 机密2 0 年( 最长2 0 年,可少于2 0 年) 学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名:书斡丢勾 枷6 年占j 弓c p e t 第一章引言 第一章引言 1 1 研究物种潜在分布区的意义 生物地理学( b i o g e o g r a p h y ) 是生物学与地理学问的边缘学科。b r o w n 认为 生物地理学是尝试证明和理解生物多样性空间分布的科学。它研究生物过去与 现在的分布,以及全球生物数量和种类的分布格局变化。 许多学者希望通过对生物多样性空间分布格局的研究,了解生物群落及其 组成成分在地球表面的分布情况及形成原因以回答这样一些问题:哪里是物种 起源地? 哪里是物种聚集中心? 物种是按照什么规律分布在地球表面? 在历史 变迁的过程中物种是怎么实现目前的分布格局? 不同物种的不同分布格局之间 有什么关系? 地形,气候和种间关系等在物种分布格局的形成中扮演什么角 色? 为什么共同祖先的物种分布不一定在相同地域? 怎样找到物种最近的亲缘 种? 历史事件,如板块漂移,更新世冰期,以及现在的全球变化怎样影响物种 的分布格局? 为什么热带地区的生物多样性高于其他地区? 怎样制定物种多样 性的保护策略? 【l 】然而为了回答如此一系列的问题,我们首先要能清晰准确的了 解物种的空间分布格局。 1 2 研究现状 杜鹃属( r h o d o d e n d r o nl ) ,约含9 7 0 种环包括种以下分类等级) ,是横断山 区与东喜马拉雅这两个具有世界意义的生物多样性关键区域的代表属之一。自 从这个属的一些种类大量被引入西方植物园栽培驯化,一百多年来它们对分类 学家、生态学家、区系学家、园林学家及爱好者始终保持着巨大的吸引力。由 于杜鹃是世界著名的观赏花卉之一,对于杜鹃属的研究一直集中在系统发育和 杂交育种上,而其分布区域的研究却寥寥无几。而且由于数据的限制,现代分 布区的研究呈现广而不细1 2 , 3 j ,细而不广1 4 5 】的状况。 过去学者的研究方法主要是通过普查或者根据经验分析动植物区系结构, 以及在地图上粗略的勾画出物种大致的分布格局1 2 , 3 1 。但是随着现代计算机科学 的进步,运算能力的增强,利用物种分布与环境因子之间存在的紧密联系【l l ,以 环境因子作为预测模型变量的物种潜在分布区模型层出不穷。最早的c l i m e x 应用s v m 预测杜鹃属( r h o d o d e n d r o nl ) 在中国的潜在分布区 1 6 1 :基于生物气候数据( b i o c l i m a t i ce n v e l o p e ) 的b i o c l i mi t - n l 和d o m a i n 【1 2 1 3 l : 基于生态位的g a r p ( g e n e t i ca l g o r i t h mf o rr u l e s e tp r e d i c t i o n ) 【1 铊1 1 ,e n f a ( e n v i r o n m e n t a l n i c h ef a c t o ra n a l y s i s ) f 挖l 和w h e r c w h y j :以及基于特有种分布 特点的特有性简约分析p a e ( p a r s i m o n y a n a l y s i so f e n d e m i c i t y ) 1 3 j 。 不同模型中运用的统计方法也大相径庭。线性回归模型( g e n e r a l i z e dt z n e a r - jl :1 : - 二,jh o 7 u , 二一、h 一k :d h ,- 一l 7 _ = 1 二 m o d e l s ,g l m s ) z 2 】,广义相加模型( g e n e r a l i z e da d d i t i v em o d e l s ,g a m s ) ,l o g i s t i c 归( l o g i s t i cr e g r e s s i o n ) 2 4 - z r l ,神经络( n e u r a ln e t w o r k s ) 阮2 5 1 ,决策树 ( d e c i s i o nt r e e s ) 1 1 4 ,主成分分析( p 血c i p l ec o m p o n e n t sa n a l y s i s ,p c a ) 2 s l ,马氏 距离( m a h a l a n o b i sd i s t a n c e ) i l l l ,最大熵法( m a x 蛔嘲e n t r o p ym e t h o d ) 1 2 9 1 ,基因算 法( g e n e t i ea l g o r i t h m ) i t 化,回归树分析( r e g r e s s i o nt r e ea n a l y s i s ) p o l 等都是过去 研究工作中运用过的数学方法。虽然现在我们拥有了强大的运算支持,但是模 型所需的杜鹃属的样本数据来源仍然是研究其分布的生态学家急需解决的问 题。 1 3 本研究的目的与意义 杜鹃属的多数种类是构成当地高山、亚高山灌丛生态系统的关键种,并为 亚高山针叶林、针阔混交林下层优势种或主要伴生种,有的种类高达数十米。 它的种类分布很广,欧、亚、北美及大洋洲均可见其踪迹,但主要分布在亚洲。 东亚与马来西亚的种类最多,占世界总数的9 0 以上,仅特有种就有8 5 0 多种。 据最近的资料1 3 1 j 表明,我国共有杜鹃属约5 7 0 种( 不包括种以下分类等级) ,其中 特有种约4 0 5 种,占世界种类的4 0 以上,是中国种子植物中最大的属。杜鹃 属不仅具有极大的观赏价值和经济价值,也具有极为重要的生态、区系意义, 对于水土保护、维持生态系统稳定起着重要作用。尽管对于现代杜鹃起源中心 还颇有争议,但其现代分布和分化中心是我国西南部的横断山区和东喜马拉雅 地区这一点已成为共识。我国西部、西南部的云南、四川、西藏等地共有杜鹃 达4 5 0 种,仅特有种就有约3 0 0 种,对杜鹃属分布的深入研究是横断山区生物 多样性保护不可缺少的重要部分。 本研究以现有的标本数据为依据,利用g i s 数据分析方法和有效的分布模 型,模拟并正确描述杜鹃属各物种在中国的高分辨率地理分布。为今后进一步 分析物种种群的发展趋势,以及物种保护提供规划依据。而且杜鹃属地理分布 2 第一章引言 数据可为其起源研究提供分析验证的条件,并为杜鹃属的引种、珍稀濒危种的 保护、和新物种的搜寻提供有利的空间依据。 虽然拥有可以预测中国杜鹃属植物潜在分布区的标本数据,但是如何选择 有效的分布模型同样是需要深入研究的问题。在1 2 中提到的物种潜在分布区模 型以及方法虽然较为广泛的应用于各个学科领域,但是在物种分布预测上却遇 到了一个共同的困难一一高维小样本数据。这是由物种分布预测的特性造成的。 物种分布预测所基于的样本通常是由科学家实地考察采样获得,数量非常有限。 然而潜在影响物种分布的环境因子却非常多,包括降水、温度、相对湿度、光 照强度的年、月均值和年、月极值,地形上的海拔、坡度、坡向,土壤类型, 植被类型等等特征,可达近百种。一般的统计方法都是基于大样本的假设,即 样本数远大于模型参数的个数。然而以上方法参数个数一般与特征维数成一次 或二次方关系,所以对于高维小样本数据这些方法所基于的假设不再成立。其 ? 后果表现为,虽然在训练样本上这些模型可以取得很高的分类正确率,但是在 新的数据上表现却很差。在统计上这种现象称为过拟合。一些降维的方法例如 p c a 也只能在一定程度上缓解这个问题。 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 1 3 2 堤针对分类和回归问题提出的 统计学习理论。它基于结构风险最小化原理( s t r u c t u r a lr i s km i n i m i z a t i o n p r i n c i p l e ) ,使得模型对期望数据做出最佳的界定,达到最佳的分类效果。由于它 具有适用于高维小样本问题的独特性质,近几年来被非常广泛的应用于科学技 术的各个领域。为了获得最好的潜在分布区预测结果,并且为今后其潜在分布 区研究提供更好的预测模型,我们实现了以s v m 为核心的物种分布预测系统。 并且通过试验证明s v m 为核心的物种分布预测系统无论在计算速度还是预测效 果上都远远优于当前广泛使用的g a r p 预测系统f l 睨l3 3 - 3 9 。当然在未来进一步 的研究中s v m 还需要与其他模型进行比较。 1 4 研究方法概述 模型的核心是以物种已知分布点生态特征为基础,建立一个生态位模型, 即将物种的分布视为与环境因素的区域异质性密切相关的因变量。利用环境因 素与已知样本点的之间的关系训练,建立并检验模型,再利用该模型对预测区 域其他栅格点的环境数据进行计算,预测得出该栅格点的概率值,并用该值判 3 应用s v m 预测杜鹃属( r h o d o d e n d r o nl ) 在中国的潜在分布区 断所预测物种是否有分布。对于s v m 预测系统的实现与利用s v m 预测系统预测 物种潜在分布区的方法将在第三章中具体说明。 利用g i s 系统( a r c i n f o8 3 ) 对预测出的物种潜在分布区进行处理。将物 种潜在分布区叠加得到杜鹃属在中国的物种多样性分布图。具体操作方法将在 第五章中详细说明。 4 第二章研究数据与方法 第二章本研究采用的数据 2 1 杜鹃属标本数据 标本数据来自于我国7 个主要的标本馆,中国科学院植物所标本馆,中国 科学院昆明植物所标本馆,中国科学院华南植物所标本馆,中国科学院武汉植 物所标本馆,四川大学标本馆,四川林校标本馆,庐山植物园标本馆,以及英 国爱丁堡皇家植物园中的部分采集地为中国的杜鹃属标本,全部5 7 0 种共计 4 5 0 0 0 份标本。所有标本均经过再次鉴定,对于在不同标本馆被定为不同物种的 同一采集号标本,专家进行了更正,删除了重复记录。将标本数据中采集地点 通过 :全中国电子地图2 0 0 4 专业版【加】( 图2 1 ) ,以及 四川省地图册1 4 l l , 广西壮族自治区地图册【4 2 1 ,西藏自治区地图册1 4 3 l , :云南省地图册【删, 重庆市地图册1 4 5 1 ,浙江省地图册1 4 6 1 , 山西省地图册【4 7 l , 福建省地图 册【删,湖南省地图册1 4 9 l , 海南省地图册刚,甘肃省地图册1 5 l l ,i :湖 北省交通旅游图册【5 2 l , :最新实用河南省地图册1 5 3 1 , :江苏省实用地图册 s 4 l , 江西省地图册1 5 5 1 , 香港特别行政区地图册【5 6 l , 山东省地图册t s t ,陕 西省地图册哪】和中国地名录中华人民共和国地图集地名索引 s 9 j 的辅 助进行数字化,统计标本的地理坐标。 由于需要研究物种的高分辨率地理分布区,所以对于采集地点模糊( 只记 录到省,县,或者记录为中国西南地区等) 的数据我们没有利用。另外,再除 去虽然有小地名,但是无法统计的地点,如风景区景点,流域,无法查找的村、 乡名等等。我总共通过查找获得4 0 0 个物种标本,共计1 3 0 9 8 条记录( 图2 2 , 附录a ) 。其中,中国特有种2 8 6 种,共计9 5 6 6 条记录( 附录a ) 。这些记录成 为模型预算中输入的标本点。 5 璺皇:型至型兰苎坚! 丝! 坌窒竺坠! ! 堡! ! 墼霍垒坌至! 图21 全中国电子地图定位标本点示意图 2 2 环境数据 模型中所运用到的环境数据包括中国数字气象数据删中的年均温,一月至 十二月的1 2 个月均温,年最高温。一月至十二月的1 2 个月最高温年最低温 一月至十二月的1 2 个月最低温,年均降水一月至十二月的1 2 个月均降水, 年均相对湿度。一月至十二月的1 2 个月均相对湿度,年均太阳总辐射和一月至 十二月的1 2 个月均太阳总辐射以及由g a r p 官方网站1 提供的亚洲数字高层数 据中的数字高层,坡度,坡向,降水流罱累积量和酶水流向共计8 3 个环境变 量图层。所有8 3 个环境变量图层均是i k m 的栅格图。如图23 为年最高气温的 栅格图。 h l t p :j b e t al i f e m a p p e r o 吲d e s k t o p g a r p d e f a u ha s p ? l e m = 2 & l a n g = 1 第一章研究数据与方法 幽224 0 0 个物种标本点在中国的分布 凹23 全国年昂高。t 温栅格图 第三章s v m 预测系统挑战g a r p 皇量置皇皇曼曼皇! ! 曼皇! 鼍曼墨皇鼍量量皇量詈暑鼍詈墨葛曼暑巴曼鼍皇皇皇詈曼暑! 詈暑! ! ! 量舞鼍詈詈詈暑皇皇皇皇皇皇皇曼皇墨! 墨曼曼詈音量鼍詈鼍詈毫基 第三章s v m 预测系统挑战g a r p 如1 2 中所提到的,虽然当前在物种分布预测上模型运用非常广泛,但是 却遇到了一个共同的困难一一高维小样本数据。一些降维的方法例如p c a 也只 能在一定程度上缓解这个问题。我们实现了以s v m 为核心的物种分布预测系统, 并且通过试验证明其无论在计算速度还是预测效果上都远远优于当前广泛使用 的g a r p 预测系统【1 铊1 , 3 3 - 3 9 。 3 1 方法 3 1 1s 原理 s v m 是盯& t b e u 实验室的v a p n i k 3 2 】提出的针对分类和回归问题的统计学 习理论。s v m 方法基于结构风险最小化原理,明显优于传统的基于经验风险最 小化原理( e m p i d c a lr i s km i n i m i z a t i o np d n c i p l e ) 的分类方法。由于许多引入注目 的特点和出众的实验性斛6 1 】,s v m 方法越来越受重视。 图3 1 支持向量机( s u p p o r tv e c t o rm a c h i n e ) 原理图 e i :错分样本惩罚;s v :支持向量;2 lw i :正负样本被分开的间距 9 戍用s v m 预测杜鹃属( r h o d o d e n d r o nl ) 在中国的潜在分布区 皇曼! 詈曼曼鲁曼皇鲁曼詈皇詈皇暑詈! ! ! ! ! 皇皇曼詈詈! 詈詈! 詈詈詈! 皇! ! ! ! ! 曼詈寡鼍! ! 詈! ! ! 量曼喜寡曼詈量鼍詈暑詈鲁詈詈! 曼曼量曼詈曼皇詈曼詈皇暑曼曼鼍鼍皇鼍 s v m 模型主要适用于两类样本的二分类问题。例如在物种分布预测中有物 种分布的点即为正例,没有该物种分布的点即为负例。s v m 利用一个超平面在 高维特征空间中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年黄山市祁门文化旅游发展集团有限公司招聘5人考前自测高频考点模拟试题附答案详解(突破训练)
- 2025广西柳州市柳北区白露街道第四季度招聘专职化城市社区工作者1人备考考试题库附答案解析
- 2025内蒙古大唐锡林浩特电厂招聘消防车驾驶员1人考前自测高频考点模拟试题及答案详解(各地真题)
- 2025四川绵阳光子科创产业发展有限责任公司招聘中层管理人员附员工14人备考考试题库附答案解析
- 2025-2026海油工程博士后科研工作站招聘9人考试模拟试题及答案解析
- 2025四川九强通信科技有限公司招聘前端开发工程师等岗位21人考试模拟试题及答案解析
- 2025年语文测评考试试题及答案
- 2025年秋季新疆塔里木油田分公司高校毕业生招聘备考考试题库附答案解析
- 2025江西赣州宁都县选调县卫健系统事业单位工作人员8人备考考试题库附答案解析
- 2025广东江门市消防救援支队政府专职消防员招聘117人(第三次)考试模拟试题及答案解析
- ECMO护理进修汇报
- 建筑施工职业健康与安全防护指南
- 跨境电商股权分配协议范文
- 2025年深圳中考化学试卷真题(含答案)
- 三甲医院影像科管理制度
- T/CCAS 015-2020水泥助磨剂应用技术规范
- 江苏省南京市2024-2025学年高二物理上学期10月月考试题
- GB/T 320-2025工业用合成盐酸
- 2024年公路水运工程助理试验检测师《水运结构与地基》考前必刷必练题库500题(含真题、必会题)
- 2025年社工招聘考试试题及答案
- 病理检查报告审核制度
评论
0/150
提交评论