Canoco4.5使用说明_中文版.pdf_第1页
Canoco4.5使用说明_中文版.pdf_第2页
Canoco4.5使用说明_中文版.pdf_第3页
Canoco4.5使用说明_中文版.pdf_第4页
Canoco4.5使用说明_中文版.pdf_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Canoco for Windows 4.5 中文简明教程 中文简明教程 2009-9 2 第一章 CANOCO 简介 一 软件功能 Canoco for Windows 是新一代的 CANOCO 软件,是生态学应用软件中用于约束与非约 束排序的最流行工具。Canoco for Windows 整合了排序以及回归和排列方法学,以便得到健 全的生态数据统计模型。Canoco for Windows 包括线性和曲线单峰方法。使用 Canoco for Windows 进行排序,能够洞察: 生物群落结构 植物与动物群落以及它们的环境之间的联系 一个对环境和(或)其生物群落的假设冲击所能造成的影响 在生物群落上进行的复杂生态学和生态毒理学实验的相关处理所能造成的影响 一个排序被计算出来后,排序图可以立即显示在显示器上。Canoco 具体独特的能力,可 以说明用协变量表示的背景变异,而用它的扩展工具来进行排列测试,包括测试的互动效果。 这些独特的特性使得 Canoco for Windows 能特别有效的解决应用研究方面的问题。 二 软件模块 The Canoco for Windows 软件包主要包含以下几个模块: Canoco for Windows:软件包的核心,用来指定要分析的数据和排序模型,排序方法 以及分析结果的查看等基本操作命令均被集中在该模块的对话框中 WcanoImp:将以电子表格形式(Excel 等)保存的外部数据转化为 CANOCO 识别的 形式 CanoDraw 4.0 for Windows:用来绘制各种类型的排序图,同时也可以生成多种等值 线和回归模型图,并进一步深层次发掘排序结果,该模块可以直接从主程序界面工 具栏激活 CanoMerge:合并 Canoco 识别的 dta 类型数据文件,并可以将数据文件以带制表分 隔符的文本形式输出(基本常用统计软件均兼容该类型文件) ,同时该模块具有滤掉 低频率物种的功能 PrCoord:对特定数据集进行主坐标分析以及冗余分析 三 统计方法 这里只简要阐述 CANOCO 具有的统计分析方法,不做赘述,后面章节将详细论述操作 步骤。主要分析方法有以下四大类型: A 非约束型排序方法非约束型排序方法(Unconstrained ordination methods) 主成分分析 (Principal components analysis,PCA) 对应分析 (Correspondence analysis,CA) 降趋对应分析(去趋势对应分析) (Detrended correspondence analysis,DCA) 主坐标分析 (Principal coordinates analysis,PCoA 或 PCO) B 约束性排序方法约束性排序方法(Constrained ordination methods) 冗余分析 (Redundancy analysis,RDA) 典型对应分析(典范对应分析) (Canonical correspondence analysis,CCA) 降趋典范对应分析 (Detrended canonical correspondence analysis,DCCA) 典型变量分析 (Canonical variate analysis,CVA) distance-based redundancy analysis (db-RDA) C 非约束性偏分析法非约束性偏分析法(Partial methods of unconstrained ordination) partial PCA、 partial CA、 partial DCA 3 D 约束性偏分析法约束性偏分析法(Partial methods of constrained ordination) partial RDA 、partial CCA 、partial DCCA 、partial CVA 四 软件模块界面介绍 Canoco for Windows 模块模块 进入软件后会出现图 1-1 界面,红色矩形所标记部分为快捷 工具栏,鼠标做短暂停留会有英文提示出现,不再赘述。左侧的 Project View 窗口是数据指 定,分类类型选择等一系列功能设置的引导窗口,按步骤操作即可;右边 Log View 窗口用来 记录分析过程和部分统计结果(如四个排序轴统计结果、轴与环境因子的相关性 、蒙特卡罗 检验结果等) ,其他一些分析结果(如物种、环境因子及样方坐标等)均保存在相应的*.sol 文件中,该文件可以用记事本打开。 图 1-1 Canoco for Windows 模块界面窗口 WCanolmp 模块模块 该模块在核心模块中没有快捷激活命令,必须常规方式打开。进入 后界面如图 1-2, 上边红色框标记部分是关于如何使用该模块的简短说明, 下面部分是可选框。 一般情况下在 Excel 中组织原数据时,以行代表样方,以列代表变量,这时第一个选择框就 不需选择;Excel 中组织数据时如果没有将第一行第一列作为样方名行和变量名列,则需要选 择第二和第三选择框,这样该模块会自动为导入的数据添加样方名和变量名;最后一个选择 框可以不用理会,采用默认的不选择状态。设置完成后点击保存按钮,在弹出的对话框中命 名并选择存放位置,即可将剪贴板中的数据文件(从 excel 中复制的)转化为 Canoco 能识别 的类型(*.dta) 。 样方名和变量名命名规则:字符不得超过 8 个,字符类型可以为数字、字母、点、连接 符和空格;超过 8 位的,在导入数据时 Wcanolmp 会默认的只保留前八位,并且以点取代不符 合规定的字符 4 图 1-2 WCanolmp 模块界面 CanoDraw 模块模块 此模块可以在核心模块中快速激活(ProjectRun CanoDraw) ,激活后 界面如图 1-3 所示。此模块这里不做介绍,后面章节有详细介绍。 图 1-3 CanoDraw 模块界面 CanoMerge 模块模块 核心模块无快捷激活命令,需常规方式打开。进入后界面如图 1-4 所示。 “Add file”用来添加文件,需要合并的文件全部在显示框中排列出来后点击“Merge” 按钮,在弹出的对话框中命名并选择存放位置即可。 对话框下部第一个对话框可以用来滤掉一些低频率的物种,框中数字代表包含某一个物 种的样方如果少于 X 个,该物种将被剔除。 5 图 1-4 CanoMerge 模块界面 五 说明 1 本教程只是个人能力范围之内的简明教程,侧重于介绍“是什么” ,难免有错误,难免有 地方过于“简”使人看后也没有“明” ,因此建议遇到具体问题或对“为什么”有强烈需求的 人一定要参考相关书籍。 2 CANOCO 就像 Excel,不但界面人性易上手,最主要的是能深能浅,但问题是我们不一 定玩的很转,有多少懂 Excel 的人敢说自己真正发挥了其数据处理的高效性?所以学习 CANOCO 也要多练习多总结。 3 目前你所看到的只是一时心血来潮的初稿,内容基本来自于 Multivariate Analysis of Ecological Data using CANOCO 一书,才疏学浅,至今原版书还有内容尚未看懂,欢迎交流促 进初稿的完善。 6 第二章 CANOCO 基础 一 专业名词(CANOCO 体系中) 解释变量解释变量(explanatory variables) :相当于自变量,又称预测变量,经常分为主环境变量 (主变量)和协环境变量(协同变量) 响应变量响应变量(response variable) :相当于因变量,又称物种数据 梯度分析梯度分析(gradient analysis) :即通常所说的排序分析,是揭示物种组成数据和实测或潜 在的环境因子之间关系的方法的总称,或者称为依据出现的物种及其丰富度,将样方依次排 列的多元统计技术的总称,有约束性排序(直接梯度分析)和非约束性排序(间接梯度梯度 分析)之分 约束性排序约束性排序(constrained ordination) :在特定的梯度(排序轴)上探讨物种的变化情况, 冗余分析(RDA) 、典型对应分析(CCA)等均属于该范畴 非约束性排序非约束性排序(unstrained ordiantion) :在潜在的(或虚拟的)梯度上寻求代表最优的解 释变量来拟合物种的回归模型,主成分分析(PCA) 、成分分析(CA)等均属于该范畴 混合排序分析混合排序分析(hybrid ordination analysis) :前面若干排序轴采用约束排序,而剩下的轴 是非约束排序的梯度分析方法 偏分析偏分析(partical analysis) :预先剔除物种变化中由协同变量产生的那部分影响,再通过 排序展示剩下的变化量的排序方法,约束排序和非约束排序均有相应的偏分析方法 物种响应环境梯度模型物种响应环境梯度模型:所有排序方法都是基于一定的模型之上,这些反应物种和环境 之间关系的以及在某一环境梯度上的种间关系的模型最常用的有两种:线性模型(linear model)和单峰模型(unimodal model) ,如图 2-1 所示。 图 2-1 线性模型和单峰模型 二 利用 CANOCO 分析数据典型流程图 利用CANOCO分析多元数据的一般流程如图2-2所示, 图中前两步在上一章中已经介绍, 这里主要以后面三步主要内容进行介绍: A 排序模型的决定排序模型的决定 在 Canoco for Windows 的分析过程中,按照操作步骤会出现一个关于模型的选择窗口, 如图 2-3 所示,究竟是选择线性模型还是单峰模型这里有一个比较简单的判断方法:先对物 种数据进行 DCA 分析,分析完成后在“Log View”窗口中,各特征值分布部分找到“Lengths of gradient”信息,这一信息代表的是每个排序轴的梯度长度。如果四个轴中梯度最大值超过 4,选择单峰模型比较合适;如果小于 3,线性模型比较合适;介于 34 之间,两种模型均 适合。 7 注意:物种数据的量纲不同时不适合做单峰模型排序,即便梯度长度大于 4;有空样方 出现的数据不能顺利进行单峰排序分析,非要采用单峰分析,需要把空样方剔除 图 2-2 CANOCO 分析数据的一般流程 图 2-3 分析模型选择窗口 B 具体排序方法的选择具体排序方法的选择 排序模型确定后需要考虑的是选择何种排序方法,为了选择更合适的排序方法,你尽可 能将各种方法都尝试,选择一个你最想要的分析结果和排序图。各种排序方法的具体的特征 和操作方法将在接下来的章节详细介绍,基本的排序方法和排序模型对照表如表 2-1 所示 线性模型 单峰模型 直接梯度分析 (约束性排排序)RDA CCA 间接梯度分析 (非约束性排序)PCA CA、DCA 表 2-1 基本排序方法和排序模型对照表 C CanoDraw 做图 做图 在介绍如何使用 CanoDraw 做图之前,必须考虑以下两点: 明确环境因子里面是否有定性变量,这些变量必须预先选出来,然后才能用于生成排 序图,预选方法:ProjectNominal variables 8 对于分量很小,于排序图的解释没有多少参考价值的稀有种,可以将这些物种不在排 序图中展示出来。一般可以通过两个标准来选择保留的物种:物种适合度(species fit)和 物种的权重(species weight) 。前者表示每个物种变化被排序空间所能展示的百分比;后者 等于某物种在所在样方内多度之和与所有物种多度之和的比,且仅仅在单峰排序里面有应用 价值,你可以自行设置权重值,只有高于该值的物种才能纳入排序图里面。两个标准实现方 法:ProjectSettingInclusion Rules 利用 CanoDraw 制作排序图具体操作步骤如下: 1 直接在 Canoco for Windows 窗口中“Project View”对话框点击右侧“CanoDraw”或 通过“ProjectRun CanoDraw”命令激活 CanoDraw 程序,出现如下对话框,作用是用来保 存 CanoDraw project 文件(*.cdw) 图 2-4 CanoDraw 模块文件保存窗口 2 环境变量中如果有形式变量, 在生成排序图之前可以通过以下命令对其进行相关设置: ProjectNominal variablesEnvironmental variables,打开如下对话框后,利用中间的“Select” 将左侧环境变量列表中的形式标量筛选到右侧即可 3 根据自己试验数据, 没有其他特别需要的话, 接下来就可以生成排序图了, 通过 Create 菜单下的子菜单可以生成不同类型的排序图,这里我们以 Biplots and joint PlotsSpecies and evi. Variables 命令为例,生成 2-5 排序图。 4 如果对排序图标记符号、文字等不太满意还可以进行设置。首先利用鼠标(左键单击) 选定你希望改变的对象(文字或线条等) ,之后利用 F5 键激活属性窗口,如图 2-6,在该窗口 你可以对标记符号、文字、线条等进行相关设置。如果你需要改动的地方比较多,可以在选 定一个对象后点击鼠标右键,弹出图 2-7 快捷菜单后利用 Selec Suchlike 命令选定所有类似的 对象, 再利用上述方法对所有对象进行属性更改。 当然, 你也可以通过 View Visual Attributes 命令激活图 2-8 对话框进行相关设置,这里不再赘述。 修改美化完成后的属性图可以保存为*.cdg 类型文件,或直接输出为 bmp、png 等类型的 图像文件。 注意:关于排序图的解读这里不做叙述,后面有专门章节对其进行重点介绍 9 图 2-5 来源于 PCA 的物种-环境双序图,图中环境变量是排序图生成后投影上去的 图 2-6 排序图属性对话框 10 图 2-7 排序图中快捷命令菜单 图 2-8 排序图美化设置对话框 11 第三章 非约束性排序 当我们同时具有环境数据和物种组成数据的时候,首先可以做非约束性排序分析,观察 物种数据的整体情况,然后再做约束排序(将环境因子加上到排序图上) 。两种排序方法是互 补的,都必须用,这样做可以保证我们既不会丢失物种组成变化量的大部分信息,又不会丢 掉与所测环境因子相关的大部分变量信息。当然如果你手头的数据只具有多个响应变量(物 种组成) ,而没有解释变量(环境数据) ,你依然可以采用非约束排序方法来分析数据。 第一节 去趋势对应分析(DCA) 一 相关知识 1 物种数据的转化物种数据的转化 在基于单峰模型的排序分析中,所有响应变量的数据不能是负值,这就要求某些带有负 值的数据必须经过转化。在 CANOCO 中常用的的转化方法有:对数转化和平方根转化。当 然,如果你觉得需要其他的转化方法,还可以在数据输入到 CANOCO 之前通过别的数据软 件进行转化。 2 去趋势去趋势 对应分析中样方在第二轴的位置很大程度上依赖于其在第一轴的位置,去势的作用便是 消除由这种依赖产生的 “拱形效应” 。 去趋势的方法一般有两种: 区间去趋势和多项式去趋势, 后者又有二阶、三阶、四阶之分。多项式去趋势阶数的选择标准:环境因子小于 10 个,选取 2 阶;小于 13 个,选 3 阶;大于 13 个,选 4 阶。 注意:对于约束排序,去趋势一般是不必要的 二 分析步骤 1 进入 Canoco for windows 模块主界面后新建 Project 文件, 会自动弹出 “Available Data” 窗口,在其中选择需要分析的数据,并选择勾选下部第二个(间接梯度分析)选择框,如图 3-1。 图 3-1 数据类型框 2 点击“Next”后,出现“Data files”对话框,利用右侧的“browse”指定需要分析的 数据文件和数据结果输出文件(Canoco solution file name 选项)名,点击“下一步” ,出现如 图 3-2 的分析类型对话框,选择其中“DCA”选项后“下一步” 12 图 3-2 分类类型选择框 3 在紧着的去趋势对话框中选择“by segments”方法,下一步,在物种数据转换对话框 中选择“Log transformation” ,默认的转换公式中参数均为 1,你可以根据自己的原始数据设 置不同的参数,一般采用默认即可。点击“下一步” 4 剩下来的“Data Editing Choices”对话框和“Finish Options”对话框不做任何设置, 一路“Next” ,最终点击“完成”后在弹出的保存对话框中指定 Canoco Project 文件保存位置 和文件名(文件类型为*.con) 5 以上设置完成后,点击“Project View”窗口的“Analysis”按钮或工具栏的,分 析结果即可在“Log View”窗口中查看,如图 3-3。图中红色标记部分即梯度长度,可以看出 四个轴最大梯度为 2.001,说明该数据进一步分析应该采用基于线性模型的排序方法。 图 3-3 Log View 窗口中分析结果 6 出图。通过“ProjectRun CanoDraw”命令激活 CanoDraw 程序。程序打开后,在弹 出的对话框中为文件名(*.cdw),并指定存放位置后,利用“Create”菜单中子命令即可生成 相应的排序图。排序图可以保存为默人的*.cdg 文件(FileSave 命令) ,也可以输出为 bmp、 png 等类型文件(Fileexport 命令) 。 13 第二节 主成分分析(PCA) 对于一个由多个变量描述的复杂事物,人们难以认识,那么是否可以抓住事物主要方面 进行重点分析呢?主成分分析的作用就是从多元事物中解析出主要影响变量, 进行详细分析。 但是一般情况下,我们并不能直接找出这些主要影响变量,而是通过原有变量线性组合出新 变量(即所谓的主成分)来表示事物的主要方面,PCA 的目标就是寻找这些虚拟的新变量。 一 相关知识 1 中心化和标准化中心化和标准化 基于线性模型的排序方法都涉及数据中心化和标准化问题。样方的中心化是让每行(每 个样方)的平均值为零,相对应地,物种的中心化则是让每列(每个物种)的平均值为零。 物种(或样方)的标准化是让每行(或列)的范数等于 1。在数值上,范数等于列(或行) 内各值平方和的平方根值。物种数据经过中心化和标准化后,各列变量的平均值均为 0,方 差均为 1。 注意:中心化和标准化不是必须都得进行,几乎所有基于线性模型分析的数据都需要中 心化,但不一定需要标准化;如果都得进行,中心化必须先进行;物种数据的量纲如果不同, 物种数据必须标准化(样方数据可能不需要) 2 排序尺度比例(线性模型)排序尺度比例(线性模型) 这里尺度比例指排序轴坐标的相对尺度比例,具有可选性。它可以使排序图展示不同的 相对比例,以便更好解释你想要探讨的问题。在解释排序图过程中,绝对值没有任何意义, 我们使用的是相对距离,相对方向和投影点的相对次序。CANOCO 中有专门的窗口提供尺度 比例的选项,如图 3-4。 图 3-4 线性模型中尺度比例选择框 首先来看左边“Focus scaling on”部分,如果你关注的是样方,就选“inter-sample distances”选项;如果你关注的是物种,就选择“inter-species correlations”选项;如果你两 个都关注,就选择最后一个选项。再来看右边“Species scores”部分,在线性模型中,你必 须决定排序图中箭头的长度是否要反映物种多度的不同(多度大的物种箭头长),或者是物种 多度是否要转化为可比较的尺度(所能解释的百分比) 。如果你选择“divided by the standard deviation” ,物种箭头长度表示的是在排序空间内展示的物种变化量的比例,是个相对值;如 果你选择“Do not post-tansform” ,箭头长度则表示的是物种在排序空间内的变化量,是个绝 对值。 14 注意:线性模型和单峰模型均具有排列尺度比例问题,这里只介绍了线性模型部分,单 峰模型的尺度问题在后面章节介绍 二 分析步骤 1 前两步操作和去趋势对应分析基本一致,只是在图 3-2 的分析类型对话框中选择 “PCA”,之后会出现图 3-4 对话框,根据自己分析目的进行选择,本例设置如图。 2 在接下来的数据转换对话框中选择“Log transformation” ,默认的转换公式中参数均 为 1,你可以根据自己的原始数据设置不同的参数,一般采用默认即可。 3 之后出现如图 3-5 对话框。一般情况下,线性模型中物种数据都进行中心化,标准化 与否视具体情况而定。 图 3-5 中心化和标准化对话框 4 之后的对话框全部默认设置,一路“Next” ,数据分析完成会在“Log View”窗口中 找到如图 3-6 信息。图中红色线条标记部分信息表达的意思是:排序轴所能解释的物种数据 比例是逐步减小的,第一二排序轴可以算是主成分轴,所能解释的无踪数据比例达 33.9% (0.207+0.132) 。 图 3-6 PCA 分析结果(部分) 5 激活 CanoDraw 模块,文件保存方法不再赘述。由于本例所采用的环境变量中具有形 式变量,所以产生排序图之前需要相关设置,按照“ProjectNominal variablesEnvironmental variables”操作,打开如下对话框,利用中间的“Select”将左侧环境变量列表中的形式标量 15 筛选到右侧。 6 通过“CreateBiplots and joint PlotsSpecies and evi. Variables”命令生成如图 2-5 形 式的排序图。从图中可以看出第一轴(横轴)和环境变量 Altit 具有很强的相关性,所以可以 认为 Altit 是良好的解释变量。 注意:后面的冗余分析便以 Altit 作为唯一环境变量,研究其对物种群落分布的影响 图 3-7 形式变量筛选对话框 图 4-6 基于 RDA 双序图上分析物种沿海拔梯度分布情况 16 第四章 约束性排序 约束排序和非约束排序的最大区别就是,后者的梯度是潜在的、虚拟的,而前者的梯度 是明确给出的。 在约束性排序中, 排序轴是参与排序的环境变量的线性组合 (多元多重回归) , 解释变量对于响应变量的影响被集中在了几个合成的排序轴上,这种排序轴也叫典范轴。典 范轴的数量和独立解释变量的数量一样多,我们一般使用的是前面的几轴。 第一节 冗余分析(RDA) 对比主成分分析可以发现,其实冗余分析就是约束化的主成分分析。PCA 和 RDA 的目 的都是寻找新的变量作为最好的预测器来预测响应变量分布,它们的主要区别在于后者样方 在排序图中坐标是环境因子的线性组合,具体原理不在这里阐述,有兴趣可以参考相关文献。 一 相关知识 1 蒙特卡罗置换检验(蒙特卡罗置换检验(Monte Carlo permutation test) 置换检验和传统检验的区别是,前者利用自己产生的分布作为零假设的分布,后者利用 现成已知的分布作为零假设的分布,具体的区别可以参考教材 3.11 部分(参考教材为: Multivariate Analysis of Ecological Data using CANOCO)所讲述内容。该置换检验的主要作用 是去检验约束排序模型的显著性。 如果不考虑样方之间的空间结构,我们可以任意置换样方位置(无限限制性置换) ,利用 F 值作为统计量,检验回归模型的显著性(这里的 F 统计量的算法和方差分析中 F 值意义相 同,但算法不同) ;如果样方位置不能随便置换(即限制性置换,原因可能是样方按照空间或 时间系列来排列) ,我们认为样方之间存在自相关,包括物种间的自相关或是环境因子间的自 相关。在这种情况下 CANOCO 提供了旋转的办法来解决置换问题:即将样方头尾相连,形 成一个圆筒,通过旋转来改变杨帆和环境因子的配比,取代原先的随机置换。 2 环境变量的预选环境变量的预选 约束性排序方法实质上类似于多元多重回归,该多元回归模型的好坏经常用响应变量中 有多少成分能被解释变量所解释来衡量,但我们知道,并不是所有的解释变量对于响应变量 的解释都有显著贡献,环境变量预选的目的就是通过逐步迭代的方式筛选出有显著解释性的 环境变量。在 CANOCO 中,可以用偏蒙特卡罗置换检验来评估每个备选环境便令对于响应 变量的解释贡献。 在使用偏蒙特卡罗置换检验之前,我们可以分别将每个环境因子作为独立的变量进行分 析,将单独解释能力最强的环境变量标记为协变量,然后将其他的候选变量作为唯一的主变 量引入分析(此时排序模型只有一个轴) ,如果检验表明能够拒绝零假设(零假设为:响应变 量不能被环境变量所解释) ,我们就可以将该环境中因子选入模型之中。你可以选择手动或自 动预选变量,CANOCO 中专门的选择对话框,如图 4-1,这里主要阐述如何手动预选变量。 图 4-2 展示的是手动预选界面,上部列表是备选环境因子,其后面的数字代表如果将该因子 引入分析,可以增加的解释量;下部列表框代表已经被选中引入分析的环境因子,最上部红 色矩形标记的数字代表已经选中的环境因子解释量占所有环境因子解释量的比例为 57% (0.624/1.098) 。如果将“6HF”也引入,则该值变为 69%( (0.624+0.136)/1.098) 。 二 分析步骤 1 前面操作步骤基本和主成分分析相同,不再赘述。出现“Data Editing Choices”对话 框后,差异开始出现。如图 4-3,选中环境变量删除命令,点击下一步后,在出现的对话框中 将左侧不需要分析的环境变量全部移除到右侧。 17 图 4-1 环境变量预选对话框 图 4-2 手动预选对话框 图 4-3 数据编辑设置对话框 18 2 紧接着出现环境变量预选对话框,如图 4-1。由于我们这里只有一个环境变量被纳入 分析,所以选择不用预选选项( “Do not use forward selection” ) 。如若被纳入的分析的环境变 量较多,可以自行尝试自动预选和手动预选,看看什么效果。 3 在置换检验对话框中,由于我们只有一个环境变量被纳入分析,所以选择第一轴显著 性检验和典范轴显著性检验效果是一样,当然你也可以选择两个都检验或者不进行蒙特卡罗 检验;右侧部分保留默认状态。在紧接着出现的置换类型对话框中选定“Urestricted permutations”类型,一路“Next”直到结束。 4 点击“Analysis”后,在“Log View”窗口中找到如图 4-5 信息。这里第一轴(即典 范轴)是约束性排序轴,对响应变量的解释比例达 11.5%,后面的三个轴都是非约束性的。 单从解释量来看,第二轴的解释量大于第一轴,但根据蒙特卡罗检验结果我们可以发现,这 不影响第一轴解释量的显著性。 图 4-5 “Log View”中分析结果 5 出图之前可以通过相关设置,使排序图中只显示能被典范轴(第一轴)很好解释的物 种,方法为:ProjectsettingsInclusion RulesLower Axis Minimum FitSpecies,由于第一轴 对响应变量的解释量为 11.5%,这里我们可以将该值设为 11%,保存后便可以如图 4-6(15 页)所示排序图。 19 第二节 典范对应分析(CCA) 典范对应分析是基于对应分析发展而来的一种排序方法,将对应分析与多元回归分析相 结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。其基本思路是在对应分 析的迭代过程中,每次得到的样方排序坐标值均与环境因子进行多元线性回归。CCA 要求两 个数据矩阵,一个是物种数据矩阵,一个是环境数据矩阵。首先计算出一组样方排序值和种 类排序值(同对应分析) ,然后将样方排序值与环境因子用回归分析方法结合起来,这样得到 的样方排序值即反映了样方种类组成及生态重要值对群落的作用,同时也反映了环境因子的 影响,再用样方排序值加权平均求种类排序值,使种类排序坐标值值也简介地与环境因子相 联系。 优点优点:CCA 是一种基于单峰模型的排序方法,样方排序与对象排序对应分析,而且在排 序过程中结合多个环境因子,因此可以把样方、对象与环境因子的排序结果表示在同一排序 图上 缺点缺点:存在“弓形效应” ,克服弓形效应可以采用去趋势典范对应分析(DCCA)或变量 预选以除去相关性过高的冗余变量。 一 相关知识 排序尺度比例(单峰模型) 这里的排列尺度比例问题是基于单峰模型而言的,和上一 章介绍的线性模型排序尺度还是有区别的。CANOCO 中该部分界面如图 4-7。 图 4-7 单峰模型排序尺度设置对话框 图中左侧部分内容和线性模型相同,不再介绍;右侧部分“Hills scaling”选项适用于物 种梯度较长尺度类型, “biplot scaling”适用于物种比较集中,梯度较短类型。一般选择后者 就行,它能为排序图提供一个更量化的解释。 一 分析步骤 1 先对先用 species-sample 资料做 DCA 分析,判断是用线性模型还是单峰模型,这一 步具体步骤不再介绍,可以参照上一章相关内容。假定 DCA 分析结果表明适宜用单峰模型, 我们选择 CCA 来进行下面的分析。 2 指定分析类型为 CCA 后,单峰模型尺度对话框才采取默认设置,如图 4-7。之后的数 据转换、数据编辑、环境变量预选对话框均采用默认设置,出现如图 4-8 对话框,选中“Both above tests”后继续下一步,选定“Unrestricted permutations”后下一步,完成设置。 20 3 CanoDraw 中直接进行下述命令操作:CreateScatter PlotsSamples。出现如图 4-9 排 序图(22 页) 。从图中我们可以看出明显的“弓形效应” ,因此我们上述的分析方法不尽合理, 合理的方法是先进行去趋势典范对应分析或变量预选以消除拱形效应,然后再以选定的变量 进行 CCA 分析。 注意:进行上述三步操作的意图旨在说明,Canoco for Windows 核心模块中的不同设置, CanoDraw 中的不同出图命令均可以生成不同的排序图,有时候不合理的一意照搬分析出来的 数据可能压根就是错误的。该教程只是 CANOCO 的入门皮毛,有兴趣的朋友还是需要参考相关 教材,以保证分析结果的准确性。 图 4-8 置换检验设定对话框 图 4-9 基于 CCA 的样方散点图 21 第五章 偏分析 这里的偏分析是指预先剔除物种变化中由协同变量产生的那部分影响,再通过排序展示 剩下的变化量的排序方法。虽然偏分析方法也有约束排序和非约束排序之分,但基本操作却 是大同小异,因此这里只举例介绍一种偏分析方法偏冗余分析(partial RDA) ,其他偏分 析类型可以自行摸索。 我们仍沿用前面介绍冗余分析时所采用的原始数据,且只具体介绍有区别的步骤,相似 不好步骤参考前面冗余分析章节内容: 1 图 3-1 上面部分数据类型选择第三个选项“species、evir. and covariable data available 下面部分选择“direct gradient analysis” 2 在指定数据文件窗口,均为协变量文件和环境变量采用相同的文件,即均为环境变量 数据 3 一路默认直到“Data Editing Choices”对话框出现,如图 4-3,系统会自动检测并勾选 删除环境变量和协变量选项,如果没有自动勾选必须手工勾选。 4 在“删除环境变量”将变量“1Altit”从左侧列表框移到右侧,如图 5-1;在接下来 的协变量对话框中将除“1Altit”外的变量全部从左侧列表框移到右侧,如图 5-2 图 5-1 环境变量删除对话框 图 5-2 协变量删除对话框 22 5 “环境变量预选”窗口,如图 4-1,选择“Do not use forward selection”选项 6 “置换检验”对话框,如图 4-9,选择“Significance of canonical axes together”之后的 设置全部采用默认直到结束 7 在 CanoDraw 模块中通过“CreateBiplots and joint PlotsSpecies and evi. Variables”命 令生成如图 5-3 形式的排序图,当然图中所呈现的物种依然时经过筛选的具有良好适合度的 物种。 图 5-3 采用偏冗余分析生成的物种环境双序图 23 第六章 排序图的解读 CANOCO 相对于 R、Primer 等大致同功能的统计分析软件来说操作过程容易上手,界面 比较直观, 不需要记忆复杂的语言代码, 做出来的排序图质量也是不用质疑。 考虑到 CanoDraw 出图的多样性(不同设置生成不同排序图) ,本章主要介绍排序图的解读方法并在各节最后以 具体实例示范,没有涉及到的排序图可以参照相似方法解读。 第一节 基于线性模型排序图的解读 出于介绍的简洁性,采用的是分解介绍法,实际过程中可能遇到上述某些图呈现在一个 排序图中情况,解读方法类似。一幅排序图不是想解读什么就能解读出什么,从排序图中究 竟能解读出什么,附表 1 中列处了可供参考信息。 一 解读基础 1 物种和样方间关系 图 6-1 图 6-2 如图 6-1,带箭头射线代表物种,空心圆点代表样方。我们将物种 2(spc_2)的射线延 长,五个样方均垂直投影到该射线上,以投影点到物种实心箭头处相对距离为标准,沿着箭 头方向为增大,反之为减小,作用是用来说明相应样方中物种 2 的多度值大小;样方 3 的投 影点在原点附近,可以认为该样方中物种 2 多度值大致等于其平均值;上图中各样方中物种 2 多度值排序为:Sa4Sa2Sa3Sa1Sa5。物种 1 和各样方关系以相同方法分析。 2 物种和物种间关系 如图 6-2 两物种射线之间夹角代表其相关性,具体地说应该是夹角的余弦值在数值上等 于两者的相关系数。途中两物种的夹角接近于直角,所以认为两者相关性较低。 3 物种和环境变量(数量型)间关系 如图 6-3 图中实心箭头代表物种,空心箭头代表环境变量。以环境变量 B 和两物种之间 的关系为例进行阐述:B 和物种 1、物种 2 夹角分别为 1,2,前者是个钝角,后者是个锐 角,相应的余弦值代表了之间的相关性,很明显,环境变量 B 和物种 2 之间呈现较好正相关, 与物种 1 呈现负相关。也可以用图 6-4 的形象方法解读,将变量 B 反向延长,物种 1 和物种 分别投影于其上,可以很清楚地看出物种 2 的投影与 B 同向,代表正相关;同理,物种 1 为 负相关。 24 图 6-3 图 6-4 4 物种与形式变量间关系 图 6-5 图 6-6 如图 6-5 实心正方形代表不同的形式变量值或者说不同的类别,射线箭头代表物种。延 长物种射线,将形式变量投影于物种线上,投影点距离物种箭头近者,代表该类别中样本所 含的该物种多度平均值较高。在此图中,类别 n_中样方所含的物种 2 多度相对于其他两个 类别高。同理,物种 1 和形式变量关系也可以采用相同方法分析。 5 样方和样方之间关系 如图 6-6 圆点代表样方。如果要解读某一样方和其他样方之间的关系,可以如图用直线 将该样方和其他样方连接起来,之间的线段长度便是样方之间的欧几里德距离,长度越短代 表两者之间的差异性越小,反之越大。图中其他四个样方和 Sa5 差异性大小依次为: Sa1Sa4Sa3Sa2。 6 样方和环境变量间关系 25 图 6-7 图 6-8 如图 6-7 将变量射线延长, 样方垂直投影于射线上, 沿着变量箭头方向环境变量值增大。 图中样方 Sa3 和 Sa4 所对应的环境变量 A 值近似相等,所有样方中变量 A 值大小排序为: Sa1Sa4Sa3Sa2 Sa5。变量 B 和样方间关系也采用类型方法分析,不再赘述。 7 样方和形式变量间关系 如图 6-8 想知道某一样方和形式变量之间关系?将该样方和形式变量用线段连接,线段 长度代表了该样方属于某一形式变量类别的概率,距离越短,概率越大;反之,越小。如图, Sa1 属于不同形式变量类别概率为:n_n_n_。其他样方和形式变量类别之间所属概 率也可以按照此方法进行分析。 8 环境变量和环境变量间关系(需进一步完善) 图 6-9 图 6-10 如图 6-9 在分析该图之前需要回顾图 3-4 左侧“Focus scaling on”部分选项,此处不同 的选项为后面的排序图埋下了解读差异,这一点在教程后面的附表 1 中也可以发现。如果你 选择的是“inter-species correlations”选项,那么解读方法就如上图所示,变量 A 和 B 之间夹 角的余弦值代表两者相关性;如果你选择的是“inter-sample distances”选项 26 9 环境变量和形式变量间关系 如图 6-10 环境变量箭头所指方向代表变量值的增加,以 A 变量为例:将变量 A 射线延 长,形式变量的质心垂直投影于射线之上,投影点到箭头的相对距离代表了所属形式变量类 别中环境变量 A 的平均值大小,越靠近箭头值越大,反之越小。图中各形式变量类别所属环 境变量 A 均值大小依次为:n_ n_ n_。 10 形式变量和形式变量间关系 图 6-11 如图 6-11 不同形式变量质心间连线的长度代表欧几里德距离,距离越短,形式变量所 代表类别间样本间差异性越小;反之,越大。 二 PCA 排序图的解读 以图 3-8 为例,我们首先从图 3-6 的 Log View 窗口可以看出,前两个排序轴对物种变量 的解释量达33.9%, 可以认为这两轴为主成分轴 (CANOCO中一般情况排序图只呈现前两轴) 。 再看生成的 PCA 排序图(图 3-8) ,可以看出环境变量 Altit 和 Brleaf 与第一轴有很好的相关 性,前者为正相关,后者为负相关(具体的相关系数值可以 Log View 窗口中查找到,前者为 0.6597,后者为-0.6265) ;环境变量 E1 和 E1Height 与第二轴有显著的负相关性,Forest 和 ForDens 与第二轴有明显的正相关性,相关系数依次为-0.5344、-0.4225、0.4960、0.348) 。 和环境变量夹角较小的物种变量,可以认为两者具有较好相关性,例如图中 Anthtriv、 CucuCano 等物种和环境变量 Altit 就有极强的相关性,其他变量和物种关系分析方法类似。 注意:前面我们已经列出了排序图各元素间关系的分解分析方法,应根据自己的分析目 的有针对性的解读 三 RDA 排序图的解读 冗余分析的最大优势在于能独立保持各个变量对生物群落变化的贡献率,并从统计学角 度评价一个或一组变量与另一组多变量数据间的关系。这里仍以前面冗余分析相关章节的排 序图为例介绍(图 4-6) 。 图 4-6 是是专门分析单一环境变量 Altitude 对物种群落影响的实例。第一轴(水平轴) 代表能被环境变量 Altitude 所解释的物种多度变化值,属于约束轴;第二轴代表不能被其解 释的变化值。从图中可以看出随着 Altitude 变量的增加物种多度是减小的,并且只给出了能 被改变量很好解释的物种。其他要素间关系分析可以根据个人目的参照前述内容。 27 第二节 基于单峰模型排序图的解读 同线性模型排序图类似,单峰模型排序也有自己蕴含的解读信息,具体内容可以参考教 程后面所附表 2。 一 解读基础 1 物种和样方间关系 图 6-12 图 6-13 如图 6-12 可以发现在基于单峰模型生成的排序图中,代表物种的不再是箭头而是空心 三角形,样方依然是实心圆点。用线段连接目标物种与样方,线段的长短代表了相应样方中 目标物种的相对多度值高低,越短多度值越大,反之越小。图中各样方所含 Spc_2 相对多度 值高低顺序为:Sa4Sa3Sa1Sa2Sa5。物种 1 分析方法类似。 2 物种和物种间关系 如图 6-13 物种之间的线段距离被称为物种分布的卡方距离,其长短代表了物种间的亲 疏关系,越长代表分布差异性越大,反之越小。 3 物种和环境变量间关系 28 图 6-14 图 6-15 如图 6-14 物种垂直投影于环境变量延长线上,物种 2 距离变量箭头的相对位置较物种 1 近,可以认为物种 2 在环境变量 B 较大时具有最适值,而物种 1 的最适值相对较低。 4 物种和形式变量间关系 如图 6-15 物种和不同形式变量类别之间的距离代表了该物种在相应类别中的相对出现 频率平均值大小,距离越大该值小,反之越大。图中各形式变量类别中物种 1 出现频率平均 值大小依次为:n_n_n_。物种 2 分析方法类似。 5 样本和样本间关系(需进一步完善) 在介绍这部分内容之前,首先还是要回过头去看下图 4-7。如果你选择的是“inter-species correlations”选项,只有当排序图中排序轴数和变量数相同时,样本间的连线距离代表的是 样本间的卡方距离;如果你选择的是“inter-sample distances”选项 6 样本和环境变量间关系 样本和环境变量间关系分析方法与上述的物种和环境变量解读方法类似。如图 6-16,将 样方投影于环境变量延长线上,投影点的相对位置代表了样方中环境变量值的大小。图中两 样方中环境变量 B 大小关系为:Spc_2Spc_1。 图 6-16 7 样本和形式变量间关系 与基于线性模型排序图解读方法一致,不再赘述 8 形式变量和环境变量间关系 与基于线性模型排序图解读方式一致,不再赘述 9 形式变量和形式变量间关系 此关系解读与样本和样本间关系解读一样,相对较复杂,不同形式变量类别之间的距离 虽然类似于样本间差异性,但涉及到距离种类较多,比如平均卡方距离、Turnover 距离,同时 也和排列尺度类别不同有关,具体内容可参考相关教材。 29 二 CCA 排序图解读 箭头表示环境因子,箭头连线的长度代表着相应环境因子与研究对象分析相关程度的大 小,越长代表其对所研究对象的分布影响越大;箭头连线与排序轴夹角余弦值代表其与排序 轴的相关性大小,具体的分析方法可以参考上述基于单峰模型的排序图解读基础环节内容。 三 线性模型和单峰模型排序图解读差异 基于线性模型和单峰模型生成的排序图解读差异主要体现的两点: 1 物种对构建的梯度(或者说排序轴)响应不同。从本章前面的介绍可以发现,线性排

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论