DIStruct使用说明_第1页
DIStruct使用说明_第2页
DIStruct使用说明_第3页
DIStruct使用说明_第4页
DIStruct使用说明_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Introduction聚类软件结构;提供了将个体置入K簇的迭代算法。 K是预先选择的参数,但可以在独立structure软件运行中是可以变化的。每个个体都会被分到每个簇(总簇为K)“成员系数(成员协同因素/系数)”,使得每个个体在K簇中的“成员系数”系数总和均为1(意思是把每个个体的成分分到K簇中去,这样每个个体在K簇中就都有成分了,一个个体在K簇中的成分值加起来就为1,不是每个个体在每个簇中都有成分分布,个体在某一个簇中没有成分则其“成员系数”系数则为0)。 隶属系数矩阵,其中个体数就是行数,K就是列数,这里被称为单独的Q矩阵。 对于每个群体(population),可以对每个簇(亚群)的

2、成员系数可以通过每个个体进行平均计算,以创建群体Q的矩阵。显示structure软件结果的一种方便的方式是将每个体显示为一条线段。该线段被划分为K个彩色组分(K种不同的颜色),它们代表个体在K个簇中预估的成员系数(成员协同因素/系数)隶属系数。structure软件提供了基于这个一般想法创建图形的各种选择。可以制作没有使用structure软件的分散图来生成单独(个体)的Q矩阵和群体Q矩阵。如果使用其他程序,则这些程序的输出结果(格式)必须简单地被格式化以匹配distruct的数据输入格式。对于本手册的其余部分,默认structure软件产生的数据作为本软件的输入数据与格式。Basic owe

3、rviewdistruct程序用C语言编写,编译版本适用于Linux,Mac OSX和Windows。 它根据structure软件的输出数据(格式)来读取数据文件(意思是必须使用structure软件的结果文件,才能在用本软件上使用)。它允许其他可选文件,允许用户控 所要显示群体的从左到右的顺序,标签打印在图上方和/或下方的数据,簇的从底到顶的顺序以及所使用的颜色。 输出以PostScript格式打印,可以使用Ghost View等程序显示生成的图形。 如果这个数字不能令人满意,通常可以直接修改Post Script代码,而不必重新运行distruct(实际上,如果程序似乎没有做你想要的操作

4、,PostScript脚本经常可以帮助修改和完善)。程序设置在文件drawparams中指定,尽管有些可以使用命令行参数给出。本文档中的全部大写字母中的变量用于drawparamsInput files要绘制的数据以从structure软件输出派生的ASCII文本格式的文件中指定。为了允许structure软件 输出文件的多次修改,不使用结构输出文件本身。相反,程序采用一个具有群体Q矩阵(必需)的文件,并且具有单个Q矩阵(可选)的单独文件,这都是structure软件的输出文件,这些(本软件需要的)文件可以很容易地生成,例如通过剪切和粘贴。本文档中使用的示例输入文件是从Rosenberg等人的

5、图2中显示的针对中南/南亚群体的K = 5图形进行修改的。 除了破坏代码,distruct包包含与此数据集相关的七个文件以及文件drawparams。 文件casia f是structure软件的输出文件。文件casia.ps是应用于其他五个文件中的数据和设置时的输出结果,如表1到5(刚好为5个文件)所示。 Color Brewer目录中提供了各种各样的配色图。群体Q矩阵如果NUMPOPS(number of population)是预定义群体的数量,K是簇数量,则distruct期望具有每行NUMPOPS行和K + 2列的文件。此文件存储在INFILE POPQ中。空白行和额外的空格是容忍的

6、。在表1的示例中,NUMPOPS = 9和K = 5。在表1中,每行代表一个群体的结果。 第一列是一个整数是为一个群体(品种/品系)提供的一个代码(编号),且后面要跟一个冒号。挨着的K列是簇1,2,.,K(0,1中的实数)的隶属系数(成员协同因素/系数)。理想情况下,这些K列中的数字总和为1; 如果他们不这样做,那么程序将它们归结为一般。 最后一列给出了群体(品种/品系)(一个整数)的样本大小(意思就是一个品种/品系采了好多份样品)。虽然大多数应用程序可能会显示单个Q矩阵,但一些应用程序可能希望仅显示群体Q矩阵(例如,Wilson等人(2001)的表2)。 因此,如果PRINT- INDIVS

7、设置为零,则distruct将仅显示群体Q矩阵。如2.2 个体Q矩阵如果NUMINDS(number of individual)是个体的数量,PRINT INDIVS设置为1,则distruct需要具有NUMINDS行的文件,每行至少有K + 6列。该文件存储在INFILE-INDIVQ。空行和空格是被允许的。此外,structure软件输出的用于置信区间的一些列将被忽略。在表2所示的示例中,NUMINDS = 210。 每一行显示1个体的成员系数(成员协同因素/系数)。第2列给出个体的代码(编号)。 第4列给出了个体所属种群(品种/品系)的代码。 第1列,第3列和第5列被忽略。列6至K +

8、 5显示群集1,2,.,K的成员系数(成员协同因素/系数)。理想情况下,这些K列中的数字为1; 如果他们没有,程序将它们的总和归一化。个体根据种群(品种/品系)的代码自动分组归类,图中个体的从左到右的顺序与输入文件中个人的从上到下的顺序相同。显示单个Q矩阵的示例在Rosenberg等人的图1和图2中。2.3 Labels below the figure要将标签放在图下方,请将PRINT LABEL BELOW设置为1.程序将搜索INFILE LABEL BELOW指定的文件。 默认值是将群体代码(编号)打印为标签。 如果找到该文件,文件行上的群体的输入顺序将用于群体图形的左右顺序。第一列包含

9、群体代码(一个整数); 其余的列包含要打印在图下方的文本。请注意,数据中未找到的其群体可以包含在该文件中。 这些额外的行将被忽略。当使用PRINT LABEL ATOP = 1时,图形上方的标签类似于以下标签。 程序将搜索INFILE LABEL ATOP指定的文件。 默认是将群体的代码打印为标签。如果找到该文件,文件行上的群体顺序将用于总体图形的左右顺序。如果图形的顶部和底部需要标签,INFILE LABEL ATOP和INFILE LABEL BELOW中的条目应按相同的顺序列出。 第一列包含群体的代码(编号)(一个整数); 其余的列包含要在图表上方打印的文本。 与下图中的标签一样,此文本

10、可以由多列组成。颜色数的确定,K值多大 就有多少种颜色,当颜色数不够时可以在文件夹ColorBrewer中选用。2.5 Vertical cluster order and cluster colors(垂直集群顺序和集群颜色)描述簇的垂直顺序的排列可以在指定的INFILE CLUST PERM文件中给出。 此处还指定了用于该图的颜色。 如果未检测到文件,则使用INFILE POPQ中群集的从左到右的顺序。 一些允许的颜色的名称如图1所示。打印机的颜色可能会有很大差异。 该文件的第一列必须包含1,2 . K中整数的置换。 第二列中的条目必须是从(不区分大小写)允许的列表中获取的颜色。集群的最大

11、数量设置为60,如果没有指定INFILE CLUST PERM文件,则将从图1的前两行按顺序获取集群的颜色。 如果GRAYSCALE设置为1,则输入0,1中的实数代替颜色名称。在此方案中,0对应于黑色,1对应于白色。本程序还承认了Color Brewer(Breweret al。,2003; Harrower and Brewer,2003)中实施的配色方案。这些配色方案,包含3-12种颜色,如图2-9所示。可以使用特定的颜色酿造颜色来产生变形图颜色布局方案有三种类型 - 定性(图2和图3),分歧(图4和图5)和顺序(图6) -9)。 定性方案可能最适合大多数描绘群体结构。 例如,要使用Col

12、or Brewer颜色方案Accent 5 qual而不是casia.perm中的方案,请在drawparams文件中使用Color Brewer / Accent 5 qual替换INFILE CLUST PERM值的casia.perm。 Accent 5 qual中的行可以重新排列,以产生与casia.perm中相同的底-顶群集顺序。2.6 Formatting errors如同structure软件一样,程序会尝试验证输入文件的格式是否正确,并报告发现的错误。 如果发现严重的“错误”,程序将退出。 在某些情况下,问题不严重,发出“注”或“警告”,程序将执行。 可能会导致程序的期望使用情况产生笔记或警告。编辑要用于扩展的文件可能会在文本的末尾引入隐藏的格式化字符。 与structure软件一样类似,当输入文件似乎格式正确时,这是错误的最常见原因之一。 在UNIX系统中,dos2unix函数可以删除许多这些字符。3 Usage options最好将distruc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论