关联分析相关软件演示.pptx_第1页
关联分析相关软件演示.pptx_第2页
关联分析相关软件演示.pptx_第3页
关联分析相关软件演示.pptx_第4页
关联分析相关软件演示.pptx_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、DEMOofrelatedsoftwareinassociationanalysis,张学海xuehai852010.5.18,Relatedsoftware,PowermarkerStructure2.2SPAGeDiTASSEL2.0,Moreinformation,PowermarkerStructure2.2/software/structure22/SPAGeDihttp:/www.ulb.be/sciences/ecoevol/spagedi.htmlTASSEL2.0,SSR带型记录,第一种读带方式:以0、1统计,相同迁移

2、率位置上,有带记为1,无带记为0。适合于NTSYS,powermarker等软件第二种读带方式:,FileformatofPowermarker,材料名称或编号,群体类型,引物名称,标记基因型,中间用“/”隔开,缺样用?/?表示。,演示,FileformatofStructure,STRUCTRE软件原理,应用STRUCTRE软件(Pritchard2000),是对群体进行基于数学模型的类群划分,并计算材料相应的Q值(第i材料其基因组变异源于第k群体的概率)。分析的大致理念是,首先假定样本存在K个等位变异频率特征类型数(即服从Hardy-Weinberger平衡的亚群,这里K可以是未知的),每

3、一类群标记位点由一套等位变异频率表征,将样本中各材料归到(或然率用Bayesian方法估计)第k个亚群,使得该亚群群体内位点频率都遵循同一个Hardy-Weinberg平衡。,structure,Createanewproject1)Projectinformation2)Informationofinputdataset3)FormatofinputdatasetSetupparametersResults,演示,K值确定,L(K)=L(K)L(K1)|L(K)|=|L(K+1)L(K)|K=m|L(K)|/sL(K)K=m(|L(K+1)2L(K)+L(K1)|)/sL(K)注:sL(K)

4、为标准差,K值确定方法具体请参考原文献:G.EVANNO,S.REGNAUTandJ.GOUDET,DetectingthenumberofclustersofindividualsusingthesoftwareSTRUCTURE:asimulationstudyJ.MolecularEcology,2005,14,26112620.,Distruct-柱形图绘制,参见distruct软件包,将文中的相应部分替换为自己的相应数据即可。,FileformatofSPAGeDi,群体大小,标记数目,亚群数目,二倍体,用于定位基因型的最大字符数,空间坐标,参数选择及结果处理,spagedi参数选择

5、问题:第一步:1kinshipcoefficient第二步:4Jackkniefoverloci第三步:3Reportmatriceswithpairwisespatialdistancesandgeneticcoefficients第四步:3mutilocusestimates生成的结果需做如下处理:将生成的txt文件用excel打开,然后将矩阵数据部分复制到一excel中,对于小于0的数据用0代替,对角线上的空着的用1代替,最后对整个矩阵乘以2即可,此时可用于tassel分析。演示,FileformatofTassel,GenotypicdataPhenotypicdataPopulati

6、onstructuredataKinshipdata,Genotypicdata,Phenotypicdata,Populationstructure,OutputfilefromStructure,Kinship,OutputfilefromSpageDi,TASSEL,演示,软件使用中需注意问题,1、powermarker算出后为何不显示聚类图?需要安装MEGAV4.0分子进化遗传分析软件2、STRUCTURE为何都是按正常操作进行却不能运行?重新加载工程即可,勿须重新建立工程3、TASSLE软件无法启动!?TASSLEneedjava1.5,软件使用中需注意问题,4、标记分析时需注意那些问题?a:allelicsize,b:needCK5、多少标记估计群体结构(Q)及kinship(K)合适?ForQ,1000singlenucleotidepolymorphismsor100simplesequencerepeatsformaize.ForK(aminimumofseveralhundredSNPsspreadoverthewholegenomeisrecommended.6、缺失数据如何表示?TASSLE:Fortraitdataandpopulationstructure,use“-999”formissingForSNPdata,use“N”.ForSSRda

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论