生物信息学16s分析测序1_第1页
生物信息学16s分析测序1_第2页
生物信息学16s分析测序1_第3页
生物信息学16s分析测序1_第4页
生物信息学16s分析测序1_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、16s16S rRNA是编码原核生物核糖体小亚基的,长度约为1542bp,其分子大小适中,突变率小,是细菌系统分类学研究中最常用和最有用的标志。其序列包含可变区(Variable region)和保守区(constant region)。可变区序列因细菌而异,且变异程度与细菌的系统发育密切相关,通过提取环境样品的DNA,并扩增和检测其中的一段或几段区域,可以了解环境样品(土壤、肠道、海洋)中细菌的种类和丰度。OTU (operational taxonomic units)如果序列之间,比如不同的 16S rRNA序列的相似性高于97%就可以把它定义为一个OTU,每个 OTU对应于一个不同的1

2、6S rRNA序列,也就是每个OTU对应于一个不同的细菌(微生物)种。通过 OTU分析,就可以知道样品中的微生物多样性和不同微生物的丰度。区域由于16s rDNA较长(1.5kb),考虑到序。16s的读长限制,只能对可变区进rDNA包含有9个可变区,分别是v1-v9。一般我们对v3,v3-v4和v6可变区域进行扩增和。主要内容QIIME安装数据处理 OTU分析与注释 Venn图绘制 Heatmap图绘制样品复杂度分析 (Alpha diversity)多样品比较分析 (Beta diversity)系统树的构建其他分析Qiime的安装()Qiime的安装电脑为什么安装不了?Linux常见命令c

3、dpwdmkdir/touchlscpmvrmzip/tarhistorywgetshutdown/reboot切换到目录显示当前目录完整路径新建目录/文件查看文件与目录文件移动文件、目录或更名删除文件或目录解压缩文件查看历史命令命令行的关机/重启工具主要内容QIIME安装数据处理 OTU分析与注释 Venn图绘制 Heatmap图绘制样品复杂度分析 (Alpha diversity)多样品比较分析 (Beta diversity)系统树的构建其他分析FASTQ数据EBI ( SRA ()样品信息文件 (map.txt)1.第一列必须是#S应该是唯一的。leID,为可区分的数字,字母或 。每一

4、行的这个值2.3.4.第二列必须为BarcodeSequence。每一行的这个值应该是唯一的。第三列必须为LinkrimerSequence,为扩增样品的引物。后面的列可以根据样品的特点加以描述,但是每一列必须包含至少两个值,就是指定样品信息,就可以在这个位置设置了。最后一列必须是Description。每一个样品不一样的地方,必须不一样额。5.#SleIDBarcodeSequenceDescriptionLinkrimerSequenleTypeSRR1370913AGCTGACTAGTCGTGCCAGCMGCCGCGGTAAtumorSRR1370913SRR1370914AGCTGAC

5、TAGTGGTGCCAGCMGCCGCGGTAAtumorSRR1370914SRR1370915AGCTGACTAGTAGTGCCAGCMGCCGCGGTAAnormalSRR1370915SRR1370920AGCTGACTAGTTGTGCCAGCMGCCGCGGTAAnormalSRR1370920join_paired_ends.py (fastq-join)过滤 (split_libraries_fastq.py)convert to fastaRead too short after quality truncation N charactersOTU分析与注释-pick_open

6、_reference_otus.pypick_otus.py从fasta文件中提取OTUs,提取方法有cd-hit,blast,Mothur,usearch。make_otu_table.py将提取出的OTUs制作成out_table,即.biom文件。assign_taxonomy.py使用reference中的reference_seqs和 taxonomy文件对序列分类。biom add-metadata将taxa数据加入到.biom文件。Venn图Heatmap图主要内容QIIME安装数据处理 OTU分析与注释 Venn图绘制 Heatmap图绘制样品复杂度分析 (Alpha dive

7、rsity)多样品比较分析 (Beta diversity)系统树的构建其他分析core_diversity_yses.pysingle_rarefaction.py-Rarify the OTU tablebeta_diversity.pybeta多样性principal_coordinates.pyPCoA图形化alpha_diversity.pyAlpha多样性make_rarefaction_plots.py稀释曲线summarize_taxa.py-Summarize Taxonomyplot_taxa_summary.py-Taxa summary plotsAlpha多样性(样本

8、内多样性)Alpha多样性是指一个特定区域或者生态系统内的多样性,常用的度量指标有Chao1 丰富度估计量(Chao1 richnessestimator) 、多样性指数(Shannon diversity index)、多样性指数(Simpson diversity index)等。计算菌群丰度:Chao;计算菌群多样性:Shannon、Simpson。Chao1 丰富度估计量Chao1:是用chao1 算法估计群落中含OTU数目的指数,chao1 在生态学中常用来估计物种总数,由Chao (1984)最早提出。Chao1值越大代表物种总数越多。计算公式:Schao1=Sobs+n1(n1-

9、1)/2(n2+1)和多样性指数Shannon-Wiener 曲线,是利用shannon指数来进行绘制的,反映样品中微生物多样性的指数,利用各样品的量在不同深度时的微生物多样性指数构建曲线,以此反映各样本在不同数量时的微生物多样性。 当曲线趋向平坦时,说明数据量足够大,可以反映样品中绝大多数的微生物物种信息。Simpson:用来估算样品中微生物的多样性指数之一,在生态学中常用来定量的描述一个区域的生物多样性。Simpson指数值越大,说明群落多样性越高。R-Abundance曲线同时解释样品所含物种的丰富程度和均匀程度。横坐标代表物种排序的数 量;纵坐标代表观测到的 相对丰度。物种的丰富程 度

10、由曲线在横轴上的长度 来反映,曲线越宽,表示 物种的组成越丰富;物种 组成的均匀程度由曲线的 形状来反映,曲线越平坦,表示物种组成的均匀程度 越高。而曲线快速陡然下 降表明样本中的优势菌群 所占比例很高,多样性较 低。Beta多样性分析(样品间差异分析)Beta多样性是生态系之间的种多样性,它包含分的比较生态系内的每一独特性。即衡量群落之类间的差别。Beta多样性不仅描述生境内生物种类的数量,同时也考虑到这些种类的相同性及其彼此之间的位置。不同生境间或某一生态梯度上不同地段间生物种类的相似性越差,Beta生物多样性越高。PCoA(主坐标分析)PCoA分析,即主坐标分析(PCoA,Princip

11、alCoordinateysis)可以从复杂的度数据中提取和可视化展示主要的高信息量突变,与PCA的主要类似。它将距离矩阵的信息转变成在一系列直交轴中显示,这样某种变量的最大值体现在第一个成分坐标中,而另一种变量的最大值体现在另一个成分坐标上。距离越近的点代表样本间相似应该聚在一起。高,理论上生物学重复的样本unweighted unifrac对于系统发生树所有枝,考查其指向的叶节点是否只存于同一个群落,那些叶节点只存在于同一群落的枝的枝长和,占整个树的枝长和的比例,就定义为UniFrac距离。UniFrac计算了仅被一个群落占据的进化历史的相对大小,这个量越大,说明两个群落中独立的进化过程越

12、多,也就说明这两个群落的差别越大。若两个群落完全相同,那么它们没有各自独立的进化过程,UniFrac值为0;若两个群落在进化树中完全分开,即它们是完全独立的两个进化过程,那么UniFrac值为1.weighted unifracUniFrac的定义中,可以看出它只考虑序列是否在群落中出现,而不考虑序列的丰度。若两个群落包含的物种完全相同,那么不管每个物种的丰度是否有差别或者差别的大小,UniFrac值为0。但在某些具体的情况下,的恰恰是群落中物种丰度的变化,例如研研究者感肠道微生物分布在抗生素治疗下的变化情况,这究时UniFrac就不能解决问题了。weighted unifrac方法,就是在U

13、niFrac的基础上,将序列的丰度纳入考虑,它能够区分物种丰度的差别。主要内容QIIME安装数据处理 OTU分析与注释 Venn图绘制 Heatmap图绘制样品复杂度分析 (Alpha diversity)多样品比较分析 (Beta diversity)系统树的构建其他分析系统树系统发生树(英文:phylogenetic tree或 evolutionary tree)是表明被认为具有共同祖先的各物种相互间演化关系的树,又被称为系统发育树、系统 演化树、系统进化树、种系发生树、演化树、进化树、系统树。 它用来表示系统发生研究的结果,用它描述物种之间的进化关系。构建系统树主要步骤filter_otus_from_otu_table.py挑选丰度1的OTUfilter_fasta.py获得丰度1OTU的fasta文件make_phylogeny.py构建系统树ggtree.R系统树可视化系统树系统树差异OTU分析;OTUbaseMea nlog2Fo ldChan gespvaluepadjtaxonomy17876444

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论