转录组实战讲解第三讲之测序质量评估和reads回贴ppt课件_第1页
转录组实战讲解第三讲之测序质量评估和reads回贴ppt课件_第2页
转录组实战讲解第三讲之测序质量评估和reads回贴ppt课件_第3页
转录组实战讲解第三讲之测序质量评估和reads回贴ppt课件_第4页
转录组实战讲解第三讲之测序质量评估和reads回贴ppt课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.,长非编码RNA测序分析实战讲解之测序质量评估和Reads回贴,卜德超 budechao 中国科学院计算技术研究所 2014-12-20,.,概要,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,长非编码RNA测序,长非编码RNAs(long non-coding RNAs,lncRNAs)是一类长度大于200 nt且不编码蛋白质的RNAs 长非编码RNA测序:通过测

2、序技术,获得某个物种或特定细胞在某一生理条件下产生的所有的长非编码RNA,.,想测长非编码RNA,提取RNA的步骤是怎样的?,.,转录组内的RNA,转录组RNA,按功能分类: mRNA 非编码RNA(即Non-coding RNA,如 tRNA,rRNAs,microRNAs,piRNAs 和lncRNAs等) 转录组内的RNA, 按polyA形态: 带polyA的RNA (mRNA和大部分的lncRNA) 不带polyA的RNA (小RNA和小部分的lncRNA),.,长非编码RNA测序,总的RNA(200),去掉rRNA后的RNA,不带polyA的RNA,带polyA的RNA,polyA富

3、集,总的RNA(200),去掉rRNA后的RNA,测序(mRNA+lncRNA),测序(lncRNA),mRNA测序(mRNA+lncRNA),方案二,方案一,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,9,一个测序实例,取样:晚期肝癌病人的肝组织(共4个) 癌旁组织(N) 原发灶(P) 转移灶(M) 门脉血栓转移灶(V),一组时间序列上的4个点的取样,.,RNA提取和测序参数,RNA提取 提取带有polyA的所有RNA 测序 Illumina Hiseq 2000测序 文库插入片段长300 双端

4、测序 reads长度为100 D-UTP链特异性文库,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,12,转录组分析的通用套路,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,.,测序数据,和参考基因组比对,测序评估及低质量过滤,编码基因表达注释,转录本重构,长非编码鉴定,长非编码表达注释,编码基因差异(特异)表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,长非编码差异表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,F

5、usions,Junctions,Genome Browser可视化,这一堂课关注内容,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,测序下机数据,测序输出的两个文件(双端测序数据): N_R1.fastq HWI-EAS724_0001:8:32:374:374#0/1 GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG +HWI-EAS724_0001:8:32:374:374#0/1 f

6、cfcfggdfggggfggggcggggggggfgggggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggd N_R2.fastq HWI-EAS724_0001:8:32:374:374#0/2 TACCGTTAATAGCAGTAATATCATAATAGTAATAGCATCATAACGGTAGTCCCATAAAAGTGTGTCAGTAGTAGTAGTA +HWI-EAS724_0001:8:32:374:374#0/2 ggggfgggggd_adcggggeggfggeggegfgeececdegggggfegcfegggegggfgacaced

7、bd_cYb,拿到共4对这样的测序文件,.,Fastq文件质量值表示,N_R1.fastq HWI-EAS724_0001:8:32:374:374#0/1 GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG +HWI-EAS724_0001:8:32:374:374#0/1 fcfcfggdfggggfggggcggggggggfgggggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggd,用字符来表示每个碱基的质量值,.,字符值-如何计算Q值,对

8、应的就是Q30,ASCII码表,.,Q-score,.,ASCII码、Q-score与错误率计算,Ascii码与Quality Score: Sanger: Q=ASCII值-33 Illumina1.3之后:Q=ASCII值-64 Quality Score与错误率:,.,20,测序质量评估,工具 fastQC(推荐) fastX-Tookit,注意adpter或是barcode的存在,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,22,和参考基因组比对,转录组比对工具选择: Tophat,Map

9、ping and discovering splicing junctions with RNA-seq,.,几种常见比对工具对比,输入:RNA-seq data,.,双比对策略,基因组-转录组双比对策略: Bowtie比对到已知编码基因集合(转录组) Tophat比对到基因组(基因组),思考:为何比对转录组?,.,比对结果统计,.,26,比对结果解读,若双端中有一端比对率高,一端比对率很低,则类同第四种情况,?,?,?,?,.,27,Tophat回贴原理,Reads,Mapped to the genome,Unmapped,Split and Mapped,Searching the sp

10、licing site,.,Junctions和Fusions鉴定,Tophat比对后的输出目录: Junctions.bed Insertions.bed Deletions.bed Tophat-fusion:Fusions鉴定工具,Tophat直接报出junctions结果,Tophatfusion:从tophat的输出挖掘fusions,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,运行命令汇总(一),fastqc o QC_outdir_N N_R1.fastq N_R2.fastq,1,

11、 质量评估:,fastqc o QC_outdir_P P_R1.fastq P_R2.fastq,fastqc o QC_outdir_M M_R1.fastq M_R2.fastq,fastqc o QC_outdir_V V_R1.fastq V_R2.fastq,.,运行命令汇总(二),tophat o tophat_outdir_N -library-type fr-firststrand -fusion-search hg19 N_R1.fastq N_R2.fastq,2, 比对基因组:,tophat o tophat outdir _P -library-type fr-fir

12、ststrand -fusion-search hg19 P_R1.fastq P_R2.fastq,tophat o tophat_outdir_M -library-type fr-firststrand -fusion-search hg19 M_R1.fastq M_R2.fastq,tophat o tophat_outdir_V -library-type fr-firststrand -fusion-search hg19 V_R1.fastq V_R2.fastq,hg19为基因组的bowtie2的index文件,.,运行命令汇总(三),bowtie o bwt_outdir_

13、N refgene -1 N_R1.fastq -2 N_R2.fastq -S N.sam,3, 比对转录组:,bowtie o bwt_outdir _P refgene -1 P_R1.fastq -2 P_R2.fastq -S P.sam,bowtie o bwt_outdir_M refgene -1 M_R1.fastq -2 M_R2.fastq -S M.sam,bowtie o bwt_outdir_V refgene -1 V_R1.fastq -2 V_R2.fastq -V P.sam,refgene为bowtie产生的index文件,.,运行命令汇总(三),tophat-fusion-post hg19,4, Fusions鉴定:,在toph

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论