版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.,长非编码RNA测序分析实战讲解之测序质量评估和Reads回贴,卜德超 budechao 中国科学院计算技术研究所 2014-12-20,.,概要,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,长非编码RNA测序,长非编码RNAs(long non-coding RNAs,lncRNAs)是一类长度大于200 nt且不编码蛋白质的RNAs 长非编码RNA测序:通过测
2、序技术,获得某个物种或特定细胞在某一生理条件下产生的所有的长非编码RNA,.,想测长非编码RNA,提取RNA的步骤是怎样的?,.,转录组内的RNA,转录组RNA,按功能分类: mRNA 非编码RNA(即Non-coding RNA,如 tRNA,rRNAs,microRNAs,piRNAs 和lncRNAs等) 转录组内的RNA, 按polyA形态: 带polyA的RNA (mRNA和大部分的lncRNA) 不带polyA的RNA (小RNA和小部分的lncRNA),.,长非编码RNA测序,总的RNA(200),去掉rRNA后的RNA,不带polyA的RNA,带polyA的RNA,polyA富
3、集,总的RNA(200),去掉rRNA后的RNA,测序(mRNA+lncRNA),测序(lncRNA),mRNA测序(mRNA+lncRNA),方案二,方案一,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,9,一个测序实例,取样:晚期肝癌病人的肝组织(共4个) 癌旁组织(N) 原发灶(P) 转移灶(M) 门脉血栓转移灶(V),一组时间序列上的4个点的取样,.,RNA提取和测序参数,RNA提取 提取带有polyA的所有RNA 测序 Illumina Hiseq 2000测序 文库插入片段长300 双端
4、测序 reads长度为100 D-UTP链特异性文库,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,12,转录组分析的通用套路,定量,鉴定,差异,功能,有多少RNA,RNA的表达量,结构、表达量、比例的变化,功能注释,.,测序数据,和参考基因组比对,测序评估及低质量过滤,编码基因表达注释,转录本重构,长非编码鉴定,长非编码表达注释,编码基因差异(特异)表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,长非编码差异表达,GO功能显著性富集,Pathway显著性富集,功能富集网络图,F
5、usions,Junctions,Genome Browser可视化,这一堂课关注内容,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,测序下机数据,测序输出的两个文件(双端测序数据): N_R1.fastq HWI-EAS724_0001:8:32:374:374#0/1 GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG +HWI-EAS724_0001:8:32:374:374#0/1 f
6、cfcfggdfggggfggggcggggggggfgggggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggd N_R2.fastq HWI-EAS724_0001:8:32:374:374#0/2 TACCGTTAATAGCAGTAATATCATAATAGTAATAGCATCATAACGGTAGTCCCATAAAAGTGTGTCAGTAGTAGTAGTA +HWI-EAS724_0001:8:32:374:374#0/2 ggggfgggggd_adcggggeggfggeggegfgeececdegggggfegcfegggegggfgacaced
7、bd_cYb,拿到共4对这样的测序文件,.,Fastq文件质量值表示,N_R1.fastq HWI-EAS724_0001:8:32:374:374#0/1 GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG +HWI-EAS724_0001:8:32:374:374#0/1 fcfcfggdfggggfggggcggggggggfgggggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggd,用字符来表示每个碱基的质量值,.,字符值-如何计算Q值,对
8、应的就是Q30,ASCII码表,.,Q-score,.,ASCII码、Q-score与错误率计算,Ascii码与Quality Score: Sanger: Q=ASCII值-33 Illumina1.3之后:Q=ASCII值-64 Quality Score与错误率:,.,20,测序质量评估,工具 fastQC(推荐) fastX-Tookit,注意adpter或是barcode的存在,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,22,和参考基因组比对,转录组比对工具选择: Tophat,Map
9、ping and discovering splicing junctions with RNA-seq,.,几种常见比对工具对比,输入:RNA-seq data,.,双比对策略,基因组-转录组双比对策略: Bowtie比对到已知编码基因集合(转录组) Tophat比对到基因组(基因组),思考:为何比对转录组?,.,比对结果统计,.,26,比对结果解读,若双端中有一端比对率高,一端比对率很低,则类同第四种情况,?,?,?,?,.,27,Tophat回贴原理,Reads,Mapped to the genome,Unmapped,Split and Mapped,Searching the sp
10、licing site,.,Junctions和Fusions鉴定,Tophat比对后的输出目录: Junctions.bed Insertions.bed Deletions.bed Tophat-fusion:Fusions鉴定工具,Tophat直接报出junctions结果,Tophatfusion:从tophat的输出挖掘fusions,.,长非编码RNA测序介绍 一个测序实例 长非编码RNA分析流程 步骤一详解:Reads质量评估 步骤二详解:基因组比对 附录:运行命令,.,运行命令汇总(一),fastqc o QC_outdir_N N_R1.fastq N_R2.fastq,1,
11、 质量评估:,fastqc o QC_outdir_P P_R1.fastq P_R2.fastq,fastqc o QC_outdir_M M_R1.fastq M_R2.fastq,fastqc o QC_outdir_V V_R1.fastq V_R2.fastq,.,运行命令汇总(二),tophat o tophat_outdir_N -library-type fr-firststrand -fusion-search hg19 N_R1.fastq N_R2.fastq,2, 比对基因组:,tophat o tophat outdir _P -library-type fr-fir
12、ststrand -fusion-search hg19 P_R1.fastq P_R2.fastq,tophat o tophat_outdir_M -library-type fr-firststrand -fusion-search hg19 M_R1.fastq M_R2.fastq,tophat o tophat_outdir_V -library-type fr-firststrand -fusion-search hg19 V_R1.fastq V_R2.fastq,hg19为基因组的bowtie2的index文件,.,运行命令汇总(三),bowtie o bwt_outdir_
13、N refgene -1 N_R1.fastq -2 N_R2.fastq -S N.sam,3, 比对转录组:,bowtie o bwt_outdir _P refgene -1 P_R1.fastq -2 P_R2.fastq -S P.sam,bowtie o bwt_outdir_M refgene -1 M_R1.fastq -2 M_R2.fastq -S M.sam,bowtie o bwt_outdir_V refgene -1 V_R1.fastq -2 V_R2.fastq -V P.sam,refgene为bowtie产生的index文件,.,运行命令汇总(三),tophat-fusion-post hg19,4, Fusions鉴定:,在toph
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校校园网贷风险防范专项教育方案
- 药品质量信息管理制度培训
- 边坡维护项目可行性研究报告
- 2026年山西省朔州市单招职业倾向性测试题库附参考答案详解(a卷)
- 2026年广西制造工程职业技术学院单招职业适应性测试题库附答案详解(巩固)
- 2026年广西安全工程职业技术学院单招综合素质考试题库带答案详解(a卷)
- 2026年广州铁路职业技术学院单招职业技能测试题库含答案详解(满分必刷)
- 2026年广西工商职业技术学院单招职业倾向性测试题库附参考答案详解(模拟题)
- 2026年广东省汕尾市单招职业适应性考试题库附参考答案详解(b卷)
- 2026年广州工程技术职业学院单招职业适应性测试题库带答案详解(培优b卷)
- 2025年贵州分类考试试题及答案
- 2025数据基础设施数据目录描述要求
- 五一期间安全运输培训课件
- 西藏助教活动方案
- 《经济思想史》教学大纲
- 《工程伦理》教案全套-教学设计
- 地球生气了课件
- 3 岁以下婴幼儿回应性照护指南
- 精神病学主治医师考试题库及答案
- 小学班主任工作-安全学习-《中小学生安全教育手册》
- 机械工程基础(第5版)课件 0绪论
评论
0/150
提交评论