实验三基因组序列分析.ppt_第1页
实验三基因组序列分析.ppt_第2页
实验三基因组序列分析.ppt_第3页
实验三基因组序列分析.ppt_第4页
实验三基因组序列分析.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验三 基因序列分析 杜娟dujuannx 基因与蛋白质组学数据分析 实验项目三 基因序列分析一 实验目的和要求 掌握基因可读框的识别 掌握启动子区域的预测掌握CpG岛的预测掌握转录终止信号的预测采用mRNA序列预测基因 Spidey的使用掌握各预测服务器结果的分析 2 原核生物基因结构 1长开放阅读框2高基因密度3简单的基因结构4基因组中GC含量变化非常大 特点 3 真核生物基因结构 特点 1基因结构复杂2具有复杂的基因转录调控方式3具有丰富的可变剪接4有明显的CpG岛 密码子使用具有偏好性 4 基因组序列分析 5 例 WhatisGenePrediction GivenanuncharacterizedDNAsequence findout 1 Wheredoesthegenestartsandends 2 Whichregionscodeforaprotein AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGC 6 7 8 一开放读码框的识别 开放读码框 openreadingframe ORF 是一段起始密码子和终止密码子之间的碱基序列ORF是潜在的蛋白质编码区 基因预测 9 10 1 ORFFinder的使用及结果分析 11 1 ORFFinder的使用及结果分析 12 1 ORFFinder的使用及结果分析 13 1 ORFFinder的使用及结果分析 14 1 ORFFinder的使用及结果分析 15 1 ORFFinder的使用及结果分析 Blast比对结果搜索到多个显著相似的序列 故所预测的ORF的可信度较高 如果要获取该ORF所编码的蛋白质序列 可以点击 Accept 按钮后 在 1GenBank 的下拉框中选择 3Fasta 并点击 view 即可获取该ORF所编码的蛋白质序列 16 1 ORFFinder的使用及结果分析 17 1 ORFFinder的使用及结果分析 18 1 ORFFinder的使用及结果分析 19 1 ORFFinder的使用及结果分析 20 2 Genscan的使用及结果分析 21 2 Genscan的结果分析 22 3 FGENESH的使用及结果分析 输入序列的Fasta文件 23 3 FGENESH的使用及结果分析 24 3 FGENESH的使用及结果分析 25 3 FGENESH的使用及结果分析 26 二 原核和真核生物基因转录起始位点上游区结构 原核生物 真核生物 上游启动子元件 UPE 核心启动子元件 转录起始位点 27 原核生物 真核生物 28 二 启动子预测 输入序列的Fasta文件 29 启动子预测结果 从预测结果可知 预测的启动子区在32564至32783之间 启动子阈值系统默认为53 00 预测的启动子分值为84 69 高于阈值 分值越高 说明预测的准确性大 与该启动子可能结合的转录因子如下所示 30 三CpG岛预测 CpG岛CpG岛又称为HTF岛 是DNA上的一个区域 此区域富含GC 二者以磷酸酯键相连 位于真核生物基因转录起始位点上游 GC含 50 长度 200bpCpG岛常出现在管家基因或频繁表达的基因的启动子附近 在这些部位 CpG岛具有阻止序列甲基化的作用 因此 搜索CpG岛可以为基因及其启动子的预测提供线索 31 输入序列的Fasta文件 32 33 四转录终止信号 加polyA信号 AAUAAA 转录终止信号 GCrich二重对称区 UUUUUU 34 35 36 POLYAH的使用及结果分析 输入序列的Fasta文件 37 POLYAH的使用及结果分析 预测的POLYA位点 LDF为权重 38 内含子 外显子剪切位点识别 对基因组序列的读码框区域进行预测内含子5 端供体位点 donorsplicesite GT内含子3 端受体位点 acceptorsplicesite AG预测工具 GENSCAN GENEMARKNetGene2 SpliceView 39 mRNA剪切位点识别 spidey 40 NCBI开发的在线预测程序用于mRNA序列同基因组序列比对分析 http www ncbi nlm nih gov IEB Research Ostell Spidey index html 41 42 序列在线提交形式 界面中有两个窗口 上方窗口用于输入基因组序列 直接粘贴序列或用GenbankID AC号 下方窗口用于输入cDNA mRNA序列 直接粘贴序列或用GenbankID AC号 可同时输入多条cDNA mRNA序列与同一条基因组序列进行分析 Spidey序列提交页面 AC002390 1 43 选择物种 44 第一条蓝色序列为基因组序列 橘黄色为外显子 45 46 47 使用NCBIORFFinder识别检索号为L03845的可读框 写下拟南芥phyA序列最长的ORF的起止区间 并粘贴此ORF编码的蛋白质序列的Fasta文件使用Genscan对检索号为D17291的序列进行基因预测 标出外显子区和PolyA位点 用FGENESH对该序列进行预测 写出预测为外显子的序列区间 并比较两个服务器预测的结果是否一致 写出二者都预测为外显子的区段 作业 48 使用CpGPlot POLYAH PromoterScan对检索号为AF319968的核酸序列进行分析 识别序列中的功能元件 将预测结果 部分 进行截图 标出主要的结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论