




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验三 基因序列分析 杜娟dujuannx 基因与蛋白质组学数据分析 实验项目三 基因序列分析一 实验目的和要求 掌握基因可读框的识别 掌握启动子区域的预测掌握CpG岛的预测掌握转录终止信号的预测采用mRNA序列预测基因 Spidey的使用掌握各预测服务器结果的分析 2 原核生物基因结构 1长开放阅读框2高基因密度3简单的基因结构4基因组中GC含量变化非常大 特点 3 真核生物基因结构 特点 1基因结构复杂2具有复杂的基因转录调控方式3具有丰富的可变剪接4有明显的CpG岛 密码子使用具有偏好性 4 基因组序列分析 5 例 WhatisGenePrediction GivenanuncharacterizedDNAsequence findout 1 Wheredoesthegenestartsandends 2 Whichregionscodeforaprotein AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGC 6 7 8 一开放读码框的识别 开放读码框 openreadingframe ORF 是一段起始密码子和终止密码子之间的碱基序列ORF是潜在的蛋白质编码区 基因预测 9 10 1 ORFFinder的使用及结果分析 11 1 ORFFinder的使用及结果分析 12 1 ORFFinder的使用及结果分析 13 1 ORFFinder的使用及结果分析 14 1 ORFFinder的使用及结果分析 15 1 ORFFinder的使用及结果分析 Blast比对结果搜索到多个显著相似的序列 故所预测的ORF的可信度较高 如果要获取该ORF所编码的蛋白质序列 可以点击 Accept 按钮后 在 1GenBank 的下拉框中选择 3Fasta 并点击 view 即可获取该ORF所编码的蛋白质序列 16 1 ORFFinder的使用及结果分析 17 1 ORFFinder的使用及结果分析 18 1 ORFFinder的使用及结果分析 19 1 ORFFinder的使用及结果分析 20 2 Genscan的使用及结果分析 21 2 Genscan的结果分析 22 3 FGENESH的使用及结果分析 输入序列的Fasta文件 23 3 FGENESH的使用及结果分析 24 3 FGENESH的使用及结果分析 25 3 FGENESH的使用及结果分析 26 二 原核和真核生物基因转录起始位点上游区结构 原核生物 真核生物 上游启动子元件 UPE 核心启动子元件 转录起始位点 27 原核生物 真核生物 28 二 启动子预测 输入序列的Fasta文件 29 启动子预测结果 从预测结果可知 预测的启动子区在32564至32783之间 启动子阈值系统默认为53 00 预测的启动子分值为84 69 高于阈值 分值越高 说明预测的准确性大 与该启动子可能结合的转录因子如下所示 30 三CpG岛预测 CpG岛CpG岛又称为HTF岛 是DNA上的一个区域 此区域富含GC 二者以磷酸酯键相连 位于真核生物基因转录起始位点上游 GC含 50 长度 200bpCpG岛常出现在管家基因或频繁表达的基因的启动子附近 在这些部位 CpG岛具有阻止序列甲基化的作用 因此 搜索CpG岛可以为基因及其启动子的预测提供线索 31 输入序列的Fasta文件 32 33 四转录终止信号 加polyA信号 AAUAAA 转录终止信号 GCrich二重对称区 UUUUUU 34 35 36 POLYAH的使用及结果分析 输入序列的Fasta文件 37 POLYAH的使用及结果分析 预测的POLYA位点 LDF为权重 38 内含子 外显子剪切位点识别 对基因组序列的读码框区域进行预测内含子5 端供体位点 donorsplicesite GT内含子3 端受体位点 acceptorsplicesite AG预测工具 GENSCAN GENEMARKNetGene2 SpliceView 39 mRNA剪切位点识别 spidey 40 NCBI开发的在线预测程序用于mRNA序列同基因组序列比对分析 http www ncbi nlm nih gov IEB Research Ostell Spidey index html 41 42 序列在线提交形式 界面中有两个窗口 上方窗口用于输入基因组序列 直接粘贴序列或用GenbankID AC号 下方窗口用于输入cDNA mRNA序列 直接粘贴序列或用GenbankID AC号 可同时输入多条cDNA mRNA序列与同一条基因组序列进行分析 Spidey序列提交页面 AC002390 1 43 选择物种 44 第一条蓝色序列为基因组序列 橘黄色为外显子 45 46 47 使用NCBIORFFinder识别检索号为L03845的可读框 写下拟南芥phyA序列最长的ORF的起止区间 并粘贴此ORF编码的蛋白质序列的Fasta文件使用Genscan对检索号为D17291的序列进行基因预测 标出外显子区和PolyA位点 用FGENESH对该序列进行预测 写出预测为外显子的序列区间 并比较两个服务器预测的结果是否一致 写出二者都预测为外显子的区段 作业 48 使用CpGPlot POLYAH PromoterScan对检索号为AF319968的核酸序列进行分析 识别序列中的功能元件 将预测结果 部分 进行截图 标出主要的结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 考点解析-华东师大版7年级下册期末试题附答案详解(基础题)
- 2025年生态修复工程生态系统服务功能评估与生态修复工程环境监测技术挑战报告
- 有用的企业面试题库【基础题】附答案详解
- 解析卷-北京市西城区育才学校7年级数学下册变量之间的关系专项练习试题(含解析)
- 2025年工业互联网平台计算机视觉在电子元件制造缺陷检测的应用前景报告
- 解析卷青岛版8年级数学下册期末试题及参考答案详解(B卷)
- 2025年度夜间经济特色摊位租赁协议范本下载
- 2025版大型超市蔬菜批发供应合同
- 2025版私人合伙旅游度假合作协议书范本
- 2025版房地产项目投资担保合同
- 2024年高级消防员技能鉴定考前必刷必练题库500题(含真题、必会题)
- 非法宗教班会课件
- 《智能客服运营管理》课件
- 管网工程施工组织设计与管理
- 幼儿园开学园长会议发言稿模版
- 2025年大学辅导员选拔考试题库:学生综合素质评价体系评价方法试题
- 酒店前台接待流程及话术
- 2025第三届全国技能大赛竞赛(装配钳工赛项)省选拔赛考试题库(含答案)
- GB/Z 27001-2025合格评定通用要素原则与要求
- 2025年第九届“学宪法、讲宪法”活动知识竞赛测试题库及答案
- 银行规范服务礼仪培训
评论
0/150
提交评论