



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学院:_ 班级:_ 学号:_ 姓名:_ 成绩:_实验五 基因结构预测分析目的:1、熟悉并掌握从基因组核酸序列中发现基因的方法。内容:1、用NCBI的ORF Finder分析原核生物核酸序列或真核生物的cDNA序列中的开放阅读框;2、使用GENSCAN在线软件预测真核生物基因;3、使用POLYAH在线预测转录终止信号;4、使用PromoterScan在线预测启动子区域。操作及问题:随着测序技术的不断发展,越来越多的模式生物启动了全基因组测序计划,完成全基因组测序的物种也越来越多,使得基因结构和功能的预测成为可能。同时,通过基因组文库筛选也可得到目的基因所在克隆。获得克隆序列后,同样也需要对目的基因做结构预测以便指导后续功能研究。本实验介绍几种常用的基因预测分析工具,预测核酸序列的开放阅读框、转录终止信号、启动子、CpG岛等信息。一、开放阅读框(open reading frame,ORF)的识别ORF是指从核酸序列上5端翻译起始密码子到终止密码子的蛋白质编码序列。原核生物与真核生物的基因结构存在很大不同,真核生物的ORF除外显子(平均150bp)外,还含有内含子,因此真核生物基因的预测远比原核生物复杂。(一)利用 NCBI ORF Finder预测原核生物核酸序列或真核生物的cDNA序列中的开放阅读框。/gorf/gorf.html1、在NCBI上查找 AC 号为 AE008569 的核酸记录。(见实验五中的AE008569.mht)问题1:这个序列的名称?问题2:这个序列来源物种所属的生物学大分类? 2、进入OFR Finder,首先在页面下方的Genetic codes下拉菜单中浏览现有的 22 种遗传密码选择项(这里我们只使用默认的standard code),利用 AC 号或其raw sequence(即不带任何注释信息的全序列)进行 ORF finding。( 预测结果见实验五文件夹中AE008569 ORF Finder.mht)3、在结果显示页面中,按照序列的正向+1、+2、+3 以及反向的1、2、3 进行的六框翻译结果以图形的方式显示在页面中。利用默认的100bp阈值所发现的各框内的ORF以绿色条状显示。同时,按照六框内所有发现的 ORF 的大小顺序,在页面的右侧有一个列表,分别显示了 ORF 的翻译框在核酸序列上的位置以及 ORF 的长度。你可以改变 ORF 鉴别中的长度阈值(50,100,300),点击 Redraw 重新进行计算。 4、点击图形上的绿色条框,就可以对这个 ORF 进行检查(当然也可以点击右侧的 ORF 列表),页面上会显示预测的氨基酸序列,同时页面上还嵌入了BLAST 程序以及 NCBI 的有关序列数据库以便于发现与此 ORF 相似的库记录。5、SixFrames 是以另外一种方法计算并显示结果,点击 SixFrames,结果中各框上边拉下的绿色短线表示为一个起始密码子,而各框下方的粉色短线表示为一个终止密码子。 6、如果你拥有一个高等生物的 cDNA 时,可以利用 ORF finder 这个简单的工具来找到你的蛋白编码区域。因为 cDNA 不含有 intron,因此可拥有与微生物相似的 ORF 结构。 根据以上预测结果回答问题3:问题3:该条序列中最长的ORF是多长?编码多少氨基酸?位于序列中的什么位置? (二)使用GENSCAN在线软件预测真核生物基因 GENSCAN(/GENSCAN.html)软件由斯坦福大学的Chris Burge开发,它是针对基因组DNA序列预测ORF及基因结构信息的开放式在线资源,尤其适用于脊椎动物、拟南芥和玉米等真核生物。这里以提交一个AC号为AC002390的人类cosmid序列为例,进入GENSCAN页面,先选择物种脊椎动物(vertebrate),上传序列文件或直接粘贴序列,运行后,从返回结果中可获得所预测到的基因数目、外显子数目和类型,预测单元的长度、方向、位置及相位、编码区打分值、可信概率、总的分值等信息。(结果见实验五文件夹中AC002390 GENSCAN Output.htm)根据结果回答问题:问题4:经预测,该序列中可能有几个基因?是否完整?问题5:预测到的第一个基因的编码区由几个外显子组成?起始外显子的位置在什么区域?二、CpG岛的预测分析CpG岛(CgG island)是指一段200bp或更长的DNA序列,核苷酸G+C的含量较高,并且CpG双核苷酸出现频率占G+C含量的50%以上,其中“P”表示“C”和“G”以磷酸二酯键连接。有6080的人类基因的启动子和起始外显子附近存在CpG岛,因此搜寻cpG岛可以为基因及其启动子预测提供重要线索。这里介绍CpGPlot这个EMBL-EBI中心开发的网上在线预测CpG岛工具。我们仍以上述AC002390这个人类cosmid序列作为CpGPlot的预测对象。进入CpGPlot页面(http:/www.ebi.ac.uk/emboss/cpgplot/index.html),上传序列文件或直接粘贴序列并采用默认参数,完成提交任务。(结果见实验五文件夹AC002390 CpGPlot.mht文件)运行(Run)后,CpGPlot将以CpGplotPNG格式返回3个图示结果:序列各个位置(G+C)含量观察值/期望值(Obs/Exp)的比率;序列各个位置的(G+C);CpG出现频率高于阈值的位置。同时以Cpgplot output输出文本,告知提交序列AC002390全长70311,各个位置(G+C)含量Obs/Exp比率0.60,(G+C)50.0;两个CpG岛长度及起始、终止位置。问题6:在该序列中预测到几个CpG岛?分别位于序列的什么区域?参照GENSCAN的预测结果发现,前一个CpG岛位置正好和基因起始外显子区域对应;而后一个CpG岛出现在启动子区域上游2 kb左右的区域,并没有基因对应关系,这可能是GENSCAN对基因位置的错误预测所致。由此说明,基因及启动子预测尚需要来自其他分析的证据。三、转录终止信号的预测分析真核生物编码基因中,转录终止信号是在mRNA序列的3端终止密码子下游位置上的加尾信号(tailing signal),其主要标志为AATAAA序列,称为多聚腺苷酸信号(polyadenylation signal),简称polyA信号序列。搜索polyA序列有助于基因终止位点的预测。这里介绍在线工具POLYAH,它可以识别3端剪切和polyA区域。进入POLYAH页面(/berry.phtml?topic=polyah&group=programs&subgroup=promoter),用Fasta格式上传AC002390序列文件或直接粘贴序列传交(PROCESS)后,网页返回结果列出了该序列所有50个可能的polyA位点的位置(Pos.)和权重(LDF)。例如,在52 398碱基处有polyA信号,权重为2.54。注意:真核生物基因组序列本身存在大量的重复序列,当以polyA位点预测基因终止信号位点时会出现较大比例的假阳性。问题7:终止信号预测结果与GENSCAN软件的预测结果是否一致?有何不同?四、启动子区域的预测分析启动子是一段位于结构基因5端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合并引导转录的起始。启动子决定了DNA转录的方向、速度和准确性。本实验借助PromoterScan工具来预测AC002390序列的启动子区域。进入PromoterScan页面(/molbio/proscan/),粘贴序列后不需要设置任何参数。(结果见实验五文件夹中AC002390 proscan.htm文件)PromoterScan以单元的形式列出所有可能的启动子区域,给出可能的转录因子名字,Ghosh TFD da
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025药店促销劳务合同
- 主提升机操作工测试考核试卷及答案
- 证券从业考试机考界面及答案解析
- 电力公司安全规程题库及答案解析
- 阳煤医院岗前培训考试及答案解析
- 护理技能高考考试题库及答案解析
- 铣工抗压考核试卷及答案
- 乙炔发生工三级安全教育(公司级)考核试卷及答案
- 四氯化钛精制工知识考核试卷及答案
- 光学数控磨工质量管控考核试卷及答案
- 2025机采棉作业合同协议书范本
- 树木学试题及答案北林
- 财政补贴政策在促进农村电商发展的扶持效果可行性分析报告
- 《创伤失血性休克中国急诊专家共识(2023)》解读 2
- 便利店设计方案
- 对意外伤害儿童的紧急救治方法
- 为成果而管理
- 乳腺癌骨转移护理查房课件
- 新视野大学英语1读写教程-Unit1-Fresh-Start-课件
- 客户信息登记表
- 不合格品处置记录表(标准版)
评论
0/150
提交评论