《生物信息学》试卷(A)_第1页
《生物信息学》试卷(A)_第2页
《生物信息学》试卷(A)_第3页
《生物信息学》试卷(A)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

====Word行业资料分享--可编辑版本--双击可删====源-于-网-络-收-集武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(A)及答案翻译下列名词并解释。(每题5分,共25分)1.EST2.ORF3.BLAST4.ANN5.HGP二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有和二维核磁共振技术。2、BLAST对序列格式的要求是常见的格式。3、系统发育树由一系列和组成,其中每个代表一个分类单元,而代表物种之间的进化关系。、、等。6.目前已经是最广泛使用的系统发育程序。三、解释说明:请按要求对下列GenBank文件作解释说明。(每小题4分,共20分)1、LOCUS行中的第3项mRNAlinear表示,这里是。2、DEFINITION行在GenBank记录中用以3ACCESSION是,是从数据库中检索一个记录的主要。4.FEATURES后面部分是,直接表达了记录的生物背景知识,5CDS30…533表示。四、问答。(共35分)1简述国际上有哪几个著名的核酸序列数据库?(10分)2何谓序列比对的相似性和同源性,它们之间有何联系和区别(10分)3试述发现基因的一般过程(15分)《生物信息学》试卷(A)答案翻译下列名词并解释。(每题5分,共25分)1.ESTexpressedsequencetag表达序列标签2.ORFOpenReadingFrame,开放阅读框3.BLASTBasicLocalAlignmentSearchTool局部相似性基本查询工具4.ANNArtificialNeuralNetwork,人工神经网络5.HGPHumangenomeproject人类基因组计划二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有X射线晶体衍射法和二维核磁共振技术。2、BLAST对序列格式的要求是常见的FASTA格式。3、系统发育树由一系列节点和分支组成,其中每个节点代表一个分类单元,而节点之间的连线代表物种之间的进化关系。统计方法进行蛋白质结构预测包括经验性方法、结构规律提取方法、同源模型化方法等。5.PHYLIP目前已经是最广泛使用的系统发育程序。三、解释说明:请按要求对下列GenBank文件作解释说明。(每小题4分,共20分)1、LOCUS行中的第3项mRNAlinear表示生物分子的类型,这里是单链的mRNA。2、DEFINITION行在GenBank记录中用以总结记录的生物意义3ACCESSION是检索号,是从数据库中检索一个记录的主要关键词。4.FEATURES后面部分是特性表,直接表达了记录的生物背景知识,5CDS30…533表示编码序列是从序列的第30个核苷酸到第533个核苷酸的连续序列四、问答。(共35分)1国际上有哪几个著名的核酸序列数据库?Genbank

Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。

EMBL核酸序列数据库

由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。。DDBJ数据库

日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。

这3个大型数据库于1982年达成协议,组成合作联合体。它们每天交换信息,并对数据库DNA序列记录的统一标准达成一致。每个机构负责收集来自不同地理分布的数据(EMBL负责欧洲,GenBank负责美洲,DDBJ负责亚洲等),然后来自各地的所有信息汇总在一起,3个数据库共同享有并向世界开放,2何谓序列比对的相似性和同源性,它们之间有何联系和区别假如两个生物大分子的序列足够相似,几乎毫无疑问(当然不是绝对)它们具有相似的生物学功能,并且可能是同源的。相似性和同源性虽然在某种程度上具有一致性,但它们是完全不同的两个概念。相似性(similarity)序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。同源性(homology)指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论。相似性是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量,而同源性是指从一些数据中推断出的两个基因在进化上曾具有共同祖先的结论,它是质的判断。基因之间要么同源,要么不同源,绝不象相似性那样具有多或少的数量关系。粗略的说,如果序列之间的相似性超过30%,它们就很可能是同源的。3试述发现基因的一般过程(15分)第一步:获取DNA目标序列可通过PubMed查找你感兴趣的资料;通过GenBank或EMBL等数据库查找目标序列。第二步:查找ORF并将目标序列翻译成蛋白质序列利用相应工具,第三步:在数据库中进行序列搜索可以利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索。第四步:进行目标序列与搜索得到的相似序列的整体比对(globalalignment)虽然第三步已进行局部比对(localalignment)分析,但整体比对有助于进一步加深目标序列的认识。第五步:查找基因家族进行多序列列线(multiplesequencealignment)和获得列线区段的可视信息。可分别在AMAS(OxfordUniversity)和BOXSHADE(ISREC,Switzerland)等服务器上进行。第六步:查找目标序列中的特定模序①分别在Procite、BLOCK、Motif数据库进行profile、模块(block)、模序(motif)检索;②对蛋白质序列进行统计分析和有关预测第七步:预测目标序列结构可以利用PredictProtein(EMBL)、NNPREDICT(UniversityofCalifornia)等预测目标序列的蛋白质二级结构。第八步:获取相关蛋白质的功能信息为了了解目标序列的功能,收集与目标序列和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论