生物信息学复习题已附答案_第1页
生物信息学复习题已附答案_第2页
生物信息学复习题已附答案_第3页
生物信息学复习题已附答案_第4页
生物信息学复习题已附答案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本卷的答案仅做参考,如有疑问欢迎提出。后面的补充复习题要靠你们自己整理答案了。 生物信息学复习题 一、填空题1、识别基因主要有两个途径即基因组dna外显子识别和基于est策略的基因鉴定。2、表达序列标签是从 mrna 中生成的一些很短的序列(300-500bp),它们代表在特定组织或发育阶段表达的基因。装 订 线3、序列比对的基本思想,是找出 检测基因 和 目标序列 的相似性,就是通过在序列中插入 空位 的方法使所比较的序列长度达到一致。比对的数学模型大体分为两类,分别是整体比对 和 局部比对 。4、2-de的基本原理是根据蛋白质 等电点 和 分子量 不同,进行两次电泳将之分离。第一向是 等电

2、聚焦分离 ,第二向是 sds-page分离 。 5、蛋白质组研究的三大关键核心技术是 双向凝胶电泳技术 、 质谱鉴定技术 、 计算机图像数据处理与蛋白质数据库 。二、判断题1、生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,c值越大,这是真核生物基因组的特点之一。(对)2、cds一定就是orf。(对)3、两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源,就具有共同的祖先。(错)4、sts,是一段200-300bp的特定dna序列,它的序列已知,并且在基因组中属于单拷贝。(对)5、非编码dna是“垃圾dna”,不具有任何的分

3、析价值,对于细胞没有多大的作用。(错)6、基因树和物种树同属于系统树,它们之间可以等同。(错)7、基因的编码序列在dna分子上是被不编码的序列隔开而不连续排列的。(对)8、对任意一个dna序列,在不知道哪一个碱基代表cds的起始时,可用6框翻译法,获得6个潜在的蛋白质序列。(对)9、 一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。(对)10、外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以不同。(对)11、比较是科学研究中最常见的方法,在生物信息学研

4、究中,比对是最常用和最经典的研究方法。(对)12、orf一定就是cds。(错)13、用不同的方法可以构建不同的系统发育树,为保证分析结果的可靠性,需要对进化树进行评估。(对)14、相似性是一种很直接的数量关系,无需实验验证。(错)15、基因树和物种树同属于系统树,它们之间可以等同。(错)16、蛋白质和dna的同源性常常通过它们序列的相似性来判定,如果两个基因或蛋白质有着几乎一样的序列,具有高度的相似性,那么它们一定是同源。(错)17、所谓局部比对是找出两个被比较序列的最类似片段。(对)三、不定项选择题1、( abc )是现在国际上最主要的三大核酸序列数据库a. embl b. ddbj c.

5、genbank d. ncbi e. ebi2、rflp是dna多态性中最多见的一种,它产生的机制包括( abe )a.dna分子产生突变,使某些酶切位点数增加b. dna分子产生突变,使某些酶切位点数减少c. 限制性酶切位点之间重复序列数目变异d. 限制性酶星活性e. 限制性酶切位点前后的dna片断发生插入或删除3、下面序列哪些为反向重复序列 ( bd )a. gcacttggcacttg b. gcacttgcaagtgc cgtgaaccgtgaac cgtgaacgttcacgc. gcacttgcaagtgc d. gcactagctagcggcgtgaacgttcacg cgtga

6、tcgatcgcc4、分析est序列时首要注意以下几点( acde )a.est序列中除了agtc外,可能出现未知碱基b.est只是单次测序,得出的结果没有可信度c.est序列中可能出现错误的插入和缺失,导致读码框移位d.某个est序列是数据库中另一序列的一个片段e.某个est序列不在基因的编码区内5、人类基因组计划要完成的几张图谱分别是(abce )a. 物理图谱 b. 遗传图谱 c. 序列图谱 d. 生物图谱 e. 基因图谱6、最常用的序列相似性查询工具是( ab )a.fasta b.blast c.swiss-prot d.pdb e.pir7、下列哪些分子类型属于非蛋白质编码区(ab

7、cde )a.内含子 b.卫星dna c.伪基因 d.启动子 e.增强子8、卫星dna的多态性是由( d )所决定的。a. dna点突变个数b. 限制性内切酶识别序列个数不同c. dna的二级结构不同d. 重复单位不同e重复次数不同9、真核基因组特点包括( abcde )a. 基因组大,巨大的非编码序列,重复序列占了绝大部分b. 基因结构复杂,无显著长度的开放阅读框c. 存在可变剪接 d. cpg岛 e. 等值区10、20世纪三大著名计划包括( ace )a.阿波罗登月计划 b.卫星计划 c.hgp d.肿瘤计划 e.曼哈顿原子弹计划四、名词解释1、生物信息学:广义的生物信息学是指从事对基因组

8、研究相关的生物信息的获取、加工、储存、分配、分析和解释。而狭义的生物信息学是指综合应用信息科学、数学的理论、方法和技术,管理、分析和利用生物分子数据的科学。2、蛋白质组:指由一个基因组,或一个细胞、组织表达的所有蛋白质。3、contig:就是叠连群,是指彼此间可通过重叠序列而连接成较长片段的一组短片段,也指彼此间可通过重叠序列而连接成较长片段的一组短片段。4、序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。 五、简答题(共30分)1、下面的粗体部分是从genbank中查出的记录的部分内容,你从中得到什么信息?(8分)locus af486325 477bp

9、dna linear vrl 12-aug-2002definition human papillomavirus type 16 strain na1 isolate pwh-q39 e6 protein (e6) gene, complete cds.accession af486325version af486325.1 gi:19744699source human papillomavirus type 16reference 1 (bases 1 to 477) authors chan,p.k., lam,c.w., cheung,t.h., li,w.w., lo,k.w.,

10、chan,m.y., cheung,j.l., xu,l.y. and cheng,a.f. title human papillomavirus type 16 intratypic variant infection and risk for cervical neoplasia in southern china journal j. infect. dis. 186 (5), 696-700 (2002) pubmed 12195358答:第一行第一行第一行第一行:locus af486325 477bp dna linera vrl 12-aug-2002 locus:基因座位,某一

11、特定的基因位于染色体或其他载体所在位置,包括该基因的全部核苷酸序列。locus名称由一个英文字母+数字组成总长不超过10个字符。在数据库中locus名称在数据库中必须是独立的、唯一的,以保证检索的不被重复。 477bp 长度 dna:生物分子类型。有dna、rna、trnamrnarrna等 vrl:分类码 三个字母组成。以前按生物种类对序列分类,现在按序列的功能分类,est、sts、con类等。 12-aig-2002 是数据的收录日期 definition行:用以总结记录的生物意义。 accession行:af486325,是检索号,是从数据库中检索一个记录的主要关键词。所有genbank

12、的记录都只有一个单独的accession行,并且只有一个检索号,检索号采用两种编码:1+5(1个大写字母+5个数字)或2+6(两个大写字母+6个数字)。现行采用2+6格式。 version行:af486325.1,检索号、版本号。1为第1版。每次序列改变,版本号加1。gi号:是基因信息号(gene identifier),一个gi号对应一个核苷酸序列,序列改变gi号也改变 keywords行是历史的遗物,现在不在强调使用。 source行是生物体的来源,organism行是分类系谱,生物的拉丁文名称。 reference 1(bases 1to 477)参考文献,每个记录收录的文献,是序列的的

13、出处依据,与medline有超级链接。 里边包含有authors,title,journal,medline,pubmed,分别是作者,主题,所属期刊,文献数据库的链接。【第一项是locus名称,前三个字母代表物种名 第二项是序列长度 第三项是序列分子类型 第四项是分子为线性的 第五项是genbank分类码 第六项是最后修订日期 。】2、 如何检测dna序列中潜在的cds? 答:对任意一个dna序列,可能并不知道哪一个碱基代表cds的起始。这种情况下,不妨试用六框翻译(six-frame translation)。如图4-2给定一个dna序列,可以利用遗传密码将其翻译为蛋白质序列,这种方式称为

14、概念性翻译(conceptual translation)。与基于生化实验的蛋白质翻译不同的是,概念性翻译仅通过理论推导或计算获得。六框翻译通过移动阅读框起始碱基,获得6个潜在的蛋白质序列。其中,3个是正向翻译,3个是反向翻译,6种可能的蛋白质中至多只有一种是正确的。3、 est能否代表一个新的基因?为什么? 答:不能,由于不是所有与数据库不匹配的est都代表不同基因,其中包含两种可能。一种可能:该est是一个cds,而数据库内尚无它的同源序列。另一种可能:该est是一段数据库内没有收录的非编码序列。4、简述蛋白质组研究的理论基础。答:1、从mrna表达水平 并不能预测蛋白表达水平。有人研究了

15、mrna和蛋白质表达的关系,以处于对数生长期的啤酒酵母为研究对象,mrna的表达由sage频率表指示,同位素标记酵母蛋白,共选择80个基因,结果没有发现翻译和转录丰度有明显相关。2、蛋白质的动态修饰和加工并非必须来自基因序列。在mrna水平上有许多细胞调节过程是难以观察到的,因为许多调节是在蛋白质的结构域中发生的。许多蛋白只有与其它分子结合后才有功能,蛋白的这种修饰是动态的、可逆的,这种蛋白修饰的种类和部位通常有能由基因序列决定。3、蛋白质组是动态反映生物系统所处。细胞周期的特定时期、分化的不同阶段、对应的生长和营养状况、温度、应激和病理状态所对应的蛋白质组是有差异的。蛋白质组学的研究可望提供

16、精确、详细的有关细胞或组织状况的分子描述。因为诸如蛋白质合成、降解、加工、修饰的调控过程,只有通过蛋白质的直接分析才能提示。 5、你打算扩增下图所示的两段序列之间的dna,请从所列出的引物中,选出合适的一对(所选引物前打钩)。 模板dna5gacctgtggaagccatacgggattg-33ctggacaccttcggtatgccctaac-5 引物5-gacctgtggaagc 5-catacgggattg5-ctggacaccttcg 5-gtatgccctaac5-cgaaggtgtccag 5-gttagggcatac5-gcttccacaggtc 5-caatcccgtatg答:

17、引物1:5-gacctgtggaagc ;引物2:5-caatcccgtatg6、 蛋白质三级结构预测的主要方法?答:1)同源建模法:依据蛋白质与已知结构蛋白比对信息构建3d模型; 2)折叠识别法:寻找与未知蛋白最合适的模板,进行序列与结构比对,最终建立结构模型; 3)从头预测法:根据序列本身从头预测蛋白质结构。 7、假设你得到一段未知蛋白氨基酸序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知蛋白质的功能和家族类别以及其结构预测.答:1、用该序列进行blastp搜索。 2、再对其进行蛋白质结构域、功能域的搜索,可以用znterproscan、pfam,并对其进行结构分析

18、。 3、再用clustw进行多序列比对。 4、用人工神经网络的方法对其结构进行结构预测8、 引物设计的基本原则有哪些,有哪些基本参数要考虑,最常用的引物设计软件是什么?答:引物设计的基本原则:引物与模板的序列要紧密互补;引物与引物之间避免形成稳定的二聚体或发夹结构;引物不能在模板的非目的位点引发dna 聚合反应(即错配)。 有如下这些基本参数要考虑:引物长度,产物长度,序列tm 值,引物与模板形成双链的内部稳定性(用?g值反映),形成引物二聚体及发夹结构的能值,在错配位点的引发效率,引物及产物的gc 含量,等等。 最常用的引物设计软件是:primer premier. 六、综合分析题(13分)1、考虑下面一条序列,标出其中可能的起始密码子和终止密码子以及可能的基因转录剪切位点。(用下划线或箭头标示),并写出可能的开放阅读框以及可能的转录

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论