生物信息学复习资料_第1页
生物信息学复习资料_第2页
生物信息学复习资料_第3页
生物信息学复习资料_第4页
生物信息学复习资料_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、名词解释(31 个)1. 生物信息学 : 广义: 应用信息科学的方法和技术, 研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义: 应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。2. 二级数据库: 对原始生物分子数据进行整理、 分类的结果, 是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。3. 多序列比对:研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。4. 系统发育分析

2、: 是研究物种进化和系统分类的一种方法,其常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。5. 直系同源:如果由于进化压力来维持特定模体的话,模体中的组成蛋白应该是进化保守的并且在其他物种中具有直系同源性。指的是不同物种之间的同源性,例如蛋白质的同源性, dna 序列的同源性。(来自百度)6. 旁系(并系)同源: 是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。 用来描述在同一物种内由于基因复制而分离的同源基因。(来自百度)7. fasta 序列格式: 将一个 dna 或者蛋白质序列表示为一个带有一些标记的核苷酸或氨基

3、酸字符串。8. 开放阅读框( orf): 是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。(来自百度)9. 结构域: 大分子蛋白质的三级结构常可分割成一个或数个球状或纤维状的区域,折叠得较为紧密,各行其功能,称为结构域。10. 空位罚分: 序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空位并进行罚分,以控制空位插入的合理性。 (来自百度)11. 表达序列标签:通过从cdna文库中随机挑选的克隆进行测序所获得的部分cdna 的 3或5端序列。(来自文献)12. gene ontology协会:13. hmm 隐马尔可夫模型

4、:将核苷酸序列看成一个随机序列, dna 序列的编码部分与非编码部分在核苷酸的选用频率上对应着不同的 markov 模型。14. 一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释15. 序列一致性:指同源 dna 顺序的同一碱基位置的相同的碱基成员 , 或者蛋白质的同一氨基酸位置的相同的氨基酸成员 , 可用百分比表示。16. 序列相似性: 指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。17. blastn: 是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 (来自百度)18. blastp: 是蛋白

5、序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 (来自百度)19. blastx:是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列 (一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白 序列比对。(来自百度)20. tblastn:是蛋白序列到核酸库中的一种查询。与 blastx相反,它是将库 中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。(来自百度)21. tblastx:是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核 酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对

6、会产生36种比对阵列。(来自百度)22. kegg:京都基因与基因组百科全书,是系统分析基因功能、基因组信息的 数据库,它整合了基因组学、生物化学以及系统功能组学的信息,有助于研 究者把基因及表达信息作为一个整体网络进行研究。23. chip-seq:就是通过高通量测序对 chip所得到的序列进行测序,从而进行 蛋白和dna相互作用相关研究。24. 分子生物网络:25. 蛋白质相互作用(ppi):是指蛋白质分子之间的相关性,并从生物化学、信 号转导和遗传网络的角度研究这种相关性。26. 高通量测序:一次性对几百万到十亿条dna分子进行并行测序,又称为下一代测序技术,具使得可对一个物种的转录组和

7、基因组进行深入、细致、全 貌的分析,所以又被称为深度测序。27. 比较蛋白质组学:即对模式生物或重要生命过程的蛋白质组学特征进行比 较。28. ncbinr:29. gt-ag 结构:30. entrez检索系统:面向生物学家的数据库查询系统,其特点之一是使用十分 方便。它把序列、结构、文献、基因组、系统分类等不同类型的数据库有机 地结合在一起,通过超文本链接,用户可以从一个数据库直接转入另一个数 据库。31. 系统生物学:是从系统水平来理解生物学系统,利用一系列的原理与方法学 来研究分子行为与系统特性与功能的关系,通过计算生物学来定量阐明和预 测生物的功能、表型和行为。二、选择题(30个)1

8、 .下面哪种数据库源于 mrna信息(a) : a. dbest、b. pdb、c. omim、 d. htgs2 .如果我们试图做蛋白质亚细胞定位分析, 应使用()o a.ndb数据库、b.pdb 数据库、c.genbank数据库、d.swiss-prot数据库3 . pir是()。a.核酸数据库、b.mrna数据库、c.启动子数据库、d.蛋白质 数据库4 .以下哪一项不属于启动子研究范围?()a.cpg岛预测、b.转录起始点预测、c.糖基化修饰、d.甲基化检测5 . htgs的含义是(c) 。a.表达序列标签、b.序列标签位点、c.高通量基因组 序列、d.人工合成序列6 . sts的含义是

9、()。a.表达序列标签、b.序列标签位点、c.高通量基因组序 歹i、d.人工合成序列7. hgp 是( c)。a.在线人类孟德尔遗传数据、b.国家核酸数据库、c.人类基因组计划、d.水稻基因组计划8、下列中属于一级蛋白质结构数据库的是: () a. embl 、 b. ddbj 、 c. pdb、 d.swiss-prot9 blast 教案所程序中, 哪个方法是不存在的? () a. blastp 、 b. blastn 、c. blastx 、 d. blastq10人类基因组的结构特点不包括:()a.基因进化、b.基因数目、c.基因重复序列、d.基因组复制11、下列哪个选项不是微阵列实验

10、设计的内容?()a. 贝叶斯网络法、 b. 对照组的选择、 c. 重复样本的使用、 d. 随机化原则12、构建序列进化树的一般步骤不包括. ()a. 建立 dna 文库、 b. 建立数据模型、 c. 建立取代模型、 d. 建立进化树13、在genbank 数据库中,生物学工作者向其提交数据有两种方式,其中用于提交少量数据的是基于 web 方式的()。 a. bankit、 b. sequin、 c. version、 d. matrix 14、 序列数据库包括核酸序列数据库和蛋白序列数据库。下列哪个不属于蛋白质序列数据库?() a. pir 、 b. uniprot 、 c. swiss-pr

11、ot、 d. omim15、 序列数据库包括核酸序列数据库和蛋白序列数据库。下列哪个不属于核酸列数据库?()a. genbank、 b. genpep、t c. embl 、 d. ddbj16、()是ncbi 提供的集成检索工具,通过一次检索可查询 ncbi 多个子数据库中的相关信息。a. retrieve、 b. srs、 c. entrez、 d. pir17、entrez数据库中的剪贴板的容量是()。a.500条记录、b.1000条记录、c.5000 条记录、d.10000条记录18、蛋白质信号肽的预测工具有()。a.nnpredict、 b.predictprotein、 c.sin

12、gald、d.singalp19、 bioinformatics 的含义是()。 a. 生物信息学、 b. 基因组学、 c. 蛋白质组学、 d. 表观遗传学20、目前应用于基因芯片表达数据统计分析的主要方法是()。a. 卡方检验、b. 相关分析、 c. 聚类分析、 d. 正态性分布检验21、 ncbi 中人类无冗余基因数据库是()。a. unigene、 b. unipro 、 c. uniref、d. urf22、基本局部比对搜素工具是()。a. mega、 b. clustalw、 c. blast 、d. gcg23、 根据研究发现, 人类基因组中真正编码蛋白质的区域仅占 dna 序列的

13、 () 。 a.1-2%、 b.3-5%、 c.5-10%、 d.10-20%24、被誉为“生物信息学之父”的科学家是()。a. dulbecco、 b. sanger、 c.吴瑞、 d. 林华安25、多序列比对工具是()。a. blast 、 b. clustalw、 c. mega、 d. gcg26、生物芯片分析中使用的聚类分析输出图形主要以下列哪种方式表现?()a. 以彩色小方块阵列表示、 b. 以蜂窝形状表示、 c. 以黑白圆点表示、 d. 以 彩色线条表示27、htgs的含义是()。a.表达序列标签、b.序列标签位点、c.高通量基因组 序列、d.人工合成序列28、accession

14、 number)勺含义是()。a.登录号、b.算法、c.比对、d.类推29、()是欧洲分子生物学网 emblnet 的主要检索工具,也是一个开放的数据查询系统。 a. query 、 b. srs、 c. pdb、 d. pir30、 数据挖掘的四个步骤不包括下列哪个. () a. 数据选择、 b. 数据转换、 c. 数据记录、 d. 结果分析三、是非题( 16 个)1、生物学就是实验科学,所有的研究结论从实验中来,于实验中得到验证。2、比较是科学研究中最常见的方法, 在生物信息学研究中,比对是最常用和最经典的研究手段。3、两个蛋白质序列相似性超过30%就是同源蛋白。4、蛋白质序列相似性指一级

15、序列中氨基酸残基相同。5、蛋白质序列相似性指氨基酸残基具有相似特性. 侧链基团大小电荷性、疏水性等相同。6、核酸序列相似性指序列中相同碱基所占的比例。7、对一段未知功能dna 片段进行功能预测需对其进行3 位翻译。8、对一段未知功能dna 片段进行功能预测需对其进行6 位翻译。9、相似性是指一种很直接的数量关系,无需实验验证。10、相似性是指一种很直接的数量关系,也需实验验证。11、不同种属间的同源序列称为直向同源序列。12、不同种属间的同源序列称为共生同源序列。13、所谓局部比对,即分析两个序列是否有局部序列的相似。14、所谓整体比对,即找出两个序列全长的最优比对结果。15、 psi-bla

16、st 是 blast 程序家族中敏感性最高的子程序。16、 phi-blast 是 blast 程序家族中敏感性最高的子程序。四、问答题( 15 个)1、生物信息学的发展经历了哪几个阶段2、序列的相似性与同源性有什么区别与联系?3、 blast 套件的 blastn、 blastp、 blastx、 tblastn 和 tblastx 子工具的用途什么?4、生物信息学的主要研究领域。5、初级数据库、二级数据库的概念,说出几个数据并说明包含什么数据。6、简述高通量测序的应用范围7、简述系统发生分析步骤8、说出至少一种蛋白质结构数据库和一种可视化工具。9、 entrez 集成于哪个数据库平台?主要功能是什么?在应用中可以访问哪些子数据库(请列举5 个以上)?10、试述swiss-prot 中的数据来源11、分子生物网络可以分成哪几类?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论