生物信息学习题_第1页
生物信息学习题_第2页
生物信息学习题_第3页
生物信息学习题_第4页
生物信息学习题_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版下载后可任意编辑和复制第第页生物信息学习题

生物信息学课后习题及答案

(由10级生技一、二班课代表整理)

一、绪论

1.你认为,什么是生物信息学?

采纳信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋

白质等)的收集、加工、储存、分析、解释的一门学科。

2.你认为生物信息学有什么用?对你的生活、讨论有影响吗?

(1)主要用于:在基因组分析方面:生物序列相像性比较及其数据库搜寻、基因猜测、基因组进化和分

子进化、蛋白质结构猜测等

在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学讨论:SARS、人类基因

组方案、基因组方案:基因芯片。

(2)指导讨论和试验方案,削减操作性试验的量;验证明验结果;为试验结果供应更多的

支持数据等材料。

3.人类基因组方案与生物信息学有什么关系?

人类基因组方案的实施,促进了测序技术的迅猛进展,从而使试验数据和可利用信息急剧

增加,信息的管理和分析成为基因组方案的一项重要的工作。而这些数据信息的管理、分

析、解释和使用促使了生物信息学的产生和快速进展。

4简述人类基因组讨论方案的历程。

通过国际合作,用15年时间(1990-2022)至少投入30亿美元,构建具体的人类基因

组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其他生

物进行类似讨论。

1990,人类基因组方案正式启动。

1996,完成人类基因组方案的遗传作图,启动模式生物基因组方案。

1998完成人类基因组方案的物理作图,开头人类基因组的大规模测序。Celera公司加

入,与公共领域竞争启动水稻基因组方案。

1999,第五届国际公共领域人类基因组测序会议,加快测序速度。

2000,Celera公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组

——拟南芥全基因组的测序工作。

2022,人类基因组“中国卷”的绘制工作宣告完成。

2022,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制胜利,人类基

因组方案的.目标全部实现。

2022,人类基因组完成图公布。

2.我国自主学问产权的主要基因组测序方案有哪些?

水稻(2022),家鸡(2022),家蚕(2022),家猪(2022),大熊猫(2022)

二.第一章

1、生物信息指哪些?

主要有从DNA序列、蛋白质序列、蛋白质结构和功能讨论中解读的:遗传信息、进化信息、

结构和功能信息。

2、基因组测序的基本策略有哪些?

逐个克隆法:小片段针对图谱的!!

全基因组鸟枪法:大片段-测序-组装

3.什么叫contig?

Contig:重叠群,基因组测序中将很多序列片段经过比对找到重叠区,从而连接成的长

片段。

4、生物信息学中最重要的贡献是什么?

1970:Needleman和Wunsch提出了闻名的序列比对算法,是生物信息学进展中最重要的

贡献;

5、什么大事大大促进了生物信息学的进展?

20世纪90年月后

HGP促进生物信息学的快速进展

6、生物信息学讨论有什么意义?

(1)熟悉生物本质,了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之

间的关系

(2)转变生物学的讨论方式

(3)转变传统讨论方式,引进现代信息学方法

(4)在医学上的重要意义

为疾病的诊断和治疗供应依据

为设计新药供应依据

三.第二章

1、简述三干六界学说。

2.TSS,外显子和内含子的概念。

TSS是转录起始位点(TranscriptionStartSite)的英文缩写,是指DNA上一段与RNA

聚合酶结合并起始转录的一段DNA序列。真核生物结构基因,由若干个编码区和非编码

区相互间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成

的完整蛋白质,这些基因称为断裂基因。其中的编码区即为外显子,非编码区即为内含

子。

3.如何推断起始密码子?内含子?

AUG甲硫氨酸(met)内含子(5’-GT??AG-3’)

4.蛋白质二级结构有哪些?

(1)螺旋

(2)b折叠–平行折叠反平行折叠

(3)b转角–连接作用”U”型结构(大多Phe,Gly组成)

(4)无规卷曲-没有确定规律性的肽链构象,但仍是紧密有序的稳定结构

(5)无序结构多肽链中有60%的区段为a螺旋和b折叠

5、HGP选择作为讨论人类的四大“模式生物“有哪些?

酵母、线虫、果蝇、小鼠。

6、背诵生物信息数据库中的核苷酸代码?

四.第三章(1)

1、下列数据库分别是什么类型的数据库?

序列数据库中的核酸数据库(GenBankPIRDDBJSWISS-PROTEMBL)

结构数据库(PDB)

2、如何查找由RaoY试验室于2022以后发表的,文章主题中与brain有关的文献,写出

检索语言。

Brain[ti]ANDRaoY[au]AND2022:2022[dp]

3、如:我要查找RaoY在Nature或Science上发表的论文,哪一个检索语言是正确的?正确①RaoY[au]AND(Nature[Journal]ORScience[Journal])

②RaoY[au]ANDNatureORScience[Journal]

③RaoY[au]ANDNature[Journal]ORScience[Journal]

④RaoY[au]AND(NatureORScience)[Journal]

五.第三章(2)

1、简述GenBank数据库中GBFF格式的结构?

GenBankflatfile(GBFF)是GenBank数据库的基本信息单位,也是最广泛地用以

表示生物序列的格式之一。GBFF可以分成三个部分,头部包含关于整个记录的信息(描

述符);第二部分包含了解释这一记录的特性;第三部分是核苷酸序列自身。全部的核

苷酸数据库记录(DDBJ/EMBL/GenBank)都在最终一行以//结尾.

2、GBFF格式的特性表格式包括哪三个部分?

特性表格式包含三个部分:

第一,特性关键词(Featurekey);

第二,特性位置(Location);

第三,限定词(Qualifiers)

3、指出下列特别标识符的格式?

①序列辨认号(GI):一串阿拉伯数字

②GenBank/EMBL/DDBJ序列接受号:

1个字母+5个阿拉伯数字;1个字母+6个阿拉伯数字

③RefSeq序列接受号:带“-”

mRNA记录(NM*);完整的基因组或染色体(NC*)

④PDB序列接受号:1个阿拉伯数字+3个字母

4、指出下列GBFF格式中特性表含义?

(23.45)..600指明序列特征起始碱基在23和45碱基之间,终止于600号碱基

145^177指明145和177碱基之间的某个位点

Complement(join(2691..4571,4918..5163))纪录中的特性处于2691至4571碱基以及

4918至5163碱基之间的序列相连构成的连续序列的互补链上

六.第四章

1、这两个序列的cost和score分别是多少?

(A)cost2score9(B)cost4score6

2、在序列比对运算时最终结果是上面哪种运算方式?(A)

3、给定一个DNA打分矩阵,假设空位罚分为2,根据以下的打分矩阵,对于下列对齐方案的计分值为多少?A

A

T

C

G1-1-1-1T-11-1-1C-1-11-1G-1-1-11

GCGACTC

TAGAGAC

***********GG00

4、推断题:

(1)A序列和B序列的相像性是80%对

(2)A序列和B序列的全都性为39.4%对

(3)A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论