生物信息学复习题
3.FASTA序列格式。FASTA序列格式。多序列比对。A) 丙氨酸Ala B) 谷氨酰胺Gln C) 甲硫氨酸 D) 半胱氨酸Cys。生物信息学有三个方面的含义。1) 生物信息学是一个学科领域。1) 生物信息学是一个学科领域。2) 生物信息学是把基因组DNA序列信息分析作为源头。3) 生物信息学的研究目标。
生物信息学复习题Tag内容描述:<p>1、一、名词解释:1.生物信息学: 研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号()表示一个新文件的开始,其他无特殊要求。4.genbank序列格。</p><p>2、生物信息学复习题一、 名词解释生物信息学, 二级数据库, FASTA序列格式, genbank序列格式, Entrez,BLAST,查询序列(query),打分矩阵(scoring matrix),空位(gap),空位罚分,E值, 低复杂度区域,点矩阵(dot matrix),多序列比对,分子钟,系统发育(phylogeny),进化树的二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致树(consensus tree),bootstrap,开放阅读框(ORF),密码子偏性(codon bias),基因预测的从头分析法,结构域(domain)。</p><p>3、生物信息学复习资料陈芳 宋东光教材:生物信息学简明教程(钟扬编)1 绪论分子生物学与计算机、信息科学的结合生物信息学(Bioinformatics);Bioinformatics is the science of storing, extracting, organizing, analyzing, interpreting, and utilizing information from biological sequences and molecules. 生物信息学及其分支学科分子生物信息学(molecular informatics)即狭义的生物信息学,指应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据;生物信息学(bioinformatics)广义的生物信息学指生命科学与数学、计算机科。</p><p>4、2012 生物信息学复习题一、选择题1. 根据 PAM 打分矩阵,下列哪个氨基酸最不容易突变?A) 丙氨酸Ala B) 谷氨酰胺Gln C) 甲硫氨酸 D) 半胱氨酸CysAla100,Gln93,Met94,Cys202. 下列哪个句子最好描述了两序列全局比对global alignments和局部比对local alignments的不同?A) 全局比对通常用于 DNA 序列,而局部比对通常用于蛋白质序列; B) 全局比对允许间隙,而局部比对不允许间隙;C) 全局比对寻求全局最大化,而局部比对寻求局部最大化; D) 全局比对比对整条序列,而局部比对寻找最佳匹配子序列3. 与 PAM 打分矩阵比较,BLOSUM 打分矩阵。</p><p>5、1.什么是生物信息学,如何理解其含义?答:生物信息学有三个方面的含义:1) 生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配 、分析和解释的所有方面。2) 生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。3) 生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问。</p><p>6、名词解释1.生物信息学 : 是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号()表示一个新文件的开始,其他无特殊要求。4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格。</p><p>7、生物信息学复习题名词解释1. Homology (同源):来源于共同祖先的序列相似的序列及同源序列。序列相似序列并不一定是同源序列。2.Orthologs(直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的同源序列,它们具有相似的功能。3.Paralogs(旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的一组基因,这些基因在功能上的可能发生了改变。基因复制事件是促进新基因进化的重要推动力。4.Xenologs (异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异同源。5.Identity Score:The sum。</p><p>8、中科院生物信息学期末考试复习题陈润生老师部分:1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要?答:生物信息学有三个方面的含义:1) 生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配 、分析和解释的所有方面,是基因组研究不可分割的部分。2) 生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。3) 生物信息学的研究目标是揭示“基因组信。</p><p>9、一、名词解释:1.生物信息学: 研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号()表示一个新文件的开始,其他无特殊要求。4.genbank序列格。</p><p>10、超二级结构:是介于二级和三级结构之间的一个结构层次。有的模体本身有一定的功能,有的与其他的结构成分协同发挥作用。Conting(叠连群):又译作连续克隆系。为搞清某段DNA的排列顺序而建立的一组克隆。被克隆的DNA小片段有相互邻接并部分重叠的关系,从而可以完全覆盖该段DNA,一个这样的克隆群即为一个conting。蛋白质组:对应于基因组的概念,指由一个细胞或一个组织的基因所表达的全部相应的蛋白质。蛋白质组是一个动态的概念:和基因不一样。不同组织和不同发育时期都不一样基因在转录后,还有一系列的修饰,翻译等过程都可以影响。</p><p>11、课程作业从下面三个题目中任选一个,运用所学的生物信息学知识,结合本研究领域,进行分析。要求:1)一定要结合本研究领域,写一个1万字左右的研究报告,包括插图、表格和文字等。2)分析中使用的软件要写明版本号。3)报告内容:包括摘要、研究背景及意义、材料与方法以及结果与讨论等部分,格式要规范。4)报告上应注明:学号、姓名、所属学院以及研究专业。5)提交时间:报告最后生成pdf格式文件,于1015年12月31日前将报告同时发给以下邮箱:longkeranaliyun.comtottyhy163.com412617230qq.com一、请利用核酸和蛋白质数据库下载“Hom。</p>