陈润生,生物信息学,考试总结_第1页
陈润生,生物信息学,考试总结_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、陈润生,生物信息学,考试总结 陈润生,生物信息学,考试总结 问题一:生物信息学的含义是什么?举一到两个例子说明你对生物信息学的哪方面感爱好。 参考答案:生物信息学有三个方面的含义:1、它是一个学科领域,包含着基因组信息的猎取、处理、存储、安排 、分析和解释的全部方面。2、生物信息学是把基因组dna序列信息分析作为源头,破译隐蔽在dna序列中的遗传语言,特殊是非编码区的实质;同时在发觉了新基因信息之后进行蛋白质空间结构模拟和猜测;其本质是识别基因信号。3、生物信息学的讨论目标是揭示“基因组信息结构的简单性及遗传语言的根本规律”。它是当今自然科学和技术科学领域中“基因组、“信息结构”和“简单性”这

2、三个重大科学问题的有机结合。 例子:怎样从新测得的dna序列中找到编码区?非编码区与编码区的差别是什么?非编码区有什么详细功能?rnai现象对于细胞来说有着很重要的意义,包括基因表达的调控等等,那么都有哪些详细机制可以诱导正常细胞产生rnai现象?sars病毒的比较基因组讨论;治疗sars的rnai设计;sars蛋白的结构猜测和模拟。 问题二:有哪些数据库可以发觉新基因,其本质是什么? 参考答案:大部分新基因是靠理论方法猜测出来的。 a)、利用ncbi中est( expression sequence tag) 数据库 (dbest) 发觉新基因和新snps。国际上现已消失了几个基于est的基

3、因索引如unigene, merck-gene, genexpress-index . 其本质是: : 以一个序列片段为线索, 通过它和整个数据库的比较, 还原出全序列原貌。当测序获得一条est序列时,它来自哪一个基因的哪个区域是未知的(随机的),所以属于同一个基因的不同est序列之间常有交叠的区域。依据这种“交叠”现象,就能找出属于同一个基因的全部est序列,进而将它们拼接成和完整基因相对应的全长cdna序列。 b)、从基因组 dna序列中猜测新orf。基于信号或基于组成。 问题三:1、基于核酸和蛋白质序列如何讨论生物进化?2、主要步骤是什么?3、当前的主要困难是什么? 参考答案:1、构建系

4、统进化树。2、主要步骤如下:a、序列相像性比较。就是将待讨论序列与dna或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相像的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有blast、fasta等;b、序列同源性分析。是将待讨论序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必需使用多序列比较算法。常用的程序包有clustal等; c、构建系统进化树。依据序列同源性分析的结果,重建反映物种间进化关系的进化树。为完成这一工作已进展了多种软件包,象pyli

5、p、mega等;d、稳定性检验。为了检验构建好的进化树的牢靠性,需要进行统计牢靠性检验,通常构建过程要随机地进行成百上千次,只有以也许率(70以上)消失的分支点才是牢靠的。通用的方法使用 bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。3、当前的主要困难是发觉了基因的横向迁移(lgt)现象。即进化程度不同的物种间存在着遗传信息基因的传递,假如拿迁移的基因做进化分析就会出错。克服lgt的方法:一是在全部序列中筛选出有垂直进化关系的序列数据集,如cog数据库;二是用完整的基因组和蛋白质组比较。 问题四:1 什么叫snp?为什么snp讨论如此重要?举2-3个snp相关的we

6、bsite。 参考答案:1、snp本意是单核苷酸多态性,泛指基因组上一个碱基的取代,现在有所扩展,也包括一些更广泛的变化,例如2-3个碱基的变化也叫snp。2、snp是联系基因型和表现型之间关系的桥梁,是基因组领域理论成果和基础讨论走向应用的关键步骤。3、snp相关 陈润生,生物信息学,考试总结 的一些网站:1、snp consortium's database 2、ncbi snp database将这些数据进行整理,去掉冗余,使每个snp都是唯一的。此时的snp被称为reference snp或refsnp。3、the human genic bi-allelic sequence

7、s database(hgbase) 这一数据库收录了人基因组中全部已知的序列变化,包括:snps、序列的插入和缺失(indels)、简洁重复序列等。4、the human gene mutation database(hgmd)5、the protein mutant database(pmd),它不是核酸突变数据库,而是蛋白突变数据库。库中收录了蛋白质特定位点的氨基酸突变信息,以及这些突变对蛋白质结构功能的影响。6、the allele frequency database(alfred):它是人类群体等位基因频率数据库, 问题四:2什么叫系统生物学?系统生物学对生物功能实现的本质熟悉的变

8、化? 参考答案:系统生物学是一门学科,是分析整个基因和蛋白质系统全部信息的学科,有三个内涵:1、整合从不同层次水平上得来的信息;2、基于整合的信息构建数学模型以描述生物体结构和功能;3、用建立的数学模型来猜测系统内外部存在环境刺激时系统结构如何变化。 本质变化:系统生物学认为真正实现生物学功能的是一组相互作用形成网络的蛋白质集合,不仅有孤立存在的元件,还有元件间的关联和相互作用。 问题五:1、什么是非编码序列、非编码rna、非编码基因?2、以人类基因组为例,有多少是非编码序列,有多少序列是有转录产物的?3、举两个例子说明非编码讨论是重要的 参考答案:1、非编码序列是基因组中不编码任何蛋白质的序

9、列;非编码rna是非编码序列的转录产物;非编码基因是功能的非编码rna在基因组中的位置。2、人类基因组中超过97是非编码序列,大于90的有转录产物,绝大部分的转录产物是非编码rna,物种间的差别主要是非编码rna。3、非编码rna有很重要的功能,例如人与黑猩猩的比较讨论发觉主要的差别在于非编码区;slne(短散在元件)可以作为调控元件,通过插入基因序列中调控邻近基因的转录活性;x-inactivation(x染色体失活)是哺乳动物的一种剂量补偿机制,其中一半拷贝转录被抑制从而失活,抑制转录是通过一个2kb的非编码rna(xist rna)实现的,xist rna装配在失活x染色体的外侧,引起结构转变导致失活;rnai讨论:rnai是由rna(sirna、机体的micro

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论