下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物信息学及应用复习题作者:日期:生物信息学及应用课程复习题1、生物信息学的基本定义,阐述它的主要研究目标、研究内容及研究方法。生物信息学 :Bioi n f orm a ti c s is t he combi n ation of biology and informat i on te c hn o logy. I t is the b r anch of sc ie n ce that deals w i th the co mputer ba s e d analy sis o f larg e b i o lo g i cal d a ta sets.生物信息学研究的最终目的-揭示
2、蕴藏在DNA和蛋白质氨基酸序列中具有普遍性、真实 性的生物遗传本质,掌握复杂的生命现象一一生命起源、生物进化以及细胞、器官和个体 的发生、发育、病变、衰亡的规律和时空联系.生物信息学的主要研究内容1 .生物信息的收集、存储、管理与提供;2 .基因组序列信息的提取和分析;3 .功能基因组相关信息分析;4 .生物大分子结构模拟和药物设计;5 .生物信息分析的技术与方法研究;6 .应用与发展研究方面方法:(1)建立生物数据库:核甘酸顺序数据库(G E NBANK)、Pro t e in D a t a B a n k(P D B)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库(YEA S
3、TS)、美国种质保藏中心(A TCC)、美国专利局数据库(USPO)等;(2)数据库检索:如 Blast等;(3)序列分析:序列对位排列、同源比较、进化分析等;(4)统计模型:如隐马尔可夫模型(hidden Markov model , HMM)基因识别、药物设计;最大似然模型(max im un likeli h ood mode 1 , ML)、最大简约法(Ma x i m u n Pa rsim o n y , MP)分子进化分析等;(5)算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经网络(art i fici al ne u ral net w o r k )等。2、生
4、物信息学的发展经历了哪几个阶段,生物信息学的研究在生命科学中的意义。生物信息学从产生至今经历了两个历史时代:前基因组时代,也被称为测序基因组时代后基因组时代,也被称为功能基因组时代第一个阶段是前基因组时代。这一阶段主要是以各种算法法则的建立、生物数据库的建立以及DNA和蛋白质序列分析为主要工作;第二阶段是基因组时代。这一阶段以各种基因组计划测序、网络数据库系统的建立和基因寻找为主要工作。第三阶段是后基因组时代。这一阶段的主要工作是进行大规模基因组分析、蛋白质组分析以及其他各种基因组学研究。3、分子生物信息数据库的主要类别,分别举例说明它们的功能。一级数据库数据库中的数据直接来源于实验获得的原始
5、数据,只经过简单的归类整理和注释。 二级数据库对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。分为四类:a)基因组数据库;b) 核酸和蛋白质一级结构序列数据库;c)生物大分子(主要是蛋白质)三维空间结构数据库 ;d)由上述三类数据库和文献资料为基础构建的二次数据库(Second ary da t a b a s e )。4、简介下列著名的生物信息数据库:GenBa nk, Swiss-P rot, P DB P ROSITE,人类基因组数据库5、简介NCBI;Entrez集成于哪个数据库平台?主要功能是什么 ?在应用中可以访问哪些子
6、数据库(请列举5个以上)?Ent rez是由N CBI主持的一个数据库检索系统,它包括核酸,蛋白以及Med line文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DN A序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neigh b orin g)信息,给出与查询条目接近的信息。数据庠名饰裁据库内容PubM 闻生物医学文献MMLinr掩要棱酸睁列PideinsSWISS-PROT, PIR以及SnBank整译得到的蛋白.费序列SlnuctirresPDB三维站的数摧库匕经完成和正在进行的氮式生物基因里信息OMTM人类遁他要病和迪行缺失荏线数掘库T&ijo
7、ndmy系统分类信息LocvsLink基因美联傕息PtjpSet具有亲爨关条的神薜之间族骏序列同源性比时结果6、解释BL A S T及其用途,它分为哪些类型?BLAST 是目前常用的数据库搜索程序,它是 Ba s i c L o cal A 1 ignment Searc h Tool的缩写,意为“基本局部相似性比对搜索工具"°BLAS T Basic Local Al i gnmentSe arch Tool)是一个基本的序列比对工具,以从数据库中找到与查询序列相似的序列。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片断,并作为内核向两端延伸,
8、以找出尽可能长的相似序列片段。川AST程序栓测等抖和歙器库类型*咫庠名粉刷序列依据席美登方 法,Bluip鬣白鼠直白肮用电网1t列潴自置R甯箫白成序列Q懈理BUiin杓赣用隗刚序列历暇花前桥威序到轴提库Bluix甚隋里白质理林敦庠列按6条法揖谎或用白底序列后曼甯发自战序列眼围用Tb brain量白重楂版用杵端中利次白质攫*由理依序列物据库希6条隹朗津康何蛋片威亨 列散幅摩TMmck椅聚移横将格般串列按6条居柬谭定通向康亨科后搜*由械赭中列的掘卑旅 枭链理鼻宸的黄自成序列效必驾”7、序列的相似性与同源性有什么区别与联系?如果两个序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性的程度
9、问题。这两条序列之间要么是同源的,要么是不同源的。所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。同源蛋白质的氨基酸序列具有明显的相似性,这种相似性称为序列同源性。相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DN A碱基或氨基酸残基顺序所占比例的高低。相似性本身的含义,并不要求与进化起源是否同一,与亲缘关系的远近、甚至于结构 与功能有什么联系。当相似程度高于5 0%寸,比较容易推测检测序列和目标序列可能是同源序列 ;而当相 似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。8、序列比对原理,在大分子序列分析中,为何局部比对比全局比对更有意义?
10、 多序列比对的主要应用。通过将两个或多个核酸序列或蛋白序列进行比对 ,显示其中相似的结构域,这是进 步相似性分析的基础。通过比较未知序列与已知序列的一致性或相似性,可以预测 未知序列功能。局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的 序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。BLA ST和Fast A等常用的数据库搜索程序均采用局部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实 现。多重序列比对:
11、用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找m o tif,保守区域等。用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。其他应用,如构建pro f ile,打分矩阵等。9、假设你得到一段未知基因的DN A序列,从你学习到的生物信息学分析方法 和软件,设计一个分析流程来分析该未知基因的功能和家族类别。基因/蛋白质的功能预测(1) 一级序列的比较:相似的序列具有相似的功能同源物的鉴定:不同物种中的直系、旁系同源物的预测主要工具:BL AST(2)保守的功能结构域:保守的功能常用工具:Inter pro/P f a m/S MA R T/PROSITE/Pr
12、oDom/C DD(3)三级结构的比较:相似的结构具有相似的功能Ubi q ui t in:泛素,主要负责蛋白质的降解SUMO小的类泛素蛋白质,基因转录&信号通路催化反应通路的分子机制相似序列相似性:不显著!1 0、试述SWISS-PR)T中的数据来源。已获得编码某个基因的DN A序列,请 设计和论述(a)怎样得到其蛋白质序列?(b)如何分析该基因编码的蛋白质序 列?数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰位点、特殊位点和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、 序列变异体等信息
13、。11、研究蛋白质结构有什么意义?为什么要进行蛋白质结构预测?试述蛋白质 三维结构预测的三类方法。方法特点工具同源群模法 (Homology/ Comparative modelling )基于序列同源比对,对于序列相似度30% 的序列模拟比较有效,最常用的方法SW1SS- MOOEL. CPHmodels串线法/折叠识别法(Thread! rig/Fold recogniition)穿”入已知的各种蚩白质折叠骨架内,适 于对蛋白质核心结构进行预测,计算量大THREADER, 3D-PSSIM从头预涮法(Ab initiojDe no vo methods )基于分干动力学,寻找能量最低的构象
14、, 计算量大,只能做小分子预侧HMMSTRf ROSSETA同源建模法(Hom o l o gy)同源蛋白质具有相似的结构和功能根据序列同源性推断目标蛋白的结构折叠识别/穿线法(Threa d in g )根据现有的蛋白质折叠类型来推断目标蛋白的折叠方式从头算预测法(ab initio)从序列到结构根据物理模型进行分子动力学模拟12、基于核酸和蛋白质序列如何研究生物进化 ?主要步骤是什么?蛋白质序列分析主要内容:(1 )蛋白质序列的基本性质分析理化性质分析,疏水性分析,跨膜区分析,信号肽预测,Coil区分析,亚细胞定位(2 )序列数据库搜索相似性搜索,模体的搜索(3 )结构域定位 (4)多序列
15、比对 序列比对为解决下列问题提供重要信息:确定新发现基因的功能;-确定基因间、蛋白质间乃至物种之间的进化关系; 预测蛋白质的结构和功能:即可以提供结构域相应的信息 ,蛋白质功能位点的残基、 蛋白 质亲水性和疏水性的氨基酸残基,从比对结果中得到更多的同源模建或二级结构预测的模板(5)空间结构预测二级结构及三级结构预测,结构预测方法评价1、构建系统进化树。2、主要步骤如下:A、序列相似性比较。就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序 列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAS T、FASTA等;B、序列同
16、源性分析。是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关 键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUST AL等;C、构建系统进化树。根据序列同源性分析的结果,重建反映物种间进化关系的进化树。为完成这一工作已发展了多种软件包,象PYLIP、MEG懈;D、稳定性检验。为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(7 0姒上)出现的分支点才是可靠的。通用的方法使用Boot s trap算法,相应的软件已包括在构建系统进化树所用
17、的软件包当中。1 3、试述基因芯片的工作原理;基因芯片对于生物分子信息检测的作用和意义?1 4、试述计算机辅助药物设计;什么是分子对接,它依据的原理是什么?计算机辅助药物设计将合理药物设计的思路与方法计算机化,综合和借助多学科的先 进技术、方法和成果,为合理药物设计提供了强有力的基本工具和手段。离开计算机的辅助,合理药物设计是寸步难行的。分子对接是指受体和配体之间通过能量匹配和空间匹配而相互识别形成分子复合物, 并预测复合物结构的操作过程。分子对接就是配体分子在受体活性部位的定位。分子对接是研究三维定量构效关系及基于结构的药物设计的一个关键步骤。分子对接是依据配体与受体作用的“锁-钥原理”,模拟小分子配体与受体生物大分子 相互作用。配体与受体相互作用是分子识别的过程,主要包括静
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026元宇宙产业生态构建与商业化路径探索研究报告
- 2026儿童防晒用品市场技术突破与消费认知及营销策略研究报告
- 2026儿童科学实验产品行业供应链优化与市场推广及盈利能力分析报告
- 2026儿童护眼产品市场技术突破与消费认知变化研究报告
- 中风急救护理的误区与纠正
- 2010辽宁省事业单位面试真题及解析
- 深度解析(2026)《GBT 26852-2011CAx系统中机电和电气应用之间的互操作要求》
- 深度解析(2026)《GBT 26704-2022 铅笔》
- 2025工程(水电安装)合同
- 产后出血的常见原因及护理要点
- 医疗设备第三方维修与保养服务项目可行性研究报告
- 2025年广东九年级物理中考三轮冲刺之题型过关综合能力题 科普阅读题(含答案)
- (四调)武汉市2025届高中毕业生四月调研考试 历史试卷(含答案)
- 安装学生床合同范本
- 危急值报告制度考试题
- T-CSEE 0399-2023 水电站紧固件技术监督导则
- 高血压急症和亚急症
- 2025届中国长江电力股份限公司“三峡班”招聘易考易错模拟试题(共500题)试卷后附参考答案
- 多轴加工项目化教程课件 项目四 任务4-1 陀螺仪基体加工
- 《公共管理学》第六章 公共政策PPT
- 2022年河北雄安新区容西片区综合执法辅助人员招聘考试真题
评论
0/150
提交评论