第七章生物信息学_第1页
第七章生物信息学_第2页
第七章生物信息学_第3页
第七章生物信息学_第4页
第七章生物信息学_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

揭开生命奥妙的新兴交叉学科

第七章生物信息学内容生物信息学概念生物信息学的内容生物信息学的研讨方法和技术生物信息学软件和数据库一、生物信息学的概念〔p199〕生物信息学是用数理和信息科学的观念、实际和方法,以计算机为工具对生物信息进展搜集、加工、储存、传播、检索和分析的科学。研讨资料和结果是各种各样的生物学数据人基因组海量信息23对=46条染色体30亿碱基对(basepairs)3~5万个基因基因组学3万种以上蛋白质蛋白质组学基因表达、作用、调控网络曾经或即将完成的生物全基因组几百种原核生物酵母菌拟南芥(1-2亿bp〕水稻人类(32亿bp)小鼠大鼠猪鸡…..等生物信息学的概念后基因组时代的到来人类初次了解了本身的基因序列,了解了很多远亲生物的基因序列正在面对指数扩增的基因序列和各种数据库面临如何将基因序列资料转变为有用的知识,进而效力于人类,造福人类安康的挑战人类功能基因组学必需多学科协作生物信息学技术生物芯片技术蛋白质组学技术高通量细胞挑选技术等生物信息学是人类功能基因组学研讨的必要工具实验生物学计算生物学实际生物学生物信息的开发和运用以核酸蛋白质等生物大分子为主要研讨对象以信息、数理、计算机科学为主要研讨手段以计算机网络为主要研讨环境以计算机软件为主要研讨工具对序列数据进展存储、管理、注释、加工对各种数据库进展查询、搜索、比较、分析构建各种类型的公用数据库信息系统研讨开发面向生物学家的新一代计算机软件生物信息学的概念

计算机学、计算机网络医学生物学、分子生物学生物信息学数学、

统计学生物信息学和其它学科的关系生物信息学是一门边缘学科,它位于生物、医学、计算机、数学等多个领域的交叉点上生物信息学的概念蛋白质组学和构造基因组学高通量药物挑选药物设计和小分子设计创新药物和新剂型生物芯片计算机辅助药物挑选高通量虚拟挑选方法分子数据库,组合化学化合物库,靶标生物大分子的功能分析...蛋白质-蛋白质相互作用识别,信号传导系统、代谢途径的分子模拟...图像处置、聚类分析、表达谱和调控网络分析...基因组信息…生物信息技术计算机辅助先导化合物设计、药物设计二、生物信息学的内容〔p200〕1.基因与基因组分析

可读框预测和基因标注序列拼接与组装结果上传到数据库碱基读取载体标识与去除测序仪中原始数据的采样与分析大规模基因序列测定生物信息学的内容基因预测DNA序列中编码区的鉴定预测方法的根据:编码统计学:编码区序列同非编码区序列相比,有不同的特点,存在一些非随机的特点GC含量密码子偏倚性(CODONFREQUENCY)第三个碱基组成基因构造/统计学方法比较/同源性生物信息学的内容原核生物基因构造编码区启动子转录起始位点非翻译区转录区起始密码子终止密码子5’3’转录终止位点RBS生物信息学的内容5’启动子转录起始位点非翻译区转录区起始密码子终止密码子3’转录终止位点外显子切除和拼接位点GTAG内含子真核生物基因构造生物信息学的内容HMM?HMM描画了模型中各隐含形状的转换概率基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCGIntronsExon隐含形状用于基因预测的隐马尔可夫模型HiddenMarkovModels,HMMATGCGTGCAGTCACCAGCAGTCAGTCG基因组序列生物信息学的内容特定形状碱基对的概率取决于它前面碱基对的形状向另一种形状的转换概率取决于转换信号的出现(剪切位点)和/或在特定隐藏形状的碱基对平均数量(即内含子或外显子大小).IntronsExonP=0.5P=0.8基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCG用于基因预测的隐马尔可夫模型生物信息学的内容研讨主要集中在核苷酸序列的存储、分类、检索和分析等方面新基因的发现非蛋白编码区生物学意义的分析基因组整体功能及其调理网络的系统把握基因组演化与物种演化基因组分析生物信息学的内容蛋白质构造新蛋白的完好、准确和动态的三维构造计算机辅助构造模拟了解蛋白质的氨基酸序列和三维构造之间的关系蛋白质序列及特性分析蛋白质组学2.蛋白质与蛋白质组分析生物信息学的内容

相当数量的蛋白质、核酸、多糖的三维构造获得准确测定,基于生物大分子构造知识的药物设计成为热点;根据靶标分子与药物分子相结合的活性部位的几何外形和化学特征,设计出与其相匹配的具有新颖构造的药物分子。3新药设计三、生物信息学的研讨方法和技术数学统计方法在分析DNA言语中的语义、分析密码子运用频率、利用马尔可夫模型进展基因识别动态规划〔DynamicProgramming〕方法一种通用的优化方法:在形状空间中,根据目的函数,经过递推,求出一条从形状起点到形状终点的最优途径〔代价最小的途径〕。DNA序列或者蛋白质序列的两两对比陈列方式识别技术两种方法根据统计特征进展识别根据对象的构造特征进展识别,常用句法识别。DNA序列上功能位点和特征信号的识别数据库技术生物分子信息的存储、管理、查询等功能建立在数据库管理系统之上人工神经网络技术在功能上、构造上模拟大脑神经网络神经网络计算速度快,更具有分析智能运用:神经网络计算在优化和方式识别方面具有非常强的才干基因识别、蛋白质构造预测上神经网络都获得了比其它方法更为准确的结果分子模型化技术利用计算机分析分子构造。经过交互操作平移、旋转和缩放分子的三维构造,从不同的角度察看分子构象和外形分子力学和量子力学计算主要基于半阅历势函数的分子力学方法研讨生物大分子的构象量子力学在确定势函数的参数和研讨部分性质分子动力学模拟研讨蛋白质的构象及动力学,是计算机模拟实验的根底遗传学运算规那么Optimisers/EvolversDNAcomputingEvolutionaryComputation(MetaphorsfromDNAtoSelection)生物信息学的研讨方法和技术“HalfdayontheWeb,savesyouhalfmonthinthelab〞专家系统将有关专家的知识和阅历以一定的知识表示方式〔如产生式规那么、语义网络等〕存放在计算中以智能的方式协助提供参考性决策。如用于基因识别Internet技术交流:经过Internet网交流生物分子数据查阅:从Internet网上查生物分子数据,如原始的序列、构造数据,加工处置的数据效力:将所要处置的数据直接送到相应的网络效力器上,效力器接受他的处置恳求,并将处置结果前往给他生物信息学的研讨方法和技术国外不断非常注重生物信息学的开展,各种专业研讨机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增1979年,美国洛斯阿拉莫斯国家实验室建立起GenBank数据库;1982年,欧洲分子生物学实验室提供核酸序列数据库EMBL的效力;1984年,日本着手建立国家级的核酸序列数据库DDBJ并于1987年开场提供效力四、常用的分子生物学软件和数据库〔p210〕国内对生物信息学领域也越来越注重1997年3月,北京大学于成立了生物信息学中心;2000年3月,中科院上海生命科学研讨院成立其他,北京大学的罗静初和顾孝诚教授在生物信息学网站建立方面、中科院生物物理所的陈润生研讨员在EST序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在DNA序列的几何学分析方面等等……软件和数据库基因图谱数据库核酸序列数据库蛋白质序列数据库大分子构造数据库等国际著名的生物信息中心NCBINationalCenterforBiotechnologyInformation(US)

EBIEuropeanBioinformaticsInstitute(EU)HGMPHumanGenomeMappingProjectResourceCentre(UK)ExPASyExpertofProteinAnalysisSystem(Switzerland)CMBICentreofMolecularandBiomolecule(TheNetherlands)ANGISNationalGenomeInformationService(Australia)

NIGNationalInstituteofGenetics(Japan)BICNationalBioinformaticsCentre(Singapore)1.数据库国内部分生物信息学和生物医学信息效力器北京大学生物信息中心中国生物信息/北京大学物理化学研讨所北京医科大学生物医学信息中国科学院微生物研讨所httpim.ac天津大学生物信息中心中科院计算所智能信息处置重点实验室生物信息学研讨组/中国科学院基因组信息学中心/DNA数据库Genbank包含一切知的核酸序列和蛋白质序列,以及相关的文献著作和生物学注释。美国国立生物技术信息中心(NCBI)建立和维护EMBL核酸序列数据库由欧洲生物信息学研讨所(EBI)维护经过因特网上的序列提取系统(SRS)效力完成查询检索。DDBJ数据库日本国立遗传学研讨所维护与Genbank和EMBL核酸库协作交换数据。运用主页上SRS工具进展数据检索和序列分析全球数据已实现同步化Globaldatasynchronization软件和数据库GenBank的增长图片来自/Genbank/genbankstats.html软件和数据库资料来自:ddbj.nig.ac.jp/images/ddbjnew/DBGrowth-e.gif2005年6月发行的第84版EMBL数据库中,总计超越4525万条、491亿碱基数量的数据库软件和数据库PublicfreeAvailableviaInternet三大基因数据库之间的关系NucleotideSequenceDatabase(entry)-2005.6.15完好序列软件和数据库蛋白质信息资源数据库〔PIR〕主要提供按同源性和分类学组织的综合性、非冗余数据库PIR由美国华盛顿的国家医学研讨基金会支持,德国马普学会的慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护。PIR经过提供蛋白质序列数据库、衍生的相关数据库及相应的软件而支持有关分子进化、功能基因组学和计算生物学方面的研讨,软件和数据库蛋白质构造数据库(PDB)由美国自然科学基金会、能源部和国立卫生研讨院共同投资建立主要由X-射线晶体衍射和核磁共振(NMR)测得的生物大分子三维构造组成用户可直接查询、调用和察看库中所收录的任何大分子三维构造软件和数据库PBD数据的增长软件和数据库2.软件序列对比和数据库搜索软件BLAST,FASTA,BLITZ等生物大分子可视化软件有Rasmol,Mage,Raster3d,Grasp等与蛋白质构造有关的程序有Procheck,WHATIF,DSSP等大型分子生物学软件包如GCG.在基因识别著名软件GRAIL、GeneID、GeneMark等蛋白质二级构造预测程序PHD软件和数据库序列分析软件——DNAMAN

lynnon/DNAMAN是美国LynnonBioSoft公司开发的高度集成化的分子生物学运用软件,几乎可完成一切日常核酸和蛋白质序列分析任务,包括多重序列对齐、PCR引物设计、限制性酶切分析、蛋白质序列分析、质粒绘图等。具有面向Windows和Macintosh两个版本。软件和数据库综合序列分析软件——BioEdit

/BioEdit/bioedit.html软件和数据库序列分析与管理软件——Omiga

accelrys/products/omiga/index.html软件和数据库VectorNTI

informaxinc/用VectorNTI软件管理序列和进展片段重叠群分析用VectorNTI软件分析蛋白质序列的跨膜区及显示蛋白质的三维构造软件和数据库RasMol软件显示分子构造表示图蛋白质三维分子构造显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论