版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因工程常用工具软件和生物信息学资源第一页,共二十八页,2022年,8月28日
生物信息资源
第二页,共二十八页,2022年,8月28日常用生物信息中心
NCBI
美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation),它的前身是美国国家卫生署(NationalInstituteofHealth,简称NIH)所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆。NCBI管理着包括GenBank在内的一批数据库,如UniGene、dbSNP、COG、LoccusLink、OMIM和MMDB等。它提供Entrez数据库检索工具、BLAST数据库序列搜索等服务。Biosino:
是中国科学院上海生命科学研究院生物信息中心的网站,它目前除维护我国的核酸序列公共数据库外,还提供包括各种链接的生物学导航信息。
第三页,共二十八页,2022年,8月28日主要生物医学文献数据库
PubMedNLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络站点的全文文章和其他相关资源。MEDLINE也有缺陷,它以医学为主,植物学等方面收录不够全面。第四页,共二十八页,2022年,8月28日中文文献数据库
《中国学术期刊数据库》医药卫生辑:
即CNKI知识创新网,中国学术期刊数据库是目前国内唯一的全文期刊数据库,因此它是获取医学期刊全文的最佳途径。第五页,共二十八页,2022年,8月28日主要核酸序列数据库
GenBank(NCBI美国国立生物技术信息中心)EMBL(EuropeanMolecularBiologyLaboratory,欧洲分子生物学实验室)DDBJ(DNADatabankofJapan,日本DNA数据库)
它们每天交换信息,并对数据库DNA序列记录的统一标准达成一致。每个机构负责收集来自不同地理分布的数据(EMBL负责欧洲,GenBank负责美洲,DDBJ负责亚洲等)第六页,共二十八页,2022年,8月28日特殊核酸序列数据库
dbEST表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。dbSTS序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。VectorDB载体数据库包含许多分子生物学中常用载体的注释及序列,大约有2600个,并与GenBank建立了联系。dbMHC主要组织相容性抗原复合体(humanMajorHistocompatibilityComplex,MHC)相关的DNA和临床数据库dbSNP单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。dbGSS基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exontrap获得的序列,cosmid/BAC/YAC末端,及其他。RefSeqNCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNAcontigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accessionnumbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和NC_xxxxxx的形式来表示。基因组数据库超过800种在GenBank中被完整测序的物种,包括大于500种病毒,〉25种细菌,酵母,和许多viroids,质粒,和细胞器。还包括正在进行中的基因组,比如人,小鼠,线虫,疟原虫,果蝇,利什曼原虫,水稻,和玉米。提供完成的基因组/染色体的图形概览,并可以探究那些逐步细化的区域。也提供那些已经被NCBI工作人员分析过的物种的编码区的摘要和TaxTables。另外,EntrezMapViewer,Entrez基因组的一个软件组成部分,提供整合的果蝇(细胞遗传学和序列图谱)和人类(细胞遗传学,遗传连锁,序列,放射杂交,和其它图谱)的染色体图谱的浏览。TPA数据库第三方注解数据库,对DDBJ/ENBL/GenBank已有的序列进行再注解和汇编第七页,共二十八页,2022年,8月28日蛋白质序列数据库
SWISS-PROT:
日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。PIR:
由美国华盛顿的乔治城大学全国生物医学研究基金会(NBRF)、德国马普生物化学研究所的Martinsried蛋白质序列研究所(MIPS)和日本东京理科大学的日本国际蛋白质信息数据库(JIPID)3家实验室共同合作开发。TREMBL:
包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源第八页,共二十八页,2022年,8月28日生物大分子结构数据库
PDB
:ProteinDataBank(蛋白质数据库)的缩写,是一个生物大分子三维结构实验数据库。PDB是目前最主要的蛋白质分子结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。其中大部分为蛋白质,包括多肽和病毒,此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。MMDB:Entrez的蛋白质分子模型数据库,属于来源于Brookhaven蛋白数据库(PDB)的三维结构的一个子集。其数据来源于X-ray晶体衍射和NMR色谱,不包括理论模型。由NCBI的MMDB组维护。第九页,共二十八页,2022年,8月28日其它常用数据库
分类学数据库Taxonomydatabase。由NCBI建立,包括>130,000现存的和灭绝的生物体的名字和谱系,在基因组数据库中至少提供一个核酸或蛋白序列。
酶学数据库ECENZYME该数据库由London大学生物分子结构与模型研究组的RomanLaskowskiandAndrewWallace建立。含有PDB数据库中已知的酶结构共3011条。其酶学分类号为1-6.DNA和蛋白质相互作用数据库DPInteract信号传导及蛋白质-蛋白质相互作用相关数据库DIP-DbofInteractingProteinsINTERACT-Protein-ProteininteractiondbProNet-Protein-ProteininteractiondbCANSITE-SignalTransduction'sWebSPAD-SignalingpathwaydbCSNDB-CellSignalingNetworksdb蛋白质二维凝胶电泳数据库WORLD-2DPAGE-Acompleteindexof2DdbandserversPhoretixlinks-Phoretixpageoflinksto2Dgeldb蛋白保守域数据CDD(ConservedDomainDatabase)-acollectionofsequencealignmentsandprofilesrepresentingproteindomainsconservedinmolecularevolution.专利数据库DPD-DNAPatentdbAgPatents-AgriculturalBiotechnologypatentsfromtheUSDAUSPTOpatentdb-USAPatentandTrademarkOfficepatentdb/-PatentinformationdatabasefromtheEuropeanPatentOffice(worldwidecoverage)TheDelphionIntellectualPropertyNetwork(IPN)
forsearching,viewing,andanalyzingpatentdocuments.第十页,共二十八页,2022年,8月28日还有其它许许多多生物数据库,例如:特定基因或蛋白质的数据库,糖类相关数据库,蛋白质翻译后修饰相关数据库,基因表达数据库,人类基因突变及疾病相关数据库等。Biosino生物信息中心进行了很好的整理,可方便的链接到相关数据库网页。()第十一页,共二十八页,2022年,8月28日数据库信息检索系统
Entrez:
是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。SRS:
检索系统在欧洲的许多网站被广泛使用。SRS是一个具有弹性的系统,可应用于大量不同的数据库。这意味着使用SRS的数据库在各个站点可能略有差异,而这种差异是由数据库管理者所决定的。例如,OWL数据库是一个非冗余蛋白质序列库,它的数据来源主要是从其它主要蛋白质数据库中收集而来的,在SEQNET服务器(www.seqnet.dl.ac.uk/srs/srsc)可通过SRS搜索而进入OWL,但在EBI网站通过SRS则不能进入OWL。序列一般可通过记录号(如来自1篇发表的论文)或是该序列注释中的一些信息进行检索。SRS的优势是可以使你通过普通的终端去检索大范围的数据库,并通过DR栏链接到在其它数据库。第十二页,共二十八页,2022年,8月28日分子生物学常用综合软件
GCG:
最初是Wisconsin大学的GeneticComputerGroup发展的,后者现在是位于美国加州的OxfordMolecularGroup的子公司。GCG包含130多个与分析有关的程序。有6种重要生物数据库随程序包一起提供,并由GCG公司负责每两个月更新一次。对DNA和蛋白质分析而言,GCG软件包是功能最强大,使用最广泛的计算机程序之一。一般以网络版服务器提供服务。主要功能:a)限制性酶切图谱b)多序列对比c)DNA到蛋白质的翻译d)蛋白质分析e)数据库搜寻f)PCR引物设计第十三页,共二十八页,2022年,8月28日VectorNTI:
功能与GCG相似,单机版提供服务。它以美观的界面,友好的操作方法在分子生物学界享有盛誉。作为一种多功能的分子生物学应用软件,在分析主界面,软件可以对核酸蛋白分子进行限制酶分析、结构域查找等多种分析和操作,生成重组分子策略和实验方法,进行限制酶片段的虚拟电泳,新建输入各种格式的分子数据、加以注释,输出高质量的图像。VectorNTISuite还有以下独立的分析程序,完成相关分析。这些独立的程序,可以通过选定->分析->结果三步调用。3DMol-显示PDB格式分子的三维结构;AlignX-序列相似性比较;AlignXblocks-序列局部完全相同比较;BioPlot-几十种核酸蛋白序列分析、理化性质分析;ContigExpress-将小片段拼装成长序列;GCGConverter-GCG格式文件转换成NTI的格式;PubMed/EntrezSearch-搜索PubMed、PDB、GenBank;BackTranslation-核酸->蛋白->核酸反向翻译的工具;MatrixEditor-矩阵数据编辑;ToolsManager-连接其他程序和网络连接的界面。分成Align、Analyze、Assemble、Tools四部分。VectorNTI还自带常规核酸、蛋白序列数据库,并能很好的管理使用用户个人的数据库。供分子生物学研究使用的综合软件很多,还包括DNAstar、DNAsis、DNATools等第十四页,共二十八页,2022年,8月28日分子生物学常用专业软件
BLAST
:“局部相似性基本查询工具”(BasicLocalAlignmentSearchTool)的缩写,Blast是NCBI研制的一个生物基因数据库系统的查询工具,功能强大,检索速度快,流行于世界上几乎所有的生物信息中心。功能名称功能Blastn用核酸序列搜索核酸序列数据库Blastp用蛋白质序列搜索蛋白质序列数据库Blastx用核酸序列(翻译成蛋白质)搜索蛋白质序列数据库TBlastn用蛋白质序列(翻译成核酸)搜索核酸序列数据库Tblastx用核酸翻译的蛋白质序列搜索核酸翻译的蛋白质序列数据库第十五页,共二十八页,2022年,8月28日Blast其它功能
BLAST两个序列一个基于BLAST的工具,对齐两个核酸或蛋白的序列,产生一个成对的DNA-DNA或蛋白—蛋白序列比较。IgBLASTIgBLAST被开发出来以便于分析在GenBank中的免疫球蛋白的序列。它允许用blastp或blastn来搜索nr数据库或一个由免疫球蛋白生殖系变化区基因的特殊的数据库。搜索可以限制在人类或小鼠的基因。IgBLAST执行三个主要的功能:1)报告与查询序列最相似的可变,D,或J区,2)根据Kabatetal.来注解免疫球蛋白domains(从FWR1到FWR3),3)对于搜索核酸或蛋白nr数据库,通过匹配IgBLAST的发现和最接近的生殖系变化区基因来简化识别相关序列的过程。PowerBLASTPowerBLAST是一个程序,允许对非常长的序列进行快速的gappedBLAST搜索,它把序列分割开,对每个部分搜索,然后把结果组装起来。包含在Sequin中的PowerBlast版本使用了新的强大的gappedBLAST算法,过滤和物种特异的输出特点还仍旧保留。第十六页,共二十八页,2022年,8月28日GeneConstructionKit
可以将载体与目的基因各自进行适当的限制酶切好后,连接成新的载体-基因。能将整个克隆过程用图示方式表示出来。可根据适当的marker将电泳图画出来,和扫描的实际结果对照,整个过程相当于模拟一个克隆过程。并提供了一个相当详细的教学文件。它还是一个优秀的质粒作图软件第十七页,共二十八页,2022年,8月28日BandScan
单向电泳条带定量分析软件。手动、自动找到条带,手动的条带可以是无规则的,可以清除背景。进行分子量、百分比、质量、波峰等方面的定量分析。直接使用扫描仪,将数据输出到excel文件。第十八页,共二十八页,2022年,8月28日ReferenceManager文献查找、引用和管理软件,功能与Endnote相似。可以在线通过查找关键词搜索PubMed和609个Z39.50数据库中的专业资料,保存查找的资料为本地文件。资料内容和记录分上下两个屏幕,如有全文或想连接网络时点击一个键就可以到相应的全文文章和摘要。可以直接在WORD中查找资料,插入引用,并在文章中对引用格式化,引用的参考资料格式有很强的用户自定义功能,可以符合各种杂志对引用格式的要求,引用时不用多窗口切换。导入Endnote的数据库,可以作为本地资料管理软件。可以自动将文章中的各种文献引用按不同期刊的要求排列,在期刊间转换只需几秒钟。写文章时会在word中将查找到相应的文献列出,方便写作。第十九页,共二十八页,2022年,8月28日FASTA
序列相似性分析是Lipman和Pearson1985年建立的序列相似性比较方法,是介于待查询序列(Querysequence)和任何FASTA格式的序列数据库或任何用户收集的序列群组之间进行的一种比较分析。FASTA能对序列进行整体相似性序阵分析,这是FASTA不同于BLAST局部序阵相似性分析的地方。FASTA可对核苷酸序列或蛋白质序列进行快速的序列整体相似性分析。第二十页,共二十八页,2022年,8月28日FastA格式>nametttttacg第二十一页,共二十八页,2022年,8月28日Sequin
美国NCBI开发的一套独立的向Genbank、EMBL、DDBJ等数据库递交数据的软件,MAC、PC/Windows和UNIX用户均可使用。与Bankit相比,Sequin更适合于递交较长的数据或与数据有关的详细资料。第二十二页,共二十八页,2022年,8月28日RasMol
读取PDB格式文件显示生物大分子三维结构图像的软件。是世界上最通用的图像显示软件,工作系统的要求很低,应用很广,可由Unix,Windows及Macintosh平台支持运行。在PC和Mac机中RasMol程序旋转分子的速度比MAGE程序要快,也比Unix工作站的分子旋转速度要快。第二十三页,共二十八页,2022年,8月28日Sigmaplot
SigmaPlot是SPSS公司附属开发的数据统计分析作图软件。可以轻松地制作精美的二维与三维图形,图形效果远远超过SPSS统计软件。它还可以进行快速图形变换,提供了多种图形模板,并且可以用html的文件格式输出。此外它也具有一般统计分析软件的功能,比如进行数据处理、统计检验以及数据打印。第二十四页,共二十八页,2022年,8月28日电子细
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目全景:亮点与挑战-管理策略与未来规划导览
- 心脏病防治策略-心脏病专家演讲
- 儿童近视防控知识普及-小学教师
- 2026四年级道德与法治下册 资源节约行动
- 2026七年级下新课标青春时光成长教育
- 2026九年级上新课标中外美术名作赏析
- 大班数学活动分苹果
- 2026肿瘤患者养生课件
- 2026社保知识普及课件
- 2026残疾康复指导课件
- 国家开放大学《课程与教学论》形考任务1-4参考答案
- GB/T 8014.2-2005铝及铝合金阳极氧化氧化膜厚度的测量方法第2部分:质量损失法
- GB/T 38582-2020森林生态系统服务功能评估规范
- 钻井液与钻井的关系
- 第八章 公关礼仪文体的写作
- 新-GJB9001C-2017内审检查表
- 12钻孔降水头注水试验成果表2017-094gk
- 小学数学冀教版六年级下册《第8课时木材加工问题》课件
- 架空电力线路巡视施工方案
- 玻璃制品生产企业安全生产事故综合应急预案
- NcStudio-V15-激光平面切割中高功率控制系统用户手册(LS3000)指导说明
评论
0/150
提交评论