第六章 生物信息本地软件.ppt_第1页
第六章 生物信息本地软件.ppt_第2页
第六章 生物信息本地软件.ppt_第3页
第六章 生物信息本地软件.ppt_第4页
第六章 生物信息本地软件.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章生物信息本地软件,1.DNAMAN,打开DNAMAN,可以看到如下界面:,DNAMAN美国LynnonBiosoft公司开发的高度集成化的分子生物学应用软件,几乎可完成所有日常核酸和蛋白质序列分析工作,包换多重序列对齐、PCR引物设计、限制性酶切分析、蛋白质分析、质粒绘图等。下载地址,2.BioEdit/BioEdit/bioedit.html,BioEdit是一个序列编辑器与分析工具软件,功能非常强大,使用十分容易。功能包括:序列编辑、外挂分析程序、RNA分析、寻找特征序列、支持超过20000个序列的多序列文件、基本序列处理功能、质粒图绘制、等.,3.PrimerPremier5.0,PrimerPremier是大名顶顶的引物设计软件,用来帮助研究人员设计最适合引物的应用软件利用它的高级引物搜索引物数据库巢式引物设计引物编辑和分析等功能可以设计出有高效扩增能力的理想引物也可以设计出用于扩增长达50kb以上的PCR产物的引物序列,由加拿大的Premier公司开发的专业用于PCR或测序引物以及杂交探针的设计,评估的软件,和PlasmidPremier2.02一起是该公司推出的最新的软件产品。其主要界面同样也是分为序列编辑窗口(Genetank),引物设计窗口(PrimerDesign),酶切分析窗口(RestrictionSites)和纹基分析窗口(Motif)。,“Premier”软件启动界面如下:,4.Oligo,引物分析著名软件,主要应用于核酸序列引物分析设计软件,同时计算核酸序列的杂交温度(Tm)和理论预测序列二级结构。Oligo使用方法介绍作为目前最好、最专业的引物设计软件,Oligo的功能很强,在这里我们介绍它的一些主要功能:如:普通引物对的搜索、测序引物的设计、杂交探针的设计以及评估引物对质量等等。在正式进行引物设计前,我们首先面临的一个任务就是向Oligo程序导入模板序列,根据不同的实验情况,oligo应用简介,5.DNAssist,10.7M。非常好用而且有名的DNA分析共享软件,含有部分蛋白序列分析功能。可以全功能使用90天。90天后仍然能够全功能使用,只是启动延时。注册费200美元。,6.RNAstructure,Version4.4/rnastructure.html,输入或载入RNA的一级序列,根据最小自由能原理,依据一定算法,预测出其二级结构图,并将图形输出到窗口,得到漂亮的二级结构图形。是非常出色的一个程序。,7.DNASIS,DNASISDNASISforWindows2.5版是日立软件公司(HitachiSofewareEngineeringCo.,Ltd.)97年推出的一个功能强大的序列分析软件。包含有大部分分子生物学软件的常用功能,可进行DNA,RNA,蛋白质序列的编辑和分析,甚至还能进行质粒作图、数据库查询等功能,足可满足一般实验室的要求。,8.ANTHEPROT,主页http:/antheprot-pbil.ibcp.fr/下载地址ftp:/ftp.ibcp.fr/pub/ANTHEPROT/WINDOWS/蛋白序列分析软件包ANTHEPROT,包括了蛋白质研究领域所包括的很多内容,功能非常强大。应用此软件包,使用个人电脑,便能进行各种蛋白序列分析与特性预测,包括:进行蛋白序列二级结构预测;在蛋白序列中查找符合PROSITES数据库的特征序列;绘制出蛋白序列的所有理化特性曲线;在Internet或本地蛋白序列数据库中查找类似序列;计算蛋白序列分子量,比重与各蛋白残基百分组成;计算蛋白序列滴定曲线与等电点;选定一个片段后,绘制HelicalWheel图;进行点阵图(DotPlot)分析;计算信号肽潜在的断裂位点等功能。强烈推荐,所有研究蛋白的人员均应使用。,9.VectorNTIAdvance,用于DNA和蛋白序列分析:VectorNTIAdvance是目前整合度最高的多功能桌面序列分析软件包。VectorNTIAdvance基于业界领先的VectorNTI软件包平台构建,包含了一整套数据分析和管理的工具,通过5个功能模块实现。所有的模块共享一个大信息量的图形化用户界面,使序列分析既简单又直观。,10.DiscoveryStudiogene1.5下载地址,DiscoveryStudioGene(简称DSGene)是Omiga的替代品。序列编辑、PCR引物设计、网络数据库搜索、蛋白质分析和其他形形色色的功能只需要简单操作就能完成。同时,可以以交互式的图形方式或者文本方式察看分析结果,而独特的工作目录窗口简化了序列组织和分析的过程。,除了独自完成一定的功能外,DSGene可以同时作为一个客户端界面,成为Accelrys生物信息学完整解决方案的一个组成部分。通过这个界面,研究人员可以储存以及检索DSSeqStore关系数据库里面的数据,运行GCGWisconsionPackage的程序进行数据库搜索和序列分析,以及通过DiscoveryStudioProjectKM在整个企业范围内共享数据。,基本功能,数据库搜索:通过BLAST和Entrez,根据序列同源性和参考文献搜索及检索NCBI的网络数据,查询得到的序列以DSGene格式下载到本地机器上,从而方便进行进一步的分析。独特的网络连接使用户只需要轻轻的点击就可以找到序列摘要和相关序列。多重序列分析:可以采用ClustalW的方法进行多重序列比对。根据化学属性等对序列中字符进行着色或进行序列编辑,随心所欲地创造出可供出版的图像。,酶解图谱分析:可以执行限制性内切酶酶解和蛋白酶解分析。在分析时,用户也可以添加自己的限制性内切酶以及蛋白酶试剂。引物分析:可以设计PCR、序列测定的引物和杂交探针。同时帮助用户检验自己的引物与DSGene中模板的匹配程度,从而减少试验错误,节约试验时间。motif搜索:寻找核酸和多肽序列中存在的序列motif。用户也可以把自己发现序列motif的数据加入到motif数据库中。,核酸性质分析:以交互的形式建立和察看基于序列的碱基组成、密码子偏向、结构属性和其他分析特性的图表,从而有助于用户发现开放阅读框、启动子和鉴定基因功能。蛋白质序列分析:通过蛋白质分析工具箱对蛋白质性质进行分析,这些性质包括二级结构、疏水性、抗原性和分子柔性。,11.GCG软件包,一、简介GCG是著名的生物信息分析商业软件包,它是由美国威斯康星的GeneticsComputerGroup开发的,集成了大量的序列分析和数据库搜索程序(10.2版本中包括160多个独立的程序),并可访问各种来源的序列数据。GCG软件包在生物软件发展历程中具有不可替代的地位,但是由于其中所有程序均只能运行在UNIX平台上,加上售价昂贵,因此在应用和普及方面受到一定的限制。但是由于GCG软件在生物信息软件领域举足轻重的历史地位,已经成为事实上的工业标准。,GCG软件包支持5种数据库,其中包括两种核酸数据库和3种蛋白质数据库。GCG支持的两种核酸数据库是GenBank数据库以及仅由GenBank中未收载的序列组成的简化版EMBL核酸序列数据库。为了方便进行搜索,这两个数据库被组合成一个复合的核酸数据库,称为GenEMBLPlus。这个复合数据库包括GenBank和EMBL核酸序列数据库的表达序列标记(EST),序列标记位点(STS)以及基因组序列纵览(GSS)条目部分。GCG支持的3种蛋白质数据库是PIR数据库、SWISS-PROT数据库和SP-TrEMBL数据库。为了方便进行搜索,SWISS-PROT和SP-TrEMBL,这两个数据库被结合在一起组成一个复合的蛋白质数据库SWISS-PROTPlus。,二、GCG软件包的功能简介,1双序列比对(1)Gap使用Needleman-wunsch算法来寻找两条序列的全局最优比对结果。(2)BestFit使用Simith-Waterman算法寻找两条序列的局部最优比对结果。(3)FrameAlign创建一条蛋白质序列与一条核酸序列三个相位翻译结果之间的局部最优比对结果,比对时通过加人空位保持阅读框架。,(4)Compare/DotPlot对两条相比对的核酸或蛋白质序列构建点阵图。(5)ProfileMake/ProfileGap创建一个称为序列谱(profile)的比对位点评分表,定量描述一组序列比对的信息。ProfileGaP创建一个序列谱和一条序列间的最优比对结果。,2多重序列比对(1)PileUp通过“聚类”的渐进式启发算法对多条序列进行比对分析,最高可支持500条序列的多重比对,这个工具和CLUSTALW类似。(2)Plotsimilarity图形化显示多序列对比结果中的序列相似性评分过程。,3数据库参考搜索Lookup通过数据库的字段如Name、Accession、Number、Author、Organism、Keyword、Title、Reference、Feature、Definition、Length或数据记录日期等数据库条目的注释信息对数据库进行搜索。4.数据库序列搜索(1)BLASTBLAST数据库相似性搜索工具。即可对本地数据库进行搜索,也可通过远程搜索NCBI的数据库。(2)FASTAFASTA数据库相似性搜索工具。使用Lipman和Pearson提出的FASTA算法对数据库进行相似性搜索。,(3)TFASTA在核酸数据库中搜索与蛋白质查询序列相似的序列,进行比对之前它将数据库中序列按6种阅读框进行翻译。(4)Framesearch在一个核酸数据库或列表文件中搜索与一个蛋白质查询序列相似的序列,也可以在一个蛋白质数据库或列表文件中搜索与核酸查询序列相似的序列。对于每个序列比对,程序寻找蛋白质序列与核酸序列各相位翻译结果之间的最优比对,比对时加人空位来保持阅读框。(5)ProfileMake/Profilesearch/ProfilesegmentsProfileMake创建序列谱定量描述一组序列比对信息。Profilesearch使用这个序列谱在数据库或文件列表中搜索与创建此序列谱序列相似的序列。Profilesegments显示数据库记录中和序列谱相似的局部区域。(6)FindPatterns搜索包含特征模式的序列。,5编辑和发布(1)Pretty提供多序列比对结果多种类型的显示方式。(2)Publish提供单序列或多序列多种类型的显示方式。(3)MaPSort/PlasmidMaP限制酶切位点分析及质粒绘图程序,可对核酸序列进行环形酶切位点分析。,6片段拼接Gelstart/GelEnter/GelMerge/GelAssembleGelstart创建一个片段拼接操作项目或对已经存在的操作项目进行初始化。GelEnter将片段复制或输入到当前操作项目中。GelMerge寻找片段间的交叠并将它们拼接为连续的序列。GelASSemble是一个用于显示交叠的编辑器,可用于去掉片段间的冲突。,7进化分析(1)Distances/GrowTree创建一组序列比对结果中两两序列之间的距离矩阵,这一距离用每100个残基中替换的核酸或氨基酸的个数表示,同时创建一个系统亲缘树。(2)Paupsearch为PAUP(进化系统简约性分析,phylogeneticanalysisusingpasimony中树的搜索选项提供一个GCG接口。(3)PaupDisplay为PAUP中的树操作、鉴定以及显示选项提供一个GCG接口。(4)Diverge应用多种方法评估两条编码序列每个位点的同义码和不同义码的置换个数。,8模式识别和基因预测(1)TestCode根据核酸序列每3个碱基组成的非随机性来预测编码区。(2)CodonPreference根据密码子使用频率以及第三位GC出现频率预测蛋白质编码区,内置了多个物种的密码子使用频率。(3)Frames根据起始和终止密码子的位置,显示核酸序列的6个开放阅读框。,(4)FindPatterns搜索包含特征模式的序列。(5)Motifs对蛋白质序列进行基于PROsITE数据库的基序搜索。(6)Composition统计核酸或蛋白质序列的组成。(7)CodonFrequency创建密码子使用频率表,输出的结果可用于包括CodonPreference在内的很多GCG子程序。,9输入输出(1)Reformat格式化各种序列文件,使其能够用于GCG程序。(2)Fromstaden将Staden格式的序列文件转换为GCG格式。如果文件中存在多个序列,将对每个序列创建一个文件。(3)FromGenBank将GenBank中flatfile格式的序列文件转换为GCG格式。如果文件中存在多个序列,将对每个序列创建一个文件。(4)FromPIR将PIR格式的序列文件转换为GCG格式。如果文件中存在多个序列,将对每个序列创建一个文件。,(5)FromFASTA将FASTA格式的序列文件转换为GCG格式。如果文件中存在多个序列,将对每个序列创建一个文件。(6)ToPIR将GCG格式的一个或多个序列文件转化为PIR格式。(7)ToFASTA将GCG格式的一个或多个序列文件转化为FASTA格式。(8)Tostaden将GCG格式的一个或多个序列文件转化为Staden格式。,10.作图(1)Map限制酶切位点分析。在核酸序列上方显示限制酶切位点,在下方显示翻译结果。(2)MapPlot生成酶切图谱。(3)MapSort预测核酸被一个或多个限制酶消化后得到的片段大小。(4)Peptidesort预测被限制酶消化后的核酸序列片段的多肤表达产物。对多肤片段根据相对分子质量、位置以及HPLC决定的相关保留时间进行排序,还包括每条肤链以及整个蛋白质组成的概要。,11.引物设计Prime为PCR选择寡核普酸引物,用于测序和PCR扩增实验。12蛋白质分析(1)Coilscan在蛋白质序列中定位coiledcoil段。(2)HTHScan在蛋白质序列中搜索螺旋一转角一螺旋基序,这种结构域一般是与DNA的结合位点,在基因调控中起作用。(3)Isoelectric预测并绘制蛋白质的滴定曲线。(4)ProfileScan对蛋白质序列进行profile数据库搜索,以检索可能存在的结构域。,(5)PepPlot使用Chou-Fasman法预测二级结构。预测结果组合在一系列预测图中,这些预测图还包括亲水性和疏水性分布曲线。(6)Peptidestructure/Plotstructure预测蛋白质序列的抗原性、柔性、疏水性以及易溶性等特性曲线。(7)SPScan在蛋白质序列中搜索分泌信号肽(SPs)。13.RNA二级结构(l)Mfold/PlotFold使用Zuker的能量最小化方法预测RNA分子的最优和次优二级结构。,(2)StemLoop在序列中搜索发夹结构或反向重复序列。用户可以指定最小的发夹碱基配对片段长度,最小或最大的发夹末端单连区尺寸,以及每个发夹结构中碱基配对片段最小的键数。14翻译(1)Translate将核酸序列翻译为蛋白质序列。(2)BackTranslate将蛋白质序列倒推为核酸序列。,12.EMBOSS主页,EMBOSS软件包下载地址/pub/EMBOSS/,文件的输入和输出:可以输入和输出不同文件格式的序列,这些格式包括BSML,GeneBank,GenPept,EMBL,SWISS-Prot,FASTA,FastP,Staden,GCG和IG-Suite等格式,多序列文件格式还包括PHYLIP,NEXUS,NBRF和GCG-MSF格式。色谱文件:可以查看、编辑、比对和分析从自动序列测定仪上得到的色谱文件,支持的格式包括大部分机器产生的ABI,SCF,ALF,CTF和ZTR格式。,13.WONDERFUL生物信息学软件系统该系统是基于生物信息学理论的核酸和蛋白质序列综合分析平台,应用于后基因组时代的基因与蛋白质功能分析及预测、药物靶的筛选、新基因发布提交、PCR引物设计、寡核苷酸分析、酶切位点分析、蛋白质水解位点分析、核酸基序分析、蛋白质结构域分析、质粒绘图、开放阅读框搜索、基因预测和识别、蛋白质功能及二级结构预测、双重及多重序列比对、构建系统亲缘树等,是功能基因组学和分子生物学领域必备软件。本系统同时提供了大量国际上成熟的生物信息学数据库接口,并提供相关中文在线辅助信息,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论