(医学课件)DNAstar软件包的使用_第1页
(医学课件)DNAstar软件包的使用_第2页
(医学课件)DNAstar软件包的使用_第3页
(医学课件)DNAstar软件包的使用_第4页
(医学课件)DNAstar软件包的使用_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DNAstar软件包及常用基因组学软件的使用简介,1,第一部分理论讲解(第一次课及第二次课第一节)第二部分上机实习(第二次课第二、三节),2,第一部分理论讲解,3,Whatisbioinformatics?,4,Whatisbioinformatics?生物信息学(Bioinformatics)是一门新兴的交叉学科,是一个涉猎内容十分广泛的学科领域。没有生物学、物理学、数学、计算机学等学科就不可能有生物信息学。生物信息学是研究相关生物信息的获取、加工、储存、分配、分析和注释的科学。,5,Bioinformaticsis:drivenbythegenerationofdata,moderatedbyhardwareandanalysismethods,Computingpower,Datagenerationplatforms,Analysismethods,生物信息的开发和应用,以核酸蛋白质等生物大分子为主要研究对象以信息、数理、计算机科学为主要研究手段以计算机网络为主要研究环境以计算机软件为主要研究工具对序列数据进行存储、管理、注释、加工对各种数据库进行查询、搜索、比较、分析构建各种类型的专用数据库信息系统研究开发面向生物学家的新一代计算机软件,7,ExamplesofBioinformatics,DatabaseinterfacesGenbank/EMBL/DDBJ,Medline,SwissProt,PDB,SequencealignmentBLAST,FASTAMultiplesequencealignmentClustal,MultAlin,DiAlignGenefindingGenscan,GenomeScan,GeneMark,GRAILProteinDomainanalysisandidentificationpfam,BLOCKS,ProDom,PatternIdentification/CharacterizationGibbsSampler,AlignACE,MEMEProteinFoldingpredictionPredictProtein,SwissModeler,8,Fivewebsitesthatallbiologistsshouldknow,NCBI(TheNationalCenterforBiotechnologyInformation;/EBI(TheEuropeanBioinformaticsInstitute)http:/www.ebi.ac.uk/TheCanadianBioinformaticsResourcehttp:/www.cbr.nrc.ca/SwissProt/ExPASy(SwissBioinformaticsResource)http:/expasy.cbr.nrc.ca/sprot/PDB(TheProteinDatabank)/PDB/,9,Halfdayontheweb,halfmonthinthelab.,savesyou,-AlanBleasby,10,DNA结构的发现与“人类基因组计划”的完成使“基因组时代”成为现实,“Thegenomiceraisnowareality”!-F.Collins,11,元素周期表的发现奠定了二十世纪物理、化学研究和发展的基础,元素周期表,“基因组序列图”将奠定二十一世纪生命科学研究和生物产业发展的基础!,“基因组”-生命科学的“元素周期表”,人体解剖图奠定了现,代医学发展的基础,12,生命的奥秘蕴藏于“四字天书”之中,GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCATCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCTCCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTCGCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT,13,基因(决定某种性状的DNA片断),基因转移技术,现代生物技术,“找”基因,“玩”基因,“用”基因,(健康、农业、工业、环境、安全),“知”基因,产品,14,发现基因的一般过程,从序列中发现基因可以理解为基因区域预测和基因功能预测2个层次,第一步:获取DNA目标序列如果你已有目标序列,可直接进入第2步;可通过PubMed查找你感兴趣的资料;通过GenBank或EMBL等数据库查找目标序列,15,第二步:查找ORF并将目标序列翻译成蛋白质序列利用相应工具,如ORFFinder、Genefeature(BaylorCollegeofMedicine)、GenLang(UniversityofPennsylvania)等,查找ORF并将DNA序列翻译成蛋白质序列,16,第三步:在数据库中进行序列搜索可以利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索第四步:进行目标序列与搜索得到的相似序列的整体对比(globalalignment)虽然第三步已进行局部(序列)对比(localalignment)分析,但整体对比有助于进一步加深目标序列的认识,17,第五步:查找基因家族进行多序列对比(multiplesequencealignment)和获得列线区段的可视信息。可分别在AMAS(OxfordUniversity)和BOXSHADE(ISREC,Switzerland)等服务器上进行,18,第六步:查找目标序列中的特定模序分别在Procite、BLOCK、Motif数据库进行profile、模块(block)、模序(motif)检索;对蛋白质序列进行统计分析和有关预测第七步:预测目标序列结构可以利用PredictProtein(EMBL)、NNPREDICT(UniversityofCalifornia)等预测目标序列的蛋白质二级结构,19,第八步:获取相关蛋白质的功能信息为了了解目标序列的功能,收集与目标序列和结构相似蛋白质的功能信息非常必要。可利用PubMed进行搜索第九步:把目标序列输入“提醒”服务器如果有与目标序列相似的新序列数据输入数据库,提醒(alert)服务会向你发出通知。可选用SequenceAlerting(EMBL)、Swiss-Shop(Switzerland)等服务器,20,21,DNAstarProductsLasergene-SequenceAnalysis(1982)GenVision-PublicationQualityGraphics(2000)ArrayStar-MicroarrayGeneExpressionAnalysis(2005),22,23,24,Overview,DNASTARproductsareusedbyresearchersinmorethan65countriesandineverystateintheUnitedStates.Theirproductsareusedbyscientistsineverymajorpharmaceuticalcompany,thetopbiotechcompaniesandmostmajorresearchacademicinstitutes.,25,Founded1982DNASTARwasfoundedbyProfessorofGeneticsFrederickBlattnerandhisComputerScientistcolleagueJohnSchroeder26yearsago.DNASTARsmissionthenwasthesameasitistoday:toprovidelifescientistswiththecomputingtoolstheyneedforsequenceanalysis.,26,Intheearlyyears,theproductwaswrittenfortheCPMoperatingsystem.WhentheIBMpersonalcomputerappeared,aDOSversionofoursoftwaresoonfollowed.WiththeadventofCompactDiscs,DNASTARwasthefirsttooffertheGenBankdatabaseonCD;hencethenameLasergene.,27,FunctionLasergeneisacomprehensivesuiteofeasy-to-usesequenceanalysissoftwareforWindowsandMacintosh.Lasergenesanalysistoolsincludealignments,contigassembly,genediscovery,primerdesign,restrictionmapping,proteinstructureprediction,28,TechnicalRequirementsLasergene7.2forWindowsWindowsVista,XPSP2or2000IntelcompatiblePentiumclassprocessor128MBRAM*90MBofavailablehard-diskspaceCD-ROMdrive(unlessdownloaded)Internetaccess(requiredtoauthorize),29,DNASTAR软件包版本,5.03版本(适合win98/Me)EditSeq、GeneQuest、MapDraw、MegAlign、PrimerSelect、Protean、SeqMan5.08版本(适合各个系统)EditSeq、GeneQuest、MapDraw、MegAlign、PrimerSelect、Protean、SeqMan6.*版本(适合WinXP/Win2000)(含6.00/6.13版本)EditSeq、GeneQuest、SeqBuilder、MegAlign、PrimerSelect、Protean、SeqMan7.*版本(适合WinXP及以上版本)(含7.0/7.1/7.2版本)EditSeq、GeneQuest、SeqBuilder、MegAlign、PrimerSelect、Protean、SeqManpro8.0版本(适合WindowsVistaandXP)EditSeq、GeneQuest、SeqBuilder、MegAlign、PrimerSelect、Protean、SeqManpro,30,EditSeq,EditandimportsequencesandannotationsTranslate,back-translateandreversecomplementsequencesLocateORFsandcreateannotationsCut/pastesequencewithinclusiveannotationsEditSeqincludedwithallsystems,31,GeneQuest,DiscoverandannotategenesPredictcodingregionsandsplicesitesLocaterepeats,patterns,orareasmatchingknownsequencedataSimulateagarosegelelectrophoresis,32,MapDraw,LocaterestrictionsitesCreatesixtypesoflinearandcircularmapsViewallsixreadingframeswithsitesandfeatures,33,MegAlign,AlignDNAandproteinsequencesPerformpairwise,multipleanddotplotalignmentsCreatephylogenetictreesGeneratesubalignmentsCustomizealignmentdisplays,34,PrimerSelect,DesignprimersorcompareyourownprimersagainstasequencetemplateAnalyzeprimersforhairpinsanddimersViewtheconsequencesofprimermutations,35,Protean,PredictproteinstructuresViewPAGEsimulationsAnalyzephysico-chemicalpropertiesDisplayresultsgraphically,36,SeqMan,AssemblesequencesTrimpoordataandremovevectorManageandordercontigsLocatepotentialSNPsVisualizetracesandcomparetwoconsensuscalls,37,DNASTARLasergenesoftware(7.*版本)consistsofanintegratedsuiteofsevenmodulesthatcanbepurchasedinanycombination.ThemodulesofLasergeneare:SeqBuilder-visualizationandsequenceeditingSeqManPro-sequenceassemblyandSNPdiscoveryMegAlign-sequencealignmentPrimerSelect-oligoprimerdesignProtean-proteinstructureanalysis&predictionGeneQuest-genefindingEditSeq-utilityforimportingunusualfiletypes,38,DNASTAR软件包(5.*版本),EditSeqGeneQuestMapDrawPrimerSelectMegAlignProteanSeqMan,39,一、EditSeq,40,EditSeq是能够迅速、正确地输入,并且修改DNA或蛋白质序列工具。每个EditSeq文件都可以分为三个可编辑的部分,上边的一部分为序列文件,中间的一部分里是评论,底部是序列的注释。,41,42,SequenceEntry,EditSeq能读取大部分的序列格式包括FASTA,GenBank,ABI、GCG和ASCII格式。可以使用菜单命令或拖拽方式输入序列文件。另外,序列也许通过使用键盘输入,或者从其他地方复制、粘贴得到。,43,EditingandAnalysis,序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反翻译,寻找开放读框,还可以进行阅读校对。另外,EditSeq能以GenBank,FASTA和GCG格式输出序列。,44,1.打开已有序列,在Windows里打开“contig3.seq”。从文件菜单(FILEMENU),选择Open。打开文件夹单击选定序列“contig3.seq”。当EditSeq窗口打开时,序列长度显示在右上角。,45,Open,46,47,2.序列的碱基组成分析File下拉菜单的import选项导入,open选项打开。Edit下拉菜单的selectall选项选中全部碱基goodies下拉菜单的dnastatistics选中出结果,48,49,G+C,50,3.寻找开放读框,在这一部分中,我们将确定序列中的ORF开放阅读框(openreadingframe,ORF)。从SEARCHMENU找到ORF,点击打开会出现下边的对话框。单击FindNext寻找第一个ORF的位置。继续点击FindNext直到你把ORF的位置选定在某一位置,ORF的坐标会出现在EditSeq窗口的顶端附近。,51,52,附:开放阅读框的鉴定,开放阅读框(openreadingframe,ORF)的鉴定是基因组注释中一项非常重要且必不可少的工作。完成这一工作可以有多种现成软件可供借助,例如NCBI网站中的ORFfinder就是其中之一(/gorf/gorf.html)。ORF的鉴定是根据起始密码和终止密码来进行的。在输入分析序列之后,有几个分析参数需要选择:,53,一是根据序列的物种来源选择遗传密码,数据库中共有22套不同物种的遗传密码可供选择。比如标准码选“1”,细菌码选“11”。二是限定最短ORF的长度。默认值是100,这时给出的结果中都是大于100个核苷酸的ORFs。这就是说作为基因的ORF很少是小于100个核苷酸的,但在实际中可能会有例外,特别是编码一些小肽的基因。,54,55,56,57,ORFs分析结果的报告表Framefromtolenth-325457286273171-138575406922118+113465151741710+2527063941125-232736342771542+31903219592561,在分析结果的报告中,将会给出6框(sixframe)分析结果。,58,由此可见,从报告结果中,可以知道各ORF的起、止点和它们位于哪一条链上以及是第几框分析的结果。值得注意的是,不同软件中如果使用不同检索参数,如使用的起始密码子(ATG,GTG,TTG)或终止密码子(TGA,TAA,TAG)不同,输出的结果将有一定差异。,59,60,61,62,核苷酸序列综合分析软件,SequenceassemblySequencemanipulationHomologycomparisonMultiplealignmentGenestructureanalysisPrimer/OligoanalysisRestrictionanalysisCodonsanalysis,63,4.DNA序列翻译,对ORF进行翻译,当然任何序列中的读框内部分(三联)都可以用下面的方法进行翻译。选定ORF,从GOODIESMENU菜单中选择翻译(Translate)。翻译的蛋白质序列出现在一个新的未命名窗口中(如下图)。它是使用标准的遗传密码翻译的。,64,65,5.密码子使用偏嗜性分析,20种氨基酸各有其特定的密码子,许多氨基酸具有多个密码子,这种现象称为简并密码。对于存在于不同物种体内的同一个蛋白质,尽管它们氨基酸序列相同,但在基因水平上,核苷酸序列可能不一样。对密码子使用的偏嗜性是物种的特征。对基因组中某些基因的密码子偏嗜性进行统计分析,有可能揭示微生物基因组中通过水平转移而获得的基因。,66,导入基因(ORFs)序列Edit下拉菜单的selectall选项选中全部碱基goodies下拉菜单的TranslateDNA选中出结果,67,68,69,6.序列的反向互补及反向转换,下面的步骤可以用于反向测定的序列的正确输入。选定序列。从GOODIESMENU菜单,选反向互补序列(ReverseComplement),或者把序列颠倒过来(ReverseSequence)命令,则被选定的序列就被翻转互补或翻转过来了。,70,原序列,反向互补序列,反向转换序列,71,7.序列的保存与输出,首先创建一个用于保存的序列。从文件菜单,选New中的NewDNA,或者NewProtein。将序列写入出现的窗口。如果你输入非法字符,计算机会发出警告。然后,我们将序列保存为EditSeq文件:从文件菜单,选Save。选定保存位置。给序列命名。单击保存则可。,72,以GenBank或GCG格式保存序列:从文件菜单,选Export。选定保存位置。为sequence(s)选格式。给sequence(s)命名。单击保存则可。,73,74,以FASTA格式保存序列:从文件菜单,选Export(1个序列),或者ExportAllAsOne(多个序列)。当使用ExportAllAsOne的时候,如果DNA和蛋白质文件同时存在,激活窗口的序列类型与你保存的类型是一致的。EditSeq仅仅将写入的序列保存为FASTA格式。选定保存位置。选FASTA格式。给sequence(s)命名。单击保存则可。,75,二、GeneQuest,76,GeneQuest可以发现和注释DNA序列中的基因,并帮助操作生物学所关心的DNA的其他feature:包括ORFS、拼接点连接,转录因子结合位点、重复序列、限制性内切酶酶切位点等。通过应用“methods”到序列,序列的feature可以以图形的形式展示出来。你可以在序列上注释任何你发现的feature。,77,SequenceEntry,GeneQuest能直接打开DNASTAR,ABI和GenBank文件。其他格式的序列文件也可以使用EditSeq改为DNASTAR格式。如果你知道Genbank序列的登录号或名称,你可以直接打开序列。,78,GeneQuest的DNA分析方法,打开GeneQuest文件后,下一步是选择应用方法。应用方法后,结果的图形显示可以帮助你了解序列上感兴趣的features。打开序列后,你会发现只有几种方法应用后的结果展示在窗口内。在这一部分中,我们将学习如何把其它方法用于我们序列的分析。,79,Title给文件取名。Ruler在文件中加入标尺。Sequence显示文件中的序列。Patterns-Matrix方法的运算参数。Patterns-Signal转录因子结合位点数据库。Patterns-Type-InPatterns使用键盘输入运算所需的Pattern参数。,80,Repeats-InvertedRepeats寻找反向重复序列。Repeats-DyadRepeats寻找Dyad重复和palindromes。Repeats-DirectRepeats寻找正向重复序列。GeneFinding-DNAFinder在打开的DNA序列中寻找指定DNA序列。分别显示正义链和反义链的寻找结果。GeneFinding-ProteinFinder在打开的蛋白质序列中寻找指定DNA序列的翻译序列。显示结果为全部6个读框。Enzymes-RestrictionMap用DNASTAR酶目录中的酶分析打开的序列,并以图形方式展示。,81,CodingPrediction-Borodovsky用BorodovskysMarkov方法来识别潜在的基因编码区,并以图形方式展示。CodingPrediction-StartsStopsORFs根据指定的ORFs的最小长度,寻找可能的开放读框,可以选择是否需要起始密码子。读框的起始和中止点分别展示。CodingPredictionLocalCompositionalComplexity根据Shannon信息学原理寻找有基因编码提示信息的区域。BaseContents-BaseDistribution序列上4种碱基、A+T和G+C的频率、分布,以及AT和gc分布区域。BentDNA-BendingIndexDNA折叠预测。,82,1.用分析方法操作,调用新的GeneQuest方法的步骤是:从MoreMethods中选择方法,加入方法帘(methodcurtain),待方法运行完毕后,选择性的拖取结果放入分析界面(assaysurface)即可(见下页)。我们使用BentDNA-BendingIndex方法进行分析。从ANALYSISMENU选择ShowAvailableMethods可以打开方法帘,也可以通过拖动分析界面左上角的小环打开方法帘。方法帘中包括已经用于分析的全部方法。,83,84,85,你将注意到方法帘没有BentDNA-BendingIndexmethod。在方法帘的顶端,点击MoreMethods打开一个下拉菜单,其中有可以用于分析的所有方法,点击BentDNA-BendingIndexmethod,该方法就进入了方法帘。,86,87,若查看方法帘中的方法是否已经被应用,点击其右边的三角形。如果图标前有数字表明该方法已经使用,数字表示应用的次数。因为我们还没有应用BentDNA-BendingIndex,所以点击三角形,会发现图标前没有数字。,点击白颜色的位置去除对图标的选择。单击选定“BendRegion,”,将其拖到分析界面,释放鼠标。序列中可能会折叠的区域就会以小盒子的形式显示出来。,88,2.以RNA折叠形式查看序列的一部分,选定目的序列,在ANALYSISMENURNA菜单中选择FoldasRNA命令。,89,90,附:tRNA基因检索,tRNA有特殊的“三叶草”结构特征,通常具有“四环”(二氢尿嘧啶核苷环即DHU环,反密码子环,额外环及TC环),三柄(DHU柄,反密码子柄,TC柄),两臂(可变臂及氨基酸臂),且氨基酸臂的端均为“-C-C-A-OH”结构。有众多分析软件可以完成,在法国Pasteur实验室网站(http:/bioweb.pasteur.fr/seqanal/),选择FasttRNAanalysismethod可以完成这一工作。利用DNAStar软件中的GeneQuest还可进行tRNA的二级结构折叠模拟。,91,92,93,再附:tRNA基因检索LoweLabtRNAscan-SESearchServerSearchfortRNAgenesingenomicsequence网站:(/tRNAscan-SE/),94,95,96,97,3.序列酶切,模仿agarose凝胶电泳判定大小,打开方法帘(methodcurtain)。从MoreMethods中选择Enzymes-RestrictionMap加入方法帘。单击图标左边的蓝色三角形,打开内切酶一览表。注意方法帘仅仅显示那些最少切割一次DNA序列的酶。刚打开酶一览表时,所有的酶都被选中了,在空白处单击一下去除选定。,98,99,选定特定的酶,拖入分析界面,即可以看见该酶的酶切位点在序列上的位置。从SITES&FEATURESMENU菜单选择AgaroseGelSimulation。新窗口即显示酶切片段在electrophoretic的分离情况(如图)。,100,101,102,ES,S(始点),E(终点),单切点限制性内切酶X将环状基因组切成1个片段,单切点限制性内切酶X将线性基因组切成2个片段,噬菌体线性基因组的确定,103,限制性内切酶Aat酶切噬菌体基因组的电子与实际图谱,M,PaP2,5100bp,43783bp,A,38626bp,5157bp,B,104,4.保存分析文件,从文件菜单,选保存。选定文件的保存位置,给文件命名。单击保存。你所应用和展示的所有信息都会被保存。,105,三、MapDraw,106,根据实验设计,分析和实验结果的展示需要的不同,MapDraw可以制作6种类的酶切图。从简单的线性图到有注释的环形图,在展示限制性酶切位点的同时,还可以同时展示序列的feature,六个读框及其翻译结果。,107,你可以按照位置、酶切频率等来排列你的酶切位点。另外,你可以用手工选任何酶切位点的结合。酶切位点过滤器(filters)也可以联合使用。MapDraw工具能使你规划酶切位点和克隆实验,产生详细,充分地结果概括。,108,1.新酶切图制作,我们以一段DNA序列DemoSequences文件夹下的“tethis21.seq”为例。首先我们寻找能够切割其序列的酶切位点。从文件菜单选择New打开右边的对话框。打开“DemoSequences”文件夹。双击打开TETHIS21.seq(见下)。,109,110,111,2.过滤器类型,过滤器(filter)是你定义的可以使用的酶切位点的集合。在你自定义过滤器之前,所有酶切位点都会用于序列分析。你可以用和或来组合过滤器。MapDraw内置的过滤器如下:Overhang过滤器是根据一套你定义的Overhang准则归类的酶切位点。这些准则包括3和5端突出,与别的酶切位点互补以及兼并的末端突出。在克隆试验中,可以使用这个过滤器寻找互补末端。频率(Frequency)过滤器是指根据出现于指定的范围序列上的频率归类的酶切位点。我们下面将使用这个过滤器型。,112,种类和复杂性过滤器(Class&Complexity)是根据酶切位点种类归类的酶切位点。这些种类包括:I型(随机)或II型(明确),或者I型+II型。这过滤器也可以根据位点复杂性、价钱和来源进行归类。手动选择过滤器(ManualPick)允许你按需要选定酶切位点。在随后的一部分中,我们学习使用手动选择过滤器的方法。,113,3.频率过滤器应用,首先让我们用频率过滤器来删除任何大于两次切割我们序列的酶。从ENZYMEMENU,选NewFilter,然后Frequency打开参数对话框。在Min和Max对应的框中输入数字1和2,其他的参数不变。这个设定将我们序列中切割多于两次的位点自动删除。在过滤器名字框中,输入“Two-cuts-max.”。单击Apply将过滤器用于序列分析然后OK退出参数对话框。你将注意到在图上酶切位点的数目现在大大地减少了。,114,115,116,117,118,4.应用手动过滤器,应用手动过滤器,还可以挑选我们一些需要的酶,用来看看切割TETHIS21序列的情况。从MAPMENU选LinearMinimap。打开的窗口显示每个限制酶切割位点的位置。从ENZYMEMENU,选NewFilter然后ManualPick。打开酶切位点过滤器编辑器。把ApoI从右边的窗口拖进左边的窗口。给过滤器取名。在这我们把过滤器叫做“Apo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论