生物信息数据库及生物信息分析软件应用课件_第1页
生物信息数据库及生物信息分析软件应用课件_第2页
生物信息数据库及生物信息分析软件应用课件_第3页
生物信息数据库及生物信息分析软件应用课件_第4页
生物信息数据库及生物信息分析软件应用课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验一

生物信息数据库及

生物信息分析软件应用现代分子生物学大实验实验目的掌握生物信息学基本概念、原理及方法应用生物信息学的一些工具进行初步的生物信息分析运用PrimerPrimier5进行引物设计实验主要内容分子生物学数据库:掌握数据库的种类、功能,文献查找方法相似序列的数据库搜索:掌握NCBI中几种基本局部序列比对方法及几种单机软件的使用方法(Blastn;Blastp;Blastx;tBlastn)。生物信息学单机软件介绍:PrimerPrimier5欧洲分子生物学实验室EMBL(EuropeanMolecularBiologyLaboratory)美国生物技术信息中心NCBI(NationalCenterforBiotechnologyInformation)日本遗传研究所DDBJ(DNADataBankofJapan)国际权威数据库国际权威数据库蛋白质数据库

SWISS-PROTTrEMBL(translationofEMBL)PIR(Promoterinformationresource)PRF(Promoterresearchfoundation)PDBSTR(Re-organizedProteindataBank)Prosite结构数据库

PDB(ProteinDataBank)NDB(NucleicAcidDatabase)DNA-bindProteindatabase

swiss-3DIMAGE酶和代谢数据库

KEGG(KyotoEneyclopedinofgenes&genemes)PKR(ProteinKinaseResource)

文献数据库

PubMedOMIMAgricola常用数据库核苷酸数据库dbEST

EST来源于mRNA

-基因长度(300-400bp,数据长度足以分析编码的产物)或者全基因(已知)

-5’端或3’端的cDNA序列(EST)

-300-400bpsingle-passsequence(可能有误,如果要求<0.1%的错误率,需要测序8-10次)

-GenBank中71%以上的是EST序列。UniGene

来源于同一基因的非重复EST,组成基因序列群(contig)

dbSTS

(sequencetaggedsites)

a.短序列(200-500bp)b.已完成染色体上的定位c.可以与电子PCR相连用dbGSS

(genomesurveysequence)

a.基因组短序列b.cosmid、BAC、YAC外源插入片断末端序列c.AluPCR序列

HTG(high-throughputgenomesequence)

尚未完成测序的重叠群(>2kb)dbSNP

每100-300bp有一个SNPEPD(EukaryoticPromoterDatabase)启动子数据库文献数据库序列相关检索操作序列查询登录号(如X58929)序列名称(如SCARGC)核酸同源性搜索

BLAST分析浏览整个基因组直观显示各染色体,可以在染色体水平上选择感兴趣的位点,逐层放大浏览染色体浏览染色体浏览染色体Blastp:氨基酸序列检索蛋白质库将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行查询;(Searchanucleotidedatabaseusinganucleotidequery)Blastn:核苷酸序列检索核苷酸库将待查询的核酸序列及其互补序列一起对核酸序列数据库进行查询;(Searchanucleotidedatabaseusinganucleotidequery)

Blastx:核苷酸序列

氨基酸序列

蛋白质库先将待查询的核酸序列按6种可读框架(逐个向前3个碱基和逐个向后3个碱基读码)翻译成蛋白质序列,然后将翻译结果对蛋白质序列数据库进行查询;(Searchproteindatabaseusingatranslatednucleotidequery)tBlastn先将核酸序列数据库中的核酸序列按6种可读框架翻译成蛋白质序列,然后将待查询的蛋白质序列及其互补序列对其翻译结果进行查询;(Searchtranslatednucleotidedatabaseusingaproteinquery)tBlastx先将待查询的核酸序列和核酸序列数据库中的核酸序列按6种可读框架翻译成蛋白质序列,然后再将2种翻译结果从蛋白质水平进行查询。(Searchtranslatednucleotidedatabaseusingatranslatednucleotidequery)同源性搜索(BasicLocalAlignmentSearchTool)序列特征注释

AnnotationbysequencefeaturesSubcellularLocalizationNoneSignalpeptideNoneobvioustransmembraneregionMotifsDomainsPfamInterProCoiledCoilRegionsSTRUCTURECannotfinddatainPDBPredictedinGTD

多序列比对

MultiplesequencealignmentanalysisClustalW,viewasJalView引物设计-primerprimer5软件引物设计的一般步骤序列查询单基因序列多基因序列引物设计引物确定引物的设计原则引物与模板的序列要紧密互补引物与引物之间避免形成稳定的二聚体或发夹结构引物不能在模板的非目的位点引发DNA聚合反应(即错配)引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应。引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(thenearestneighbormethod)。Tm值:50%的引物和互补序列表现为双链DNA分子时的温度引物的设计原则引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。引物的设计原则引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。引物的设计原则primerprimer5软件的使用primerprimer5软件的使用primerprimer5软件的使用primerprimer5软件的使用primerprimer5软件的使用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论