生物学信息分析.ppt_第1页
生物学信息分析.ppt_第2页
生物学信息分析.ppt_第3页
生物学信息分析.ppt_第4页
生物学信息分析.ppt_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关生物信息学分析及软件的使用,基因工程下游技术实习,实验目的,了解相关的生物信息学数据库(NCBI数据库等)和掌握数据库检索方法,学会相关软件的使用,并利用生物信息学软件根据研究目的和对象设计引物。,方法,根据酶或基因的名称(GenBank登录号)找到需要的基因的核苷酸序列,根据序列和PCR的目的设计获得该基因的CDS的引物(注意引物设计时引物酶切位点)。,目的基因序列的检索,主要数据库介绍,Genebank EMBL DDBJ,Genebank Genebank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护

2、的。 NCBI的网址是:,EMBL核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。 数据库网址是:http:/www.ebi.ac.uk/embl/,DDBJ数据库日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。 DDBJ的网址是:http:/www.ddbj.nig.ac.jp/,NCBI介绍:NCBI建立在1988年,作为一种公共分子生物学信息资源

3、, 而创建的公开数据库。 NCBI的计划:1.基本研究;2.数据库;3.软件的开发;4.教育和训练,现在我们以查找甘薯异戊烯氯喹异构酶(Ipomoea batatas isopentenyl diphosphate isomerase ,ipi)的 编码序列为例,介绍如何从中在线获取所需要的核酸序列,应用举例,1.进入,2.选择数据库,3.查询关键词,4.开始查询,显示格式,符合条件的记录数,每页显示数目,相关记录 点击进入,Genbank格式的序列记录,FASTA格式的序列记录,基因表达的ORF分析,aagcaagacg ccaagggcca aggctggctg caagaagcaa ag

4、aggaacga acactgtgaa 61 tatcccaatg tcgatgatgg cttctgttca aatctgtcgg agattctctc ccctagtcgc 121 ccggccggcg atttactctg ccaattcttc attcctctca ccagtctctt tcgcctcttc 181 ttctctttca attatgccga tccgcctccg ctgcagagct tcagtacact ctgtccgcgc 241 cgcctccacc atgggggaca ccatcactga tgccaacatg gatgctgtcc agcgccgcct 3

5、01 catgtttgac gacgagtgta ttttggtgga tgagaatgac cgtgttgttg gtcatgatac 361 caagtataat tgtcatctta tggagaagat tgaatctgag aatctgcttc acagagcttt 421 cagtgttttc ttatttaatt caaactatga gttgcttctt cagcaacgat ctgcgacaaa 481 ggtcaccttc cctttggtgt ggactaacac ctgctgcagc catcctctgt accgggagtc 541 tgagttgatt gaagag

6、aatg ctcttggtgt gaggaatgct gcacaaagaa agcttcttga 601 tgaactgggg attcctgcag aggatgtccc agttgatgaa ttcacaacat tgggccgtat 661 cctgtataaa gcaccttctg atgggagatg gggagagcat gaacttgatt atcttctctt 721 cattgtgagg gatgttggca tgcacccaaa cccggatgag gttgcagatg ttaaatatgt 781 gaatagggaa cagctgaaag agatcttgag gaaa

7、gcaaat gctggagagg atggtataaa 841 gctttcccct tggttcagat tagtcgtcga aaatttcttg ttcaaatggt gggatcatgt 901 cgagaaaggc accctaatgg aagctgcaga tatgaaaacc attcacaagt tggcctaaac 961 agccattggc tgagcttttg ttaaaccctt acatctacca ttcacttaac tgagcaaaaa 1021 tatattctat ggtcttctgc ttagtttcat gcttcatgct tgaactttca a

8、gttttatgt 1081 tacttttggc tgttaggaac tagtaatata tgtgaacttg ctatcaaaaa aaaaaaaaaa 1141 aaaaaaaaaa aaaaa /,基因表达的ORF分析,利用计算机和互联网,对核酸序列的所有相位进行搜索可以很快地获得结果。国际互联网上的分析资源有:/gorf/查找);http:/expasy.hcuge.ch/www/dna.html(将翻译为蛋白质)。,核酸序列的比对分析,对核酸序列的首要分析是联网进行序列的同源性分析,以便能够利用最新的数据库反映该序列是否是已知

9、序列以及与已知序列同源性的高低。典型的分析是采用NCBI的BLAST软件对GENBANK中的非冗余数据库(non-redundant database,nr)进行查询。该数据库是对GENBANK、EMBL和DDBJ中去除所有相同核酸序列进行整合后所得到的最为全面的已知基因数据库,其中还包括了部分基因组的序列。,运行时联网至:/BLAST 按照提示进行查询。,ggggtcgagt ccgcgtccac ccgcgagtac aaccttcttg cagctcctcc gtcgccggtc 61 cacacccgcc accagttcgc cat

10、ggatgac gatatcgctg cgctcgtcgt cgacaacggc 121 tccggcatgt gcaaggccgg cttcgcgggc gacgatgctc cccgggccgt cttcccctcc 181 atcgtgggcc gccctaggca ccagggtgtg atggtgggta tgggtcagaa ggactcctac 241 gtgggcgacg aggcccagag caagagaggc atcctgaccc tgaagtaccc cattgaacac 301 ggcattgtca ccaactggga cgatatggag aagatttggc a

11、ccacacttt ctacaatgag 361 ctgcgtgtgg cccctgagga gcaccctgtg ctgctcaccg aggcccctct gaaccctaag 421 gccaaccgtg aaaagatgac ccagatcatg tttgagacct tcaacacccc agccatgtac 481 gtagccatcc aggctgtgtt gtccctgtat gcctctggtc gtaccactgg cattgtgatg 541 gactccggag acggggtcac ccacactgtg cccatctatg agggttacgc gctccctcat

12、 601 gccatcctgc gtctggacct ggctggccgg gacctgacag actacctcat gaagatcctg 661 accgagcgtg gctacagctt caccaccaca gctgagaggg aaatcgtgcg tgacattaaa 721 gagaagctgt gctatgttgc cctagacttc gagcaagaga tggccactgc cgcatcctct 781 tcctccctgg agaagagcta tgagctgcct gacggtcagg tcatcactat cggcaatgag 841 cggttccgat gccc

13、cgaggc tctcttccag ccttccttcc tgggtatgga atcctgtggc 901 atccatgaaa ctacattcaa ttccatcatg aagtgtgacg ttgacatccg taaagacctc 961 tatgccaaca cagtgctgtc tggtggcacc accatgtacc caggcattgc tgacaggatg 1021 cagaaggaga ttactgccct ggctcctagc accatgaaga tcaagatcat tgctcctcct 1081 gagcgcaagt actctgtgtg gattggtggc

14、tctatcctgg cctcactgtc caccttccag 1141 cagatgtgga tcagcaagca ggagtacgat gagtccggcc cctccatcgt gcaccgcaaa 1201 tgcttctagg cggactgtta ctgagctgcg ttttacaccc tttctttgac aaaacctaac 1261 ttgcgcaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa /,点击,点击,PCR引物设计,PCR基本原理,Mg2+,3-,C,-3,3-,-5,T,T,A,A,G,G,G,C,A,T,A,G,T,A,G,G,C,5-,

15、3-,-5,T,A,-3,5-,T,T,A,A,G,G,G,C,A,T,A,G,T,A,C,5-,因此,引物设计是整个工作的基础和关键。,引物设计的原则,1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38bp 2. 引物3端出现3 个以上的连续碱基,特别是GGG 或CCC,引物设计的原则,3.引物3端的末位碱基对Taq 酶的DNA 合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A 的错配效率明显高于其他3 个碱基。 4. 5端序列对PCR 影响不太大,因此常用来引进修饰位点或标记物。 5.引物二聚体或发夹结构也可能导致PCR 反应失败

16、。,引物二聚体,Mg2+,C,G,T,A,T,T,A,A,G,G,G,C,A,T,T,A,A,G,G,G,C,A,T,A,G,G,C,G,A,A,T,Mg2+,-3,-3,3-,5-,-5,DNA 聚合酶,引物二聚体,Mg2+,C,G,T,A,T,T,A,A,G,G,G,C,A,T,T,A,A,G,G,G,C,A,T,A,G,G,C,G,A,A,T,Mg2+,-3,-3,3-,5-,-5,DNA 聚合酶,引物二聚体,Mg2+,C,G,T,A,T,T,A,A,G,G,G,C,A,T,T,A,A,G,G,G,C,A,T,A,G,G,C,G,A,A,T,Mg2+,-3,-3,3-,5-,-5,DNA

17、 聚合酶,发夹结构,引物设计的原则,引物二聚体及发夹结构的能值过高: G 4.5kcal/mol 产生引物二聚体带,并且降低引物有效浓度而使PCR 反应效率降低。,引物设计的原则,6. 引物序列的GC 含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。,7. 引物所对应模板位置序列的Tm 值在72左右可使复性条件最佳。 Tm 值的计算公式: Tm4(G+C)2(A+T),引物设计的原则,引物设计的原则,8. G 值是指DNA 双链形成(或者打开)所需的自由能,该值反映 双链结构内部碱基对的相对稳定性。应当选用3端G 值较低(绝对值不超过9),而5端和中间G

18、值相对较高的引物。 引物的3端的G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应。,这么多要求烦死人了,我抗议!除非,常用的引物设计软件,Oligo 6 (引物评价)* Premier Primer (自动搜索)* Vector NTI Suit Dnasis Omiga Dnastar Primer3 (在线服务)*,常用的引物设计软件,Primer Primer5.0的使用技巧简介,1、软件安装与主要功能介绍 2、引物设计应用举例,常用的引物设计软件,我们可以通过网上下载或其它方式获得安装软件,1、软件安装与主要功能介绍,2、引物设计应用举例 引物分类:按PCR目的不同可分为检

19、测引物和克隆引物两大类.,常用的引物设计软件,检测性引物特点:反应灵敏性、扩增特异性,克隆性引物特点:产物完整性和保真性,PCR引物设计应用举例,1 ctgcaggcca ctggttaccg ggaattgttc cggtcaacgc ggtattaggt ggcgcgctga 61 gctatctgat ccttaacccg attttgaatc gtaaaacgac agcagcaatg acgcatgtgg 121 aggctaacag tgtcgaataa cgctttacaa acaattatta acgcccggtt accaggcgaa 181 gaggggctgt ggcag

20、attca tctgcaggac ggaaaaatca gcgccattga tgcgcaatcc 241 ggcgtgatgc ccataactga aaacagcctg gatgccgaac aaggtttagt tataccgccg 301 tttgtggagc cacatattca cctggacacc acgcaaaccg ccggacaacc gaactggaat 361 cagtccggca cgctgtttga aggcattgaa cgctgggccg agcgcaaagc gttattaacc 421 catgacgatg tgaaacaacg cgcatggcaa acg

21、ctgaaat ggcagattgc caacggcatt 481 cagcatgtgc gtacccatgt cgatgtttcg gatgcaacgc taactgcgct gaaagcaatg 541 ctggaagtga agcaggaagt cgcgccgtgg attgatctgc aaatcgtcgc cttccctcag 601 gaagggattt tgtcgtatcc caacggtgaa gcgttgctgg aagaggcgtt acgcttaggg 661 gcagatgtag tgggggcgat tccgcatttt gaatttaccc gtgaatacgg c

22、gtggagtcg 721 ctgcataaaa ccttcgccct ggcgcaaaaa tacgaccgtc tcatcgacgt tcactgtgat 781 gagatcgatg acgagcagtc gcgctttgtc gaaaccgttg ctgccctggc gcaccatgaa 841 ggcatgggcg cgcgagtcac cgccagccac accacggcaa tgcactccta taacggggcg 901 tatacctcac gcctgttccg cttgctgaaa atgtccggta ttaactttgt cgccaacccg 961 ctggtc

23、aata ttcatctgca aggacgtttc gatacgtatc caaaacgtcg cggcatcacg 1021 cgcgttaaag agatgctgga gtccggcatt aacgtctgct ttggtcacga tgatgtcttc 1081 gatccgtggt atccgctggg aacggcgaat atgctgcaag tgctgcatat ggggctgcat 1141 gtttgccagt tgatgggcta cgggcagatt aacgatggcc tgaatttaat cacccaccac 1201 agcgcaagga cgttgaattt gcaggattac ggcattgccg ccggaaacag cgccaacctg 1261 attatcctgc cggctgaaaa tgggtttgat gcgctgcgcc gtcaggttcc ggtacgttat 1321 tcggtacgtg gcg

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论