第四章 核酸序列分析-1_第1页
第四章 核酸序列分析-1_第2页
第四章 核酸序列分析-1_第3页
第四章 核酸序列分析-1_第4页
第四章 核酸序列分析-1_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第四章第四章 DNA序列分析序列分析21 如何查询下列文献:如何查询下列文献:Wan, Y. and Lemaux, P.G. Generation of large numbers of independently transformed fertile barley plants. Plant Physiol. 1994 ,104: 3748.回顾回顾2 2上次上机操作内容简要说明。上次上机操作内容简要说明。3序列分析序列分析其实就是从已知蛋白质、其实就是从已知蛋白质、RNA、DNA序列作出序列作出生物学推论生物学推论的过程。的过程。4主要内容主要内容4.1 引言引言4.2 序列的一般分

2、析序列的一般分析4.3 基因预测与鉴定基因预测与鉴定4.4 非编码区分析与调控元件识别非编码区分析与调控元件识别54.1 引引 言言6一、一、DNA序列分析的意义序列分析的意义uDNA序列分析是生物信息学中的重要内容之一序列分析是生物信息学中的重要内容之一u DNA是生物遗传信息的最终决定者是生物遗传信息的最终决定者u DNA序列携带的遗传信息具有极高的复杂性序列携带的遗传信息具有极高的复杂性u DNA序列分析是揭示遗传语言复杂性的基本过程序列分析是揭示遗传语言复杂性的基本过程7二、基因结构与功能简介二、基因结构与功能简介原核生物基因结构原核生物基因结构1 1 长开放阅读框长开放阅读框2 2

3、高基因密度高基因密度3 3 简单的基因结构简单的基因结构4 4 基因组中基因组中GCGC含量变化非常大含量变化非常大特点:特点:8真核生物基因结构真核生物基因结构特点:特点:1 1 基因组规模大基因组规模大2 2 非编码区序列占绝大部分(人类,非编码区序列占绝大部分(人类,9797)3 3 基因结构复杂基因结构复杂4 4 具有复杂的基因转录调控方式具有复杂的基因转录调控方式5 5 具有丰富的可变剪接具有丰富的可变剪接6 6 有明显的有明显的CpGCpG岛、密码子使用具有偏好性岛、密码子使用具有偏好性9v 序列一般性分析序列一般性分析v 基因识别与鉴定基因识别与鉴定v 非编码区分析及调控元件识别

4、非编码区分析及调控元件识别四、四、DNA序列分析基本内容序列分析基本内容104.2 DNA序列的一般分析序列的一般分析11华北制药集团的谈杰创建的一个非常有用的生华北制药集团的谈杰创建的一个非常有用的生物信息学资源网站。物信息学资源网站。http:/www.bio- CalculatorOligo Calculator、BioEditBioEdit、DNAMANDNAMAN等进行综合计算。等进行综合计算。Oligo Calculator ,/JaMBW/ 一、序列统计一、序列统计17JaMBW是一个分子生物学软件包,功能包括:序列格式是一

5、个分子生物学软件包,功能包括:序列格式转换、求序列的补体序列与逆序列、将转换、求序列的补体序列与逆序列、将DNA序列翻译成序列翻译成蛋白序列、序列分析、蛋白序列、序列分析、 多序列比较、特征位点查找、多序列比较、特征位点查找、3维维分子结构查看、分子结构查看、PCR引物设计、缓冲液设计等功能,包引物设计、缓冲液设计等功能,包含了分子生物学研究常用的一些操作。含了分子生物学研究常用的一些操作。JaMBW是一个非是一个非常出色的工具软件。常出色的工具软件。以以JaMBW 的的Oligo CalculatorOligo Calculator为例演示为例演示181920计算结果:计算结果:21序列转换

6、主要包括两方面的工作:序列转换主要包括两方面的工作: 1 1)序列格式转换)序列格式转换 2 2)互补与反向序列格式转换)互补与反向序列格式转换序列转换序列转换是分子生物学和生物信息学研究中最常遇到的工是分子生物学和生物信息学研究中最常遇到的工作之一,因此,掌握序列转换的常用方法是分子生物学家作之一,因此,掌握序列转换的常用方法是分子生物学家和生物信息学家的基本要求。和生物信息学家的基本要求。二、序列转换二、序列转换22ReadSeq是目前最流行的格式处理软件之一。是美国印是目前最流行的格式处理软件之一。是美国印第安那大学的第安那大学的Don Gilbert开发编制的。开发编制的。支持支持23

7、种序列格式的转换,几乎囊括了目前所有的一种序列格式的转换,几乎囊括了目前所有的一级序列格式。级序列格式。/molbio/readseq/1 1 序列格式转换序列格式转换23选择输出选择输出格式格式24EMBLEMBL格式格式)序列标准格式)序列标准格式 XX(XX(不能少)不能少)YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY2 2)序列长度少于)序列长度少于1818bpbp时一时一定要用标准格式定要用标准格式3 3)序列长度大于)序列长度大于1818bpbp时,时,“XX”XX”可省去。可省去。序列格式说明:序列格式说明:2

8、52 互补与反向序列格式转换互补与反向序列格式转换RevSeqRevSeq程序是一款专门将序列进行反向和互程序是一款专门将序列进行反向和互补转换的小工具。补转换的小工具。个头虽小,但很实用。它是著名的生物信息个头虽小,但很实用。它是著名的生物信息学软件包学软件包EMBOSSEMBOSS的一个成员。的一个成员。http:/mobyle.pasteur.fr/cgi-bin/portal.py?form=revseq26粘贴序列粘贴序列上传序列文件上传序列文件1)反向链)反向链2)互补链)互补链3)反向互补链)反向互补链改变文件名改变文件名27要求填写要求填写E-mailE-mail地址地址28填

9、写验证码填写验证码29互补反向链互补反向链输出转换结果输出转换结果30同时转换多条序列同时转换多条序列31三、序列翻译三、序列翻译所谓序列翻译,是指用计算机程序把核酸序列按三所谓序列翻译,是指用计算机程序把核酸序列按三联体密码规则翻译成蛋白质序列。联体密码规则翻译成蛋白质序列。6 6框架翻译,即从正向框架翻译,即从正向1 1,2 2,3 3位碱基开始按三联体密位碱基开始按三联体密码规则翻译成码规则翻译成3 3条蛋白质序列以及从反向条蛋白质序列以及从反向1 1,2 2,3 3位碱位碱基开始翻译得到基开始翻译得到3 3条蛋白质序列,共条蛋白质序列,共6 6条蛋白质序列。条蛋白质序列。问题:问题:

10、究竞蛋白质序列是不是真正表达的蛋白产物?究竞蛋白质序列是不是真正表达的蛋白产物?方法:方法: 1 1)对于已知蛋白,可进行数据库搜索判断序列的可靠性。)对于已知蛋白,可进行数据库搜索判断序列的可靠性。 2 2)对于未知新基因,则需要参考序列的其他特定信息。)对于未知新基因,则需要参考序列的其他特定信息。3233许多程序对许多程序对DNADNA序列一次进行全部序列一次进行全部6 6个阅读框的翻译。个阅读框的翻译。程序之一程序之一:EBIEBI著名软件包著名软件包EMBOSSEMBOSS中的中的TranseqTranseqhttp:/www.ebi.ac.uk/emboss/transeq/特点:

11、特点: 1 1)输入序列可以是原始序列,也可以是)输入序列可以是原始序列,也可以是GCGGCG,FastaFasta,EMBLEMBL,GenBankGenBank,PIRPIR等格式。等格式。 2 2)可一次翻译成)可一次翻译成1 1条,同向条,同向3 3条,双向条,双向6 6条蛋白质序列。条蛋白质序列。 3 3)翻译时可选择标准密码子或其他类型的密码子)翻译时可选择标准密码子或其他类型的密码子34Transeq主页主页35翻译结果(翻译结果(6框架)框架)36程序之二程序之二: ExPASyExPASy的的Translate ToolTranslate Toolhttp:/us.expas

12、/tools/dna.html特点:特点: 1 1)程序简单,没有太多的可选项,运行速度快。)程序简单,没有太多的可选项,运行速度快。 2 2)一次翻译双向)一次翻译双向6 6条蛋白质序列。条蛋白质序列。 3 3)输出结果较)输出结果较TranseqTranseq清楚,不仅将终止密码子用清楚,不仅将终止密码子用StopStop英文单词表示,还将起始密码子以英文单词表示,还将起始密码子以METMET标记出来标记出来37Translate ToolTranslate Tool主页主页38Translate ToolTranslate Tool翻译结果翻译结果39程序之三程序之三: NCB

13、INCBI的的ORF finderORF finder/gorf/gorf.html特点:特点: 1 1)输入序列只能是)输入序列只能是FastaFasta格式。格式。 2 2)输出结果以图形化表示,并将核酸序列与氨基酸序)输出结果以图形化表示,并将核酸序列与氨基酸序列同时排列出来。列同时排列出来。 3 3)可将结果直接用)可将结果直接用BlastBlast进行序列数据库搜索比对。进行序列数据库搜索比对。40ORF Finder主页主页41ORF Finder ORF Finder 翻译结果翻译结果No responseNo response

14、4243四、序列的限制性酶切分析四、序列的限制性酶切分析 酶切条件的分析是根据酶切条件的分析是根据限制性内切酶限制性内切酶能识别能识别DNADNA分分子中的特定序列并在某一碱基处切开序列。而用几子中的特定序列并在某一碱基处切开序列。而用几种不同的内切酶可切割某特定基因,以便于进一步种不同的内切酶可切割某特定基因,以便于进一步实验(如基因的克隆,表达重组体的构建等)。实验(如基因的克隆,表达重组体的构建等)。 与与PCRPCR一样,酶切实验是目前分子生物学实验室最一样,酶切实验是目前分子生物学实验室最常用的实验方法之一,因此,酶切图谱分析程序也常用的实验方法之一,因此,酶切图谱分析程序也成为了最

15、常用的分子生物学软件之一。成为了最常用的分子生物学软件之一。限制性内切酶数据库:限制性内切酶数据库: REBASEREBASE(Restriction Enzyme DatabaseRestriction Enzyme Database),),由新由新英格兰生物实验室管理维护。英格兰生物实验室管理维护。http:/ NEBcutterNEBcutter 该程序是与该程序是与REBASEREBASE整合在一起的免费限制性内切整合在一起的免费限制性内切酶分析软件酶分析软件特点特点1 1)既可对我们自已的序列进行分析,也可对)既可对我们自已的序列进行分析,也可对GenBankGenBank中中的序列

16、进行分析。的序列进行分析。2 2)分析长度不能超过)分析长度不能超过300300kbasekbase。3)3)限制性内切酶种类最齐全,提供限制性内切酶种类最齐全,提供NEBNEB数据库中的内切数据库中的内切酶和商业内切酶的酶切结果。酶和商业内切酶的酶切结果。4 4)结果图形化显示,具有非常友好的交互性。)结果图形化显示,具有非常友好的交互性。48REBASE 主页主页REBASEREBASE工工具选项具选项49NEBcutterNEBcutter工具工具50NEBcutterNEBcutter工具主页工具主页结果可保存结果可保存2 2天天51线性表示的酶切结果线性表示的酶切结果52环形表示的酶

17、切结果环形表示的酶切结果53五、载体绘制五、载体绘制不论是在分子生物学实验还是撰写论文中,不论是在分子生物学实验还是撰写论文中,载体绘载体绘制制是一项经常遇到的工作。是一项经常遇到的工作。载体(载体(vectorvector)是指运载外源是指运载外源DNADNA有效进入受体细有效进入受体细胞内的工具。胞内的工具。54作为载体应满足以下几方面的要求:作为载体应满足以下几方面的要求:(1)(1)有某种限制酶的一个切点,最好是有许多种限制酶有某种限制酶的一个切点,最好是有许多种限制酶的切点,而且每种酶的切点只有一个;的切点,而且每种酶的切点只有一个;(2)(2)外源外源DNADNA插入后不影响载体在

18、受体细胞中进行自我复插入后不影响载体在受体细胞中进行自我复制,载体对受体细胞无害,能接纳尽可能长的外源制,载体对受体细胞无害,能接纳尽可能长的外源DNADNA片段;片段;(3)(3)具有利于选择的标记基因,可以很方便地知道外源具有利于选择的标记基因,可以很方便地知道外源DNADNA已经插入,以及把接受了载体的受体细胞选出;已经插入,以及把接受了载体的受体细胞选出;(4)(4)具有促进外源具有促进外源DNADNA表达的调控区。表达的调控区。55载体分类载体分类按生物属性分:非病毒类和病毒类按生物属性分:非病毒类和病毒类按功能分:克隆载体和表达载体按功能分:克隆载体和表达载体按进入细胞类型分:原核

19、载体、真核载体和按进入细胞类型分:原核载体、真核载体和 穿梭载体(穿梭载体(shuttle vectorshuttle vector)56各种基于本地机和各种基于本地机和WebWeb在线设计的载体作图软件在线设计的载体作图软件都比较多。都比较多。基于基于PCPC本地机的软件本地机的软件:pDRAW32,pDRAW32,WinplasWinplas,Sim VectorSim Vector等。等。 基于基于Web Web 在线设计的软件在线设计的软件:SavvySavvy(Scalable Vector Scalable Vector Graphics Plasmid MapGraphics P

20、lasmid Map)/savvy/57585960本地机安装软件本地机安装软件Winplas2.7Winplas2.7本程序无须安装,直接打开使用。本程序无须安装,直接打开使用。载体元件分三类:载体元件分三类:ARCARC、 MarkerMarker、 TextText61七、引物设计七、引物设计在基因克隆、核酸分子杂交、在基因克隆、核酸分子杂交、DNADNA序列测定和序列测定和PCRPCR等等实验中,都需要使用寡核苷酸作为探针或引物。而实验中,都需要使用寡核苷酸作为探针或引物。而实验的成败与探针或引物的设计密切相关。实验的成败与探针或

21、引物的设计密切相关。62一个优化的寡核苷酸引物在设计过程中应考虑的几个基一个优化的寡核苷酸引物在设计过程中应考虑的几个基本问题:本问题:1 1)引物的引物的33末端不互补末端不互补 避免形成引物二聚体避免形成引物二聚体2 2)引物分子内不互补引物分子内不互补 避免形成发夹结构避免形成发夹结构3 3)引物的组分和解链温度引物的组分和解链温度 理想的引物应当有理想的引物应当有5050的的GCGC含量含量,40-60% 40-60% 均能满均能满足足PCRPCR的扩增要求。的扩增要求。635 5)引物内部稳定性引物内部稳定性 在在DNADNA测序和测序和PCRPCR中最好用中最好用55末端稳定(末端稳定(GCGC含量高一含量高一些些) ),而,而3 3 末端不太稳定(末端不太稳定(ATAT含量高一些)的引物。含量高一些)的引物。6 6)引物的特异性引物的特异性 为获得最终单一的为获得最终单一的PCRPCR产物片段,选用的引物序列就产物片段,选用的引物序列就应当是唯一和特异的,即在模板中没有重复序列。应当是唯一和特异的,即在模板中没有重复序列。4 4)引物长度引物长度 产物长度等于或小于产物长度等于或小于500500bp,bp,引物长度可短一些引物长度可短一些16-1816-18bpbp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论