版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 基因组序列诠释问 题v基因组序列所包含的全部遗传信息是什么?v基因组作为一个整体如何行使其功能?v用什么方法寻找基因,研究基因地功能呢?1. 寻找基因1.1 根据开放读框预测基因 起始密码子 ATGv第一个ATG的确定(依据Kozak规则); Kozak规则是基于已知数据的统计结果. 所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律.Kozak规则: 若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:(1)第4位的偏好碱基为G;(2)ATG的5端约15bp范围的侧翼序列内不含碱基T;(3)在-3,-6和-9位置,G是偏好碱基;(4)
2、除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基。 信号肽分析软件(SignalP http:/www.cbs.dtu.dk/services/signalP ) 把预测过程中证实含完整mRNA 5端的序列翻译为蛋白序列; 然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽; 信号肽分析 终止密码子 终止密码子: TAA,TAG,TGA GC% = 50% 终止密码子每 64 bp出现一次; GC% 50% 终止密码子每100200 bp 出现一次; 由于多数基因 ORF 均多于50个
3、密码子,因此最可能的选择应该是 ORF 不少于100 个密码子。 3端的确认 3端的确认主要根据Poly(A)尾序列,若测试DNA片段不含Poly(A)序列,则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断。 非编码序列、内含子高等真核生物ORF阅读的复杂性:基因间存在大量的非编码序列(人类基因组中是70%)绝大多数基因含有非编码的内含子。 高等真核生物多数外显子长度少于100 个密码子,有的不到50个密码子甚至更少;不能根据ORF长度判断读框的准确性。u编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。u不同种属间使用同义密码的频率有很大差异: 如
4、人类基因中, 丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少 苏氨酸(Thr)密码子多为ACA,ACC或ACT,而ACG很少 密码子偏爱性 密码子偏爱性 高等植物207个基因u单子叶植物53个,6个单子叶种群,18种氨基酸有16种氨基酸的密码子摇摆碱基为G+Cu双子叶植物154个,35个双子叶种群,只有7种氨基酸的摇摆碱基是G+C,其余均为A+Tu密码子偏倚 codon bias,原因不明。 外显子内含子边界外显子内含子边界外显子和内含子的边界有一些明显的特征:p如:内含子的5端或称供体位(donor site)常见的顺序为 5AGGTAAGT-3;p3端又称受体位(accep
5、tor site), 多为5PyPyPyPyPyPyCAG-3(“Py”嘧啶核苷酸,T或C);p但是由于边界序列常有例外,仅适用于一定范围。上游控制序列 几乎所有基因(或操纵子)上游都有调控序列,它们可与DNA结合蛋白作用,控制基因表达。 通过同源性比较来预测mRNA的5端,最常用的与转录起始位点相关的数据库是真核启动子数据库(The TRADAT Project , Eukaryotic Promoter Database, EPD. http:/www.epd.unil.ch/ )。 另外个别生物基因组的特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛。 内含子和外显子
6、序列差异内含子受选择压力小,突变多。由于碱基C 到A,内含子A/T比例高内含子A/T比例高,所以终止密码子出现的频率高。 软件预测 采用NCBI的ORF预测软件 ( ORF finder: /gorf/orfig.cgi )判断ORF的可能范围。基因注释软件基因注释软件vGenscan 重于信号指令:起始密码、终止密重于信号指令:起始密码、终止密码、剪接受体位和供体位序列等码、剪接受体位和供体位序列等vFgeneSH 重于内容指令:密码子使用偏好、重于内容指令:密码子使用偏好、内含子外显子的差异等内含子外显子的差异等vTWINSCAN和和SG
7、P2根据相似性和一致性根据相似性和一致性基因注释软件缺点基因注释软件缺点v外显子注释的准确率外显子注释的准确率 25%v同源性:homology起源于同一祖先但序列已经发生变异的序列,分布在不同物种间的同源基因,只有是与非的区别。v一致性:identity同源DNA序列的同一碱基位置上相同的碱基成员,或者蛋白质中同一氨基酸位置相同的氨基酸成员的比例,用%表示。v相似性:similarity 同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。比较比较氨基酸和基因的同源性?氨基酸和基因的同源性?分子杂交分子杂交可确定可确定DNA片段是否含有表达顺序片段是否含有表达顺序Northern
8、blot:指将待测指将待测DNA样品标记后与样品标记后与RNA杂交,以判断杂交,以判断RNA中是否含有中是否含有DNA的转录的转录产物。但在操作中存在一些问题产物。但在操作中存在一些问题1.3 试验确认基因试验确认基因1977年年J.C.Alwin首创首创Northern blotting 问题问题解决方案解决方案A 某一基因的转录产物进行某一基因的转录产物进行可可变剪接变剪接或该基因为某一或该基因为某一多基多基因家族因家族的成员时,会出现多的成员时,会出现多个杂交带个杂交带设计其他实验区分设计其他实验区分心肌特异性蛋白问题问题解决方案解决方案B 基因的表达具有组织特异性基因的表达具有组织特异
9、性及发育阶段的差别,而选择及发育阶段的差别,而选择的的RNA样品中不一定含有该样品中不一定含有该基因产物基因产物尽可能多地收集各种不尽可能多地收集各种不同发育时期及不同组织同发育时期及不同组织器官的器官的RNA问题问题解决方案解决方案C 某些基因产物丰度极低或某些基因产物丰度极低或不易提取不易提取适当适当提高提高RNA上样量上样量,或先以已知的或先以已知的DNA序列序列设计引物设计引物从从mRNA中中扩扩增增基因产物基因产物C 基因表达产物丰度的问题拟拟Northern 杂交杂交 根据已知的DNA顺序设计引物,从mRNA群体中扩增基因产物,再以DNA为探针与之杂交。动物园杂交动物园杂交 根据亲
10、缘关系相似的物种,其基因的编码区相似性较高,而非编码区的同源性很低的原理。vDNA顺序中基因位置的确定顺序中基因位置的确定 cDNA测序受两个方面的影响:测序受两个方面的影响:一是相关一是相关cDNA在在cDNA文库中出现的频率;文库中出现的频率;二是二是cDNA的完整性的完整性如何获取基因全长如何获取基因全长cDNAcDNA序列?序列?A cDNA A cDNA 文库构建文库构建B RACE B RACE 技术技术干扰cDNA筛选基因的因素:v目标cDNA所占比例很低分成亚群进行筛选cDNA均一化 v影响cDNA测序的因素与mRNA的反转录有关cDNA文库构建(CLONTECH)cDNA文库
11、构建(CLONTECH)5RACE(CLONTECH)3RACE(CLONTECH)确定DNA顺序中基因的位置A 通过对全长cDNA序列的测序、对比,以及与基因组DNA的比较,确定基因所在的区域;B 通过物种已建立遗传图和物理图来确定基因的位置;利用计算机分析基因功能利用计算机分析基因功能2、基因功能的预测、基因功能的预测2.1 2.1 同源性确定基因功能同源性确定基因功能2.2 2.2 同源性分析在酵母基因组计划中的应用同源性分析在酵母基因组计划中的应用2.1 2.1 同源性确定基因功能同源性确定基因功能 种间同源种间同源基因或基因或直系基因直系基因(orthologous gene):):
12、指不同物种之间的同源基因,它们来自物种分化指不同物种之间的同源基因,它们来自物种分化以前的共同祖先以前的共同祖先 种内同源种内同源基因或基因或平行平行基因(基因(paralogous gene) 同同一物种内的同源基因,它们常常是多基因家族的一物种内的同源基因,它们常常是多基因家族的不同成员不同成员同源基因一般不会有同源基因一般不会有完全一致完全一致的核苷酸序列,因为不同的的核苷酸序列,因为不同的基因或不同的生物都会独立地发生随机突变,但它们有相似的基因或不同的生物都会独立地发生随机突变,但它们有相似的序列,大部分未突变的核苷酸序列,大部分未突变的核苷酸位置位置是是相同相同的的 同源性分析可以
13、给出整个基因或其中某一区段功能的有关同源性分析可以给出整个基因或其中某一区段功能的有关信息信息2.2 2.2 同源性分析在酵母基因组计划中的应用同源性分析在酵母基因组计划中的应用v酵母基因组大约含有酵母基因组大约含有6000个基因个基因v30是通过传统遗传学分析得到的是通过传统遗传学分析得到的v另外另外70是用同源性分析获得是用同源性分析获得3.1 3.1 基因基因失活失活在基因功能分析的作用在基因功能分析的作用3.2 3.2 基因的基因的超表达超表达用于功能检测用于功能检测3、实验确认基因功能、实验确认基因功能3.1.1 基因剔除(knock-out) 最简便的基因失活的方法. 主要原理:
14、在一段无关DNA 片段的两侧连接与代换基因两两侧侧相同的顺序,将这一构建导入目的细胞,由于同同源片段之间的重组源片段之间的重组,可使无关片段取代靶基因无关片段取代靶基因,整合到染色体中。为了便于筛选,用于取代的外源DNA中含有报告基因含有报告基因。3.1 基因失活在基因功能分析的作用基因失活在基因功能分析的作用tk 胸苷激酶标记基因 gangcyclovirneor 新霉素抗性基因G4183.1.2反义反义RNA 反义RNA是由基因的负链编码,可与正义RNA (sense RNA)或DNA 编码顺序结合,干扰mRNA 的转录,加工和转运,调控基因的表达。v构建反义RNA 表达载体: 将全目的基
15、因或部分目的基因反向插入表达载体 转化目标生物 获得转基因个体或品系 分析转基因植株在生理、生化、形态等方面的变异 判别目的基因的功能p3301-HbF(11030bp)300bpHbF35S proNco ISpe I Bst EIIp3301-HbR(11030bp)300bpHbR35S proNco IBst EII正义表达载体反义表达载体v反义反义RNA 作用机理:作用机理: A 干扰翻译的起始与延伸干扰翻译的起始与延伸,可与翻译起始顺序及,可与翻译起始顺序及编码序列结合形成双链编码序列结合形成双链RNA,随之被细胞降解。,随之被细胞降解。 B 与与mRNA 的引导顺序结合,阻止核糖
16、体的附的引导顺序结合,阻止核糖体的附着,使着,使翻译无法启动翻译无法启动。 C 反义反义RNA与与mRNA形成双链分子后,使形成双链分子后,使RNA多聚酶脱离模板,多聚酶脱离模板,转录终止转录终止。3.1.3 RNA干涉 RNAi是通过是通过双链双链RNA的介导的介导,特异性地降特异性地降解相应序列的解相应序列的mRNA,从而阻断相应基因表达从而阻断相应基因表达的的转录后水平的基因沉默机制转录后水平的基因沉默机制.RNAi 作用机理A dsRNA核酸内切酶核酸内切酶Dicer被激活,它把被激活,它把dsRNA加工加工成成2125 个核苷酸长的个核苷酸长的RNA链;链;B 这些小片段这些小片段R
17、NA(siRNA)作为另一个核糖核酸复合作为另一个核糖核酸复合体体RISC(RNA-induce silencing complex,RNA诱诱导沉默复合体导沉默复合体)的指引物,结合到的指引物,结合到RISC上,使之识上,使之识别并降解别并降解mRNA,从而导致与双链,从而导致与双链RNA同源的基因同源的基因沉默;沉默;vRNAi设计方法及应用设计方法及应用A Fraser 合成合成与开放读码框相对应的双链与开放读码框相对应的双链RNA或利用或利用细菌克隆表达细菌克隆表达这些双链这些双链RNA微量注微量注射和喂食射和喂食干扰同源基因的表达干扰同源基因的表达B Chuang B Chuang
18、等设计出嵌合体结构等设计出嵌合体结构 连接强启动连接强启动子大量表达双链子大量表达双链mRNAmRNA干扰同源基因的表达干扰同源基因的表达HbF基因的基因的RNAi载体构建载体构建RNAi技术的优缺点vRNAi最根本的特点是特异性最根本的特点是特异性vRNAi具有特殊的具有特殊的穿越能力穿越能力,而且干扰作用会,而且干扰作用会传给传给后代后代;vRNAi对一些低水平表达的基因的对一些低水平表达的基因的RNAi现象并不明现象并不明显,而且几个有相同或相似序列的基因,显,而且几个有相同或相似序列的基因,RNAi也也会同时作用与它们。会同时作用与它们。3.2 基因超表达基因超表达v增加基因的增加基因
19、的拷贝数拷贝数v采用采用强启动子强启动子促使基因促使基因超表达超表达构建转座子突变库构建转座子突变库酵母双杂交(酵母双杂交(yeast two-hybridization)3.3 其他方法其他方法3.3.1 转座子插入突变转座子插入突变 上世纪三十年代,上世纪三十年代,玉米遗传学家玉米遗传学家 Barbara McClintock在研究中在研究中发现了发现了玉米籽粒色斑玉米籽粒色斑不稳定遗传的现象,不稳定遗传的现象,可能是一种可转移的可能是一种可转移的遗传因子。遗传因子。1944:美国国家科:美国国家科学院院士学院院士1945:美国遗传学:美国遗传学会主席会主席1983:Nobel Prize
20、 ,35年后将年后将转位因转位因子的重大发现归功子的重大发现归功于她于她McClintock(1902-1992) Ac和和Ds这两个因子都位于玉米的第九号染色体短臂,这两个因子都位于玉米的第九号染色体短臂,在在色素基因色素基因C的附近。的附近。Ac因子因子全长全长4.5kb,有,有5个外显子,其产物是个外显子,其产物是转座酶转座酶。Ac因子两端是长因子两端是长11bp的反向重复序列的反向重复序列(IR); Ds因子因子长长0.4-4kb,它的中间,它的中间(在在转座酶基因中转座酶基因中)有许多有许多种长度不等的缺失种长度不等的缺失, Ds的两端也都有的两端也都有11bp的反向重复序列。的反向
21、重复序列。 Ac-Ds转座元件结构示意图。右边示Ac及Ds元件的单链DNA末端反向重复配对所形成的茎环结构,这种结构可能对转座有意义玉米转座因子对胚乳颜色的影响玉米转座因子对胚乳颜色的影响 35S Ac转座酶 NPTII IAAHAc GUS NPTII IAAHDsE IAAHDsG GUS NPTII IAAH 吲哚乙酸水解酶,NAM( 萘乙酰胺)敏感35S Ac转座酶 NPTII IAAHAc GUS NPTII IAAHDsE IAAHDsG GUS NPTII 增强子捕获 GUS NPTII E E E 外显子 GUS NPTII 内含子 基因捕获外显子 GUS NPTII 外显子外显子突变体库构建载体策略A、插入突变隐性、插入突变隐性突变体库构建存在问题B、冗余基因的存在、冗余基因的存在3.3.2酵母双杂交(酵母双杂交(yeast two-hybridization)转录激活因子转录激活因子DNA结合结构域结合结构域(BD)(DNA binding domain) 转录激活结构域转录激活结构域(AD)(activation domain) 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品交付周期确保目标实现承诺书3篇范文
- 商务谈判技巧及方案制定指南
- 2026年平面设计兼职与全职的利弊分析与选择
- 某道路改造施工组织设计方案
- 请假扣年终奖协议书
- 网吧布线施工方案(3篇)
- 检查车施工方案(3篇)
- 定制刻字活动方案策划(3篇)
- 皮影公园活动策划方案(3篇)
- 灌溉用水施工方案(3篇)
- 统编版语文四年级下册第二单元 快乐读书吧 《看看我们的地球》导读课课件
- 保洁公司合作协议
- 电子元器件销售培训
- 听评课记录30篇
- 【部编人教版】三年级语文下册分层作业【全册含答案】
- 2024年开学第一课:人工智能与未来教育
- 《老年性骨质疏松症中西医结合诊疗指南》
- 作品自愿登记保证书
- 全国职业院校技能大赛赛项规程(高职)(高职)化工生产技术
- 档案室密集架采购投标方案(技术方案)
- 【乡村振兴背景下农村居家养老服务的问题及对策:H村为例(后附问卷)11000字(论文)】
评论
0/150
提交评论