基因组学课件基因组_第1页
基因组学课件基因组_第2页
基因组学课件基因组_第3页
基因组学课件基因组_第4页
基因组学课件基因组_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基因组学课件基因组 基因组学课件基因组 基因组学课件基因组 u1990年启动,人类基因组年启动,人类基因组“工作框架图工作框架图”已于已于2000年年6月完成,月完成,2003 年年“人类基因组序列图人类基因组序列图”完成完成 u测出人类约测出人类约 3,000,000,000 碱基对的序列(相当于每页碱基对的序列(相当于每页3,000个字母,个字母, 共需共需100万页印完)万页印完) u由美、日、德、法、英、中六国参加。美国由美、日、德、法、英、中六国参加。美国54,英国,英国33,日本,日本7 ,法国,法国2.8,德国,德国2.2,中国,中国1.0 基因组学课件基因组 Homo sapi

2、ensArabidopsis thalianaThermotoga maritima Escherichia coliBuchnerasp. APS Rickettsia prowazekiiUreaplasma urealyticum Bacillus subtilis Drosophila melanogaster Thermoplasma acidophilum Plasmodium falciparum Helicobacter pylori Mus musculus Caenorhabitis elegans Rattus noivegicus Borrelia burgorferi

3、 Saccharomyces cerevisiae Aquifex aeolicusNeisseria meningitidis Z2491 Mycobacterium tuberculosis 生殖道支原体生殖道支原体枯草芽孢杆菌枯草芽孢杆菌 普氏立克次体普氏立克次体-伤寒伤寒幽门螺杆菌幽门螺杆菌-胃癌胃癌 嗜热菌嗜热菌脑膜炎奈瑟菌脑膜炎奈瑟菌-流脑流脑结核分枝杆菌结核分枝杆菌 疏螺旋体疏螺旋体-眼莱姆病眼莱姆病 热海栖热袍菌热海栖热袍菌 嗜酸热原体嗜酸热原体 恶性疟原虫恶性疟原虫酿酒酵母酿酒酵母 黑腹果蝇黑腹果蝇 大肠杆菌大肠杆菌智人智人拟南芥拟南芥 家鼠家鼠秀丽小杆线虫秀丽小杆线虫 大白

4、鼠大白鼠 基因组学课件基因组 基因组学课件基因组 已经完成基因组测序的部分生物种属已经完成基因组测序的部分生物种属 物种名称物种名称 (species) (species) 基因组大小基因组大小 (genome size) (genome size) 文献文献 (referencereference) 酿酒酵母酿酒酵母SaccharomycescerevisiaeSaccharomycescerevisiae 12,068,000bp 12,068,000bp Science Science 274:546,1996 274:546,1996 大肠杆菌大肠杆菌( (EscherichiaEsc

5、herichia colicoli) ) 4,653,831bp 42834,653,831bp 4283个结构基因个结构基因 ScienceScience277:1453,1997 277:1453,1997 流感嗜血杆菌(流感嗜血杆菌(Haemophilus Haemophilus influenzaeinfluenzae) 1,830,240bp 1,830,240bp ScienceScience269:496,1995 269:496,1995 生殖器支原体(生殖器支原体(Mycoplasma Mycoplasma genitaliumgenitalium) 600,000 bp 6

6、00,000 bp ScienceScience270:397,1995 270:397,1995 幽门螺杆菌(幽门螺杆菌(Helicobacter pyloriHelicobacter pylori) 1,667,867 bp 1,667,867 bp NatureNature388:539,1997 388:539,1997 包柔氏螺旋体包柔氏螺旋体( (病病) ) 901,725bp (901,725bp (染色体染色体)533,000()533,000(质质 粒粒) ) NatureNature390:580,1997 390:580,1997 结核杆菌(结核杆菌(Mycobacter

7、iumMycobacterium tuberculosistuberculosis) 4,410,000 bp 4,410,000 bp Welcome TrustWelcome Trust资助英、法科学家于资助英、法科学家于 SangerSanger中心完成中心完成,1997, 12,1997, 12宣布宣布 梅毒螺旋体梅毒螺旋体( (treponema palliadccmtreponema palliadccm) ) 1,138,000 bp 1,138,000 bp ScienceScience281,375,1998 281,375,1998 线虫(线虫(Caenorhabditii

8、s elegansCaenorhabditiis elegans) 97Mb,19,00097Mb,19,000基因基因 ScienceScience 282:2012,1998 282:2012,1998 人人 3 310109 9 bp bp ScienceScience291,1304,2001 291,1304,2001 拟南芥(拟南芥(Arabidopsis thalianaArabidopsis thaliana) 120Mb 120Mb NatureNature408:796,2000 408:796,2000 果蝇(果蝇(Drosohila melanogasterDrosoh

9、ila melanogaster) 180 Mb 180 Mb ScienceScience287,2185,2000 287,2185,2000 基因组学课件基因组 种群物种 基因组尺寸 (百万对) 基因数 序列测定 完成时间 原核生物支原体 Mycoplasma0.584701995 大肠杆菌 E. coli k124.64,3001997 绿脓杆菌Pseudomonas aeruginosa6.3 5,5002001 真核生物 (单细胞) 酿酒酵母 S. cerevisiae126,2001996 裂变酵母 S. pombi144,9002001 幽门螺杆菌Helicobacter py

10、lori1.71,5002001 多细胞线虫 C. elegans10018,4001998 果蝇 Drosophila14013,6002000 脊椎动物红鳍东方鲀 Fugu rubripes40030,000? 人类3,00040,000?2003 小鼠3,30040,000?2002 植物拟南芥 Arabidopsis12525,0002000 水稻56030,000?2005 玉米5,00030,000? 小麦17,00030,000? 基因组学课件基因组 viruses plasmids bacteria fungi plants algae insects mollusks rep

11、tiles birds mammals Genome sizes in nucleotide pairs (base-pairs) 10410810510610710111010109 The size of the human genome is 3 X 109 bp; almost all of its complexity is in single-copy DNA. The human genome is thought to contain 25,000 to 40,000 genes. bony fish amphibians 基因组学课件基因组 生物体基因组比较生物体基因组比较

12、基因组学课件基因组 基因组学课件基因组 基因组学课件基因组 寄生于细菌内的病毒 如:大肠杆菌噬菌体(coliphages) 遗传物质:单链/双链、环状/线状、DNA/RNA 基因组学课件基因组 不具有细胞形态结构,仅由核酸和蛋白质构成 如:人艾滋病毒HIV、SARS冠状病毒 体积小,10300nm 严格的专性细胞内寄生 对抗生素不敏感 电子显微镜下的SARS冠状病毒 100nm 基因组学课件基因组 人类研究得最为详尽的模式生物 如:K12菌株,全基因组于1997年测定,长460万bp 长度1.6 m,单细胞原核生物,繁殖快 大肠杆菌及其全基因组大肠杆菌及其全基因组 Escherichia co

13、li O157:H7 Escherichia coli K12 基因组学课件基因组 真菌界的单细胞真核生物 有16条染色体 全基因组于1996年测定 基因组学课件基因组 一种透明的、生活在海滩泥沙中的小虫 细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元 有6条染色体,全基因组长9.7Mb 1998年测定 基因组学课件基因组 繁殖快,容易诱发变异 全基因组长约1.8亿bp 2000年 基因组学课件基因组 十字花科草本,生活周期为6周,是理想的模式植物 2000年完成基因组测序;“2010年计划”完成全部功能基因鉴定 第一个经完全测序的开花植物 基因组学课件基因组 基因组比较紧致,

14、为小麦的1/37,是禾本科植物的首选测序对象 12条染色体 2002完成框架图;2005年完成序列全图 参与国际水稻参与国际水稻基因组基因组计划的中、美、日、法等国科学家合影计划的中、美、日、法等国科学家合影 基因组学课件基因组 1个受精卵在24小时内分裂到各种器官初具雏形的程度 基因组学课件基因组 身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象 基因组学课件基因组 基因组大小与人类相近,约30亿个核苷酸对,有19条染色体 2002年 基因组学课件基因组 第第1章章 什么是基因组什么是基因组 所有生命都具有指令其生长与发育,维持 其结构与功能所必需的遗传信息,生物所 具有的

15、携带遗传信息的遗传物质总和称为 基因组(genome) 基因组(genome)一词出现于80年前,基基 因组学因组学(genomics) 则是由美国科学家 Thomas Roderick在1986年提出的,是指对 所有基因进行基因组作图 (包括遗传图谱、 物理图谱、转录本图谱) ,核苷酸序列分 析,基因定位和基因功能分析的一门科学 基因组学课件基因组 +结构基因组学(structural genomics) 结构基因组学主要以构建生物的遗传图谱、物 理图谱和转录本图谱及全序列测序为主要目标 +功能基因组学 (functional genomics) 功能基因组学包括生化功能、细胞功能、发育 功

16、能和适应功能等的研究 +比较基因组学(comparative genomics) 基于基因组图谱和测序基础上,对已知的基因 和基因组结构进行比较,来了解基因的功能、 表达机理和物种进化的学科 基因组学课件基因组 1.1 遗传的分子基础遗传的分子基础 DNA RNA 蛋白质蛋白质 基因组学课件基因组 遗传信息流的方向 基因组学课件基因组 1.1.1 DNA的化学与生物学的化学与生物学 组成 一级结构 二级结构 构象 拓扑结构:正超螺旋,负超螺旋 基因组学课件基因组 +核苷酸与多聚核苷酸 2 脱氧核糖 含氮碱基:-N-糖基键(嘧啶1位氮,嘌呤9位氮) 磷酸集团:单,双,三磷酸 Nucleoside

17、Nucleotide +碱基配对 A-T G-C 基因组学课件基因组 +RNA和DNA的核糖脱氧核戊糖其差异 在于第二个碳 原子上的基团,前者是羟基羟基,后者是氢原子氢原子 基因组学课件基因组 腺苷腺苷(AR) 脱氧胞苷脱氧胞苷(dCR) 1,N9-糖苷键糖苷键 1,N1-糖苷键糖苷键 1 1 N9 N1 C2 C4 基因组学课件基因组 A-T,G-C配对可形成很好的线性氢键 A-T对和G-C对的几何形状一样,使双 链距离相近,使双螺旋保持均一 碱基对处在同一平面内。不论核苷酸 的顺序如何,都不影响双螺旋的结构 为DNA半保留复制奠定了基础 基因组学课件基因组 DNA分子的 一级结构 基因组学

18、课件基因组 +作用于双螺旋结构的力 氢键碱基对GC间形成3个氢键, AT对形成2个氢键 疏水作用(碱基堆积)同一条链碱 基之间碱基平面电子形成强烈疏 水作用 van der Vaals力碱基平面之间距离 0.34nm符合范德化作用力半径范围 (0.17nm) 静电斥力(磷酸基)双链磷酸基斥 力使得两条链分开,Na离子中和 磷酸基(屏蔽作用),增加疏水作用; 碱基内能碱基分子内能增加(温度 等)影响碱基定向排列 +结构 大沟(major groove) 小沟(minor groove) 基因组学课件基因组 碱基配对及氢键形成碱基配对及氢键形成 基因组学课件基因组 螺旋桨效应 p螺旋桨扭转螺旋桨扭

19、转就是一个碱基对中的两个碱基并不处于同一平面中,而是两 个碱基平面相对碱基的长轴各自向着相反的方向扭转 p如果沿着碱基对的长轴看去,靠近的一个碱基总是顺时针方向扭转。这 样,螺旋桨扭角也总是定义为正值A-DNA为15,B-DNA为 12,个 别情况下可以低至3,高至25。 基因组学课件基因组 +DNA的构象现已知有A,B,C,D,E,T,Z 7种 +引起DNA双链构象改变的因素: 核苷酸顺序 碱基组成 盐的种类 相对湿度 Z-DNA B-DNA 基因组学课件基因组 基因组学课件基因组 +1972年 Pohl发现 poly(dG-dC)在高盐下旋 光性发生改变 +1979年 Wang A.H-J

20、(王惠君),A.Rich对 d(CGCGCG)单晶作X衍射分析提出 ZDNA模型 基因组学课件基因组 +糖磷骨架呈“之”字 形(Zigzag)走向 +左旋 +G糖苷键呈顺式,使G 残基位于分子表面 +分子外形呈波形 +大沟消失,小沟窄而 深 +每个螺旋有12bp 基因组学课件基因组 +可能提供某些调节蛋白的识别可能提供某些调节蛋白的识别 啮齿类动物病毒的复制起始部位有啮齿类动物病毒的复制起始部位有d d(GCGC)有交替顺序)有交替顺序 的存在的存在 +增强子增强子 在在SV40SV40增强子中有三段增强子中有三段8bp8bp的的Z-DNAZ-DNA存在存在 +转录相关:转录相关: 原生动物纤

21、毛虫,它有大、小两个核,大核有转录活原生动物纤毛虫,它有大、小两个核,大核有转录活 性,小核和繁殖有关。性,小核和繁殖有关。Z-DNAZ-DNA抗体以萤光标记后,显示抗体以萤光标记后,显示 仅和大核仅和大核DNADNA结合,而不和小核的结合,而不和小核的DNADNA结合,说明大核结合,说明大核 DNADNA有有Z-DNAZ-DNA的存在,可能和转录有关。的存在,可能和转录有关。 基因组学课件基因组 基因组学课件基因组 +所谓所谓DNA的三级结构,是指在一二结构基础的三级结构,是指在一二结构基础 上的多聚核苷酸链上的卷曲。在一定意义上,上的多聚核苷酸链上的卷曲。在一定意义上, 是指双螺旋基础上的

22、卷曲是指双螺旋基础上的卷曲 +三级结构包括链的扭结和超螺旋或者是单链三级结构包括链的扭结和超螺旋或者是单链 形成的环或是环状形成的环或是环状DNA中的连环体中的连环体 基因组学课件基因组 基因组学课件基因组 +松驰型松驰型DNA (relax form)。 +超螺旋超螺旋(Supercoiled) DNA, 负超螺旋负超螺旋 正超螺旋正超螺旋 + 检测检测DNA三级结构的方法:三级结构的方法: 密度梯度离心 凝胶电泳 电镜观察 基因组学课件基因组 SV40小染色体的拓扑 学结构 基因组学课件基因组 原核生物原核生物DNADNA的三的三 级结构:级结构: +绝大多数原核生绝大多数原核生 物的物的

23、DNADNA都是共都是共 价封闭的环状双价封闭的环状双 螺旋螺旋 +如果进一步盘绕如果进一步盘绕 则形成麻花状的则形成麻花状的 超螺旋三级结构超螺旋三级结构 基因组学课件基因组 +White方程: L=T+W +L(Linking number):链环数链环数或称拓扑环拓扑环 绕数绕数,指cccDNA中一条链绕另一条链的总 次数。其特点是 L是整数 在 cccDNA中任何拓扑学状态中其值保持不变 右手螺旋对L取正值 基因组学课件基因组 +W(Writhing number):扭曲数,即超数旋数 +其特点是: 可以是非整数 是变量 右手螺旋时,W取负值 基因组学课件基因组 +T(Twisting

24、 number):缠绕数缠绕数,即双螺旋的 圈数 +其特点是 可以是非整数 是变量 右手螺旋时T为正值 +超螺旋的量度可以用超螺旋密度超螺旋的量度可以用超螺旋密度来表示:来表示: =(L-TL-T)/T/T 在天然在天然DNADNA中,中,约为约为-0.05-0.05 基因组学课件基因组 基因组学课件基因组 +DNA分子的结构单元分别是三碱基体和分子的结构单元分别是三碱基体和四四 碱基体碱基体 +碱基体通过碱基体通过Watson-Crick氢键配对和氢键配对和Hoogsteen 氢键配对相互作用而结合成共平面聚合体:氢键配对相互作用而结合成共平面聚合体: Watson-Crick Hoogst

25、een Watson-Crickreversed Hoogsteen Reversed Watson-Crick Hoogsteen Reversed Watson-Crick reversed Hoogsteen 基因组学课件基因组 +1987年Mirkin等在一种质 粒的酸性溶液中首次发现 +多聚嘧啶和多聚嘌呤组成 的DNA螺旋区段,其序列 中有较长的镜像重复时, 形成局部三股配对,并互 相盘绕的三股螺旋 +两股的碱基按Watson-Crick 方式配对,第三股多聚嘧 啶(镜像重复)通过TAT和 CGC+配对,而处于双螺旋 的大沟中 基因组学课件基因组 +基本结构:基本结构: Py-Pu-

26、Py构象构象(如如T-A.T, C-G.C+) Pu-Pu-Py构象构象(如如A.A-T, G.G-C) 基因组学课件基因组 链链间是Watson-Crick碱基对区 链链间是Hoogsteen碱基对区 基因组学课件基因组 基因组学课件基因组 基因组学课件基因组 鸟嘌呤四聚体 u重复的非编码DNA序列(TTAGGG)n存在于所有的人类染色体端粒中。这些重 复序列形成了可能具有重要生物学功能的多种分子间或分子内非B-DNA构象,其 中最常见的构象之一便是四螺旋DNA结构 u平行四螺旋结构表现为螺旋桨构象;反平行四螺旋结构则有椅式和筐式两种构象 u端粒DNA序列都由4个碱基G组成的平面G4碱基子形

27、成折叠方式不同的分子内四 螺旋结构 (a)(a)G-G-四聚体四聚体; (b) ; (b) 平行四链平行四链; ; (c) (c),(d) (d) 发夹二聚体形成的反式四链发夹二聚体形成的反式四链; (e) ; (e) 分子内反式四链分子内反式四链 基因组学课件基因组 +种类: 核糖体RNA(ribosomal RNA, rRNA) 转运RNA (transfer RNA, tRNA) 信使RNA (messenger RNA, mRNA) 小分子细胞质RNA(small cytoplasmic RNA, scRNA) 小分子细胞核RNA (small nuclear RNA, snRNA):

28、真 核生物 +分布: rRNA和tRNA:约80% mRNA:约占5% scRNA和snRNA :约15% 基因组学课件基因组 RNA分子的组成 基因组学课件基因组 RNA分子的不稳定 基因组学课件基因组 单链RNA的分子内碱基配对 可形成不同构型的高级结构 基因组学课件基因组 1.1.3 蛋白质的结构蛋白质的结构 一级结构(Primary structure) 二级结构(Second structure) 三级结构(Tertiary Structure) 四级结构(Quaternary structure) 基因组学课件基因组 蛋白质的二级结构:-螺旋(- helix),-折叠(-sheet

29、) 基因组学课件基因组 蛋白质基序 (motif) 由2个或3个二级结构如-螺旋,-折 叠和转环构成的组合,它们有特征性的 序列,具有特定的功能,称为基序基序 (motif) 锌指结构(zinc finger) 螺旋-环-螺旋(helix-loop-helix) 基因组学课件基因组 2种常见的蛋白质基序 基因组学课件基因组 蛋白质模块蛋白质模块 蛋白质的三级结构中有一些在结构上和功能 上相对独立的组成区域,如球形或纤维状结构, 称为域(domain),它们介于二级结构与三级 结构之间 具有催化活性的激酶区可称为激酶域 (kinase domain) 具有结合活性的区域如DNA结合域(DNA-

30、binding domain)和RNA结合域,膜结合域 (membrane-binding domain)等 基因组学课件基因组 +原核 (prokayote) 生物基因组: 真细菌(eubacteriun) 古细菌 (archaebacterium) + 真核生物 (eukaryote) 核基因组 细胞器 线粒体基因组 叶绿体基因组 基因组学课件基因组 1.2.1 C值与值与C 值悖理值悖理 C值是指一个单倍体基因组中DNA的总量 C 值悖理(矛盾)(C-value paradox): 在结构、功能很相似的同一类生物中,甚 至在亲缘关系十分接近的物种之间,它们 的C值可以相差数10倍乃至上百

31、倍 两栖动物的C值在1-100pg 基因组学课件基因组 不同进化地位的生物C值的分布范围 基因组学课件基因组 1.2.2 顺序复杂性顺序复杂性 单一顺序:基因组中单拷贝的DNA顺序 重复顺序:多拷贝的DNA顺序 不同顺序的DNA总长称为复杂性 (complexity),复杂性代表了一个物种 基因组的基本特征 基因组学课件基因组 DNA复性动力学复性动力学 DNA的复性依赖于两条互补单链之间的随机碰撞, 反应速率遵循二级动力学,可表述为:dC/dt=- kC2,C代表t时刻单链DNA的浓度,k为反应常数 通常以Cot1/2=1/k表示特定DNA的顺序复杂性, 这里Co代表DNA的起始浓度,t表示

32、保温时间, Cot1/2为起始浓度DNA在保温t时间后有半数DNA 完全复性的数值 Cot1/2值越大,说明复性速率越慢 Cot1/2值与基因组DNA的复杂性成正比 基因组学课件基因组 +Cot曲线(Cot curve):复性组分与Cot对数作 图 +真核生物基因组DNA组分为非均一性,可分 为三种类型: 快速复性组分(fast component) 居间复性组分 (intermediate component) 缓慢复性组分 (slow component) +以大肠杆菌含4.2106bp单一顺序为标准 基因组学课件基因组 DNA复性动力学 复性动力学 基因组学课件基因组 +高度重复顺序:

33、重复单位长度在数个碱基对至数千碱基对之间, 拷贝数的变化可从几百个至上百万个 +高等真核生物高度重复顺序DNA有如下一些 特点 它们都是由极其相似的重复拷贝首尾相连串接 排列 在介质氯化铯中作密度梯度离心时,可形成特 异的卫星带,故又称卫星DNA 集中分布在染色体的特定区段 基因组学课件基因组 +中度重复顺序分散在整个基因组中 +哺乳类基因组有两大类中度重复顺序: 短序列分散核因子(short interspersed nuclear element, SINE) 长度在500 bp以下,拷贝数可达10万以上 长序列分散核因子(long interspersed nuclear element

34、, LINE) 长度在1000 bp以上,拷贝数1万左右 基因组学课件基因组 +基因主要位于单一顺序 +DNA驱动(DNA-driven)杂交 将少量的mRNA或cDNA(complementary DNA)经 放射性同位素标记后与过量的基因组DNA混合,可 获得复性动力学曲线 将此与基因组DNA的复性曲线比较,可鉴别与 mRNA 或cDNA杂交的基因组DNA组分 结果证实,80%的mRNA只与基因组DNA中的单一 顺序复性,其余的部分为中度重复顺序 mRNA代表了基因组中编码蛋白质的顺序,说明基 因主要分布在单一顺序 基因组学课件基因组 +组成基因的DNA成分包括 编码初级转录物的全部顺序

35、为正确启动转录及进行转录物加工所必需的最 低要求的DNA顺序 调节转录速率所必需的DNA顺序. + 根据表达的终极产物,可将基因分为两大 类 编码RNA的基因 编码蛋白质的基因。 基因组学课件基因组 +rRNA基因 真核生物:18S、5.8S、28S和5S 原核生物:16S、23S和5S +tRNA基因 +scRNA基因(小分子细胞质RNA) 7SL RNA(细胞质信号识别颗粒骨架)、7SK RNA和 5S RNA +snRNA基因(小分子细胞核RNA) 与蛋白质结合形成核酸核蛋白(snRNP) +snoRNA基因 (小分子核仁RNA) 修饰rRNA:甲基化和转变为假尿嘧啶 基因组学课件基因组 基因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论