版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、作者:唐丽君,中南大学湘雅医学院:研究所,第11章,真核基因和基因组,第1节,真核基因的结构和功能,第2节,真核基因组的结构和功能,关键困难,1。基因和基因组的概念2。真核基因的基本结构和真核基因组的结构特征。顺式作用元件的类型和特性,1 .人类基因组中重复序列的类型和特征。多基因家族和假基因的概念。线粒体基因结构2。人类基因在染色体上的分布特征,真核基因的结构和功能,第1,1节。真核基因包含编码蛋白质或核糖核酸的编码序列和与之相关的非编码序列。2.真核基因结构最突出的特征是它的不连续性。3.高等真核生物中大多数编码蛋白质的基因都有内含子,除了组蛋白基因。编码rRNA和一些tRNA的基因也有内
2、含子。4.在外显子和内含子的连接处有一个高度保守的序列,即大部分内含子5以GT结尾,大部分内含子3以AG结尾,这是真核基因中RNA剪接的识别信号。5.人们一致认为,一个基因的5个末端被称为上游,3个末端被称为下游。在基因序列中,对应于起始核糖核酸链合成的第一个核苷酸的碱基被标记为1,即-1、-2等。到第五个端点,以及2、3等。到第三端。真核基因的基本结构、真核生物的断裂基因及其侧翼序列、基因结构、基因编码区的DNA碱基序列决定了特定成熟RNA分子的序列。2.有些基因只编码具有特定功能的核糖核酸,如核糖核酸、核糖核酸和其他小核糖核酸分子。大多数基因通过基因进一步编码蛋白质多肽链。3.编码序列中碱
3、基的改变或突变可能使基因失去原有功能或获得新功能。4.一些相同的脱氧核糖核酸序列可以编码不同的蛋白质多肽链,这是由于它们的起始位点的改变或不同的剪接产物。基因编码区编码多肽链和特定的核糖核酸分子,位于基因转录区前后并与之相邻的脱氧核糖核酸序列通常是基因的调节区,也称为侧翼序列。这些调控序列,也称为顺式作用元件,包括启动子、上游调控元件、增强子、绝缘体、尾信号和一些细胞信号反应元件。调控序列参与真核基因表达的调控,真核基因的一般结构和调控序列,启动子提供转录起始信号。启动子是脱氧核糖核酸分子上的一个序列,可以介导核糖核酸聚合酶结合,形成转录起始复合物。大多数真核基因的启动子位于基因转录起点的上游
4、,启动子本身通常不被转录;然而,一些启动子(如编码tRNA基因的启动子)位于转录起始点的下游,并且这些DNA序列可以被转录。真核生物主要有三种类型的启动子。(1)启动子富含GC碱基对:含有启动子的基因主要是编码rRNA的基因。类启动子包括核心启动子和上游启动子元件(UPE)。(2)启动子样结构具有TATA盒的特征性结构:具有启动子样结构的基因主要是能够转录mRNA并编码蛋白质的基因和一些snRNA基因。启动子样通常由TATA盒和上游调控元件组成。一些启动子也可以在TATA盒上游有CAAT盒、气相色谱盒和其他特征序列。(3)启动子样基因包括甲盒、乙盒和丙盒。具有启动子样基因的基因包括核糖核酸分子
5、的编码基因,如5S rRNA、tRNA和U6核糖核酸。增强子增强相邻基因的转录增强子,这些增强子是顺式作用元件,可以增强真核基因启动子的工作效率,并且是真核基因中最重要的调节序列。(1)它可以在相对于启动子的任何方向和任何位置(上游或下游)发挥增强作用。(2)增强子序列距离受调控基因数十个碱基对,距离数千个碱基对。(3)通常几个增强子序列形成一个簇,(4)有时增强子序列也可以位于内含子中。(5)不同的增强子序列与不同的调节蛋白结合。沉默子是一个负调控元件沉默子是一个特定的脱氧核糖核酸序列,可以抑制基因转录。当它与一些反式作用因子结合时,可以抑制基因转录和沉默基因。4.绝缘体阻碍了增强剂的作用。
6、绝缘体是在基因组转录调控中起重要作用的元件,它可以阻碍启动子中增强子的作用或保护基因免受附近染色质环境(如异染色质)的影响。绝缘体阻碍了增强子对启动子的作用,可能是通过影响染色质的三维结构,如脱氧核糖核酸弯曲或形成环状结构。真核生物基因组的结构和功能,第二节,细胞或生物体的一整套单倍体遗传物质的总和称为基因组。病毒、原核生物和真核生物所储存的遗传信息数量有很大差异,它们的基因组在结构和组织上也有各自的特点,包括基因组中基因的组织和排列以及基因的类型、数量和分布。人类基因组包含所有由核染色体DNA(常染色体和性染色体)和线粒体DNA携带的遗传物质。1.真核生物基因组中基因编码序列的比例远远小于非
7、编码序列。2.高等真核生物的基因组包含大量重复序列。3.真核生物基因组中有多个基因家族和假基因。4.大多数基因在转录后经历选择性剪接,80%的选择性剪接会改变蛋白质序列。5.真核基因组DNA与蛋白质结合形成染色体,染色体储存在细胞核中。除了配子细胞,体细胞的基因组是二倍体。1.真核生物基因组有独特的结构。不同生物基因组的比较。*指单倍体细胞中的染色体数目。人类染色体上基因分布的特征基因在染色体上分布不均匀。基因密度最高的是19号染色体,最低的是13号染色体和y染色体。染色体上有一个没有基因的“沙漠区”,即500kb区域没有任何基因的编码序列。人类染色体大小示意图,真核生物基因组中有大量重复序列
8、。在人类基因组中,重复序列占基因组长度的50%以上。重复序列的长度各不相同,从短的两个碱基到长的数百甚至数千个碱基。重复序列的重复频率也不同。1.高度重复的序列;2.适度重复的序列;3.单拷贝序列或(低度重复序列);2.真核生物基因组中存在大量重复序列;1.高度重复序列,是存在于真核生物基因组中的短核苷酸重复序列,可重复106次以上。(1)高度重复序列根据其结构特征可分为两类。反向重复序列:它是由相同序列的两个互补拷贝在相同的脱氧核糖核酸链上反向排列而成。反向重复序列的单位长度约为300bp或略短,其总长度约占人类基因组的5%,其中大部分是分散的,而不是聚集在基因组中。卫星DNA:卫星DNA的
9、重复单位一般由210个碱基组成,排列成串,主要存在于染色体的着丝粒区,约占人类基因组的5%-6%。1。高度重复序列,(2)参与复制水平调节的主要功能。反向重复通常存在于DNA复制起点附近,这是一些蛋白质(包括酶)的结合位点。参与基因表达的调节。高重复序列可以在细胞核内转录成异质的核糖核酸分子,而一些反向重复序列可以形成发夹结构,这有助于稳定参与染色体配对的核糖核酸分子。如果卫星DNA聚集在着丝粒附近,它可能与染色体减数分裂期间的染色体配对有关。中度重复序列中度重复序列是指在真核生物基因组中重复数万次的核苷酸序列,通常占整个单倍体基因组的10%。它们中的一些在基因组的一个区域中排列成一串,而它们
10、中的大部分以单拷贝基因的间隔排列。根据重复序列的长度,中度重复序列可以分为两种类型。(1)短散布重复片段(SINES):平均长度约为300500个碱基,以平均长度约为1000个碱基的单拷贝序列间隔排列。拷贝的数量可以达到几十万份。例如,Alu族、Kpn族和Hinf族属于这类中度重复序列。(2)长的散布的重复片段(LINES):平均长度为3 500bp5 000bp,它们以平均长度为13 000bp的单拷贝序列间隔排列(每个序列可达数万个碱基)。Alu家族的哺乳动物是人类基因组中最丰富的短而分散的片段之一,单倍体人类基因组中平均每6kb重复3050万个Alu序列,分别占人类基因组的3%和6%。每
11、个单位长度都有一个限制性酶切点(AGCT)。在130bp和170bp的Kpn家族中等重复序列中,限制性内切酶Kpn位点分散在仅次于Alu家族的第二大家族重复序列中,拷贝数约为30,004,800个Hinf家族存在于人类基因组中,在重复序列的限制性内切酶Hinf位点有319bp的串联重复。真核生物基因组中的RRNA基因也属于中度重复序列。所有重复单元中的rRNA基因都是相同的,它们通常以簇的形式存在,而不是分散在基因组中。这个区域被称为rDNA区域。人类rRNA基因位于染色体13、14、15、21和22的核仁组织区域,每个核仁组织区域平均包含50个rRNA基因重复单元。5s rRNA基因似乎都位
12、于1号染色体上,每个单倍体基因组大约有10000个。3.单拷贝序列(低重复序列),在单倍体基因组中只出现一次或几次,大多数编码蛋白质的基因都属于这一类。在基因组中,单拷贝序列的两边通常是分散的重复序列。由单拷贝序列编码的蛋白质在很大程度上体现了生物体的各种功能。多基因家族是指由一个祖先基因的重复和变异产生的一组结构相似、功能相关的基因。(1)基因家族聚集在某一条染色体上,它们可以同时发挥合成某些蛋白质的作用。例如,组蛋白基因家族聚集在7号染色体长臂的2至3和6区。(2)基因家族的不同成员聚集在不同的染色体上,编码一组密切相关的蛋白质。例如,人类珠蛋白基因家族分为两个基因簇:珠蛋白和珠蛋白,分别
13、位于16号染色体和11号染色体上。真核生物基因组中存在大量的多基因家族和假基因,以及一些具有相似DNA序列但不一定具有相关功能的单拷贝基因或基因家族群,如免疫球蛋白基因超家族基因ras超家族。一个亚家族在一个多基因家族中可以有多个基因,根据其不同的结构和功能可以分为多个亚家族。例如,在G蛋白中大约有50个成员属于ras超家族,根据它们的序列同源性可以进一步分为三个主要的亚家族:Ras、Rho和Rab。4。与正常基因非常相似但不能表达的DNA序列通常存在于假基因的基因组中。根据来源,假基因可以分为两种类型:加工假基因和未加工假基因。(1)加工假基因:这些基因可能曾经有过功能,但它们在进化中获得了
14、一个或几个突变,导致序列的细微变化,阻碍了正常的转录和翻译功能,因此它们不能再编码核糖核酸和蛋白质产物;加工的假基因通常缺乏正常基因表达所需的调控序列,没有内含子,可能有多聚腺苷酸尾。(2)未加工假基因:基因从多拷贝或单拷贝的突变或不完全复制。人类基因组中大约有20,000个假基因,其中大约2,000个是核糖体蛋白假基因。近年来,已经发现假基因也表达功能性ncRNAs。脱氧核糖核酸(线粒体脱氧核糖核酸(mtDNA)是细胞中重要的细胞器,也是生物氧化的场所。一个细胞可以有数百到数千个线粒体。2.它可以在线粒体中独立编码一些蛋白质,线粒体是核外遗传物质。3.甲基叔丁基醚的结构与原核生物相似,是一种
15、环状分子。人类线粒体基因组总长度为16 569bp,编码37个基因,其中13个基因编码一些构成呼吸链多酶系统的多肽,22个基因编码mt-tRNA,2个基因编码mt-rRNA(16S和12S)。线粒体基因结构人类线粒体基因组通过基因组测序,人们知道了几种生物的基因组大小和基因数量。1.一般来说,随着进化过程中个体复杂性的增加,基因组的总趋势是从小到大,基因的数量也是从小到大。2.决定生物复杂性的因素:基因组大小、基因数量、基因密度等。人类基因组是最大和最复杂的,但它不包含最多的基因。人类基因的数量约为2万个,仅略多于果蝇的1.5倍,大致相当于线虫基因的数量。人类只有300个基因,而老鼠没有。人类基因组的基因密度很低,因为基因组中有许多转座子、内含子和调控序列,它们对进化过程中遗传多样性的产生非常重要。人类基因组中大约有20,000个蛋白质编码基因。1.基因是编码具有特定功能的产品(如蛋白质或核糖核酸)和携带遗传信息的基本单位。除了一些以核糖核酸为基因组的核糖核酸病毒,它们通常指染色体或基因组的脱氧核糖核酸序列。2.基因的基本结构包括蛋白质或核糖核酸的编码序列及其相关的非编码序列。3.基因组是指生物体中所有遗传信息的总和。真核生物基因组具有基因编码序列在基因组中所占比例小于非编码序列的特点,高等真核生物基因组含有大量重复序列,有多个基因家族和假基因,具有选择性剪接,真核生物基因组DN
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川巴中市精神康复医院(巴中市第四人民医院)招聘员额制工作人员3人建设笔试模拟试题及答案解析
- 德阳经济技术开发区第五幼儿园2026年春期面向社会公开招聘“两自一包”非在编幼儿教师建设考试参考题库及答案解析
- 2026海南琼中黎族苗族自治县招聘中学教师25人建设考试参考题库及答案解析
- 2026广东广州市天河区新蕾五星学校招聘2人建设考试参考题库及答案解析
- 2026贵州铜仁江口县中医医院青年就业见习人员岗位招聘3人建设笔试模拟试题及答案解析
- 2026黑龙江佳木斯市汤原县引汤工程纪念馆招聘公益性岗位人员1建设考试备考题库及答案解析
- 2026中国瑞林博士后工作站人才招聘5人建设考试备考题库及答案解析
- 2026河湖南省南华大学附属第二医院招聘非事业编制人员53建设笔试参考题库及答案解析
- 2026年绥化绥棱县事业单位公开招聘工作人员16人建设考试备考试题及答案解析
- 2026重庆卡福汽车制动转向系统有限公司招聘1人建设考试参考试题及答案解析
- 2024年贵州六盘水市公安局合同制留置看护人员招聘笔试参考题库附带答案详解
- 银行资产配置方案
- 免费模式6种核心方式
- 安捷伦GC仪器操作步骤
- GFM阀控密封铅酸蓄电池安装维护手册
- 牙体代型制备与修整(口腔固定修复工艺课件)
- GB/T 6109.20-2008漆包圆绕组线第20部分:200级聚酰胺酰亚胺复合聚酯或聚酯亚胺漆包铜圆线
- GB/T 26523-2022精制硫酸钴
- 美学第六讲日常生活美
- 职业健康检查机构卫生管理自查表(2018年版)
- 通用设备经济寿命参考年限表
评论
0/150
提交评论