【毕业学位论文】(Word原稿)TCF7L2 细胞特异性靶基因识别和调控网络研究-博士论文_第1页
【毕业学位论文】(Word原稿)TCF7L2 细胞特异性靶基因识别和调控网络研究-博士论文_第2页
【毕业学位论文】(Word原稿)TCF7L2 细胞特异性靶基因识别和调控网络研究-博士论文_第3页
【毕业学位论文】(Word原稿)TCF7L2 细胞特异性靶基因识别和调控网络研究-博士论文_第4页
【毕业学位论文】(Word原稿)TCF7L2 细胞特异性靶基因识别和调控网络研究-博士论文_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 1 第一章 胞特异性靶基因识别和调控网络研究进展 录调控概述 基因表达领域的中心目标之一是了解哺乳动物机体如何以适当的空间和时间模式调节约 3基因表达过程中的转录因子的功能的知识,可以应用在解决生物学和医学领域的根本问题。要破解这些机制,我们需要了解众多影响转录的过程和开发相应的技术和战略方法解决这些问题。 在真核生物中, 组装成染色质,它通过限制访问 合酶和一些辅助因子保持基因在惰性的状态。染色质 是由 组蛋白 组成 ,形成称为核小体的结构。 组蛋白可在翻译后 被修饰,以减少核小体抑制转录因子结合的能力。 转录调控一个宏观的概念就是顺式调控元件,如启动子 、 增强子 等 。启动子由 常见 序列元件 组成 ,如 , 起始子序列和其他 的 转录 因子的结合位点,这些共同作用来启动转录机制。增强子包含那些离转录起始位点有一定距离的转录因子结合位点。 一般因子结合到核心启动子上的结果转录活性通常很低,但可以通过位点特异性因子结合到启动子近侧区域来增加转录活性,这样可以帮助稳定一般因子与核心启动子间的相互作用。 启动子的活性会被进一步增强通过转录因子结合到远端的增强子区域 , 或可以通过随后招募一 个组蛋白修饰酶从而为转录创建一个更加良好的染色质环境 , 或可招募一个酶能够诱使结合起始复合物开始伸长。转录也可以被调节通过抑制因子结合到远离转录起始位点的抑制序列或沉默子上 ,这样就可以干扰活化子的结合或者招募创建抑制性的染色质结构的组蛋白修饰复合物。 对于人类,据估计有 200转录因子结合到核心启动子上,这被认为是通常转录机制的元件 1,2,3,4。另外,有约 1400 个转录因子具有序列特异性 此通过结合到位点特异性顺式元件来调控一系列的基因 5,6,7。有趣的是位点特异性因子倾向于 在所有组织或是一两个组织中表达,这表明了它具有通常的或特异性的功能 5。一个转录调控子的结构 、 功能,以及基因表达异常的改变都与人类的一系列疾病相关,包括癌症和发育障碍 6。 例如,有 164 个转录因子与 277 个疾病直接相关 7,8。 需要解决的问题是,转录因子在基因组上结合的位点所在,是如何实现结合特异性的,染色质的那种特征影响转录因子与基因组稳定相互作用的能力,以及转录因子是如何结合从而来调控附近的基因。 幸运的是,染色体免疫共沉淀后芯片( 测序( 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 2 及类似技术 如 最新进展,使得科学家们可以创建某种给定细胞类型的特定的蛋白质 互作用的全局图。 究中识别的结合位点相对于基因组的特征进行分类,如最近的基因,或相对于不同的基因结构(如,结合到启动子,增强子,外显子或内含子)的结合频率,以及染色质域点的类型。 对于大多数人类转录因子, 1000可以通过 1 或 2 个通道的测序获得,花费为1000元 9,10,11。 因为需要多个 阵列,以覆盖整个人类基因 组,全面的研究 更加昂贵。然而,对于某些应用(如 详细分析蛋白复合物结合到一小部分的基因组 上 ),有重点的 验目前仍比全基因组分析更具有成本效益。 二三十年前,科学家们使用 体外实验或报道 结构 (定义为基础的转录活性和 区 域 所必需的顺式作用元件, 来控制细胞类型特异性,激素或周围 的转录反应 12,13,14。在大多数情况下,小的启动子片段( 一个 游500 10 用作突变分析的起点。一个常见的观察是,严重 的截断片段可能导致启动子活性的大的变化,但就 增量 删除该片段的 5末端,导致只有轻微的 活性的 变化 ,这就表明 多个转录因子结合位点 是分散在整个 被分析的区域 的。相比之下,其它研究发现,激素调节或细胞类型特异性的启动子的转录不能被体外实验或报道结构来分析 15,16,17。 这一结果提出了两个现在已经被全基因组的结合分析解决的重要问题:即不同的转录因子是否以簇的形式结合在彼此周围,给定转录因子的大多数结合位点是否在启动子区域附件分布。 转录因子可以被分为结合到近端启动子区域和结合到增强子 上两种。然而,在大多数分析中 , 一个单一结合位点,或是 某些情况下一小部分位点被用于研究一个特定的因子 18,19,20。 这些重点分析不允许得出一个因子是否结合在启动子区域的近端或远端的一般结论。 因此,对因子准确的分类少不了在全基因组的结合位点分析。 知道某个因子相应于 结合位置能够有利于了解这个因子是如何调控转录的机制。 例如, 近的转录因子结合位点是通过稳定核心启动子元件处的转录因子来调节转录。 端的转录因子结合位点,位于基因的上游区域或是下游区域,是通过远端复合物和 的复合物蛋白质 制从而调节转录。 因此,全面的分析某个转录因子的结合位点不仅能够促进基因组图谱的发展,还能为了解该因子调控转录的机制提供见解。 初步大规模的对转录因子结合位点的 析集中在识别 附近的结合位点或是已知基因 近 1结合位点 21。 虽然这些研究识别了上百个,在某些情况下上千个被某一特定转录因子结合的启动子序列,但仅仅局限于对启动子近端的结合位点的识别 , 因此不知道这些识别的结合位点是否代表某种兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 3 因子在基因组上结合的大多数位点。 例如,有一些因子如 锌指蛋白 263( 全基因组的 析表明这些因子结合到基因组的不同区域,包括远离 基因外区域和基因内区域(包括外显子和内含子) 22,23。 研究表明 少于 10%的转录椅子 (是因子还是椅子?) 有多达 50%以上的结合位点位于转录起始位点 内 24,25。另一项研究,用 析了 13个小鼠胚胎干细胞的位点特异性转录因子,结果表明大多数结合位点是位于启动子近端区域以外的 26。 对果蝇发展的早期的研究识别了调控区域,这些区域是由不同的转录因子 的组合结合的,这就 表明转录因子可以相互靠近共同调控转录。 例如调控果蝇基因的增强子包含了多个转录因子,每个转录因子都有多个位点,在许多情况下,结合位点都聚集摘 一个小的间隔内。 最近,对果蝇转录因子的结合模式大范围的分析,显示了长度为 1隔为约 50结合热点 27,28。 果蝇基因组为人类基因组的十分之一大小,因此对人类的基因组的转录因子是否以相同的模式聚集并不是很清楚。 由于人类的基因组很大,相关的转录因子数目很多 (约 1400 个),大多数对结合位点是否聚集形成调控元件的调查使用了计算工具 29。 一些实验表明 在人类基因组上至少有几个结合热点。一个被广 泛研究的哺乳动物增强子是干扰素 增强子 30,31,有八个转录因子在干扰素 基因 (游的 55区域内结合到重叠的元件上。多年来一直用单一调控元件的经典的突变分析来表征。 尽管很少有人类的基因组区域被如 强子一样被表征, 增强 子 区域得到了很好的研究,包括小鼠和鸡 球蛋白基因座控制区和人类生长荷尔蒙和主要组织相容性复合物 强区域 32。 陈 (此处是否应该用全名或者英文名字) 等人分析了一组共同作用来调节多能性和维持小鼠胚 胎干细胞的自我更新特性的因子 33。他们发现,一些区域,被称为多种转录因子结合位点( 被一些转录因子结合 , 具体而言, 也叫做 和 点的聚集被发现在启动子区域以外,这就表明了这些区域可能是增强子区域,这一后续的实验中显示具有强的增强子活性。 这些 识别提供了 作调节的小鼠胚胎干细胞的 转录的 事实。 不幸的是 (能否改为 “受客观条件限制 ”) ,只有极少数人的转录因子进行了分析,这些因子似乎并没 有表现出很大程度的重叠 结合在启动子以外的区域。 然而,很难知道观察聚类的缺乏是否是由于缺乏在人类基因组上结合的热点,或是由于尚未研究的因子的正确组合的可能性。要了解在哺乳动物基因组上聚集结合的情况需要收集更多的 据。 特定的组蛋白修饰模式的兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 4 基础上增强子的全基因组分析,最近也已经开始 34,35。但是,在组蛋白模式的基础上识别潜在的增强子区域并没有揭示有多少位点特异性因子结合到该区域。 如果结合位点的簇被发现在哺乳动物的基因组内,它们可能对应的是类似一个在的,在这里多种因素共同作用介导 的转录激活。 在体外实验中,如 of 被同一转录因子结合的 启动子序列比较, 推导出 一些转录因子 有共同的结合6。随后的生物信息学分析用共识 位置权重矩阵搜索人类基因组来识别某个转录因子在基因组上所有可能的结合位置。 这种方法提供了对于一个给定的转录因子所有可能得位置 37。 然而,在哺乳动物基因组 中有共识 多个匹配,多于该因子的结合位点 38。 映射转录因子结合位点到整 个基因组中取得了很大的进展,扩大转录因子的数量对于我们寻找其整体结合模式的信息是非常重要的。但是简单的收集全基因组范围内的数据不足以解决所有关键问题。 目前,我们 还不可能最终用特定的靶基因连接特定的结合位点 ,主要原因可能是 许多结合位点分散在相互距离为几十或几百 ,甚至可能在不同的染色体上,所有的合作共同调控一个靶基因。如果是这样,连接一个结合位点到最近的基因上是不恰当的 ,会导致不正确的分配靶基因和低估与转录调控有关的结合位点的数量。 定义染色体构象的特征的方法,如 9,40,可以帮助识别协同调控的基因组合,可能是通过折叠数千个看似无关联的结合位点到一个较小数目的 如,染色体构象捕获技术,可以识别多个长程的蛋白质 以揭示增强子结合蛋白和一个遥远基因的启动子的连接 ,从而导致了更准确的揭示该因子在细胞中的调节作用 41。 尽管 以识别一个特定的细胞类型的一个特定的因子的所有结合位点,但是研究人员在用 别一个特定的因子在许多个不同的细胞类型的所有可能得位点的方面仍然面临着 严峻的挑战。 团目前正在进行研究,以估计需要许多类型的细胞,以是被一组因子的大多数结合位点 (此处陈述不是很明白) 。如果有限的,但不同的一组细胞类型可以代表人类的很多不同的组织,那么就可能没有必要在每个可能的细胞类型上执行全基因组分析了。 大多数设计研究一个特定的顺式元件和一个潜在的靶基因之间的关系的方法都涉及创建一个包含感兴趣的调控元件的报告结构 42。不幸的是, 因为报告分析删除了其正常的基因组范围内的顺式元件,所以它们不能揭示长程调控的效果。精确的突变或缺失基因组中的一个单一的顺式元件可以被 实施在模式生物上,如酵母,替代基因组的部分的有效的方法已被开发 出来 。 从理论上讲,突变可以被设计来改变一个在动物模型或人类细胞的特异性结兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 5 合位点。然而,小鼠或人类基因组的特定的小区域的突变是不经常使用到来研究单个的结合位点的意义,由于同源重组频率低限制了这种技术的效率。 在位点特异性 的靶点使用人工锌指技术的这种新的方法可能会提高基因组更换的效率 43。因此,诱变可能会成为一个仔细分析个别顺式元件 的作用 的实用方法。此外,人工锌指技术融合到转录激活或抑制区域已被用于特异性的调节细胞的启动子 44。 因此, 有可能人工锌指(没有激活或抑制结构域)可以被用来简单的阻止一个因子结合到基因组的一个单一的结合位点上,但是这尚未被证明成功。 其他可能的方法包括使用吡咯咪唑聚酰胺或肽核酸(也许还有变异)结合到基因组中的特定的顺式作用元件上 45,46,47。 尽管很少有研究使用这些方法来分析一个特定的位点,甚至更少研究这些药物对整个转录组的影响, 但他们承诺提供一种方法,用于测试自然基因组的一个特定的结合位点的功能 。其他一些发现也刺激了关于长程和组合调控的新的看法的产生。 这些发现包括 大多数转录因子结合到基因组成千上万的地方,以 及结合位点不仅仅是位于启动子近端区域,一些结合位点缺乏与共识 序列相似性。 然而,目前的基因组学研究 尚未确定是否大多数转录因子聚集在人类基因组的热点上以及结合频率有什么样的功能结果。这两个问题的答案都需要很多因子的基因组图谱。 要真正了解一个给定的因子在基因组中一个特定的位点上所起的作用,就需要识别附近所有其他因子的结合以及在该区域组蛋白修饰的情况。这些研究都需要科学家们更好的合作完成。团以及 观基因组计划 都可以识别大量转录因子的结合位点,并发展许多不同的细胞类 型的表观基因组的知识 , 然后研究者可以进行在某个特定的细胞类型中的一个特定的因子的作用的后续功能分析。在未来几年的大规模的数据收集为研究人员提供了大量的信息,这将为后续上百个能解决重要的生物问题的实验打下坚实的基础。 术和生物信息学分析 人类以及其他高等生物的基因组序列主要是非蛋白质编码序列,其中的大部分序列是作为转录调控元件而存在的。细胞核中这些元件与转录因子以及其他合蛋白结合后,在细胞的不同生理状 态下调控基因的表达。了解 合蛋白,尤其是一些重要的转录因子的结合靶序列对于整个细胞的调控网络的研究具有重要的指示作用 48。 全基因组范围内识别 蛋白质体内相互作用的标准方法。 测序( 结合的 术是在全基因组水平分析 蛋白质相互作用的两大主要技术之一 49。 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 6 图 1验示意图 将 第二代测序技术相结合的 术,能够高效地在全基 因组范围内检测与组蛋白、转录因子等互作的 段 50。 原理是:首先通过染色质免疫共沉淀技术( 异性地富集目的蛋白结合的 段,并对其进行纯化与文库构建;然后对富集得到的段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的 段信息 51,52。 验示意图见图 1。在生理状态下,把细胞内的 蛋白质交联( 裂解细胞,分离染色体,通过超声或酶 处理将染色质随机切割,利用抗原抗体的特异性识别反应,将与目的蛋白相结合的 段沉淀下来,再通过反交联( 放结合蛋白的 段,最后 测序 获得 段的序列。当研究重点是得到核小体的位置和组蛋白修饰的位置的时候,实验中并不首先进行 是用超声或者 接进行打断,者对照 NA or 末端补平 ( 平末端片段 ( 3( 3 片段末 端加 A ( 带接头的片段 ( 连接接头 ( 去除空载接头及片段长度选择 ( of DP 凝胶纯化 ( ( NA 州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 7 优先使 用 以更高效地去除掉 段以得到核小体更为精确的位置 53,54,55。 实验设计的关键:( 1)抗体质量:一个灵敏度高和特异性高的抗体可以得到富集的 段,这有利于探测结合位点。( 2)样本量: 10要用 行扩增的轮数也比较少,因而由 致的偏差比较小。( 3)空白对照:空白对照是必要的,存在很多假阳性情况,举例: 1. 开放的染色体区域更容易被打断成片段,这样导致 在基因组上的分布是不均匀的 ; 时候得到结果难以解释。空白对照的用途:可以判断由到的 候具有统计上的显著性。( 4)三种类型的空白对照: 这是最常用的; NA(P 使用这个的一个问题是收集到的量可能不够; 5) 测序 深度:在发表的验中,一般使用 一个 生的数 原始 参考基因组序列 ( 过滤接头,将 ( to 未能对比上的 对比上的 基因组未知 覆盖度计算 ( ( 扫描 基因 ( O 重复区域注释 ( 联基因 释及信号通路预测 ( O 域在基因组上的位置分布 (in 确定重复区域中 布 ( in 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 8 图 1生物信息分析流程示意图 据作为一个基本单位,目前一个 概是 82009 数据)。判断足够的 测序 深度的标准是:当增加 测序 ,得到更多的 时候不能发现更多的东西 56,57,58。应该 (这 2 个字是否可以删除?) 这一准则到结合位点的数量上就是:进行 测序 ,增加 而无法得到更多的结合位点。对于基因组比较小的物种( 说,一个标准的 到的数据太多了,仅仅用于测一个样本比较浪费,所以可以多个样本加不同的 在一起测。 作为全基因组范围内分析转录因子或其他染色质蛋白结合位点及表观遗传机制的两大主要技术之一,相对于 有以下主要优势:第一,实现真正的全基因组分析。目前所能获得的芯片上固定的探针只能代表全基因组部分序列,所获得的杂交信息具有偏向性;第二,对于结合位点分析, 过寻找 “峰 ”,结合分辨率可精确到 1030 芯片上 探针由于长度所限,无法精确定位,即使目前最高水平的商业芯片都无法提供可与 美的分辨率;第三是所需样本数量。 要多达 4g 的起始样本,在杂交之前需要进行 可能导致背景增高,竞争性扩增等导致假阳性。而 需要纳克级起始材料,如 始材料可低至20以预计, 术将在细胞的基因表达调控网络研究中发挥更为重要的作用 59,60。 对客户提供的 品 (如果有阴阳参启动子区域或 列的 )进行定量检测,检测合格后进行测序文库构建、 簇 (增、高通量测序。基本数据分析数据产出统计:对测序结果进行图像识别( 去除污染及接头序列;统计结果包括:测定的序列 (长度、 量、数据产量。标准高级数据分析内容包括: 列与参考序列比对; 计样品 检测及计数、平均峰长度、峰长中位数);统计样品 基因上、基因间区 的分布情况及覆盖深度;给出每个样品 O 功能注释;在多个样品间,对与 联基因做差异分析(如图 1示)。 主要特征:( 1) “好 ”数据的特征:与非特异性的染色体背景相比,从研究目标上得到了足够的 段; “好 ”数据的数据量: 2序文库很全,基本包含了所有的想要研究的片段。( 2) ,称为 3)信号值高的位 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 9 ag of in in of DR,ag to of or of DE :or DE of by DR, q of q DE to 州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 10 表 1常用的 据分析软件 点 (的区域 )并不总是且不是唯一有生物学意义的信号,中等信号被认为 更可靠。( 3) 背景分布常常由空白对照经验拟合得到,一些算法也可以根据数据本身而不用 到 61。 在数据分析过程中,因为所有和测序相关的步骤可能都会含有 面直接从 有的 骤开始阐述。 指用于 据分析 的软件包,一般常用来 色体区域上的特征峰, 步骤主要使用 完成。一般的 个组成部分 : 1) 染色体上信号波形的定义; 2) 建立背景校正模型; 3) 建立搜索 准则,即建立判断怎样可以是一个 般会用到背景校正模型中的背景值 ); 4) 校正模型,过滤掉假阳性的 5) 给找到的 出显著度 62。 探测信号波形 (方法:有两种方法: 就是染色体上一段连续的 过一个事前定义的阈值就称为找到了一个 方法对于富集度比较大的 应性较好,但是中等信号值会被归到噪 音或 ; 2. 利用一些额外信息,例如 义一个固定的或者动态变化的 后沿着染色体进行扫描。 对背景建模包含假设的统计噪音分布或者一些列的假设用以利用 去除 面的背景值、噪音。当没有 时候,背景值一般假设使用 布或 布来模拟。有 的时候一般用值减去 值当做其值。候选 ,建立统计学检验,查看得到的 显著程度(与随机状况相比)。统计后过滤不合格一般基于两点来进行过滤:正反链上的比值,正链减反链的值等;单点重复,应该每个点得有个阈值,少于这个阈值舍去该点。显著性排序 (使用 小越显著,有些提供 较为常用的数据 分析的软件 如 表 1示 53。 复序列 许多最近的 研究表明 ,真核基因组很大一部分 是重复碱基序列 63,64。 例如,将近一半的人类基因组被重复序列所覆盖 ,其中很多的重复序列都是人们所熟悉的。虽然有些重复序列似乎看起来不具有什么功能, 但在人类进化过程中扮演着不可缺少的角色。很多生物机制导致了重复序列的产生,导致产生和插入到基因组中的序列的额外拷贝。 重复可以是各种形状和大小,它们可以是广泛散列的重 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 11 复序列,可以是串联重复或 嵌套重复,它们可能会包含 2 个副本或数万份拷贝,而且它们的范围大小可以从 1碱基(单核苷酸重复或双核苷酸重复)到数以万计的碱基。 人类基因组中的重复序列可以被分为两个大类,短串联重复序列(也称为微卫星 ),和长散布重复序列(也称为短穿插核元件 (长穿插核元件(。在人类基因组上最常见的穿插重复序列的例子之一是 型的重复元件,它覆盖人类基因组的将近 11%65。 下面介绍的是人类染色体上分布最丰富的重复 段 。 端粒重复序列 端粒重复序列 位于人类和脊椎动物的染色体的线性 子末端的串联重复单元 粒重复序列( 基对延伸达 5000 至 00字表述是否有误,请核实) ,并具有不同于正常 结构 66。一个特殊的酶叫做端粒酶,以一个不寻常 方式复制在染色体末端,防止在复制过程中染色体缩短。 亚端粒重复 亚端粒重复是穿插在临近端粒的最后 500000 个非重复序列中的重复序列。一些序列是具有染色体特异性的,一些似乎出现在所有人类染色体的末端附近 67。 微卫星重复 微卫星重复是指分布在大多数染色体的常染色体臂上的各种简单的二 -、三 -、四-、五 中二 n 最常见,人类记忆组平均每 30000 个碱基就发生一次这样的重复,总拷贝数多达 100000 个。在大多数真核基因组上 复的尺度范围是从约 20 到 60 个碱基对 68。 小卫星重复 这一类的重复序列也属于分散串联重复序列 ,其中的重复单元的长度是 30 至 35个碱基对,是具有包含了 10 至 15 个碱基对长度的核心序列的一个可变序列。 小卫星重复的尺度范围从 200 个碱基对到几千个碱基对,比微卫星重复的拷贝数目较小, 在染色体末端的端粒处倾向于发生更大的数目 68。 复 复是人类基因组中最丰富的穿插重复。 复序列的长度为 300 个碱基对,在人类基因组中平均每 3300 个碱基对发生一次,总的拷贝数目为一百万个。 暗带 的 分布 更为丰富。 他们出现在整个灵长类动物家族 , 是同源的,并认为是 来自 一个小的,丰富的 因,该基因编码了 300 个核苷酸长的 子被称为 7 这个7六个蛋白质结合形成了 蛋白质 合物 ,该蛋白质 合物识别 其新合成的蛋白质 的信号序列,并 辅助通过膜的内质网(它们被形成 的位置)到其 细胞内的最终目的地的迁移 69。 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 12 复 复是序列长度为 1000 到 7000 个碱基对的长散布重复序列。 段在3末端有一个共同的序列,但在 5末端可变地缩短,从而有一个大范围的大小。人类基因组中它们平均每 28000 个碱基对发生一次,总的拷贝数目为约 10 万,并倾向于在吉氏液染色的黑带部分更丰富。 复序列也被发现在 大多数其他哺乳动物 的基因组中 。全长度 的 段 (总数的 是一个不同组的 类反转录转座子的 “跳跃 基因 ”,这个基因 在基因组中 是 可移动的,被认为是反转录病毒的残余 反转录转座子至少有一个编码蛋白 的基因,并包含 如同 信使 A 尾 。 近 日,一个完整长度的 、 功能性的 发现。人们发现它编 码 一个 功能 性的 逆转录 酶 ,一个 段 被复制并重新插入到基因组中的 过程的 关键的酶 70。 星 星 一个 在所有人类染色体着丝粒区域长串联排列的重复序列家族。其 重复单元 为 约 340 个碱基对,是一个二聚体,也就是说,它由两个亚基组成,每个约 170 碱基对长 度 。 星 生在着丝粒缩颈两侧,并延伸至 1000 至 5000 个碱基对长 度的区域 71。其他 灵长类动物中的 星人类的是类似的 。 卫星 I, 复 卫星 I, 复 是 三个经典的人类卫星 以从大量的基因组通过 浮力密度梯度离心分离,因为它们的密度不同于其它 列的密度。卫星 I 在 很 丰富 , 是由 一个 17 - 和 25 个碱基对的重复单元的 交替阵列所 组成的。 卫星 是来自简单的五碱基重复单元 星卫星 加 高度 从基本的重复单元 分化 。卫星 I, 长串联排列 发生 在 染色体的 1, 9, 16, 17,和 Y 染色体的 异染色质区域 ,和染色体 13, 14,15, 21,和 22 的短臂 上 72。 以从其他基因组的 分离出来,因为它的快速的复性退货的特性。 拷贝数目多大一万或 更多 73,74。 因概述 早在 1991 年, 75 就报道了 族的原型, 一种淋巴样转录因子。而现在这个家族成员大都被认为是许多器官和组织发育的转录调节子。在 结构被搞清楚以后, 76 就成功分离出了兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 13 将其分别命名为 为 列表现出很大 的相似性,于是 就提出它们很可能是 迁移率族 (转录因子的亚单位。 77,78 2000 年与他的合作者们利用原位杂交免疫荧光技术描绘出了 基因图谱并将其定位于染色体 域。 个研究小组发现了 2 型糖尿病与冰岛人种的基因组上的因的变异有非常强的关联 79。这些变异彼此之间有较强的关联,并代表着一个风险等位基因,是目前对照组的 28%, 2 型糖尿病个体组的 36%。因为等位基因并不能解释 因的变异与 2 型糖尿病之间的联系,这些发现有些幸运。更重要的是他们对美国和丹麦的人种也做了相似的实验,获得了相似的发现, 因的变异与 2 型糖尿病之间有较强的关联 80,81。总体而言,对2 型糖尿病的效果是相当可观的,每增加一份风险等位基因增加 病的几率,并且这具有大量的统计置信度( P 为 10 随后的研究继续证明着 异与 2 型糖尿病 82, 83,84较强的关联。例如在英国人种的 6736 个样本中,同样的 因的变异与 的每个等位基因点的比值相关联。具有 两个副本的等位基因的该人种的 10%的个体发展为 2型糖尿病的可能是没有风险等位基因的个体的两倍。对于其他的种族也获得了相同的数据。例如,对印度、日本、墨西哥、西非、摩洛哥、法国、阿米是人和芬兰人的祖先,也得到了相同的结果。但是,等位基因的频率有差异,这将会影响不同人种 变异对公众健康的重要性。随着 5 个大型的全基因组的关联的扫描的完成,现在很清楚 迄今已查明的 2 型糖尿病的敏感性基因。 被称作 一种转录因子和 号通路的组成部分,是 核受体。 号对细胞增殖,迁移和正常胚胎是至关重要的,并已被证明是调节肌肉发育和脂肪细胞分化的 85,86。它已被证明是在胚胎发育胰腺和胰岛细胞的发育所至关重要的 85。在调节葡萄糖动态平衡中号通路的重要性被最近的发现进一步强调,即包含 也有其他两个候选基因: 染色体 10q 的区域的变异与 2 型糖尿病的发作密切的联系。 号的一个靶点。 导致 2 型糖尿病的特定的基因缺陷仍然不清楚。在大量与疾病高度相关的变异种 ,没有明显的功能性候选者。在最初的研究中显示最强的相关性的单核苷酸多态性( 然是最有可能得候选者。但它发生在非编码区的内含子区域,没有明显的机制影响 活性。由于 有可能通过影响 表达变异起作用,而不是改变所表达的蛋白质结构 87。 兰州大学 博士研究生学位论文 胞特异性靶基因识别和调控网络 研究 14 尽管潜在的变异存在着不确定性,糖尿病发作的作用在生理水平上是通过减少胰岛素的分泌造成的。 人 从糖尿病的防治研究表明,使用基线测量的结果表明,在移除 T 等位基 因后,比在移除 合子后,胰岛素的分泌具有显著更低的水平(纠正胰岛素响应的 P 值小于 88。 人发现发现 0的胰岛素分泌指数( P = 胰岛素处置指数( P = 89。 其他的研究也产生类似的结果,在胰岛素分泌的测量上而不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论