(遗传学专业论文)密码子位点特征初步研究和组蛋白基因进化动力学比较.pdf_第1页
(遗传学专业论文)密码子位点特征初步研究和组蛋白基因进化动力学比较.pdf_第2页
(遗传学专业论文)密码子位点特征初步研究和组蛋白基因进化动力学比较.pdf_第3页
(遗传学专业论文)密码子位点特征初步研究和组蛋白基因进化动力学比较.pdf_第4页
(遗传学专业论文)密码子位点特征初步研究和组蛋白基因进化动力学比较.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(遗传学专业论文)密码子位点特征初步研究和组蛋白基因进化动力学比较.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 采用生物信息学的方法 对g e n b a n k 和k e g g 和d w 等数据库中记录的2 0 个 物种1 8 7 5 1 1 个c d s 的密码子碱基分布和各类真核生物h 2 a 和h 2 b 基因的分子 数据进行了较为系统的分析 取得了以下主要研究结果 1 某种碱基在各位点上的含量与该碱基的总含量都存在正相关 碱基含量 对该碱基在第三密码位的分布的影响要远大于其他的两个密码位 这一现象起到 对蛋白质进化稳定性的调节作用 2 密码子的使用过程中t 在第二位使用的频率远大于第一位 g 在第一位 的使用频率则比第二位高的多 这一现象同密码表中该位点的碱基所编码的氨基 酸特征有极大的关系 3 同一基因在不同物种中t 在第二密码位和第一密码位的比值与基因组比 值的差距各不相同 这可能是在生物由低级向高级进化过程中 非保守基因含量 的增加有关 4 在动物中组蛋白h 2 a h 2 b 的表达效率与g c 含量和g 0 3 含量呈显著 的正相关 真菌恰好相反 两者呈负相关 而植物却表现出不相关 表明三类生 物h 2 a h 2 b 密码子偏爱使用所承受的选择压力明显不同 其中 动物的正选 择压是密码子与反密码子作用的稳定性 真菌的正选择压则是密码子与反密码子 作用的效率性 植物则选择了稳定和效率的平衡 5 h 2 a h 2 b 基因的p s 和p n 在三类生物的种间和种内的表现为 动物和植 物p s p n 真菌p s 朋 单细胞酵母p s p n f u n g ih 2 aa n dh 2 bg e n e s s h o w i n g p s p n y e a s t sh 2 a a n dh 2 b i i s h o w i n gp n p s s ot h e ym a y f o l l o wd i f f e r e n te v o l u t i o nm o d e l s w i t hp i n n t sa n d a n i m a l s h 2 a h 2 bg e n e sf o l l o w i n gt h eb i r t h a n d d e a t hm o d e l f u n g i sh 2 a h 2 b g e n e sf o l l o w i n gt h eb e t w e e nb i r t h a n d d e a t hm o d e la n dc o n c e r t e de v o l u t i o nm o d e l a n d y e a s t s h 2 aa n d h 2 b g e n e sf o l l o w i n gt h ec o n c e r t e de v o l u t i o nm o d e l k e y w o r d s c o d o n b a s ed i s t r i b u t i n g h i o n eg e n e s e v o l u t i o n a i yd y n a m i cp a t t e r n i i i 学位论文独创性声明 本人郑重声明 l 坚持以 求实 刨新 的科学精神从事研究工作 2 本论文是我个人在导师指导下进行的研究工作和取得的研究 成果 3 本论文中除引文外 所有实验 数据和有关材料均是真实的 4 本论文中除引文和致谢的内容外 不包含其他人或其它机构 已经发表或撰写过的研究成果 5 其他同志对本研究所做的贡献均已在论文中作了声明并表示 了谢意 作者签名 叁 i i 缝 日期 2 塑 s 学位论文使用授权声明 本人完全了解南京师范大学有关保留 使用学位论文的规定 学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版 有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅 有权将学位论文的内容编入有关数据库进 行检索 有权将学位论文的标题和摘要汇编出版 保密的学位论文在 解密后适用本规定 作者签名 友 i l 缱 日期 2 翌 第一部分文献综述 第一章遗传密码的起源及其进化 1 遗传密码的起源 遗传密码的起源和一直有两派观点争鸣 一是立体化学理论 w o e s e 1 9 6 6 认为密码起源于氨基酸和密码子或反密码子 或更一般地和r n a 的立体化学相 互作用 这派观点的极端代表认为密码关系是立体化学最佳匹配的结果 二是冻 结偶然性理论 c r i c k 1 9 6 8 其中最极端的代表认为密码关系是进化过程中的 偶然性被固定下来的结果 这种关系一旦建立便永久保留下来 以上两种因素对遗传密码的进化都有影响 而两派的极端观点都失之片面 例如后来发现的密码反常 c u n 从编码l e u 变成编码t h r 酵母线粒体 c g g 从 编码a r g 变成编码t r p 玉米线粒体 说明并非只有一套最佳密码 事实上 全 部密码关系的最佳立体化学匹配从来也没有被证明过 但是 氨基酸的疏水性和 反密码子37 二核苷的疏水性顺序相同是己确认的事实 说明立体化学作用的因 素确实重要地影响着氨基酸和反密码子的识别 另一方面 从氨基酸的生物合成 看 在一条合成路径上的氨基酸所用编码的密码子往往只差一个碱基 看来 后 期形成的氨基酸和早期出现的氨基酸的编码存在关系 这种氨基酸和密码字典的 协同进化说明密码指定并非纯属偶然 从三联体遗传密码被成功破译以来 遗传密码的起源问题便一直是人们关注 的热点之一 有关的假说有很多 如认为氨基酸与其相应的密码子之间的密码关 系可能来自于原始t r n a 链 包括识别核苷酸及反密码子 与氨基酸的直接相互作 用 t r n a 识别或第二套遗传密码 加上r i b o z y m e 具有肽基转移酶及氨酰t r n a 合成酶功能 r n a 自复制系统即可能开始转录 翻译甚至反转录 经自然选择开 始进化 或提出了双链核酸分子 d s r n a 或d s d n a 与氨基酸共同作用导致遗传密 码起源的新假说 认为两条核酸链的存在是遗传密码起源所必需的 它们同时以 三联体的形式发挥作用 其中 一条链上的三联体为互作密码子 负责与氨基酸 直接作用建立特异对应关系 另一条链上的三联体为密码子 负责存储这种特异 关系信息 这些假说都推动了遗传密码起源问题的进异步的研究 但是关于遗传 密码的起源问题至今仍未得到令人满意的诠释 2 遗传密码进化的阶段性 先驱研究者c r i c k 1 9 6 8 将密码子进化分为两个时期 在密码子出现之前 核苷酸和氨基酸存在某种随机性的相互作用 他推测 这个时期氨基酸同核苷酸 单体 二聚体乃至四聚体都可能发生某种形式的相互作用 本文把这个时期称为 前密码子期 当三聚体同氨基酸的对应关系偶然出现 并在进化过程中被固 定下来 就进入了 密码子起源期 e i g e n 1 9 8 1 同c r i c k 的观点一致 但他更 侧重研究在原始密码子出现以前 先导的t r n a 形成时期 到了上个世纪8 0 年代 晚期 o r g e l0 9 8 9 提出 密码子的进化应分为两个阶段 第一阶段是原始解码 机理起源 也就是双字母的原密码子和有序肽共同起源时期 第二阶段才是 三 字母 现代密码子的进化 后者应是在核糖体等分子翻译机器出现后的事 综上所述 整个密码予的起源和进化可划分为4 个时期 前密码子期 p r e c o d o np h a s e t r n a 形成期 t r n ae m e r g e n c ep h a s e 原密码子链与有序 肽同步起源期 p h a s eo fs y n c h r o n o u so r i g i n a t i o no ft h ep r o c o d o ns t r a n da n d s e q u e n c e dp e p t i d e 以及密码子进化期 c o d o ne v o l u t i o np h a s e 2 1 前密码子期 这个时期的理论以w o e s e 立体化学相互作用论为代表 他们推测在密码子起 源之初 以三聚体第2 位碱基与决定氨基酸特性的侧链的立体化学结合为基础 形成密码子一氨基酸的直接配对 c o d o n a m i n oa c i dp a i r i n g 此论一出 就立 即遭到c r i c k 1 9 6 8 的批评 虽然他也承认在前密码子期氨基酸和核苷酸之间可 能有过某种非编码关系的相互作用 但是他强调这种关系在进化过程中已消失 再去寻求 现代密码子 与氨基酸的直接配对是没有希望的 研究者普遍认为 原密码子必然也是三聚体 否则 在进化过程中就要不断 地改变阅读框和重新编码 这不符合进化规律 然而对参与编码的碱基数目的推 测 则大不相同 从3 个到1 个都有 研究的进展表明 双字母原密码子的见解 已成为主要观点 2 2t r n a 起源期 2 这是个关键时期 其特点是在对接体上建立的氨基酸与二核苷的直接配对 转交为原始t r n a 分子上的氨基酸与反密码的信息对应关系 7 0 年代中期的 试 管选择或进化 实验系统形成了r n 系统的准种群 这是对偶然冻结论的支持 这个理论由于对r n a 分子立体结构的推测同以后发现的t r n 三级结构很相近 便得到了普遍的接受 但是他们关于原密码子起源的观点却未获得较大的认同 因为它无法解释密码表中反映出的明显的规律性 因此 d ed u v 指出 密码子 的起源不能仅仅用巧合来解释 由此可见 在t r n a 起源的探索中 虽说绕过了密码子与氨基酸是否直接配 对问题 但是反密码子与氨基酸的对应关系从何而来 依然无法避开确定论和偶 然论之争 然而 由于对接体模式的建立 便为问题的最终解决提供了钥匙 随 机分布在r n 分子中的t r n a 前体分子 就被相关的对接体通过碱基配对和相继 的氨酰反应所 钓出 形成了某种嵌合体形式的 氨基酸一t r n a 一寡核苷酸 复 合体 见图1 1 在这里 对接体上的寡核苷酸起到了类似氨酰 t r n a 合成酶的 作用 通过这种嵌合作用 氨基酸一二核苷 的配对关系便从对接体转到了t r n a 前体分子的结构上 变成了信息对应关系 图1 1 原始t r n a 分子起源示意图 螺 n 原始t 疆瞧合诈 于是 遗传密码子的起源便迈出了最关键的一步 识别专一氨基酸和原密码 的原始t r n a 分子及其模板出现了 由于同寡核苷酸配对的环上只有接纳三核苷 酸的恰当位置 如果寡核苷酸长于3 联体 其第4 位以后的核苷酸也会被水解 成为与特定氨基酸对应的3 联体原密码子 2 3 原密码子链与有序肽同步起源期 先驱性的理论是w o n g 1 9 7 5 提出的共进化论 c o e v o l u t i o n 他分析了密 码表后 认为密码子是氨基酸进化的印记 如果将每相差一个碱基的密码予串联 起来 就构成由生物合成前体氨基酸 逐步进化为产物氨基酸的路线图 不过 共进化观点虽很新颖 但存着在根本性的问题 例如前体氨基酸转化的产物氨基 酸为什么恰好对应于密码子某一个碱基的突变 第2 位碱基在密码子设定上为 何起着决定性作用 复杂的密码子多态性现象从何而来 均无法作出合理解释 o r g e l 1 9 8 9 在探索解码机理的起源时 提出一个双原密码子与有序二肽同 步起源的模式 图1 2 他设想两个负载着氨基酸的原始t r n a 分子先并联 2 个氨基酸缩合为二肽然后解读一个密码r n a 链 并联t r n a 分子环上碱基配对部 位的构型 决定它们只能按 3 中读2 的方式 同刚a 链上碱基配对 这样 两个相邻的原密码子 同时也是最简单的阅读框 便同有序二肽同步起源了 此 时 两个并联的原始t r n a 分子 扮演了催化肽键形成的核酶角色 兰奇一著嘭 b 图1 2 原始解码和编码机理起源的示意图 a o r g e l 的解码机理起源观点r 原始t r n a a 氨基酸 c 原密码子 n r n a 链 b 原始编码机理起源观点t 原密码子3 联体 2 4 现代密码子进化期 这个阶段的主要内容是 3 中读3 现代密码子同氨酰 t r n a 合成酶 以下 简称a a r s 的同步进化 4 肖一吊 商单 一寄 参 一般认为t r n a 的反密码子和接收臂都存在被专一a a r s 识别的因子 但是有 2 个极端的例外 根据h o u 和s c h i e e l 1 9 8 8 的报导 a l a 的a a r s 并不依赖反 密码子 仅仅依靠t r n a 分子接受臂上1 个特殊的碱基对就能识别对应的 t r n a a i a 然而 s c h u l m a n 1 9 9 1 却报道了1 个完全相反的例外 他发现m e t 的反密码子是其a a r s 识别t r n a 的唯一的决定性因子 而且第l 位碱基 对应密 码子第3 位碱基 起主要作用 如果将其更换 氨酰反应的相对效率将下降到l 旷 倍以下 以上2 个相反的例子提示 在原始a a r s 出现以前 作为专一的原始反密码 子核苷已是t r n a 结构中的确定部分 与该酶没有特殊关系 因此 同其它核苷 一样 它们充当识别因子与否 完全取决于是否为t r n a 分子同特定氨基酸相互 识别所必须 然而原始a a r s 却参与了双义原密码子第3 位碱基 或反密码子第1 位碱基 的分化 因而分化后的反密码子必须是该酶的识别因子 甚至像m e t 的 反密码子那样 成为唯一的识别因子 此外 一般氨酰反应必须有一个校对机理 以保证翻译的忠实性 然而 有一部分a a r s s 在氨基酸被活化的第一时间里 就 确保了高度的忠实性而无需再校对 这部分氨基酸已查明的有 a s p h i s c y t t r p a s n 和l y s 它们的密码子都是由双义原密码子分化来的 而且 其中a s n 和l y s 还共用一个双义原始密码子a a n c y t 和t r p 则共用u g n 由此可见 由 原密码子编码的原始a a r s 在双义原密码子第3 位碱基 或反密码子的第l 位碱 基 的分化过程中 可能起到了选择因子的作用 而且在专一的 3 中读 现代 密码子出现后 它们本身也同步进化为现代酶 5 第二章基因表达和进化中密码子使用偏好性 基因表达调控是一个多水平 基因组 转录 转录后的翻译及翻译后修饰 加工 的复杂过程 不同物种生物中基因的表达调控和遗传密码的选用都有密切 的关系 了解基因在密码子使用上的偏好性 对研究生物的系统进化 及从转录 翻译水平分析基因表达的规律都有重要的意义 1 在核基因组中密码子使用的偏好性 核基因组特征包括基因的类型 基因的组成及结构 它的进化推动翻译系统 的进化 进而影响基因的表达调控水平 因此 研究基因的表达调控应该从基因 组本身的结构入手 c h i uw 等利用经修饰的水母绿色荧光蛋白作为报告基因 广泛应用于研究信号传导途径 翻译效率 嵌合蛋白的亚细胞定位 所有这些都 意味着不同生物之间密码在偏爱选择上具有通用性 在远源的物种中r 如人和玉 米 可以设计高频率表达的重组蛋白 然而 g u t i e r r e zg 等却有不同的观点 他 们发现大肠杆菌基因组本身在组成上就具有异质性 它包括两类四聚体 含高频 四核苷酸c r a g 的基因通常含丰富的c t f g a c l a c c a a t r g g t a g g 和 c a g g i 类四聚体1 相反 缺少c r a g 的大肠杆菌基因c c t g c c a g c t g g 和c a g g i i 类四聚体1 丰富 由此可看出 同一物种的两个基因类型在密码子的 选择 氨基酸组成 d c m 位点的频率上也存在差异 所以 分析低等及高等生 物核基因组密码子的偏爱特点 找出其异同点 对于我们今后改造基因 有效控 制基因的表达水平 显得尤为重要 近来 文献报道了很多有关四膜虫属嗜热微生物的碱基序列 w u i t s c h i c kj d 等对纤毛虫a 盯富集的基因组中g c 的含量 密码子的选择 起始密码邻近 区和终止密码位点进行分析 结果表明蛋白编码区的平均g c 含量是3 8 5 非编码区g c 含量为2 1 3 非编码区占1 9 内含子占1 5 他们对7 5 个 可编码嗜热微生物蛋白的序列进行观察 发现偏爱密码子总是以t 结束 且在 密码的第3 个位点上尽量避免g 高表达的基因相对g c 含量高 在密码的选择 方面表现出很强的偏好性 而发育调控的基因相对a t 含量高 对密码的选择没 有太高的要求 r o t h b e r gpg 在研究脊髓灰质炎病毒r n a 序列的核苷酸分配情况时发现 6 腺苷的分配不均一 5 含量低 3 含量高 二核苷酸c g 出现相对较少 u g 和c a 出现频率较高 由此可见 密码的选择绝非偶然 以腺苷结尾的密码最易 受到偏爱 由于果蝇的基因组结构简单 有人把它作为研究偏爱密码的模型 观察发现 果蝇比其他微生物更具有偏好性 在漫长的进化过程中 它的某些氨基酸对密码 子偏爱的模式在系统发育时是固定不变的 可是 某些基因 甚至是发生紧密连 锁的基因 在种间杂交时 氨基酸对密码的选择却会有很大的改变 在同义位点 中 g c 往往优先选择 许多氨基酸 在同一位点可供选择g c 时 优先选 择c 但也有例外陬i 和t 觚优先选择g 短的基因比长的基因更具偏好性 在t r n a 中含偏爱密码予的基因 更易与同工t r n a 相结合 从而快速高效的得 到表达 而且在种内多态性水平高 a m l d k 等在研究老鼠多基因家族中一个富含脯氨酸的蛋白基因时 证实了 它包括1 3 个串联重复区 每个重复有1 4 个氨基酸长度 其原型序列为 p p p p g g p q p r p p o g 重复的每一个氨基酸都有一个偏爱密码 每个重复的d n a 共有序列为c c a c c a c c a c c a g g a g g cc c a c a gc c g a g a c c cc c tc a a g g c g c 含量高达7 0 重复区内核苷酸和氨基酸的高度保守性也说明了该基 因可能是通过4 2 b p 的内部重复基因复制演化而来的 从以上对核基因组的分析 我们不难看出 1 在低等生物或寄生生物 如病 毒 基因中 密码优先选择a t 在较高等的生物 如果蝇和鼠 基因中 密码优 先选择g c 2 密码的偏向主要体现在同义密码予的第3 个核苷酸位点上 由 此就有学者提出了 解消趋异假说 n u l l h y p o t h e s i sd i v e r g e n c e 他们认为 氨 基酸组成及密码的偏向 主要体现在同义密码子的第3 个核苷酸位点上 不同血 统间的同义密码子将随时间的推移日趋分散 一个基因内部在前后置换达到平衡 后 对同一氨基酸而言 都应对应相同的密码子 但是 s m i t hjm 等人提出异 议 他们估算出大肠杆菌中两个高表达基因g a p a 和o m p a 的解消趋异值分别为 3 9 3 和3 8 1 5 而实际上饱和趋异值却只有1 9 0 2 5 4 他们认为对一个 基因中某一氨基酸来说 同义密码子在可摆位置也可能作不同的选择 p w c l ljr 进 步证实了该结论 7 2 在细胞器基因组中密码子使用的偏好性 m o r t o nbr 对3 个叶绿体基因组序列 m a r c h a n t i a o r y z a n i c o t i a n a 进 行对比 观察到叶绿体在同义密码子的选择上偏爱n n t 和删较n n c 和n n g 而言 n 代表任意核苷酸 但p s b a 基因则不同 它的n n c 比n n t 更具有优越 感 这因为p s b a 是叶绿体主要的翻译产物 它在密码选择上应以最能适合t r n a 的有效性为准 对果蝇y a k u b a d r o s o p h i l a y a k u b a 的线粒体d n a 研究结果表明 复制发生在一个含1 0 7 7 核苷酸的区域内 其中a t 占9 2 8 它缺少所有哺 乳动物的m t d n a 中与第二链d n a 合成起始相关的序列 也缺少内含子 虽然 d y a k u b a d 的线粒体中r r n a 基因g c 含量非常低 比报道的任何一种后生生 物r r n a 基因都短 但它们却能折叠成相似的二级结构 同非细胞器的t r n a 序 列相比 d y a k u b a 的t r n a 基因显得更易变 在线粒体的蛋白编码基因中 a t g a t r a t a 和a t a a 某一特定条件下 都可以作为翻译起始位点 仅有t a a 作为 终止密码子 其中a g a a t a t g a 特异表达s e r l e u t r p 有5 9 种有意义 的密码子被用到 但9 3 8 都以a t 结束 由此可见 线粒体d n a 分子中a t 核苷酸在所有位点都受到偏爱 且协调一致发生作用 线粒体基因组和叶绿体基因组都属于细胞质遗传 它们与核基因组相比 所 携带的信息量更少 结构 功能更为简单 但在选择上却更偏爱a t 加强对叶 绿体基因组遗传密码的研究 不仅可以在分子水平上研究光合作用各过程的调节 控制核质互作关系 而且可通过叶绿体基因工程改变叶绿体的功能 从而创造出 生产上有价值的作物新品种 相对来说 对植物线粒体基因组中遗传密码的研究 意义显得更为重大 密码的组成与表达调控及起源进化的关系 都有助于人们了 解线粒体 进一步了解植物的生理生化 最终通过植物基因工程手段控制细胞质 雄性不育 c y t o p l a s m i cm a l es t e r i l i t y c m s 为找出新的育种方法打下基础 3 在转录水平调控中对密码子使用的偏好性 转录水平的调控 是基因表达调控中重要的一步 顺式调控元件 c i s a c t i n g e l e m e n t 是指与结构基因串联的特定的d n a 邻近序列 它们对基因转录的精确 起始和活性调节起着举足轻重的作用 为了找出与表达产物相关的密码间存在的潜在差别 y a m sm 等把一套高表 达大肠杆菌结构基因的邻近序列与一套低表达的大肠杆菌结构基因的邻近序列 作一比较 发现二者具有惊人的非随机性 具低水平表达产物的基因受到的影响 程度更大 集中表现在其邻近序列会减少表达 它的偏爱模式为r y y r 或 y r r y r 表示嘌呤 y 表示嘧啶 为分界线 因此 我们可以通过相邻突变的 表达量减少来预测新位点 也可以作为翻译时活性设计的一种策略 真核基因中起始密码a u g a 为 1 位置 的邻近序列并不是随机分布的 k o z a km 曾经对1 5 3 个真核m r n a 进行分析 发现其中1 5 1 个m r n a 在 3 位 置含嘌呤 位含g 因此 a g n n a u g g n 为任意核苷酸 作为真核生物起始 位点所偏爱的序列 非功能a u g 三联体5 端非编码区的核苷酸 完全不同于 这些功能位点 可见 3 4 位点的嘌呤有利于a u g 密码的识别 s z c z e s n ae 等曾构建了一系列翻译前甲状旁腺激素起始编码d n a 的质粒 发现m r n a s 帽式结构易于为a u g 识别 同时r n n a u g r r 为嘌呤 n 为任意核苷酸1 为 m r n a 翻译起始最易于识别的位点 k o z a km 再次用引物延伸反应 t o c p r i n t i n g 证明了起始位点a u g 后紧跟g 的确可以增大与m r n a 匹配时a u g 的识别能力 a u g g u a 除外 而与 5 6 位置无关 j o h n s t o njc 等也从黄瓜双功能枯斑病 毒的p 2 0 和p 2 1 的翻译调控中得到同样的结论 这些都说明了 k o z a kr u l e s 是 合理的 终止密码u a a u g a 和u a g 在不同种真核m r n a 中使用频率不同 在脊 椎动物和单子叶植物中 u g a 的使用频率较高 而其他的真核生物中主要采用 u a a 为终止密码 u a g 的使用频率则很低 4 环境对密码子使用偏好性的影响 在紫外光诱导的情况下 基因中某些密码会导致有选择的突变 m i l l e r jh 对 e c o l i 中l a c 基因在紫外光诱变下的结果表明 6 0 6 5 的是碱基替换 3 0 3 5 是移码突变 缺失突变占5 把紫外光诱变和s o s 化学诱变作 l b 较 并 确认紫外光诱变是有方向性的 其最喜欢的突变位点是g x c a x t 的转换 这种 转换方式通常在相邻嘧啶之间发生 如核苷酸序列由a c a 变为t c a 时 必会 导致转换频率的增加 而在基因框架c t d t c t 序列中 经常发生c t 活t c 序列的丢失 这说明在发生移码和碱基替换时 除邻区以外的极大外围区域也可 9 以影响突变频率 高温也是影响密码发生偏向选择的一个重要因素 8 5 条件下的极端嗜热菌 t r n a 茎l x s t e mr c g i o n 含 有大量的g c 碱基对 明显高于中温嗜热菌 且在5 4 号位s 2 t 代替了t 对嗜热菌t r n a 的反密码子环进行研究 还发现g c 专一 出现在第一位置 同义密码子g g i q c c n 比g c n c g n 更具有优势 综上所述 在研究生物进化和基因表达调控的过程中 密码的选择起着很重 要的作用 无论是低等生物还是高等生物 不管是细胞核遗传还是细胞质遗传 在密码的偏爱及核苷酸的选择上都有明显的倾向性 研究遗传密码在基因组的启 动子结构 转译起始序列及转录终止区的偏向选择 这些都为控制外源基因表达 效率提供了重要的参考指标 l o 第三章本论文相关软件的使用和数据的处理方式 1 相关软件的使用介绍 本章节中运用的软件包括d a m b e m e g a v e r s i o n3 1 和c l u s t a l x 其 中d a m b e 和m e g a 主要用于计算和分析 c l u s t a l x 仅用于序列的比对和数据 格式的转化 d a m b e 软件 d a t aa n a l y s i si nm o l e c u l a rb i o l o g ya n de v o l u t i o n 是一款用 于检索 组织 处理 排列和分析分子序列数据的整合的软件包 它也可用等位 基因频率数据来计算遗传距离和种系发生重构 在本章节中主要利用d a m b e 分析和计算各物种基因序列的以下几个 核酸和氨基酸组成 g c 含量 相对同 义密码子使用 r e l a t i v es y n o n y m o u sc o d o nu s a g e r s c u 和密码子适应指数 c o d o na d a p t a t i o ni n d e x c a d m e g a 是 款用于检验和分析d n a 蛋白质序列的演化的软件 它能对多 个序列数据进行分析 对类群内和类群间的遗传多样性进行估计 还可以推断高 等级水平的物种 基因的演化关系 此外 我们还可以对选定的密码子进行一些 简单的统计 包括密码子简并性 以及用n e ia n dg o j o b o r i 1 9 8 6 方法对密码子 同义位点和非同义位点进行计算 系统发育树可以利用 p h y l o g e n yi c o n s t r u c t p h y l o g e n y 来建立n e i g h b o rj o i n i n g m i n i m u me v o l u t i o n m a x i m u mp a r s i m o n y 和u p g m a 等各种不同类型的系统发育树 在本论文中我们主要利用m e g a 软 件对密码子同义位点和非同义位点 即p s 和p n 值 进行计算和构建系统发育树 2 数据的处理方式及其生物学意义 2 1r s c u 值的计算 相对同义密码子使用 r e l a t i v es y n o n y m o u sc o d o nu s a g e r s c u 的是由 d a m b e 软件中的s e q a n a l y s i s c o d o nu s a g e r e l a t i v es y n o n y m o u sc o d o n u s a g e 计算得出 如下图 r s c u 由s h a r p p m 于1 9 8 7 年首次提出用来分析基因的密码子使用变化 昭c 阢 堕 暖 o b s f 是密码子的观察数目 脚r 是该密码子的期望数目 或平均数目 而 1 1 了a a 嘲 栏 2 s y n l 其中y a a 是蛋白质序列中该密码子编码的氨基酸的总数 y s y n i 是编码该 j 氨基酸的同义密码子个数 如l l e 有3 个同义密码子 了s y n i 3 可见如果某 一 个密码子的r s c u 1 就说明该密码子的使用超过了预期的频率 属于经常使用 的密码子 称为最适密码子 而0 0 5 p n 则净 化选择下的b i r t h a n d d e a t h 模式在进化中发挥了主要作用 h e l e ne ta l 2 0 0 2 如果非同义位点差异的比例较大 即p s p n 因此我们可以 推测哺乳动物组蛋白h 2 a h 2 b 和h 3 h 4 的进化模式一样 都遵循净化选择 下的b i r t h a n d d e a t h 进化模式 只有相对低等的红原鸡 其组蛋白h 2 a 的p s p n p s 略小于p n 推测其进化模式为b i r t h a n d d e a t h 模式和协同进化模式共有 协同 进化稍微占据主要地位 但其组蛋白h 2 b 的p s 仍显著大于瑚 2 拟南芥和水稻组蛋白h 2 a 和h 2 b 均表现出了 p s p n 由此可以推断 植物组蛋白h 2 a 和h 2 b 与哺乳动物组蛋白i 1 2 a 和i 1 2 b 的进化模式一样 都遵 循净化选择下的b i r t h a n d d e a t h 进化模式 但是仔细分析结果还是可以发现 植 物组蛋白h 2 a 和h 2 b 的p s 与p n 的差值并没有哺乳动物p s 与p n 的差值大 推 测在植物组蛋白h 2 a 的进化中b i r t h a n d d e a t h 模式的选择压并没有哺乳动物强 3 真菌组蛋白h 2 a h 2 b 基因的平均p s p n 因此我们可以知道真菌组蛋 白h 2 a h 2 b 基因的进化是在净化选择下的b i r t h a n d d e a t h 进化模式和协同进化 的作用下共同完成的 而对于真菌中相对低等的酵母而言 其组蛋白h 2 a h 2 b 基因的平均船 平均p n 即 酵母组蛋白h 2 a h 2 b 是遵从协同进化模式 从表7 3 和7 4 的p s p n 的值与这些生物的进化水平联系起来考察时不难发 现 不同生物组蛋自h 2 a h 2 b 基因的p s p n 值与这些生物的进化水平存在着 某种共线性关系 即 p s p n 的数值随着生物进化等级的提高而增加 由此推测 生物组蛋白h 2 a h 2 b 基因在进化上可能经历了由协同进化模式向净化选择压 力下的b i r t h a n d d e a t h 进化模式逐渐演化的过程 3 2 三类生物h 2 a h 2 b 基因的船和 附值与h 3 h 4 的比较 表7 5 组蛋白h 3 的p s 和p n 平均值 物种学名p s x l 0 0 p t f x l 0 0i s p n 狗 c f a m i l i a r i s 4 6 4 4 2 3 9 1 9 4 3 褐鼠 r n o r v e g i c u s 3 1 1 3 2 9 2 3 3 黑猩猩p t r o g l o d y t e s 5 2 7 1 2 2 2 2 3 7 4 拟南芥 a t h a l i a n a5 4 8 6 5 3 8 1 0 1 9 人 h s a p i e n 5 1 7 21 53 4 4 8 小鼠 肛m u s c u u s3 2 0 52 11 5 2 6 哺乳动物m a m m a l4 8 4 73 1 51 5 3 8 酵母y e a s t5 1 9 28 1 66 3 6 真菌f u n g i5 7 2 71 1 8 4 4 8 3 表7 6 组蛋白h 4 的p s 和p n 平均值 物种学名p s x l 0 0 p n x l 0 0p s p w 狗 c f a m i l i a r i s 3 1 6 70 3 98 1 4 3 褐鼠 r n o r v e g c u s 4 3 9 50 1 92 3 1 3 1 黑猩猩p t r o g l o d y t e s 5 6 6 35 1 11 1 0 8 红原鸡 g g a l l u s 1 4 30 0 34 7 6 7 桔氏锥虫t c r u z l 5 71 1 81 3 3 拟南芥五t h a a n a4 5 52 6 51 7 1 7 人 且s a p i e n 5 3 4 21 9 12 7 9 7 小鼠越m u s c u l u s2 3 5 30 21 1 7 6 5 哺乳动物 m a m m a l 4 3 9 90 9 54 6 3 1 酵母 y e a s t 3 9 8 4 7 1 2 5 6 0 真菌f u n g i 4 4 7 51 4 3 23 1 3 通过观察组蛋白h 3 h 4 的p s p 的值 不难发现三类生物的组蛋白h 3 h 4 均遵守净化选择下的b i r t h a n d d e a t h 模式 根据四种核心组蛋白基因 h 2 a h 2 b h 3 和h 4 在三类生物中的保守性与进化模式 可归为h 2 a h 2 b 及h 3 h 4 两类 前者的保守性较低 在不同生物中的进化模式复杂 在进化上可能经历了 由协同进化模式向净化选择压力下的b i r t h a n d d e a t h 进化模式逐渐演化的过程 后者的保守性高 在不同生物中都遵从净化选择下的b i r t h a n d d e a t h 模式 4 根据组蛋白基因h 2 a h 2 b 构建生物进化树 进化树是通过m e g a 中的p h y l o g e n y 构建 本论文是采用n j 方式进行构 数 b o o t s t r a p t e s t o f p h y l o g e n y m o d i f i e d n e i g h b o r j o i n i n g m e t h o d 点击选择 p s 和p n 值计算时所采用的模型 点击c o m p u t e 即可构建出进化树 图7 1 7 2 通过观察h 2 a h 2 b 构建生物进化树同传统的生物进化树比较我们可以发 现一些相同点 1 同物种阃 来自不同的地区或者不同的亚种 进化关系是最近 的 2 动物 特别是哺乳动物 同植物和真菌之问的界限比较明显 符合传统 的生物进化分类 但是在植物和真菌还有些低等动物之间的界限确不明显 这可 能是由于它们的组蛋白h 2 a h 2 b 基因都受着协同进化和b i r t h a n d d e a t h 双重进 化模式的影响而变的难以区分 人 缸展鸡 枯氏锰主 懈 牛蠢勃愿主 非洲爪蟾 褐鼠 寰弓 鱼 生 拟南芥 i 裂弱睁母 l i 酿酒酵母 恶性疟厦虫 溶组织阳米巴 小型患孢彦 患孢千虫 脑敏孢千鱼 图7 1 组蛋白基因h 2 a 构建的生物进化树 人 黑猩疆 福置 小曩 红厦鸡 红藻 枯氏锰虫 i 基球酵母 裂殪酵母 囊j 鲁千虫 酿渣i 坶 白色念珠菌 恶性疟触 溶组织阴米巴 拟南芥 牛寨轴原虫 脑微孢平虫 1 守 占 1 0 图7 2 组蛋白基因h 2 b 构建的生物进化树 附录一本论文所涉及的基因索取号 组蛋白h 2 a 基因索取号 代号学名中文名 g e n e i dp r o d u c t d r e 2 5 2 9 1 32 5 2 9 1 31 1 2 af a m i l y m e m b e rz 1 7 r e r o 斑马鱼 d r e 3 9 4 0 4 83 9 4 0 4 8h 2 af a m i l y m e m b e rx p f h 2 6 5 4 7 8 92 6 5 4 7 8 9h i s t o n eh 2 a p f a 8 1 4 5 2 3 只扣 c 印u 眦 恶性疟原虫 8 1 4 5 2 3 h 2 av a r i a n t p u t a t i v e a 3 7 9 2 1 53 7 9 2 1 5h 2 九z 1 2 z a n 妇 非洲爪蟾 l a 3 8 0 5 7 5 3 8 0 5 7 5h 2 a f a m i l y m e m b e ry 2 c f a 4 7 5 5 0 14 7 5 5 0 1s i m i l a rt oh 2 a m e m b e rv c f a 4 7 8 2 1 54 7 8 2 1 5s i m i l a rt oh 2 a m e m b e rz c f a 4 7 8 4 9 34 7 8 4 9 3h i s t o n eh 2 a f c f a 4 8 2 2 0 34 8 2 2 0 3s i m i l a rt oh i s t o n eh 2 a 1 c f a 4 8 3 1 6 84 8 3 1 6 8s i m i l a rt oh i s t o n eh z a o c f a 4 8 6 1 7 44 8 6 1 7 4s i m i l a rt oh i s t o n eh 2 a c c f a 4 8 6 1 7 54 8 6 1 7 5s i m i l a rt oh i s t o n eh 2 a c f a 4 8 6 6 6 94 8 6 6 6 9s i m i l a rt oh 2 a m e m b e r j c f a 4 8 8 2 5 1 4 8 8 2 5 1 s i m i l a rt oh j s t o n eh 2 a c f a 4 8 8 2 5 4 c f a m i l i a r i s 狗 铝8 2 5 4s i m i l a rt oh i s t o n eh 2 a l c f a 4 8 8 2 6 24 8 8 2 6 2 s i m i l a rt oh i s t o n eh 2 a 1 c f a 4 8 8 2 6 8 4 8 8 2 6 8 s i m i l a rt oh i s t o n eh 2 a i c f a 4 8 8 2 7 84 8 8 2 7 8s i m i l a rt oh i s l eh 2 a 1 c f a 4 8 8 2 8 94 8 8 2 8 9s i m i l a rt oh i s t o n eh 2 a 1 c f a 4 8 8 2 9 14 8 8 2 9 1s i m i l a rt oh i s t o n eh 2 a j c f a 4 8 8 2 9 74 8 8 2 9 7s i m i l a rt oh i s t o n eh 2 a 1 c f a 4 8 8 2 9 9 4 8 8 2 9 9 s i m i l a rt oh i s t o a eh 2 a 1 c f a 4 8 8 3 0 84 8 8 3 0 8s i m i l a rt oh i s t o n eh 2 a j r n 0 2 4 8 2 82 4 8 2 8 t e s t i s s p e c i f i ch i s t o n e2 a h 2 a m e m b e rv r 丑0 2 8 9 7 8 42 8 9 7 8 4 p r e d i c t e d r n 0 2 9 3 8 42 9 3 8 4h 2 a f a m i l y m e m b e ry h i s t o l i e1 h 2 a n r n 0 3 0 6 9 7 0 i l n o r v e g i c u s 褐鼠3 0 6 9 7 0 p r e d i c t e d r n 0 3 6 5 8 7 73 6 5 8 7 7h i s t o n e2 h 2 a a h i a t o n e1 h 2 a o r n 0 3 6 7 4 2 33 6 7 4 2 3 p r e d i c t e d r n 0 5 8 9 4 0 5 8 9 4 0 h 2 a f a m i l y m e m b e rz p t r 4 5 2 6 3 6 p t r o g l o d y t e s 黑猩猩4 5 2 6 3 6s i m i l a rt oh 2 a m e m b e rz p t r 4 6 1 4 0 0 4 6 1 4 0 0 s i m i l a rt oh 2 a m e m b e rz p r 4 6 2 4 8 64 6 2 4 8 6s i m i l a rt oh 2 a m e m b e rr p t 6 2 4 9 04 6 2 4 9 0s i m i l a rt oh i s t o n eh 2 a 1 p t r 4 6 4 2 2 54 6 4 2 2 5s i m i l a rt oh 2 a m e m b e rz p t r 4 6 6 8 6 44 6 6 8 6 4s i m i l a rt oh i l o n eh 2 a x p i r 4 6 7 2 6 1 4 6 7 2 6 1s i m i l a rt oh i s t o n eh 2 a p t 惦9 7 0 04 6 9 7 0 0s i m i l a rt oh i s t o n eh 2 a 1 p d 一7 1 8 9 4 4 7 1 8 9 4s i m i l a rt 0h i s l o n eh 2 九1 p 船4 7 1 8 9 54 7 1 8 9 5s i m i l a rt oh i s l o n eh 2 a 1 p t r 4 7 1 9 0 34 7 1 9 0 3 s i m i l a rt oh 2 a m e m b e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论