【优秀毕业论文】拟南芥盐和干旱胁迫下调控网络分析.pdf_第1页
【优秀毕业论文】拟南芥盐和干旱胁迫下调控网络分析.pdf_第2页
【优秀毕业论文】拟南芥盐和干旱胁迫下调控网络分析.pdf_第3页
【优秀毕业论文】拟南芥盐和干旱胁迫下调控网络分析.pdf_第4页
【优秀毕业论文】拟南芥盐和干旱胁迫下调控网络分析.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东北林业大学 硕士学位论文 拟南芥盐和干旱胁迫下调控网络分析 姓名 臧卫东 申请学位级别 硕士 专业 发育生物学 指导教师 李玉花 石铁流 201006 摘要 摘要 目前的研究发现 植物在胁迫条件下表达大量胁迫相关基因 部分转录因 子参与了胁迫响应 进而调控胁迫响应基因的表达 本文利用拟南芥胁迫下的 7 表达谱数据和相应的转录调控数据构建调控网络 发现了不同转录因子和代谢途 径之间的相互作用关系 阐述了胁迫下的调控机制 我们还从代谢途径的显著 性角度出发找到了显著相关的代谢途径 在盐胁迫调控网络中 我们发现转录因子a t 5 g 0 1 3 8 0 和a t 4 g 3 1 8 0 0 有共 同的下游基因 转录因子w r k y 5 3 通过调控转录因子a t w r k y l8 和g b f 3 来 调控下游的代谢途径 转录因子a t w r k y l 8 g t 3 b a t 5 g 0 1 3 8 0 和g b f 3 的共 同作用p 4 5 0 代谢途径响应胁迫 在盐和干旱胁迫下的共调控网络中 转录因子a g l l 5 和a r r l 0 下调降解 相关的代谢途径 转录因子a g p l 和a t e r f 2 激活a l p h a 亚麻酸和苯丙素代谢途 径 关键词 调控网络 拟南芥 胁迫 代谢途径 a b s t r a c t a b s t r a c t m a n yt r a n s c r i p t i o nf a c t o r sa r ei n v o l v e di nt h er e g u l a t i o no fs t r e s s i n d u c i b l e g e n e s p a r to ft h et r a n s c r i p t i o nf a c t o r sf u n c t i o nn o to n l yi ns t r e s st o l e r a n c eb u ta l s oi n s t r e s sr e s p o n s e i nt h i ss t u d y w eh a v eu t i l i z e da f f y m e t r i xe x p r e s s i o np r o f i l e so f s t r e s s e da r a b i d o p s i sc o n s t r u c t e dag e n er e g u l a t i o nn e t w o r k w bf o u n dt h er e g u l a t o r y r e l a t i o n s h i p sb e t w e e nd i f f e r e n tt f sa n dt h ep a t h w a y s a n dr e v e a l e dt h ea r a b i d o p s i s r e g u l a t i o nm e c h a n i s mu n d e rs t r e s s t h er e g u l a t i o nn e t w o r ks h o w st h ec r o s s t a l kb e t w e e nt f sa n dp a t h w a y s w b f o u n dt h es a m eg e n e sr e g u l a t e db yb e t ht h et r a n s c r i p t i o nf a c t o r sa t 5 g ol38 0a n d a r 4 g 318 0 0 1 1 地t r a n s c r i p t i o nf a c t o rw r k y 5 3p l a yak e yr o l ei ns a l ts t r e s st h r o u g h r c g u l a t i o nt r a n s c r i p t i o nf a c t o r sa r w r i i k y l8a n dg b f 3 t h ec y t o c h r o m ep 4 5 0 p a t h w a yw a sc o a c t i v a t e db yt h r e et r a n s c r i p t i o nf a c t o r s a mk y l8 g t 3 b a t 5 g 0 1 3 8 0 g b f 3 t h eo v e r l a po fs a l ta n d d r o u g h t s t r e s s r e g u l a t i o n n e t w o r ks h o w st h a t d e g r a d a t i o n r e l a t e dp a t h w a y s w e r e d o w n r e g u l a t e db y t h ea g l l 5 a r r i o t r a n s c r i p t i o n f a c t o r sa g p1 a t e i t f 2a c t i v a t e a l p h a l i n o l e n i c a c i da n d p h e n y l p r o p a n o i dp a t h w a y s k e y w o r d s r e g u l a t i o nn e t w o r k a r a b i d o p s i st h a l i a n a s t r e s s p a t h w a y i i 1 绪论 1 绪论 拟南芥 a r a b i d o p s i st h a l i a n a 属于十字花科植物 广泛分布于亚洲 欧洲和北美 地区 由于其一些独特的生物学特征 如植株小 生长周期短 种子产率高 核基因组 小 天然白花授粉等 而成为植物分子遗传学研究中不可代替的模式植物 拟南芥最早被欧洲学者l a i b a c h 1 9 4 3 年 选为模式遗传有机体 以后被美国学者 r e d e i 1 9 7 0 年 详细研究 1 9 8 0 年公布了拟南芥的详细遗传图谱 1 9 8 7 年在美国密歇 根州立大学召开了专门有关拟南芥研究的国际会议 此后许多原本在其他模式植物上进 行研究的人 很快转向把拟南芥作为首选模式植物 1 9 9 0 年确立了拟南芥的长期研究目 标 即2 0 0 0 年底完成基因组测序 并强调要把拟南芥的研究成果应用于其他植物 去解 决与农业 工业和人类健康有关的实际问题 1 9 9 6 年一个拟南芥基因组测序的国际合作组 t h ea r a b i d o p s i sg c n o m ei n i t i a t i v e a g i 开始工作 并于2 0 0 0 年底公布了5 条染色体的测序结果和分析报告 拟南芥基因 组测序工作的完成 为拟南芥基因克隆 基因功能分析特别是系统研究整个拟南芥基因 组提供了便利的条件 使其成为当前国际上研究植物生长发育的首选对象 被人们称为 植物界的 果蝇 1 1 拟南芥胁迫的研究进展 1 1 1 抗盐机理 盐分是影响植物生长和产量的一个重要环境因子 高盐会造成植物减产或死亡 过 去的二十年已有很多有关盐胁迫生物学及植物对高盐反应的报道 植物的抗盐性涉及生 理生化多方面的因素 是个多因素控制的复杂的反应过程 不同的盐生植物 虽然它们 都生活在同样的高盐分下 但其抗盐机理却是不一样的 迄今为止 植物耐盐机理尚不 十分清楚 1 1 1 1 植物抗盐的生理基础 渗透调节能力是植物耐盐的最基本特征之一 盐生植物体内存在着一套渗透调节机 制 通过无机离子和有机亲和物质的参与 降低细胞液的渗透势 从而使水分顺利地进 入植物体内 保证了植物生理活动的进行 参与渗透调节的无机离子主要是n 矿 k c a 2 和c 1 很多非盐生植物选择l f 而排斥n a 而盐生植物却选择n a 排 斥k 盐生植物体内含有高浓度的n a 被认为与它的抗盐性有紧密的关系 为了保持 液泡中的离子平衡 细胞质中要累积大量低分子量的成分 如多元醇 糖类 氨基酸及 其衍生物 细胞内脯氨酸的积累可以提高植物的耐盐性 在盐胁迫条件下 脯氨酸可以 作为渗透调节剂 氮源 酶和细胞结构保护刘 防止质膜通透性的变化 保护质膜的完 整性 稳定膜结构 此外 近几年来还发现了一些大分子量的蛋白质如调渗蛋白 胚胎 发育晚期丰富表达蛋白l e a 等 这些溶质分子不但能降低细胞渗透势 增强吸水能力 东北林业大学硕士学位论文 以维持细胞膨压 提高植物对逆境的适应能力 还能稳定酶 蛋白复合体 如p si i 外周 多肽 等生物大分子的结构与功能 保持膜的有序态 在细胞内起渗透调节作用 因 此 这些物质一般也称之为渗透调节物质 2 1 1 1 2 植物激素调节 盐胁迫下 植物体内的i a a c r k g a e t h a b a 等均发生不同程度的变化 但最复杂的变化是a b a 和c t k 大多数植物在盐胁迫下表现出不同程度的a b a 积 累 m u n r o 和s h a r p 认为 在盐胁迫下a b a 作为最初调节过程的信号调节植物对盐胁 迫的适应性反应 3 1 短期盐胁迫下植物生长主要受根部盐渗透的影响 叶片生长受a b a 的调节 长期盐胁迫下 植物生长受抑主要来自离子毒害 对耐盐性不同的植物 如棉 花 大麦 番茄和菜豆等的研究均发现 a b a 具有调节植物对长期盐胁迫的反应 提 高植物耐盐性的作用 许多实验也证实外源a b a 能提高离体细胞对盐分的适应性和促 进蛋白质的合成 增强植物抗盐性 j 1 1 1 3 改变光合作用途径 盐胁迫会通过降低水势抑制光合作用 所以 耐盐的主要途径应该是增加水的利用 率 一些盐生植物 如豆瓣绿属植物 马齿苋科植物以及番茄科植物冰草等 在盐渍或 水分胁迫下可以改变光合碳同化途径 即由c 3 途径变为c a m 途径 c a m 植物在夜 间开放气孔进行c 0 2 的吸收和固定 白天气孔关闭减少蒸腾失水 一些盐生植物如獐 毛 在盐渍条件下 其代谢途径可由c 3 途径改变为c 4 途径 增强了光合作用 1 1 1 4 抗氧化防御系统的活性 植物的膜系统主要是由膜脂和膜蛋白组成的 植物受盐胁迫时 体内会产生大量 的氧自由基 活性氧 从而引起膜脂的氧化伤害 植物体内有抗氧化的过氧化酶系统 当受盐胁迫时 过氧化酶系统活动加强 以清除过多的活性氧 盐胁迫下植物体内抗氧 化防御系统由一些能清除活性氧的酶系和抗氧化物质组成 如s o d p o d c a t a s a g s h 类胡萝卜素等 它们协同起作用共同抵抗盐胁迫诱导的氧化伤害 单一的 抗氧化酶不足以防御这种氧化胁迫 在盐胁迫下 植物体内s o d 等酶的活性与植物的 抗氧化胁迫能力呈正相关 而且在盐胁迫下 盐生植物与非盐生植物相比 其s o d c a t p o d 活性更高 因而更能有效地清除活性氧 阻抑膜脂过氧化 总之 分子和基因组分析揭示了受到逆境胁迫诱导的基因 他们的功能主要集中在 胁迫响应和抗胁迫方面 环境胁迫 例如干旱 高盐和低温等对植物产生影响 植物通 过不同的生化和生理过程来响应胁迫并且适应胁迫 许多基因是在转录水平来响应不同 胁迫 并且这些基因所表达的蛋白的功能主要集中在胁迫酎受方面 现阶段已有一部分 转录因子被证实与胁迫响应相关 如w r k y m y b 和b z i p d o f 等转录因子家族已经证 实了在调控植物胁迫响应中起着很重要的作用1 6 j 许多基因同时在干旱和高盐浓度的条 件下高表达 说明了他们之间存在着一定交互联系 植物胁迫响应机制涉及了复杂的基 因调控网络在不同逆境胁迫中 即使在同一胁迫下 不同的代谢途径之间也有一部分是 交互影响 1 绪论 1 1 2 抗旱机理 植物激素a b a 可以导致气孔的关闭并且诱导干旱胁迫基因的表达 7 8 基因表达分 析证明 在干旱胁迫下存在a b a 依赖和独立于a b a 的转录调控系统 图1 1 是转录调 控网络中的不同胁迫信号的基因表达情况的最新进展 9 干旱 高盐和冷胁迫下 至少存在六个信号转导通路 3 个依赖a b a 和3 个独立于 a b a 的通路 在依赖a b a 的通路中 a b r e 作为一个a b a 响应元件来执行功能 a r e b a b f s 属于a p 2 转录因子 在这一过程中表达 m y b 2 和m y c 2 主要是刺激 a b a 诱导的下游r d 2 2 基因的表达 m y c 2 同时刺激在j a 诱导的下游基因的表达 在 胁迫下 n a c r d 2 6 转录因子调控a b a 和j a 响应的下游基因表达 这些m y c 2 和 n a c 转录因子在逆境胁迫和创伤应激下存在着一定关系 在其中一个独立于a b a 的通路中 d r e 不仅是在干旱和盐胁迫下 而且在冷胁迫 下也同时发挥着重要的功能 d r e b l c b f s 在冷胁迫下表达 d r e b 2 s 对在脱水和高 盐胁迫中下游基因的表达有着很重要的作用 其他的a b a 独立的通路 调节干旱和盐 胁迫的转录因子并没有在冷胁迫中高表达 9 这些研究表明 不同环境胁迫下存在着相同的响应机制来响应胁迫 d r o u g h t h i g hs a l i n i t y c o l d id r e b l c b f l a p 2 e r f 戗量n 了了下l 上 舢上上 l u n o t i o n g e n ep r o d u c t si n v o l v e di ns t le s sr e s p o n s ea n dt o l e r a n c e 1 2 高通量数据概述 基于基因芯片的表达数据是分析特定条件下基因变化情况及其相应的机制的重要来 东北林业大学硕士学位论文 源之一 a 电恤e 咄公司于上世纪末提供了拟南芥全基因组的基因芯片 该芯片包含了 拟南芥全基因组的信息 为拟南芥的相互作用提供了一个很好的芯片平台 基因芯片又 称为d n a 芯片 它是由大量d n a 或寡核苷酸探针密集排列所形成的探针阵列 其工作 的基本原理是与在生命体中基因信息的阅读 存储 复制 转录和翻译均通过分子识别 的规则一致 可通过碱基互补匹配原则识别一个核酸分子的序列 基因芯片的各点就是 把大量已知序列的探针集成在同一个微小的基片 硅片 玻片 塑料片等 上 将已被荧 光标记过的靶核酸序列与芯片上的探针进行杂交 经洗涤后 除去未杂交的样品 便可 通过处理和分析基因芯片杂交图像 基因芯片能够在同一时间内分析大量的基因 实现 生物基因信息的大规模检测 生物芯片虽然能提供大量的数据 但是数据的爆炸不等于知识的爆炸 在得到芯片 数据后只有进行科学地分析才能得到科学的信息 在基因芯片使用过程中需要用生物信 息学的方法对大量生物芯片得到的数据进行处理分析 芯片技术作为一个非常有用的工 具来分析植物逆境胁迫下的基因表达谱 例如干旱 高盐 冷或是a b a 处理后的胁迫下 0 0 l 近几年有大量的文献利用胁迫芯片 通过生物信息学方法预测了在胁迫下的转录 调控网络从而阐述胁迫机制 不只生物芯片数据 还有其他数据库的数据 都从不同角度阐述了拟南芥的功能及 胁迫机制 如 k e g g 中的p a t h w a y 代谢途径 的数据 a t p i d 中的p p i 蛋白质相互作用 数据 1 3 研究目的意义 目前 随着基因组学和蛋白质组学的飞速发展 人们已经构建了酵母 人等生物的 蛋白质相互作用网络 并在基因调控网络的研究上进行着积极探索 在植物方面 随着 模式植物拟南芥和水稻基因组计划的完成 为建立模式植物的基因调控网络和蛋白质相 互作用网络提供了基础条件 在此研究背景下 本论文构建了盐和干旱胁迫下的调控网络 来阐述特定胁迫下表 达的转录因子与代谢途径之间的调控关系 通过模式分析来确定胁迫下调控机制和重要 的胁迫响应基因及代谢途径 最后可以通过基因工程的方法 改良植物的抗逆性 对系 统地研究和阐明生命活动的规律具有重要意义 4 2 拟南芥调控网络分析的数据基础 本论文研究的数据基础 也就是数据来源 在整个论文工作中起着至关重要的作 用 数据来源的可靠性直接关系到每一种预测方法的精确度 以及在拟南芥全基因组编 码的蛋白质中相互作用的覆盖情况 本章分别对每一种数据来源进行详细地描述 2 1 基因芯片数据 本研究使用的芯片数据都属于a f f y m e t r i x 公司开发的a f f y m e t r i xa t h i 2 5 k 芯片平 台 该芯片主要针对的物种是拟南芥 探测范围为拟南芥全基因组 选取这一芯片平台 的原因是 其芯片针对拟南芥范围广 基础成熟 具有统一 规范的处理方法及理论 在不同实验室的实验过程中使用这同一平台 有助于减小系统误差 同时我们使用的芯 片都来自a t g e n e x p r e s s 计划和g e o a t g e r t e x p r e s s 计划通过这一芯片平台 多国共同合 作研究拟南芥的全基因组表达情况 g e o t h eg e n ee x p r e s s i o no m n i b u s o i l 提供了免费 的芯片数据和第二代测序以及其他高通量的数据 通过最后筛选 确定使用以下3 组实 验芯片作为数据来源 编号为m e 0 0 3 2 8 的芯片 实验的目的是研究植物的盐胁迫下连续的时间点下的表达 情况 该实验共有芯片5 2 张 包含生物学样本2 6 组 每一组的组内重复为2 次 作者 是c e c i l i ad a n g e l o j o a c h i mk i l i a n j o e r gk u d l a o l i v e rb a t i s t i c 和s t e f a nw e i n l 编号为m e 0 0 3 3 8 的芯片 实验目的是研究植物体l5 分钟干旱胁迫刺激时的d n a 响 应 该实验共有芯片6 0 张 包含生物学样本3 0 组 每一组组内重复为2 次 作者是 c e c i l i ad a n g e l o j o a c h i mk i l i a n j o e r gk u d l a o l i v e rb a t i s t i c 和s t e f a nw e i n l 编号为g s e 7 6 4 1 的芯片 实验目的是研究植物体在盐胁迫下根的响应 该实验共有 芯片3 6 张 包含生物学样本1 2 组 每一组组内重复为3 次 作者是d i n n e n yj r w a n gj y l e ej 和b e n f e y p n 芯片的探针注释信息来自a f f y m e t r i x 公司 包含所有a f f y m c 缸 i xa t h l 2 5 k 芯片的 探针信息 对于m e 0 0 3 2 8 和m e 0 0 3 3 8 我们从m as b o h n c r th 的文章f 1 2 中直接利用处理 后的差异表达谱进行后续分析 而对于g s e 7 6 4 1 我们利用r 语言1 1 3 的l i m m a 包进行处理 后得到相应的差异表达谱 2 2 蛋白质相互作用数据 该论文用到的相互作用数据来自a t p i d h t t p a t p i d b i o s i n o o r g t 1 4 和 t a i r h 业 丛必盟堑坐i 亟q p 出 q 幽 1 5 中 包括实验证实的和预测的高可信度的数据 其 中实验证实的有3 6 5 1 对 总共蛋白质相互作用2 2 5 0 9 对 a t p i d a r a b i d o p s i st h a l i a n a p r o t e i n i n t e r a c t o m ed a t a b a s e 通过贝叶斯的方法整合了不 同来源的拟南芥相互作用蛋白 包括实验证实的和预测的蛋白质相互作用对 该网址可 东北林业大学硕士学位论文 以查询单个蛋白对应的蛋白质相互作用网络以及其他该蛋白的相关生物学注释 t a i r 是位于美国s t a n f o r d 的拟南芥信息资源网站 t h ea r a b i d o p s i si n f o r m a t i o n r e s o u r c e 是国际上最为权威的拟南芥基因组数据库和拟南芥基因组注释系统 具有丰 富的数据资源和最新的注释信息 拟南芥转录因子数据库d a t f 的每个条目都有t a i r 链接 可以直接查看最新更新信息 我们整理了t a i r 中更新于2 0 0 9 年0 5 月2 7 日的蛋 白质相互作用数据 2 3 转录调控数据 a g r i s t h ea r a b i d o p s i sg e n er e g u l a t o r yi n f o r m a t i o ns e r v e r 1 6 数据库提供了拟南芥启 动子的序列 转录因子和他们对应的目的基因 a g r i s 当前包含2 个子数据库 a t c i s d b a r a b i d o p s i st h a l i a n ac i s r e g u l a t o r yd a t a b a s e 拟南芥顺式调控数据库和a t t f d b a r a b i d o p s i st h a l i a n at r a n s c r i p t i o nf a c t o rd a t a b a s e 拟南芥转录因子数据库 这2 个数据库 为我们提供了大量的转录调控数据用于转录调控分析 其中a t t f d b 包含了大约1 7 7 0 个转录因子 最近又新收集了实验证实的调控网络数据a r a b i d o p s i st h a l i a n a r e g u l a t o r yn e t w o r k a t r e g n e t 他包含了1 0 6 5 3 对转录因子直接调控的下游的目的基 因 另外我们通过阅读文献也收集了7 7 5 8 对调控关系 其中的大部分都存在a g r i s 中 整合后 最后共有1 3 2 6 6 p m r s 涉及了8 5 t f 和1 0 2 5 5 目的基因 a t h a m a p 1 7 1 也娅 必凸盟 尘垦丛堑 亟型 数据库提供了拟南芥转录因子结合的信息 我们 从这一数据库中收集的8 6 个已知的转录因子来识别每个目的基因的转录因子结合位点 这一结合位点区域定位转录起始位点 t s s 的上游的2 0 0 0 b p 到下游1 0 0 b p 如果t s s 不 确定的话 我们以序列的a t g 为起始位点 我们认为如果某个基因存在特定的转录因子 的结合位点 那么我们认为该转录因子与这个基因存在着调控关系 我们总共收集了 5 0 0 0 多个目的基因对应的转录因子的调控作用对 一个基因可能被有多个转录因子调 控 同时一个转录因子可以调控多个基因 2 4 代谢途径的数据 k e g g 京都基因与基因组百科全书 是基因组破译方面的数据库 在后基因时代一 个重大挑战是如何使细胞和有机体在计算机上完整的表达和演绎 让计算机利用基因信 息对更高层次和更复杂细胞活动和生物体行为作出计算推测 k e g g 的p a t h w a y 数据 库整合当前在分子互动网络 比如通道 联合体 的知识 k e g g 的g e n e s s s d b k o 数 据库提供关于在基因组计划中发现的基因和蛋白质的相关知识 k e g g 的 c o m p o i 州d g n 化a n r e a c t i o n 数据库提供生化复合物及反应方面的知识 我们整理了k e g g 中拟南芥的每一个代谢途径对应的所有基因 最终收集了1 3 0 拟 南芥代谢途径以及对应的2 2 8 7 基因 6 2 拟南芥调控网络分析的数据幕础 2 5 本章小结 本章介绍了课题所有数据信息的来源 并详细介绍了数据搜集情况 关于本章的所 有数据总结见下表2 1 表2 1 数据来源及其相关描述及链接 7 东北林业大学硕士学位论文 3 拟南芥调控网络的整合及相关分析 3 1 研究内容 本论文的主要研究内容包括通过基因芯片共表达数据和转录因子结合位点的数据分 析盐胁迫及盐和干旱胁迫下的转录调控关系 还有通过差异基因在不同代谢途径富集情 况来推导代谢途径之间的联系 并运用数据挖掘过程 分析盐胁迫下转录调控机制 并 构建拟南芥胁迫下转录调控网络 其具体流程如图3 1 所示 a t h a m a p t f t a r g e tg e n e s r e g u l a t i o nd a t a me 0 0 3 3 8 c h i pd a t a d r o u g h ts t r e s s 一 g s e 7 6 4 1 c h i pd a t a s a l ts t r e s s m e 0 0 3 2 8 c h i pd a t a s a l ts t r e s s a g r i sk n o w nt f t a r g e tg e n e s r e g u l a t i o nd a t a fn e t w o r kme 0 0 3 2 8 i g s e7 6 4 1 me 0 0 3 3 8 卜r 1 函薪燕有鼠丽两 lg s e 7 鲢l n e t w o r km e r g e m e 0 0 3 2 8 g s e 7 6 4 1 b a s eo nt h ea g r i s p a t h w a ys i g n i f i c a n ta n a l y s i s 图3 1 分析流程图 m e r g ef i n a l d a t a p a t h w a y n e t w o r k 我们筛选出3 组胁迫相关的芯片表达谱数据 分别来自a t h a m a p 和a g r i s 的2 组 转录调控数据 1 组蛋白质相互作用数据 首先 计算三组芯片数据的差异表达基因 查 找差异表达基因对应的a t h a m a p 数据中所有转录因子 t f 的结合位点 然后分别计算差 异表达基因与转录因子在3 组芯片的相关系数 p c c 如果差异基因存在某个转录因子 的结合位点并且他们之间的相关系数大于0 7 的 我们认为差异基因与转录因子之间存 在着调控关系 基于3 组芯片和以上分析的a t h a m a p 调控数据 构建了3 个调控网络 并通过整合g s e 7 6 4 1 和m e 0 0 3 2 8 芯片数据构建了盐胁迫调控网络以及基于网络模式分 析进一步确定了胁迫下可能的调控机制 然后对其中1 个子网络进行了详细分析研究 通过整合g s e 7 6 4 1 m e 0 0 3 2 8 和m e 0 0 3 3 8 这3 组芯片数据 构建了盐和干旱胁迫共有 8 3 拟南芥调挖网络的整合及相关分析 的调控网络 a g r i s 来源的数据都是经过实验证实的调控数据 在3 组芯片中 我们分别筛选出 转录因子与目的基因都是差异表达基因的调控数据 然后构建g s e 7 6 4 1 和m e 0 0 3 2 8 的 共有的盐胁迫调控网络 将基于a t h a m a p 构建的盐胁迫调控网络与基于a g r i s 构建的 盐胁迫调控网络进行整合 并利用g o 注释 1 8 进行功能分析 并进一步结合来源于 a t p i d 1 4 和t a i r 的蛋白质相互作用数据进行了网络调控分析 为进一步阐述胁迫响应基因的表达机制 我们利用k e g g 中的代谢途径结合我们的 表达谱数据进行了显著性分析 获得了胁迫条件下显著表达的代谢途径 以及胁迫条件 下代谢途径之间的显著相关关系 3 1 1 芯片分析原理 基因芯片 g e n ec h i p 也叫d n a 芯片 d n a 微阵歹i j d n am i c r o a r r a y 寡核苷酸阵列 o l i g o n u c l e o t i d ea r r a y 是指采用原位合成 i ns i t us y n t h e s i s 或显微打印手段 将数以万计 的d n a 探针固化于支持物表面上 产生二维d n a 探针阵列 然后与标记的样品进行杂 交 通过检测杂交信号来实现对对生物分子 细胞 组织的高通量检测分析 他是将生 命科学研究中所涉及的不连续的分析过程 如样品制备 化学反应和分析检测 利用微 电子 微机械 化学 物理技术 计算机技术在固体芯片表面构建的微流体分析单元和 系统 使之连续化 集成化 微型化 3 1 2 共表达原理 大多数研究都假设具有相互作用的蛋白质或者共调控的蛋白质之间应该比随机蛋白 质之间具有更好的表达相关性 但是之前有报道说在基因组范围内表达相关性与蛋白质 相互作用之间并没有必然的联系 最近有工作通过研究物种之间的保守信息 进一步加 强了表达相关性与蛋白质相互作用之间的关联 本研究也认为表达相关性与蛋白质调控关系之间存在一定的联系 本论文统计了不 同的基因表达谱之间的相关系数 相关系数的计算方法有很多种 我们采用了 p e a r s o n 主要是因为处理的芯片数据量巨大 p e a r s o n 相关系数计算方法具有简单快捷 的优点 p e a r s o n 相关系数计算公式为 2 3 1 这里的x y 为两个基因在不同芯片中的表达值 勺值越接近于1 表示两个基因的表达谱越相似 若勺值等于一1 表示两条基因的表 达谱刚好完全相反 越接近于 1 表示相反程度越高 若勺值越接近于0 则表示两条 基因之间的相关联性越小 9 东北林业大学硕士学位论文 3 2 芯片分析流程 3 2 1 芯片预处理 首先进行芯片的预处理工作 a f f y m e t r i x 公司利用原位合成芯片的固有优势 独创 了一套p m m m 探针设计方案 其设计原理如下 每一个基因或e s t 都是由一个或几个 探针集 p r o b es e t 组成 每组探针集由1 1 2 0 对2 5m 茁的探针对 p r o b ep a i r 组成 每对探 针包括两个探针池 p r o b ec e i l 其中一个是完全匹配 p e r f e c t m a t c h p m 的 另外一个是 序列中间有一个碱基错配的 m i s m a t c h m m 本试验采用的芯片都是来自a 竭恤e 咄 公司开发的a 蛳n e h 奴a t h i 2 5 k 全基因组芯片 所有的芯片都是一个样本包括2 3 次 重复试验 在处理中我们对不同芯片中同一个样本的基因表达值采取重复试验的有效基 因表达值取平均值来进行计算 3 2 2 计算差异基因 在每一组中选取表达值变化大于2 倍的基因作为差异表达基因 在本研究中使用r 语言的l i m m a 包 1 9 来计算芯片的差异表达值 并计算共表达的相关系数 1 9 1 通过贝叶斯 校正的方法来计算差异值 r 语言代码如下 d a t a r e a d a f f y f i l e n a m e s c e l f i l e s 撑读入芯片数据 e s e t n n a d a t a d e s i g n m o d e l m a t r i x 一l f a c t o r c 1 l 2 2 2 c o l n a m e s d e s i g n g r o u p l 什 g r o u p 2 j e i t 1 m f i t e s e t d e s i g n c o n t r a s t m a t r i x m a k e c o n t r a s t s g r o u p1 g r o u p 2 l e v e l s d e s i g n f i t 7 c o n t r a s t s f i t f i t c o n t r a s t m a t r i x f i t 2 e b a y e s f i t 2 y t o p t a b l e f i t 2 c o e 仁l a d j u s t 竹f d r 一 s o r t b y b n n u m b e r 5 0 0 0 0 w r i t e t a b l e y f i l e r e s u l t t x t w 舶m e s f s 旷一x t 一 输出所有的探针的表达情况 计算每个基因的差异表达值以后 我们再进一步筛选差异值大于2 或小于 2 的那些基 因 3 2 3 计算相关系数 同样也通过r 语言来计算a t h a m a p 中整理的8 6 个t f 与差异表达基因之间在胁迫的 表达谱中的共表达相关系数 r 语言代码如下 d a t a r e a d t a b l e 竹s t r e s s p r e d a t a t x t 什 h e a d e r t s e p t 一 r o w n a m e s 1 撑导入处理好的 芯片数据 f f r e a d t a b l e t f p r o b e t x t n h e a d e r f s e p t 一 撑导入需要研究的转录因子 l o 3 拟南芥调控网络的整合及相关分析 g e n e r e a d t a b l e f c g e n e p r o b e t x t s e p t j 导入需要研究的差异表达基因 r e s u l t f i l e t f g v n ec o rs t r e s s d a t a t x t w 群打开一个文件用来存放结果 c a t p a t h w a y i f t f i l e r e s u l t f o r xi n1 d i m t o o 1 c a t a s c h a r a c t c r t t x 1 t f i l e r e s u l t c a t i l 6 l 阿e s u l d f o r i ji i l1 d i m g o n e 1 c a t a s c h a r a c t o r g c n e j i t f i l c r e s u l t q u e r y a s m a t r i x d a t a a s c h a r a c t e r g e n e j l f o r ii nl d i r n t f 1 m a t c h 一a s m a t r i x d a t a a s c h a r a c t e r t f i l v o c o r a s n u m e r i c q u e r y a s n u m e r i c m a t c h 撑计算任意2 个之间的p c c c a t v t f i l e r e s u l o c a t h l f i l e f r e s u l o c l o s e r e s u l t 撑关闭文件 3 3 整合差异表达基因与调控网络数据 经过以上分析 我们获得了3 组芯片数据中的差异表达基因 以及这些基因与 a t h a m a p 中整理的8 6 个转录因子相应的相关关系 为研究显著相关的转录因子与其目的 基因之间可能的调控关系 收集了这些差异基因对应的a t h a m a p 中转录因子结合位点的 数据 如果差异基因上游启动子区存在某个转录因子的结合位点 并与这个转录因子的相 关系数大于0 7 或小于 0 7 则认为该差异基因与此转录因子之间存在着调控关系 为获 得转录因子与下游的代谢途径之间的调控关系 我们将差异基因映射到相应的代谢途径 上 这样 基于3 组芯片和a t h a m a p 的调控数据 分别构建了3 个调控网络 这3 个调 控网络分别对应盐胁迫和干旱胁迫调控 为了研究盐胁迫和干旱胁迫下共有的调控机理 对这三个调控网络进行了整合 为了研究盐胁迫下的调控机理 整合g s e 7 6 4 1 和 m e 0 0 3 2 8 芯片数据构建了盐胁迫调控网络 东北林业大学硕十学位论文 以上的调控网络是基于a t h a m a p 数据构建的 通过与a g r i s 中的数据比较发现 2 个数据库之间共有的转录因子只有1 2 个 交集很小 因此我们基于a g r i s 中l 万多对 经过实验验证的调控关系 在3 组芯片中筛选差异表达的转录因子和目的基因 绘制3 个调控网络 并进一步整合g s e 7 6 4 1 和m e 0 0 3 2 8 芯片数据 构建了基于a g r i s 的盐胁 迫调控网络 3 3 1 基于a t h a m a p 构建盐胁迫调控网络 m e 0 0 3 2 8 和g s e 7 6 4 1 这2 组数据同为高盐浓度条件下根或根茎的基因表达谱 我们 以此为基础 将2 组数据整合构建了盐胁迫下的调控网络 首先 整合基于a t h a m a p 中的调控关系 与这2 个表达谱数据 构建了盐胁迫下的 调控网络 得到2 个网络 图3 2 a b 图3 2 a b 都是表示转录因子在盐胁迫下的转录 调控关系 a 图反映的是转录因子与下游基因的调控关系 b 图是反映转录因子与下游 代谢途径的调控关系 共有2 4 个转录因子 2 6 9 个目的基因 6 5 个代谢途径 其中的5 个 a t h 0 0 1 9 0 a t h 0 0 2 3 0 a t h 0 0 5 9 2 a t h 0 0 9 0 1 a t h 0 0 9 8 0 在后续的代谢途径分析中是显著表 达的 为了进一步确认这些网络中的差异表达基因的功能 我们对其进行了g o g e n e o n t o l o g y i 1 8 1 分析 表3 一l 列出的是盐胁迫调控网络中的基因在g o 分析中p 值最小的前 l o 个结果 我们发现这些基因的功能主要集中在胁迫响应 少数的几个集中在一些代谢 过柙 a 黼艇三 图3 2 盐胁迫下的转录调控网络 图3 2 a 图展示的是盐胁迫下转录因子与目的基因之间的调控关系 b 图展示的是盐胁迫下转 录因子与目的基因所对应的代谢途径之间的调控关系 其中三角形节点代表的是转录因子 圆形节 点代表的是目的基因 方形节点代表的是目的基因所在的代谢途径 红边表示的是转录因子激活下 游的基因或者代谢途径 绿边表示转录因子抑制下游的基因或者代谢途径 1 2 3 拟南芥调控网络的整合及相关分析 i l l i 目l e 目自 e l 目目目 e 自 i i i l i l i i 表3 1 盐胁迫条件下差异表达基因的g o 功能分析 具体可以参见b t n g o 堋 3 3 2 盐胁迫下的调控网络中的模式分析 我们对盐胁迫调控网络进行模式分析 模式是指在已知网络中的频繁出现的子网络 目前有m f i n d e r m a v i s t o f a n m o d 等软件 2 0 l 可以实现模式分析 前2 个工具不能 分析有向图 而f a n m o d 具有预测精确度高 分析速度快 且可以分析有向网络等优点 最终 我们利用f a n m o d 这个软件对盐胁迫下的调控网络进行模式分析 as i z e 3 s i z e 4 s i z e 5 bs i z e 3s i z e 4s i z e 5 图3 3 网络模式分析 a 列出的是转录因子与目的基因的调控网络 图3 2 a 的模式 b 列出的是转录因子与代谢途径 越一怂 随一随一风 1一八一八一八 1盥一风一嫩一搬一丝 冈一冈一冈一冈 一八一八一八一 1 东北林业大学硕士学位论文 的调控网络 图3 2 b 的模式 图中分别列出了各调控模式 3 4 5 个点 下可靠性 v a l u e 最高的前5 个 文章中未列出 黄点表示转录因子 a 图粉色点表示目的基因 b 图蓝点表示代谢途径 绿边表 示抑制作用 红边表示的是激活作用 a a 0 图3 4 子模式对应的子网络 a 对应的子模式是盐胁迫下转录因子与目的基因的调控网络中4 个点的模式 b 对应的子模式 是盐胁迫下转录因子与i b 的代谢途径的调控网络中5 个点的模式 对f a i 岍v i o o 筛选出的子模式进一步分析 图3 4 a 是盐胁迫下转录因子与目的基因 的调控网络中4 个点的调控模式 图3 3 a 中的子模式的实例 包含2 个转录因子 2 个目 的基因 转录因子a t 5 g 1 0 1 2 0 激活i m s 3 和抑制a c s 8 而转录因子r a v i 与两个目的 基因的作用相反 抑制i m s 3 和激活a c s 8 基于a t h a m a p 对这几个基因的结合位点分 析 i m s 3 a t 5 g 2 3 0 1 0 的动子区上有r a v l 和a t 5 g 1 0 1 2 0 t e i l 结合位点 r a v i 在其 正链上面有多个结合位点 1 9 2 4 一1 8 9 9 1 3 3 3 1 3 1 l 1 2 8 9 1 1 2 2 a t 5 g 1 0 1 2 0 t e i l 在正链上的结合位点 1 6 4 8 8 8 8 8 5 4 这2 个转录因子在i m s 3 启 动子区上的结合位点距离从2 3 4 b p 到1 0 7 0 b p a c s 8 a t 4 g 3 7 7 0 的启动子区上有r a v l 和a t 5 g 1 0 1 2 0 t e i l 结合位点 r a v l 在 a c s 8 启动子区的正链上有多个结合位点 1 6 9 6 1 6 7 4 一1 3 4 0 2 6 1 3 4 8 一8 1 负链 上也有多个结合位点 1 7 8 6 1 4 0 0 4 5 0 3 9 9 一3 6 1 6 3 a t 5 g 1 0 1 2 0 t e i l 在 a c s 8 启动子的正链上的结合位点 1 8 8 1 1 8 6 6 1 7 4 9 1 6 3 7 l1 2 7 负链上也有多 个结合位点 1 8 5 0 1 7 1 2 8 1 4 6 6 5 这2 个转录因子在a c s 8 启动子区上的结合位 点的距离从3 7 b p 到1 8 5 s b p 对该模式的2 个转录因子相关性分析 发现r a v i 和 a t 5 g 1 0 1 2 0 这2 个转录因子呈负相关 相关系数为 0 6 1 0 图3 4 b 对应的是盐胁迫下转录因子与目的代谢途径的调控网络中5 个点的调控模式 图3 3 b 中的子模式的实例 包含3 个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论