(控制科学与工程专业论文)基因调控网络构建方法研究.pdf_第1页
(控制科学与工程专业论文)基因调控网络构建方法研究.pdf_第2页
(控制科学与工程专业论文)基因调控网络构建方法研究.pdf_第3页
(控制科学与工程专业论文)基因调控网络构建方法研究.pdf_第4页
(控制科学与工程专业论文)基因调控网络构建方法研究.pdf_第5页
已阅读5页,还剩126页未读 继续免费阅读

(控制科学与工程专业论文)基因调控网络构建方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

r e s e a r c ho nc o n s t r u c t i o no f g e n e r e g u l a t o r y n e t w o r k s c a n d i d a t e :q i a n gb o s u p e r v i s o r :w a n gz h e n g - z h i ad i s s e r t a t i o n s u b m i t t e di np a r t i a lf u l f i l l m e n to ft h er e q u i r e m e n t s f o rt h ed e g r e eo fd o c t o ro fe n g i n e e r i n g i nc o n t r o ls c i e n c ea n de n g i n e e r i n g g r a d u a t es c h o o lo fn a t i o n a lu n i v e r s i t yo f d e f e n s et e c h n o l o g y c h a n g s h a ,h u n a n ,p r c h i n a m a r c h ,2 0 1 0 独创性声明 is 42618 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的 研究成果尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他入已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教 育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:日期:年月 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文 档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文 ( 保密学位论文在解密后适用本授权书。) 学位论文作者签名: 作者指导教师签名: 日期: 日期: 年月 年月 日 日 国防科学技术大学研究生院博士学位论文 目录 摘要j a b s t r a c t 一m 第一章绪论一1 1 1 引言1 1 2 研究背景2 1 2 1 布尔网络模型。2 1 2 2 微分方程模型3 1 2 3 贝叶斯网络模型4 1 3 论文的主要工作与创新5 1 3 1 主要研究内容5 1 3 2 主要创新工作7 1 4 论文的结构9 第二章系统生物学与基因调控网络11 2 1 系统生物学1 1 2 2 基因表达调控的分子生物学基础1 2 2 2 1 基因表达的机制1 3 2 2 2 基因表达的调控。1 4 2 3 基因调控网络的拓扑层次1 5 2 4 本章小结一1 9 第三章基于无时序芯片数据构建癌症基因调控网络功能模块2 1 3 1 癌症基因调控网络概述2 1 3 2 癌症基因网络构建方法研究一2 l 3 2 1 常用方法及问题2 1 3 2 2 癌症基因调控网络功能模块构建方法2 2 3 3 癌症特征基因筛选方法2 3 3 3 1 决策分类树方法2 3 3 3 2p t r e e 方法2 5 3 4 癌症特征基因的相关功能模块划分一2 7 3 4 1 共表达基因聚类2 7 3 4 2 基于g o 信息对共表达基因进行注释2 8 3 4 3 结合注释信息与芯片数据划分癌症特征基因2 8 第1 页 国防科学技术大学研究生院博士学位论文 3 5 基于文献挖掘方法构建癌症基因调控网络功能模块2 9 3 6 实验与结果分析3 0 3 6 1 特征基因提取3 0 3 6 2 结肠癌特征基因集划分3 1 3 6 3 基于文献挖掘方法构建调控网络模块3 4 3 7 本章小结3 6 第四章基于时序芯片数据构建动态基因调控网络3 9 4 1 基于贝叶斯网络模型的常用结构学习算法3 9 4 2 基于贝叶斯网络应用g e s 机制遗传算法构建基因调控网络4 1 4 2 1 马尔科夫等价空间。4 1 4 2 2 基于g e s 机制的遗传算法设计4 2 4 2 2 1 编码4 2 4 2 2 2 初始种群构建4 3 4 2 2 3 适应度函数4 4 4 2 4 4 遗传算子设计4 4 4 3 实验结果与分析4 6 4 3 1 参数选择4 6 4 3 2g e s 机制遗传算法与其它常用算法性能比较4 7 4 3 3g e s 机制遗传算法与标准遗传算法性能比较4 9 4 3 4 酵母基因调控网络构建4 9 4 4 基于动态贝叶斯网络模型构建基因调控网络。5 0 4 4 1 从静态网到动态网5 0 4 4 2 动态网的优势5 2 4 4 3 动态网络贝叶斯度量的可分解性5 2 4 4 3 1b n 的结构度量函数5 2 4 4 3 2d b n 的贝叶斯度量函数可分解性5 3 4 5 实验结果与分析5 4 4 5 1 实验平台5 4 4 5 2 标准网络a s i a 的动态贝叶斯网络结构学习5 4 4 5 3 酵母动态调控网络结构预测5 7 4 5 4 结果分析5 7 4 6 本章小结5 8 第五章融合芯片数据与序列信息构建调控网络转录模块5 9 5 1 基于芯片数据构建基因转录模块方法。5 9 第u 页 国防科学技术大学研究生院博士学位论文 5 2 融合芯片数据与序列信息提炼共调控基因6 0 5 2 1 共表达基因聚类6 0 5 2 2 结合基因序列信息提炼共调控基因6 l 5 2 3 实验结果与分析6 l 5 2 3 1 共表达基因聚类6 l 5 2 3 2 共调控基因提炼6 2 5 3 转录因子表达值估计。6 3 5 3 1 转录因子和共调控基因预测模型。6 3 5 3 2h m m 的基本理论6 4 5 3 2 1h m m 的定义6 4 5 3 2 2h m m 的基本算法6 6 5 3 3h m m 的数值稳定性7 2 5 3 4 实验结果与分析7 3 5 4 本章小结7 5 第六章基因调控网络隐变量与参数学习7 7 6 1 调控网络参数学习常用算法及存在的问题一7 7 6 1 1 基于非线性动力学系统模型学习基因调控网络参数一7 7 6 1 2 线性化方法一7 8 6 1 3 无迹卡尔曼滤波方法8 0 6 2 无迹粒子群算法8 2 6 2 1 粒子滤波方法8 2 6 2 2 基于无迹粒子群方法学习基因调控网络参数8 2 6 3 实验与结果分析8 4 6 3 1r e p r e s s i l a t o r 人工转录调控网络参数学习8 5 6 3 1 1r e p r e s s i l a t o r 模型介绍一8 5 6 3 1 2 参数设置8 6 6 3 1 3 粒子数目对隐变量估计效果的影响8 7 6 3 1 4u p s f 与u k f 模型的隐变量估计性能比较8 8 6 3 2j a k s t a t 信号通路调控参数学习8 9 6 3 2 1j a k - s t a t 信号通路介绍8 9 6 3 2 2 基于实验数据学习j a k s t a t 通路中的变量与参数9 0 6 4 本章小结9 2 第七章结束语:9 5 7 1 论文工作总结9 5 第1 l i 页 国防科学技术大学研究生院博士学位论文 7 2 未来工作展望一9 6 致谢一9 9 参考文献表10 1 作者在学习期间取得的学术成果一11 3 第1 v 页 国防科学技术大学研究生院博士学位论文 表目录 表3 1同时执行m 个检验的检验结果2 8 表3 2 分类能力显著的结肠癌特征基因集3 0 表3 3e f s t 与p - t r e e 算法性能比较3 l 表3 4 芯片数据结合g o 信息对结肠癌特征基因集划分结果31 表3 5 用于构建调控网络功能模块的3 个结肠癌特征基因子集3 4 表4 1不同算法对标准网络a s i a 进行预测得到的结果指标均值比较4 8 表4 2 算法指标比较的统计显著性分析4 9 表4 3g e s 机制遗传算法与标准遗传算法性能比较。4 9 表5 1有统计意义高频出现的核苷酸序列在基因启动子区域中所处的位置6 2 表6 1u p s f 对未知参数与隐变量估计均方根误差的统计8 7 第v 页 国防科学技术大学研究生院博士学位论文 图目录 图1 1 布尔网络模型2 图2 1d n a 编码功能域划分1 3 图2 2 酵母转录调控网络的6 种基序1 7 图2 3 前馈回路基序类别1 8 图3 1e f s t 方法基本框架2 3 图3 2p - t r e e 决策树示例2 6 图3 3结肠癌基因调控网络功能模块3 6 图4 1结构不同但概率分布相同的图结构示例4 2 图4 2网络结构编码示例4 3 图4 3 基于g e s 机制遗传算法构建调控网络流程4 6 图4 4 a s i a 网络4 7 图4 5 酵母基因调控网络5 0 图4 6d b n 示意图。5 l 图4 7 静态与动态贝叶斯网络模型对循环的描述5 2 图4 8 动态a s i a 网络5 5 图4 9g e s 机制遗传算法应用于a s i a 动态网络结构寻优过程5 6 图4 1 0a s i a 动态网络结构预测结果5 6 图4 1 1 酵母细胞周期基因动态网络预测结果5 7 图5 1共调控基因与公共转录因子调控关系6 3 图5 2h m m 图形模式6 4 图5 3h m m 组成示意图6 5 图5 4 前向算法和后向算法示意图6 8 图5 5 转录因子表达值预测与验证7 4 图6 1常规与无迹卡尔曼滤波估计非线性系统参数与隐变量性能比较8 1 图6 2r e p r e s s i l a t o r 模型8 5 图6 3u p s f 对蛋白质浓度的估计8 8 图6 4u k f 与u p s f 的估计性能比较8 9 图6 5j a k s t a t 信号通路9 0 图6 6 基于u p s f 对细胞质中磷酸化s t a t 5 及s t a t 6 总量的估计9 1 图6 7j a k s t a t 通路中不可观状态变量的估计9 2 第v l 页 国防科学技术大学研究生院博士学位论文 摘要 基因调控网络是由一组或多组基因、蛋白质、小分子以及它们之间的相互调控作 用所构成的复杂生化系统。目前,基因调控网络的预测与重构是生物信息学研究中一 个崭新的研究领域。它试图通过基因芯片表达谱数据反向挖掘基因间的关联信息,通 过可视化技术再现基因间相互作用的网络拓扑结构,揭示基因间复杂的作用机理及基 因功能信息。为了对庞大而复杂的调控网络进行动力学分析,仅仅靠观察与描述的方 法是难以实现的,因此需要引入数学工具对其建立模型进行分析和模拟。在此背景下, 本文以预测重构基因调控网络为主题,基于不同类型的芯片表达谱数据信息,对基因 调控网络的结构学习与参数辨识进行了深入的研究和分析,其主要内容与创新之处包 括: ( 1 ) 基于无时序芯片数据的癌症基因调控网络功能模块构建方法研究。 癌症在生理、组织和细胞水平上均呈现出一定的复杂性。由于癌症基因芯片数据 一般由不同患者的癌症组织和正常组织样本的芯片实验汇集而得,因此不具备时序信 息。目前基于无时序芯片数据构建癌症调控网络的方法所获结果普遍准确率不高且规 模庞大,具有极复杂的调控动力学性质,为进一步对其进行描述与分析造成了很大的 困难。针对这一现状,本文提出了一种基于无时序芯片表达数据的癌症基因调控网络 功能模块构建方法:该方法首先在很大程度上提高了癌症特征基因的筛选速度:其次 在网络构建工作上将调控网络划分为不同的功能模块分别进行构建,相对于目前其它 方法,所获得的调控网络模块不仅具有明确的生物意义,在结构上也更简约;最后通 过文献挖掘方法引入了一定数量在调控过程中与特征基因直接或间接发生联系的其 它基因,使得构建的癌症特征基因调控网络功能模块不仅准确率大为提高,内容也更 加丰富。 ( 2 ) 基于时序芯片数据的动态基因调控网络模块构建方法研究。 基因间的调控是随时间、环境变化的动态事件,因此基因调控网络属于连续复杂 动态系统。与不具备时间信息的芯片表达数据相比,时间序列基因j 卷片表达数据包含 更丰富的基因调控信息。本文提出了一种基于贪婪等价搜索机制的遗传算法对调控网 络结构进行学习,该方法通过引入遗传算法的多点并行性,使得算法易于摆脱局部最 优;通过编码网络结构作为遗传算法的染色体和设计基于g e s 机制的变异算子,使 网络的进化过程基于马尔科夫等价空间而不是有向无环图空间,相对于标准遗传算法 大大加速了网络进化过程。通过将基于此方法构建得到的酵母基因调控网络模块与相 关实验文献与数据库比较,该方法的准确性得到了验证。最后通过将所提出的算法与 动态贝叶斯网络模型相结合,克服了之前无法对基因之间反馈调控作用建模的缺陷, 第i 页 国防科学技术大学研究生院博士学位论文 进一步加强了所提出方法对基因调控网络的重构能力。 ( 3 ) 融合基因芯片表达谱数据与对应序列信息构建调控网络转录模块。 基因表达芯片数据常用于分析转录因子和靶基因之间的调控关系。在不同生物过 程或环境条件下,基因表达的变化通过调控关系进行传递,最终实现生物功能,因此 多个基因的时间序列表达数据之间的关系自然成为人们理解生物过程调控机理的重 要信息。基于基因表达数据得到的调控网络模块一般称为转录模块,表示在转录过程 中与相同调控因子相结合的共调控基因集合。目前基于芯片数据构建转录模块的方法 普遍存在两点缺陷:首先共表达基因普遍被作为共调控基因研究,但共表达未必共调 控;其次由于模块中转录因子一般未知,因此难以对转录因子与目标基因间的调控关 系进行量化分析。本文首先采用模糊c 均值方法聚类共表达基因;然后对所获聚类 结果中的每个基因截取其转录起始位点上游8 0 0b p 作为启动子区域,查找其中具有 统计学意义高频出现的核苷酸序列作为转录因子结合位点,通过检查转录因子结合位 点在该类别基因启动子区域中是否存在对共调控基因进行提炼;最后将转录因子作为 h m m 模型中的隐变量节点,靶基因作为可观测节点,分别基于顺势调控与反式调控 两种情况,通过b a u m - w e l c h 算法对模型参数进行学习,并采用v i t e r b i 解码算法对 转录因子表达序列作出了有效预测。 ( 4 ) 基因调控网络模块参数与隐变量学习。 基因调控网络中的参数与隐变量对量化分析细胞周期的生物过程具有不可替代 的作用。基因调控网络的结构被确定之后,需要进一步对网络参数进行学习。目前基 于微分方程模型学习网络参数的工作普遍基于卡尔曼滤波器,但卡尔曼滤波器对所分 析系统有线性假设,而基因调控网络具有很强的非线性,因此目前对基因调控网络进 行参数学习工作的精确度具有很大提高空间。本文提出了一种基于无迹粒子群滤波的 方法学习基因调控网络参数与隐变量,通过采用无迹卡尔曼滤波器产生粒子滤波的重 要性密度函数,得到了更高的估计精度。 我们将本文提出的方法分别应用于仿真网络r e p r e s s i l a t o r 与真实基因调控网络 :i a k - s t a t 通路,对网络中不可观测的隐变量及未知网络参数进行学习,由于算法不 受线性模型假设的约束,取得了良好的效果。相对于目前基于卡尔曼滤波器模型的各 种算法,在减少对网络中隐变量与未知参数的估计误差方面有很大的改进。 关键词:基因调控网络;癌症;时序芯片数据;动态网络;转录模块;信息融合;参 数学习;粒子滤波 第i i 页 国防科学技术大学研究生院博士学位论文 a b s t r a c t g e n er e g u l a t o r yn e t w o r k ( g 砌叼i sac o m p l e xb i o c h e m i c a ls y s t e mw h i c hc o n s i s t s o fs e t so fg e n e s ,p r o t e i n s ,s m a l lm o l e c u l e sa n dt h e i ri n t e r a c t i o n s p r e s e n t l yt h ep r e d i c t i o n o fg r ni san e wr e s e a r c hf i e l di nb i o i n f o r m a t i c s ,a n di ta t t e m p t st or e v e r s e l yo b t a i nt h e r e l a t i o n s h i p sb e t w e e nt h eg e n e sb a s e do nm i c r o a r r a yd a t a , a n dr e b u i l dt h es t r u c t u r eo fg e n e r e g u l a t o r yn e t w o r k sb yv i s u a l i z a t i o nt e c h n o l o g y ,t h e r e f o r et h ec o m p l e xi n t e r a c t i o n sa m o n g g e n e sa r ed i s c o v e r e d d e p e n d i n go no b s e r v a t i o na n dd e s c r i p t i o nt om a k eak i n e t i c s a n a l y s i sf o rt h eh u g en e t w o r ki sd i f f i c u l t , s om a t h e m a t i c a lt o o l sa r en e e d e dt ob u i l dm o d e l s f o r a n a l y s i s a n ds i m u l a t i o n o nt h i s b a c k g r o u n d ,t h i sd i s s e r t a t i o ni sf o c u s e do n r e s t r u c t u r i n gt h eg e n er e g u l a t o r yn e t w o r k s b a s e do nd i f f e r e n tk i n do fm i c r o a r r a yd a t a , d e 印s t u d yi sm a d ef o rt h eg e n er e g u l a t o r yn e t w o r k s s t r u c t u r el e a r n i n ga n dp a r a m e t e r s i d e n t i f i c a t i o n 砀em a i nc o n t e n t sa n dc o n t r i b u t i o n so ft h ed i s s e r t a t i o na l es u m m a r i z e da s f o l l o w s : ( 1 ) t h er e s e a r c ho nb u i l d i n gt h ef u n c t i o n a lm o d u l e so fc a n c e rg e n e sr e g u l a t o r y n e t w o r kb a s e do nm i c r o a r r a yd a t aw i t h o u tt e m p o r a lo r d e ri n f o r m a t i o n c a n c e rp r e s e n t s c o m p l e x i t y o np h y s i o l o g i c a l ,t i s s u ea n dc e l l u l a rl e v e l s t h e m i c r o a r r a yd a t ao fc a n c e ri sg e n e r a l l ym i x e db ys a m p l e so nd i f f e r e n tp a t i e n t s ,s oi td o e s n o tp o s s e s st h e t e m p o r a l o r d e ri n f o r m a t i o n p r e s e n t l yt h e a c c u r a c yo fm e t h o d sa r e c o m m o n l yl o wf o rc o n s t r u c t i o no fc a n c e rg e n e sr e g u l a t o r yn e t w o r k sb a s e do nm i c r o a r r a y d a t aw i t h o u tt e m p o r a lo r d e ri n f o r m a t i o n ,a n dt h eo b t a i n e dn e t w o r k sg e n e r a h yh a v eh u g e s c a l e s ,w h i c hb r i n g sg r e a td i f f i c u l t yf o rf u r t h e rd e s c r i p t i o na n da n a l y s i s a i m i n ga tt h i s s i t u a t i o n ,t h i sd i s s e r t a t i o np r e s e n t san o v e lm e t h o df o rb u i l d i n gt h ef u n c t i o n a lm o d u l e so f c a n c e r g e n e sr e g u l a t o r yn e t w o r kb a s e do nm i c r o a r r a yd a t aw i t h o u tt e m p o r a lo r d e r i n f o r m a t i o n :f i r s t l yt h es p e e do fs e l e c t i n gf e a t u r eg e n e so nc a n c e ri sg r e a t l yi n c r e a s e d ;i n t h es e c o n dp l a c et h er e g u l a t o r yn e t w o r ki sd i v i d e di n t od i f f e r e n tf u n c t i o nm o d u l e sa n dt h e n b u i l dr e s p e c t i v e l y ,t h i sn o to n l ym a k e st h eo b t a i n e dm o d u l e sh a v em o r eb i o l o g i c a l s i g n i f i c a n c e ,b u ta l s ot h en e t w o r km o d e li ss i m p l i f i e d ;f i n a l l ys o m eg e n e sa r ei n t r o d u c e d w h i c ha r ei n t e r a c t e d 谢t l lt h ef e a t u r eg e n e si nt h er e g u l a t o r yp r o c e s s e sb yl i t e r a t u r em i n i n g , t h e r e f o r et h en e t w o r km o d u l e s c o n t e n ti sm o r ea b u n d a n t ,a n dt h ea c c u r a c yo fo b t a i n e d m o d u l e s s t r u c t u r ei si m p r o v e d ( 2 ) t h er e s e a r c ho nb u i l d i n gm o d u l e so fd y n a m i cg e n er e g u l a t o r yn e t w o r kb a s e do n t e m p o r a lm i c r o a r r a yd a t a t h er e g u l a t i o nb e t w e e ng e n e si sad y n a m i ce v e n tw h i c hi sc h a n g e d 、肮t 1 1t i m ea n d 第i i i 页 国防科学技术大学研究生院博士学位论文 e n v i r o n m e n t ,s og e n er e g u l a t o r yn e t w o r kb e l o n g st oc o n t i n u o u s l yd y n a m i cs y s t e m c o m p a r e dt od a t aw h i c hh a sn o tt e m p o r a lo r d e r , t h et e m p o r a lm i c r o a r r a yd a t ah a sm o r e r i c hi n f o r m a t i o n t h i sd i s s e r t a t i o np r e s e n tan e wg e n e t i ca l g o r i t h mb a s e do ng r e e d y e q u i v a l e n c e s e a r c hm e c h a n i s mt ol e a r n t h es t r u c t u r eo fr e g u l a t o r yn e t w o r k s :b y i n t r o d u c i n gt h ep a r a l l e l i s mo fg e n e t i ca l g o r i t h m ,t h em e t h o di sa p tt oa v o i dt h e l o c a l o p t i m i z a t i o n ;e n c o d i n gt h en e t w o r ks t r u c t u r ea st h ec h r o m o s o m e so f t h eg e n e t i ca l g o r i t h m a n dd e s i g n i n gt h em u t a t i o no p e r a t o rb a s e do ng r e e d ye q u i v a l e n c es e a r c hm a k et h e e v o l u t i o np r o c e s so fn e t w o r ks t r u c t u r ei nm a r k o ve q u i v a l e n c es p a c e ,o t h e rt h a nd i r e c t e d a c y e l i cg r a p hs p a c e t h em e t h o dp r e s e n t e di sa p p l i e dt oy e a s tg e n e sn e t w o r k s ,a n d w i t h c o m p a r i s o nt ot h er e l a t e de x p e r i m e n t sa r t i c l e sa n dd a t ab a s e s ,t h ee f f i c i e n c yo f o u rm e t h o d i sv a l i d a t e d f i n a l l yb yc o m b i n i n gm ya l g o r i t h m 、析t l ld y n a m i cb a y e s i a nn e t w o r km o d e l , t h el i m i t a t i o no nf a i l i n gt om o d e lt h ef e e db a c ko fr e g u l a t i o nm e c h a n i s mi so v e r c a m e ( 3 ) a n a l y s i so fm o d u l eo fc o - r e g u l a t e dg e n e sb yi n t e g r a t i n g i n f o r m a t i o nf r o m m i c r o a r r a ya n ds e q u e n c e s m i c r o a r r a yd a t ai so f t e nu s e dt oa n a l y z et h er e l a t i o n s h i pb e t w e e nt r a n s c r i p t i o nf a c t o r s a n dt a r g e tg e n e s i nd i f f e r e n tb i o l o g i c a ls i t u a t i o n s ,t h ec h a n g e so fg e n e s e x p r e s s i o n s t r a n s f e rb yt h er e l a t i o n s h i p st or e a l i z et h eb i o l o g i c a lf u n c t i o n s t h u st h er e l a t i o n s h i p so f t e m p o r a lm i c r o a r r a ye x p r e s s i o nd a t ao fm u l t i p l eg e n e sn a t u r a l l yb e c o m et h ei m p o r t a n t i n f o r m a t i o nt ou n d e r s t a n dt h er e g u l a t o r ym e c h a n i s mo fb i o l o g i c a lp r o c e s s e s t h em o d u l e o fr e g u l a t o r yn e t w o r ko b t a i n e df r o mm i c r o a r r a yd a t ai so f t e n c a l l e da st r a n s c r i p t i o n m o d u l e ,w h i c hm e a n st h ec o - r e g u l a t e dg e n e sb i n d i n gt ot h es a m er e g u l a t o r yf a c t o ri nt h e t r a n s c r i p t i o nf a c t o r p r e s e n t l yt h ec o n s t r u c t i o nm e t h o d so f t h et r a n s c r i p t i o nm o d u l e sb a s e d o nm i c r o a r r a yd a t ag e n e r a l l yh a v et w od e f e c t s :f i r s t l yt h ec l u s t e r e dc o e x p r e s s e dg e n e s o b t a i n e df r o mm i c r o a r r a yd a t aa r en o ta l w a y sc o r e g u l a t e d ;s e c o n d l yq u a n t i t a t i v ea n a l y s i s o ft h er e l a t i o n s h i p sb e t w e e nt r a n s c r i p t i o nf a c t o ra n dt a r g e tg e n e si sd i f f i c u l tb e c a u s eo ft h e u n k n o w no ft h ec o m m o nt r a n s c r i p t i o nf a c t o r t h i sd i s s e r t a t i o nc l u s t e r st h ec o e x p r e s s e d g e n e sb ym e t h o do ff u z z yc = m e a n sc l u s t e r i n g n ei n f o r m a t i o ni nt h eb i o l o g i c a lp r o c e s s i s r e m a i n e dt ot h eb i g g e s te x t e n tb e c a u s et h eo b t a i n e dc l u s t e r sc o u l db eo v e r l a p p e d ,a n dt h e i n t e r n a ls t r u c t u r eo ft h ec l u s t e r si sp r o v i d e dt oe s t a b l i s ht h ec l a s s i f i c a t i o ns t a n d a r d s t h e n t h es e q u e n c e so f8 0 0b pl e n g t ho fe v e r yg e n ei nt h es a m ec l u s t e ra r ei n t e r c e p t e da st h e i p r o m o t e rr e g i o n s ,h i g h - f r e q u e n c yo c c u r r e ds e q u e n c ew h i c hh a s _ s t a t i s t i cs i g n i f i c a n c ei nt h e p r o m o t e rr e g i o n s i ss e l e c t e da s t h et r a n s c r i p t i o nf a c t o rb i n d i n gs i t e ,t h e r e f o r et h e c o r e g u l a t e dg e n e sa r ee x t r a c t e df r o mt h ec o e x p r e s s e dg e n e sb ye x a m i n a t i o no ft h e e x i s t e n c eo ft h et r a n s c r i p t i o nf a c t o rb i n d i n gs i t e f i n a l l yt h et a r g e tg e n e sa r er e g a r d e da s 第i v 页 国防科学技术大学研究生院博士学位论文 t h eo b s e r v e dn o d e si nh i d d e nm a r k

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论