(应用化学专业论文)特定功能基因的非编码区信息分析及进化研究.pdf_第1页
(应用化学专业论文)特定功能基因的非编码区信息分析及进化研究.pdf_第2页
(应用化学专业论文)特定功能基因的非编码区信息分析及进化研究.pdf_第3页
(应用化学专业论文)特定功能基因的非编码区信息分析及进化研究.pdf_第4页
(应用化学专业论文)特定功能基因的非编码区信息分析及进化研究.pdf_第5页
已阅读5页,还剩90页未读 继续免费阅读

(应用化学专业论文)特定功能基因的非编码区信息分析及进化研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国科学技术大学硕士学位论文 中文摘要 摘要内容:作为后基因组时代的主要任务之一,非编码区的功能研究是当今的 热点研究领域。为了更进一步揭示非编码区的功能,本文通过对人类组织特异性 基因的非编码区信息( 如选择性启动子、可转移元件、重复元件以及c p g 岛等) 进行识别和提取,利用生物信息学技术对这些非编码区特征以及不同功能的人类 组织特异性基因进行了比较深入地研究。结果显示:1 ) 不同种类的人类组织特 异性基因具有不同的非编码特征( 如特定的选择性启动子类型、可转移元件和重 复元件成相反趋势等) ,推测这些不同的非编码信息特征可能在相应基因的功能 分化调控中起重要作用:2 ) 通过系统地比较分析环境应答基因和人类组织特异 性基因及其在小鼠中相应的同源基因的选择压力及进化速率等,发现处于信号通 路不同阶段的人类组织特异性基因具有不同的进化速率,但有趣的是他们却具有 相似的同义选择压力( k s ) ,这表明进化速率的不同可能并非由不同的突变率导致, 而更有可能是由非编码区的不同调控元件的选择所致;3 ) 与环境应答相关的基 因相比,发现人类组织特异性基因并非进化最快的基因,数据显示他们至少比细 胞通信及细胞分化相关的环境应答基因进化速率小。本文结果为更加精细的非编 码区功能注释奠定了基础,对特定功能基因的进化以及转录调控网络研究都具有 积极的推动作用。 关键词:组织特异性基因;环境应答基因;非编码区;选择性启动子; 功能元件;进化速率;选择压力: ab s t r a c t c 0 m e n t :a so n ea r d u o u s c h a l l e n g eo fp o s t g e n o m ee r a ,t l l e 孤n o t a t i o na l l d d e c i p h e r m e n to fn o n c o d i n gr e g i o n sb e c o m et h ef o c u sa 1 1 dh o t s p o ti nc u r r e n ts t u d i e s f o rf 证t h e rr e v e a l i n gt h em n c t i o n so fn o n c o d i n g r e g i o n s ,i nt h i sa n i c l e ,w ei d e n t i f i e d 虹i e n o n c o d i n gi n f o n n a t i o no fh u m 孤t i s s u e s p e c i f i cg e n e s ,s u c ha st h ea l t e m a t i v e p r o m o t e r s ,c p gi s l a n d s ,t r a j l s p o s a b l ee l e m e n t s ,o t h e rr e p e a te l e m e n t sa n ds oo n t h e n t | l eh u m a nt i s s u e s p e c i f i cg e n e sh a v eb e e nc l a s s i f i e da c c o r d i n gt ot h er e s p e c t i v ep k 屺e i n v o l v e di nt h er e g u l a t o r yp a t h w a y ,赳l dt h er e l a t e dn o n c o d i n gf e a t u r e sh a v eb e e n c o m p a r a t i v e i ya n a i y z e d 锄o n gt h ed i 虢r e n tc a t e g o r i e so fh u m a n t i s s u e s p e c i f i cg e n e s u s i n g b i o i n f o n n a t i o n a it e c l u l o l o g y n l er e s u l t si n d i c a t e dt h a t1 ) t h ed i 恐r e mc l a s s e so f h u m a nt i s s u e - s p e c i f i cg e n e sh a v ed i s t i n c tn o n c o d i n gc h 锄l c t e r i s t i c s t h i si m p l i e st h a t m ed i s s i m i l a rn o n c o d i n gf e a t u r e s ,s u c h 懿m ed i 疵r e n tt y p e so fa l t e m a t i v ep r o m o t e r s 锄di n v e r t e dt r e n d sb e t w e e nt h et r 锄s p o s a b i ee l e m e n t sa n do t h e rr e l ) e a te l e m e n t s ,m a y c o n t r i b u t et ot h er e g u l a t i o no ff | u n c t i o n d i v e r g e n c ei nc o n s i d e r e dg e n e s 2 ) w e e x a m i n e dd i 行宅r e n t t y p e so fs e i e c t i o np r e s s u r e s 【e g a g a i n s t 锄i n oa c i dm u t a t i o n s ( k a k s ) ,a g a i n s tm u t a t i o n s a t s y n o n y m o u s s i t e s ( k s ) ,a g a i n s t m u t a t i o n sa t n o n s y n o n y m o u ss i t e s ( k a ) 】b y 冬y s t e m i ca n a l y s e so fh u m a nt i s s u e - s p e c i f i cg e n e s ,t h e e n v l r o i l n l e n t a lr e s p o n s eg e n e sa i l dt l l e i r h o m o l o g o u sg e n e si nm o u s e t h e ( i a _ t a d e m o n s n a t et h a tt h ed i 行e r e n tc a t e g o r i e so fh u m a n t i s s u e - s p e c i f i cg e n e sa r es u b j e c tt o d i 丑奄r e n te v o l u t i o n a r yf o r c e s 。h o 、v e v e r ,t h es i m i l a rk si m p l yt h a tt h e d i v e r g e n t e v 0 l u t i o nr a t i om a yr e s u l t 舶mt h ep 谢f y i n gs e l e c t i o nf o rc r u n sa i l d p r o t e i n 劬c t i o n ,n o tt h em u t a t i o nr a t i o 3 ) n o ta l lt y p e so fh u m a j l 矗s s u e s p e c i f i cg e n e s e v o i v em o r eq u i c k l yb yc o m p a r e dw i t l le n v i r o n m e n t a lr e s p o n s eg e n e s o u rr e s u h s s h o wt t 埘m o s to fh 唧a n t i s s u c s p e c i n cg e n e se v o l v em o r es l o w l yt h a l lc e l l - s i g n a l i n g 锄dc e l l d i v i s i o nr e l a t e de n v i r o 啪e n t a lr e s p o n s eg e n e s o u rr e s u l t ss h e dl i 曲to nt h e n o n - c o d i n gr e g i o np r o p e n i e so fd i 日e r e n tk i n d so fh u m a nt i s s u e s p e c i f i cg e n e sn o t r e v e a l e db e f o r ea n dt h c r e f o r e p r o v i d ea 垃锄e w o r kf o rm o r er e f i n e d 矗m c t i o n a l a r m o t a t i o n so fn o n c o d i n gr e g i o n si nh 啪a nt i s s u e s p e c i f i c g e n e s ,a sw e l la sa r e 凫r e n c eb 嬲e 内r 允r t h e rd e c i p h e m l e n ta b o u tt h et 舢s c r i p t i o nr e g u l a t i o na r l dt h c e v o l u t i o no fc e r 面ng e n e s k e y w o r d s : t i s s u e s p e c i 矗cg e n e ;e h v i r o 吼e n t a lr e s p o n s eg e n e ;n o n c o d i n gr e g i o n ; a l t e n l a t i v ep r o m o t e r ;r e g u l a t i o ne l e m e n t ;e v o l u t i o nr a t i o ;s e l e c t i o np r e s s u r e ; 2 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与本人一起工作过的个人以及 对本论文的研究工作所做的任何贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复印手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 勺奶弋 作者签名轰于曼 御年s 月刃日 中国科学技术大学硕士学位论文 第一章引言 伴随着“什么是生命? 生命的本质是什么? ”这个古老而又年轻的话题,一代 代卓越的科学家在探索未知的道路上接踵前行。一次次天才的设想,一个个新理 论的验证铸造了生命探索史上的一座座里程碑。 早在1 9 世纪,e w a l dh e r i n g 和s 锄u e lb u t l e r 便提出了“遗传是一种形式的 记忆,一种储存信息的传递”,同期,随着d e l b r n c k 的“遗传传递中的信息”概念 的提出,“信息”便成为了生命探索的内在推动力。d 删i n 和m e n d e l 又将人们的 视线指引到:这种“信息”的长期进化传承、与环境互作以及和表型关系等这些我 们今天熟知而仍然存在许多未知的话题。近半个世纪后,随着a v e 巧等人证明 “d n a 是遗传物质”的实验成功完成,这种“信息”的奥秘开始露出了冰山一角。 随后不久,n o b e l 奖获得者w a t s o n 和c r i c k 于1 9 5 3 年提出了“d n a 双螺旋结构” 的天才设想。从此,关于生命“信息”的研究进入了分子时代。 历史的车轮滚入到2 0 世纪下半叶,随着测序等分子生物学技术的发展成熟, 一个具有划时代意义的计划人类基因组计划( h 啪a i lg e n o m ep r o j e c t ,简 称h g p ) 由美国科学家在1 9 8 5 年率先提出,其目的在于破译人类全部遗传信息。 h g p 于1 9 9 0 年正式启动后,数据“爆炸”,一门新兴学科生物信息学应运 而生。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭 示数据所蕴含的生物学意义的目的。由于当前生物信息学发展的主要推动力来自 分子生物学,生物信息学的研究主要集中于核苷酸、氨基酸及蛋白序列、结构以 及作用网络的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地 理解为:将计算机科学和数学应用于生物大分子及其相互作用的网络信息的获 取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学 意义的交叉学科。 随着“第三次技术革命”的逐渐深入,以“是什么样”为主的结构基因组学开始 向“为什么这样”转化,随即进入了以功能基因组学、转录组学、蛋白质组学和代 谢组学为主的后基因组时代。本论文便在此种大背景下,主要利用比较基因组学 及生物信息学方法,对几类特定功能基因的非编码区功能信息进行研究,同时也 对这几类特定功能基因的进化特征进行了初步分析,目的是为了更进一步揭示非 编码区的功能以及为更加精细的非编码区功能注释奠定理论基础,推动功能基因 的进化以及转录调控网络研究的快速发展。 串凝释学技术大学矮l :学链论文 第一节生物信息学相关研究概述 生物信息学是伴随着基因缝研究丽产生和发展的,其发展历程大致经历了三 个阶段,蘸基因组时代:这一阶段生物信息学的主要工作包括生物数据库的建立, 检索工具的开发以及d n a 和蛋白质序列分析;基因组时代:这一阶段生物信息 学的主要工作是大量核苷酸序别测定、分析、新基因寻找和识别,以因特网为基 础的网络数据库系统的建立和交互界面的开发以及基因缀序列信息的提取分析 等;后基因组时代:这一阶段生物信息学的主要研究工作将包括蛋白质组学研究 及人类基因组注释。 随着研究的逐步深入,其研究内容与形式也产生了分纯,主要分为以下凡个 方蘑:结构基因组学的研究、比较基因组学的研究、功能基因组学的研究、药物 基因组学的研究、环境基因组学的研究:以转录产物分析为代表的转录组研究; 蛋白质的结构与功能的研究、鬣白质分子相互作用及其作用途径的研究。具体说, 是从核酸稻蛋囱质序列出发,分析序到中表达的结构与功能的生物信患。其研究 内容主要包括:( 1 ) 新基因的发现与鉴定;( 2 ) 完整基因组的比较研究;( 3 ) 非 编码区信息结构分析及调控网络研究;( 4 ) 大规模基因功能表达谱的分析:( 5 ) 蛋白质功能及相互作用网络研究;( 6 ) 遗传密码起源和生物进化的研究:( 7 ) 生 物大分子的结构模拟与药物设计。 本文主要利用比较基因组学等生物信息学方法进行分析研究。 比较基因组学是基于基因组图谱和测序基础上,对已知的基因和基因组结 构进行纥较,来了解基因的功能、表达机理和物种进化的学科。利髑模式生物 基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因, 揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。,目 前从模式生物基因组研究中得出一些规律:模式生物基因组一般比较小,但编 码基因的比铡较高,重复顺序耧菲编码顺序较少;其gc 含量比较高;内含予 和外显子的结构组织比较保守,剪切位点在多种生物中一致;d n a 冗余,即重 复:绝大多数的核心生物功能由相当数量的。吡o l o g o u s 蛋白承担;s y n t e n y 连 锁的同源基因在不同的基因组中有相同的连锁关系等。模式生物基因组研究揭 示了人类疾病基因的功能,剥用基因顺序上的溺源性克隆人类疾病基嚣,利用 模式生物实验系统上的优越性,在人类基因组研究中的应用比较作图分析复杂 性状,加深对基因组结构的认识。 科学对报曾报道:沈较基因组学有可能解决目前生物学研究孛的个 中心阀题:基嚣组中功能信息的识别。是然杂志发表了作为比较基因组学中 首批重大研究工作之一结果表明,比较基因组学是一项功能极为强大的技术, 2 中国科学技术大学硪士学位论文 将对关予包括人类在内的所有物种的基因组分析产生巨大影响。研究人员将三 种酵母( 这些酵母与s c e r e v i s i a e 酵母相距5 0 0 万2 0 0 0 万年) 的基因组序列草图 与s 。e e 鬻v i s i 鑫e 酵母的完整基因组序列徽了对泷。这一对比导致对酵母基因霾录 做出重大修正,这些修正包括建议删除大约5 0 0 个以前已经注解过的基因和发 现约5 0 个耨基因。这些成果被认为是向着识别基函组中大多数不为基因编码、 但却可能调节其功能的那些成分的功能这一目标迈出的重要一步。 事实表明,比较基因组学在后基因组时代研究巾发挥着极其重要的作用。 3 中国科学技术大学硕:学位论文 第二节非编码区研究概述 1 “垃圾”与“瑰宝” 可能对生物学研究者来说,人类基因组测序完成仅仅意味着漫长、艰辛而 有趣的征程开始。较早的基因组注释观念认为m i 州a 和开放阅读框的存在才是 特定序列被认为是基因的可靠证据,而其他的基因组序列则被认为是所谓的 j u n k ”d n a 。因而当时大量的工作用于识别c d n a s 和e s t s ,一系列基于试验证 据的基因发现方法也因此被确立。最近1 0 年,随着w a t e r s t o n 等人首次在脊椎动 物中运用基因组比较的方法 1 】,大量的研究开始用于探索基因组功能【1 8 】。因 此,约占人类基因组9 9 的、原以为可能是“垃圾”的非编码序列的部分功能才逐 渐被人们所认识。随着探索研究的深入,非编码区域功能的研究主要分化形成了 两个大的领域:非编码d n a 和非编码r n a 的研究。 非编码d n a 的功能探索研究主要集中在三个方面:第一,启动子区特征及 相关作用元件研究【7 ,9 1 8 】;第二,基因组水平的可转移元件及重复序列研究 1 9 2 3 】;第三,基于保守性和选择限制的其他非编码区域功能研究 2 4 2 8 】。而非 编码r n a 的研究不仅使得这个大家族有了新成员( 如m i r n a ,p i r n a 等) ,而且让 人们对其功能有了更新的理解,如对减数分裂过程中未配对d n a 以及可转移元 件的沉默作用等 2 9 3 6 】。 对未知世界的探索,或许就是一次次对已知规律的否认或更新的过程。伴随 着对基因组功能的探索历程,今天的科学家谁还会认为基因组中的非编码区是 j u n k ”? 2 单个与网络 非编码区功能的探索逐渐从对单个元件、单个r n a 基因的局域研究向模体、 簇等为代表的相互作用发展,进而向调控网络系统研究纵深【3 7 4 1 】。转录调控模 式的基本单位是转录因子、结合位点和目标基因。这些元件组成具有特定动力学 性质的调控网络。多个调控元件相互作用形成具有一定独立性的模体,再由模体 形成复杂的网络,参见图1 1 ( s t m c t l i r ea 1 1 de v o l u t i o no f t r a j l s c r i p t i o n a jr e g u l a t o r ) r n e t w o r k s c u r ro p i ns t m c tb i o ,2 0 0 4 ) 。随着实验数据的积累和研究的深入,对调 控网络的拓扑性质进行研究,发现调控网络中的相互作用不是平均分布的,有些 调控网络元件与许多其他元件作用,形成h u b ;而另外一些调控网络元件只与很 少的其他元件作用;这种性质被称为s c a l e 一能et o p o l o g y 4 2 。然而,即使我们拥 有了构成调控网络的各种元件和调控网络的统计学信息,还不足以了解生命系统 的动态结构和活动行为。因为这不仅需要知道组成调控网络的调控元件和拓扑学 性质,还需要了解其中的调控网络如何协调、行使功能,以及整体的动态特性。 4 基于计算机模拟和可计算的量化模型开发,以及调控网络中c i r c u i t 的研究和系 统生物学研究将会使得调控网络系统更加清晰完善、也逐渐接近生物本身规律 【4 3 - 4 5 。 c m o d u b 榔。 j 九j 、l 龛冷、一 图1 1 :转录调控网络组成示意图 f i g 1 1 s t m c t u r a lo 唱a n i s a t i o no f 仃a n s c r i p t i o n a lr e g u l a t o r ) ,n e t w o r k s ( a ) t h e b a s i cu n i t c o m p r i s e st h et r a n s c r i p t i o nf a c t o r ,i t st a 唱e tg e n ew i t hd n a r e c o g n 王t i o ns i t e 锄dt h er e g u l a t o r yi n t e r a c t i o nb e t w e e nt h e m ( b ) u n i t sa r eo r e n o 玛a l l i s e di n t on e t w o r k m o t i f s ,w h i c hc o m p r i s es p e c i f i cp a t t e m so fi n t e 卜r e g u l a t i o n t h a ta r eo v e r - r 印r e s e n t e di nn e 铆o r k s e x 锄p l e so f m o t i f si n c l u d es i n g l ei n p u t ( s i m ) , m u l t i p l ei n p u t ( m i m ) a n df e e d f o r w a r dl o o p ( f f l ) m o t i f s ( c ) n e t w o r km o t i f sc a nb e i n t e r c o 衄e c t e dt of o ms e m i - i n d 印e n d e n tm o d u l e s ,m a n yo fw h i c hh a v eb e e n i d e n t i f i e db yi n t e g r a t i n gr e g u l a t o r yi n t e r a c t i o nd a t aw i t hg e n ee x p r e s s i o nd a t a ,a l l d i m p o s i n ge v o l u t i o n a r y c o n s e r v a t i o n ( d ) t h ee n t i r e a s s e m b l y o fr e g u l a t o 巧 i n t e r a c t j o n sc o n s t i t u t e st h e t r 肌s c r i p t i o n a lr e g u l a t o 巧n e t w o r k ,w h i c hp r o v i d e st h e b l u 印r i n tf o rr e g u l a t i o no fg e n ee x p r e s s i o ni na no 唱a n i s m 3 近程与远程 随着对基因近临区域的非编码元件的深入研究,人们对远程相关的调控元件 也越来越关注 2 2 ,4 6 4 8 】。众所周知,远程的增强子是一类调控基因表达的基因 组元件,而增强子通常远离与它所调控的基因,因而在基因组范围内定位这些增 强子显然很困难。最近,b e r k e l e y 国家实验室的p e n l l a c c h i o 领导的科研团队通过 将高度保守性分析和高通量试验相结合的方法在基因组水平大规模研究增强子, 应该说是目前增强子识别的有效方法代表 4 9 】。遗憾的是,基于保守性的方法显 然排除了至少两种可能:序列并无相似性而功能保守的调控和物种特异的功能调 串莺科学技寒大学硕士学傻论文 控,如f i s h e r 等人的研究便佐证了这种局限性 5 0 】。因此,对子远程相关的调控 元件研究,更为系统高效熬计算识别手段值得更深入地进行。 4 单一功能与多重角色 随饕非编码区域功能研究的逐步深入,对功能元件的认识也逐渐全藤,特定 的功能元件也随之从单一的功能向多重角色转化。除前面提及的许多非编码 r n a 新功能被发现,最近,b r e n n e c k e 等人在果蝇中发现分散的小r n a 产生位点 是转座子活性的主要调控子。这发现展示了小烈a 薪功能的同时也进一步揭 示了小r n a 和转座子关系,为构建调控网络提供了基础【5 l 】。另外,由s i n e s 所 导致的新功能【2 1 】、“绝缘子”中的调控元件发现【5 2 】等研究让我们进一步认识至i j 某种功能元件确蜜有它的多重角色。而c h o i 等入对编码区的非编码元件的描述让 我们从另一个焦度对功能元件的多重惫色有了新的认识,即同一元件所在的位置 不周可能就有了新的功能、甚至成为了新的元件【5 3 】。因而,对调控元件的多种 功能的发现不仅有利于我们认识其本质,也对调控信息的网络化构建具有推动作 用。 6 中国科学技术大学硕士学位论文 参考文献 1 w a t e r s t o nl m ,l i n d b l a d - t 0 hk ,b i m e ye ,r 0 9 e r sj ,a 研l j f ,a g a n 砌p , a g a 朋a l ar ,a i n s c o u 曲r ,a l e x a n d e r s s o nm ,a np e ta 1 ( 2 0 0 2 ) i n i t i a ls e q u e n c i n ga n d c o m p a r a t i v ea n a l y s i so f t h em o u s eg e n o m e n a t u r e ,4 2 0 :5 2 0 - 5 6 2 2 d e 加i t z a k i se t ,r e y i i l o n da ,l y l er ,s c 锄u 髓n ,u c l ac ,d e u t s c hs ,s t e v e n s o n b j ,f i e g e lv ,b u c h e rp ,j o n g e n e e lc v e ta l ( 2 0 0 2 ) n 啪e r o u sp o t e n t i a l l yf u n c t i o n a l b u tn o n - g e n i cc o n s e r v e ds e q u e n c e so nh u m a nc h r o m o s o m e21 n a t u r e ,4 2 0 :5 7 8 - 5 8 2 3 s i e p e la ,b e j e r a n ogp e d e r s e nj s ,h i n r i c h sa s ,h o um ,r o s e n b l o o mk , c l a w s o nh ,s p i e mj ,h i l l i e rl w ,r i c h 棚sse ta l ( 2 0 0 5 ) e v o l u t i o n 撕l yc o n s e e d e l e m e n t si nv e r r t e b r a t e ,i n s e c t ,w o n l l ,觚dy e a s tg e n o m e s g e n o l 优r e s ,l5 :10 3 4 - l0 5 0 4 t h o m a sj w ,t o u c i l i i l a nj w b l a k e s l e yr w ,b o u 胁dg gb e c k s t r o m - s t e m b e 玛 s m ,m 岫g u l i e se h ,b 1 锄c h e t t em ,s i e p e la c ,t h o m a sp j ,m c d o w e nj ce ta 1 ( 2 0 0 3 ) c o m p a f a t i v ea n a l y s e so fm u l t i s p e c i e ss e q u i c e sf r o m 协g e t e dg e n o m i cr e g i o n s n a t u r e ,4 2 4 :7 8 8 - 7 9 3 5 c o o p e rg m ,b m d n om ,g r e e ne d ,b a t z o g l o us ,s i d o wa ( 2 0 0 3 ) q 啪t i t a t i v e e s t i m a t e so fs e q u e n c ed i v e 唱e n c ef o rc o m p a r a t i v e 锄a l y s e so fm 锄m a l i a ng e n o m e s g e n o m er e s 1 3 :81 3 8 2 0 6 l u n t e rgp o n t i n gc p h e i nj ( 2 0 0 6 ) g e n o m e - w i d ei d e n t i f i c a t i o no fh 啪a n f h n c t i o n a jd n a u s i n gan e u t r a l i n d e lm o d e l p l o sc o m p u tb i o l ,2 :e 5 7 x i ex ,l uj ,k u l b o k a se j ,g o l u bt r ,m 0 0 t h av ,l i n d b l a d 玎0 hk ,l a l l d e re s , k e l l i sm ( 2 0 0 5 ) s y s t e m a t i cd i s c o v e r yo fr e g u l a t o 巧m o t i f si nh 呦a i lp r o m o t e r s 锄d 3 0u t r sb yc o m p a r i s o no f s e v e r 硝m a m m a l s n a t u 】旧,4 3 4 :3 3 8 3 4 5 8 f e u l ( l ,c a r s o na r ,s c h e r e rs w ( 2 0 0 6 ) s t m c t w a lv a r i a t i o ni nm e 胁n 觚 g e n o m e n a tr e vg e n e t ,7 :8 5 9 7 9 b u s h ,e c a 1 1 db t l a h n ( 2 0 0 6 ) ”t h ee v o l u t i o no f 、v o r dc o m p o s i t i o ni n m e t a z o a np r o m o t e rs e q u e n c e ”p l o sc o n l p u tb i o l2 ( 11 ) :el5 0 10 c a d s o n ,j m ,a c h a l ( r a v a r c y ,e ta 1 ( 2 0 0 7 ) ”s c o p e :aw e bs e r v e rf o rp r a c t i c a l d en o v om o t i fd i s c o v e ”n u c l e i ca c i d sr l e s 11 g u h a t h a k u r t a ,d ( 2 0 0 6 ) c o m p u t a t i o n a li d e n t i f i c a t i o no ft 眦s c r i p t i o n a lr e g u l a t o 巧 e l e m e n t si nd n a s e q u e n c e n u c l e i c a c i d sr e s ,3 4 ,3 5 8 5 3 5 9 8 12 m a c i s a a c ,k d a n d f r a e n k e l ,e ( 2 0 0 6 ) p r a c t i c a ls t r a t e g i e s f o rd i s c o v e r i n g r e g u i a 加r yd n as e q u e n c em o t i f s p l o sc o m p u t 。b i 0 1 ,4 ,e 3 6 。 1 3 t b i i 【p a ,m ,l i ,n ,b a i l e y ,t l ,c h u r c h ,g m ,d em o o r b ,e s k i n ,e ,f a v o r o v a v , f r i t l l ,m c ,f u ,ye ta j ( 2 0 0 5 ) a s s e s s i n gc o m p u t a t i o n a lt o o l sf o rt h ed i s c o v e r yo f 7 中国科学技术人学硕:l 学位论文 n 觚s c r i p t i o nf a c t o r b i n d i n gs i t e s n a t b i o t e c l l l l 0 1 ,2 3 ,13 7 - 14 4 14 c a r l s o n ,j m ,c h a k r a v a r t y ,a a n d 研o s s ,r 。h ( 2 0 0 6 ) b e a m :ab e 锄s e a r c h a l g o r i t l u n f o rt h ei d e n t i f i c a t i o no fc i s - r e g u l a t o d ,e l e m e n t si n g r o u p so fg e n e s j c o m p u t b i 0 1 ,1 3 ,6 8 6 7 0 1 15 c h a k r a v a r t y ,a ,c a r l s o n ,j m ,k h e t a l l i ,r s ,d e z i e l ,c e a n dg r o s s ,r h ( 2 0 0 7 ) s p i a c e r :i d e n t i f i c a t i o no fc i s - r e g u l a t o 叫e l e m e n t sw i t 王l n o n c o n t i g u o u sc r i t i c a l r e s i d u e s b i o i n f o m a t i c s ,i np r e s s 16 d o 、v n ,t a ,c m b e 唱m a j l ,e ta 1 ( 2 0 0 7 ) ”l a 唱e s c a l ed i s c o v e r yo fp r o m o t e r m o t i f si nd r o s o p h i l am e l a n o g a s t er f ip l o sc o m p u tb i o l3 ( 1 ) :e 7 。 17 m a ,s a n dh j b o l u l e r t ( 2 0 0 7 ) ”i n t e g r a t i o no f 心a b i d o p s i s t l l a l i a n a s 仃e s s r e l a t e dt m s c r i p tp r o f i l e s ,p r o m o t e rs t m c t u r e s ,a n dc e l l s p e c i f i c e x p r e s s i o n ” g e n o m eb i o l8 ( 4 ) :r 4 9 l8 k a w 匈i ,h ,m c f r i t h ,e ta 1 ( 2 0 0 6 ) ”d y n a m i cu s a g eo ft r a n s c r i p t i o ns t a r ts i t e s 谢m i nc o r ep r o m o t e r s ”g e n o m eb i o l7 ( 1 2 ) :r 1 18 1 9 h o l m e s ,i ( 2 0 0 2 ) t r a n s c e n d e n te l e m e m s :,t l o l e g e n o m et r a i l s p o s o n s c r e e n s a i l do p e ne v o l u t i o n a r yq u e s t i o n s g e n o m er e s 1 2 :1 1 5 扣1 1 5 5 2 0 e d g 矾r c a j l dm y e r s ,e w ( 2 0 0 5 ) p i l e r :i d e n t i f i c a t i o na n dc l a s s i f i c a t i o no f g e n o m i cr 印e a t s b i o i n f o r m a t i c s21 :i 15 2 一i15 8 21 n i s h i h a r a ,h ,a f s m i t ,e ta 1 ( 2 0 0 6 ) i f u n c t i o n a ln o n c o d i n gs e q u e n c e sd e r i v e d 舶ms 烈e si nt h em 锄m a l i a ng e n o m e ”g e n o m er e sl6 ( 7 ) :8 6 4 - 7 4 2 2 b e j e r 肌o ,g ,l o 、m e ,c ,a h i t u v ,n ,k j n g ,b ,s i 印e l ,a ,s a l 锄a ,s ,i 之u b i n ,e m , k e n t ,w j ,a i l dh a u s s l e r ,d ( 2 0 0 6 ) ad i s t a le n h a l l c e r 锄du 1 们c o n s e r v e de x o na r c d e r i v e df r o man o v e lr e t r o p o s o n n a t u r e4 41 :8 7 9 0 2 3 o h s h i m a ,k a l l do k a d a ,n 。s i n e sa i l dl i n e s :s y m b i o n t so fe u k a r y o t i c g e n o m e sw i t hac o m m o nt a j l c ”o g e n e t g e n o m er e s 1 l0 :4 7 5 - 4 9 0 2 4 a n d o l f i a t t 0p ( 2 0 0 5 ) a d a p t i v ee v o l u t i o no fr l o n c o d i n gd n ai i ld r o s o p h i l a n a t u f e ,4 3 7 :l1 4 9 1 15 2 2 5 b u s he c ,l a l mb t ( 2 0 0 5 ) s e l e c t i v ec o n s t r a i mo nn o r l c o d i n gr e g i o n so fh o m i i l i d g e n o m e s p l o sc o m p u tb i 0 1 ,1 :e 7 3 2 6 k 舢k o vg v ,s c h m i d ts ,s u n y a e vs ( 2 0 0 5 ) s m a nf i t n e s se 行e c to fm u t a t i o n si n h i g h l yc o n s e r v e dn o n - c o d i n gr e 舀o n s h u mm o lg e n e t ,l4 :2 2 2 1 2 2 2 9 2 7 w b 0 1 f ea ,g o o d s o nm ,g o o d ed k ,s n e l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论