(生物医学工程专业论文)solid测序平台下转录因子有关的chipseq数据分析策略.pdf_第1页
(生物医学工程专业论文)solid测序平台下转录因子有关的chipseq数据分析策略.pdf_第2页
(生物医学工程专业论文)solid测序平台下转录因子有关的chipseq数据分析策略.pdf_第3页
(生物医学工程专业论文)solid测序平台下转录因子有关的chipseq数据分析策略.pdf_第4页
(生物医学工程专业论文)solid测序平台下转录因子有关的chipseq数据分析策略.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(生物医学工程专业论文)solid测序平台下转录因子有关的chipseq数据分析策略.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 捅要 论文题目:s o l i d 测序平台下转录因子有关的c h l p - s e q 数据分析策略 作者姓名:王薇 7 导师姓名:陆祖宏( 教授) 学校名称:东南大学 下一代高通量测序技术的应用背后如果没有后期强大的生物信息学分析能力,那么所有的基于测序的 生物学研究都将举步维艰;而数以g 计的测序数据的产生给生物信息研究人员提供了新的挑战及难得的施 展机会。本论文研究的是高通量测序平台s o l i d 系统所产生的序列数据分析策略,包括c h i p s e q 数据分 析管道的总结,c h i p s e q 分析管道中关键步骤算法的评估选用,c h i p - s e q 数据分析新的角度的开辟,和 m e d l p - s e q 数据分析和c h i p s e q 数据分析的差异比较。 c h i p - s e q 是在全基因组水平上研究活体细胞中蛋白质和d n a 相互作用谱的有效手段。s o l i d 系统是 目前测序通量最高的新一代d n a 测序系统。在s o l i d 系统的d n a 测序文库制备过程中,采用对免疫共 沉淀获得的d n a 片段进行二次超声打断可以满足e p c r 对序列长度的要求,因此s o l i d 测序文库中的 d n a 测序片段较短。本课题首先研究测序文库中d n a 片段的长度对c h i p s e q 分析的影响,以筛选出合 适的软件分析本实验室的所产生的c h i p s e q 数据。通过真实的c h i p - s e q 数据和模拟产生的c h i p - s e q 数据, 对目前3 种主要的c h i p s e q 分析方法( c i s g e n o m e ,s i s s r s 以及m a c s ) 的特点进行研究。通过模拟数据 分析结果我们认识到在使用c h l p - s e q 分析软件时,需要结合我们的实验设计和软件的设计思想,在两者相 匹配的情况下选择最为合适的软件进行分析。三个软件平台中,c i s g e n o m e 相对于其他两个可以提供不受 测序平台限制的分析,并且其分析平台在w i n d o w s 操作系统上提供友好界面,此外,还提供m o t i f 分析, 可视化,基因注释等功能,是一款实验生物人员也易于操作和学习的软件,因此,在对本实验室所产生的 真实的c h i p - s e q 数据进行分析时,这个软件成为首选软件。 一次转录因子的c h i p - s e q 实验可产生成千上万个富集位点,但是大部分富集位点都没有落在转录起始 位点附近( 启动子区) 。许多证据表明核小体在基因周围的分布情况是:在转录起始位点前有一个无核小 体区,该无核小体区由前后两个信号强烈的核小体区( 1 号和+ l 号核小体) 包围。我们针对用c h l p - s e q 技术鉴定的转录因子n r s f 的在全基因组范围的结合位点数据,考察了各富集区域的实验的( c h i p s e q 所 测) 和预测的核小体分布情况。通过实验所测核小体信息,在随机所选的位于启动子附近的c h i p 。s e q 富集 区域内,我们同时发现了核小体占位和核小体缺失;通过预测的核小体占位,对于那些非启动子附近的高 集峰,它们转录相关性可部分地通过t s s 附近的理想的核小体的定位来确定。由于通常只有一小部分的富 集区域可以注释到已知t s s 附近,可以推测这一方法可用于c h i p s e q 的注释步骤。 基于他人刚组蛋白标记物预测的m i r n a s 启动予数据,我们利用c h i p s e q 技术寻找转录因子e g r i 在k 5 6 2 细胞系中与m i r n a s 的结合位点,共在1 2 4 个不同的m i r n a s 的启动子区发现e g r i 的结合位点, 占已知启动子的m i r n a s 基因( 2 9 4 ) 的4 2 。我们选择其中的1 2 个m i r n a s 进行了c h i p p c r 实验验证, 验证结果部呈阳性。这个实验首次在p m a 处理的k 5 6 2 细胞系巾发现了转录园子e g r l 与1 2 4 个m i r n a s 的结合,将有助于该特定细胞系的m i r n a 的转录牛物学通路的理解。 关键字:下一代测序技术,蛋白质- d n a 相互作用,c h i p s e q ,c i s g e n o m e ,核小体的分布,e g r l 。m i r n a 的转录结合,m e d i p s e q 数据分析 1 东南大学硕士学位伦文 a b s t r a c t t h e s i st i t l e :c h i p - s e qd a t aa n a l y s i ss t r a t e g i e sf o rw a n s c r i p t i o nf a c t o r so l ls o l i ds y s t e m g r a d u a t es t u d e r rn aa e :,a n gw b i s u p e r v i s o rn a m e :l uz u h o n g ( p r o f e s s 0 0 s c h o o ln a m e :s o u t h e a s tu n i v e r s i t y t h eb i o i n f o r m a t i c sa n a l y s i si sa ni n d i s p e n s a b l ep a r tf o rt h ea p p l i c a t i o n so fn e x tg e n e r a t i o ns e q u e n c i n g a tt h e s a m et i m e ,t h ed e l u g eo fm i l l i o n so fd a t ap r o v i d e sn e wc h a l l e n g e sa n dp o s s i b i l i t i e sf o rb i o i n f o r m a t i c sr e s e a r c h e r s t h i sw o r ka i m st oi n v e s t i g a t ea na n a l y s i ss t r a t e g yf o rs e q u e n c i n gd a t ag e n e r a t e df r o mh i g h t h r o u g h p u ts e q u e n c i n g s y s t e ms o l i d t h et a s k si n c l u d et h es u m m a r yo f c h i p - s e qa n a l y s i sp i p e l i n e ,t h ea s s e s s m e n ta n dd e t e r m i n a t i o no f t h ek e ya l g o r i t h m si nc h i p s e qa n a l y s i sp i p e l i n e ,t h ei n t e g r a t i o no f d i f f e r e n td a t a s e t st ob r o a d e nc h i p - s e qa n a l y s i s , a n dt h ec o m p a r i s o no fd i f f e r e n c e sb e t w e e nm e d i p - s e q a n a l y s i sa n dc h i p s e qa n a l y s i s t h ec o m b i n a t i o no fc h r o m a t i ni m m u n o p r e c i p i t a t i o nw i t hs e q u e n c i n g ( c h i p - s e q ) i sa ne f f e c t i v em e t h o df o r o b t a i n i n ga ni nv i v og e n o m e - w i d ep r o f i l eo ft h ei n t e r a c t i o no fap r o t e i nw i t hd n a t h em a i nd i f f e r e n c eo ft h e s o l i da n ds o l e x as y s t e m se x i s t s i nt h el e n g t ho fd n af r a g m e n t sd u r i n gp r e p a r i n gs e q u e n c i n gl i b r a r i e s t h e s o l i ds y s t e mh a sr e l a t i v e l ys h o r td n af r a g m e n t si fi tp r o c e s s e saf u r t h e rs o n i c a t i o no fi p e dd n af r a g m e n t si n o r d e rt om e e tt h el e n g t hr e q u i r e m e n to fd n af r a g m e n t sf o re m u l s i o n - p c r ( e p c r ) t h ea u t h o rf i r s ti n v e s t i g a t e s t h ei n f l u e n c e so fd n af r a g m e n tl e n g t ho nd a t aa n a l y s i s 疗o mc h i p s e qa n ds ot h a tt h es u i t a b l es o f t w a r ew i l lb e s e l e c t e dt oa n a l y z et h ec h i p - s e qd a t ag e n e r a t e di nt h i sl a b u s i n gr e a la n ds i m u l a t e dc h i p s e qd a t a , t h r e em a i n c h i p - s e qa l g o r i t h m s ( c i s g e n o m e ,s i s s r sa n dm h c s ) h a v eb e e ni n v e s t 追a t e d b a s e do nc a r e f u le x a m i n a t i o n ,t h e a u t h o rr e a l i z e dt h a ta m o n gt h o s ea v a i l a b l es o f i w a r e s ,t h eb e s ti st h eo n eo fw h i c ht h ep r i n c i p l ed e s i g nf i tt h e e x p e r i m e n tp r o c e s s c o m p a r e dt ot h eo t h e rt w ot o o l s ,c i s g e n o m ep r o v i d e sa n a l y s i si n d e p e n d e n to ft h e s e q u e n c i n gs y s t e ma n do f f e r sf i i e n d l yu s e ri n t e r f a c e i nw i n d o w so p e r a t i o ns y s t e m b e s i d e s ,c i s g e n o m e i n t e g r a t e st h em o t i fa n a l y s i s ,v i s u a l i z a t i o n ,g e n ea n n o t a t i o ni n t oi t ss y s t e m ,w h i c hi se a s i l yt ol e a r na n do p e r a t e ,s o i tb e c o m e st h ef i r s tc h o i c ew h e na n a l y z ec h i p - s e qd a t ai nt h ea u t h o r sl a b f o rat r a n s c r i p t i o nf a c t o r , ac h i p s e qe x p e r i m e n tc a ng e n e r a t et h o u s a n d so fe n r i c h e ds i t e s h o w e v e r , m o s to f t h et r a n s c r i p t i o nf a c t o rb i n d i n gs i t e sd on o tl o c a t en e a rt r a n s c r i p t i o ns t a r ts i t e s ( t s s ) e v i d e n c e ss h o wt h a ta t5 e n d so f ag e n e “- 1 ”a n d “+ 1 ”n u c l e o s o m e sb r a c k e tan u c l e o s o m e - f l e er e g i 册( n f r ) t h ea u t h o rt h e nc h e c k e dt h e e x p e r i m e n t a la n dt h ep r e d i c t e dn u c l e o s o m a ld i s t d b u t i o ni nn r s fe n r i c h e dr e g i o n sa n df o u n dn u c l e o s o m e p o s i t i o n i n ga n dn u c l e o s o m ef r e er e g i o n ;b a s e do nt h ep r e d i c t e dn u c l e o s o m ep o s i t i o n i n g , f o rt h o s ee n r i c h e d r e g i o n sw h i c hd on o tl o c a t en e a rt h ep r o m o t e r s ,t h e i rt r a n s c r i p t i o n a lr e l e v a n c ec a nb ed e t e r m i n e db yt h ei d e a l n u c l e o s o m eo r g a n i z a t i o nn e a rt h et s s t h i sm e t h o di ss u p p o s e dt ob eu s e di na n n o t a t i o ns t e pd u r i n gc h i p s e q a n a l y s i s t h ea u t h o rp e r f o r m e dac h i p - s e qe x p e r i m e n tt of i n dt h et a r g e t i n gm i r n a g e n e so fat r a n s c r i p t i o nf a c t o r , e g r i ,i nh u m a ne r y t h r o l e u k e m i ac e l ll i n ek 5 6 2a n df o u n de g r ib i n d i n gs i t e sn e a rt h ep r o m o t e r so f1 2 4d i s t i n c t m i r n ag e n e s ,a c c o u n t i n gf o ra b o u t4 2 o ft h em i r n a sw h i c hh a v eh i g h - c o n f i d e n c ep r e d i c t e dp r o m o t e r s ( 2 9 4 ) 1 2m i r n a sw e r ec h o s e nt o p e r f o r mc h i p p c ra s s a ya n dt h er e s u l t sc o n f u m e dt h eb i n d i n gt r u t h t h e e x p e r i m e n t sf w s t l yp r o v i d eag l o b a lb i n d i n gp r o f i l eb e t w e e ne g r ia n di t st a r g e t i n gm i r n ag e n e si np m a - t r e a t e d k 5 6 2c e l l s ,w h i c hm a yf a c i l i t a t et h eu n d e r s t a n d i n go fp a t h w a y sc o n t r o l l i n gm i r n ab i o l o g yi nt h i ss p e c i f i cc e l l l i n e k e yw o r d s :n e x t g e n e r a t i o ns e q u e n c i n g ,p r o t e i n - d n ai n t e r a c t i o n s ,c h i p s e q ,c i s g e n o m e ,n u c l e o s o m e d i s t r i b u t i o n ,e g r i ,t r a n s c r i p t i o nb i n d i n go fm i r n a ,m e d i p - s e qd a t aa n a l y s i s 目录 目录 绪论1 下一代测序技术的发展及应用1 c h l p - s e q 技术的发展背景2 1 2 1 蛋白质与d n a 相互作用2 1 2 2 c h i p - p c r 与c h i p - c h i p 。3 1 2 3c h i p - s a g e 与c h i p p e t 5 1 2 4 c h i p - s e q 6 1 2 5 d n a 甲基化与m e d i p s e q 7 c h i p s e q 数据分析8 1 3 1 c h i p s e q 的一般特征1 0 1 3 2 c h i p s e q 数据分析的算法概述。1 1 本课题研究内容1 3 基于二次打断i p e dd n a 片段c h i p s e q 的模拟分析1 4 前言。1 4 材料和方法1 5 2 2 1 s o l i d 和s o l e x a 平台下c h l p - s e q 示意图1 s 2 2 2 数据集1 6 2 2 3真实的s o l i dc h i p s e q 数据特征提取。1 6 2 2 4模拟1 8 2 2 5 转录因子n r s f 和模拟的c h i p s e q 数据分析1 9 2 3 结果和讨论。1 9 2 3 1 c h i p s e q 进一步超声的优势。1 9 2 3 2s o l i dc h i p s e q 数据的局部正链和负链的峰的特点2 0 2 3 3 模拟的序列的全局和局部分布图谱2 1 2 3 4 比较:c i s g e n o m e ,s i s s r s 和m a c s 对真实的n r s f 数据的分析结果2 2 2 3 5 比较:c i s g e n o m e ,s i s s r s 和m a c s 分析模拟的s o l e x ac h i p s e q 数据和s o l i d c h i p s e q 数据2 4 2 3 6处理真实的s o l i dc h i p s e q 数据的建议2 6 2 4 结论2 6 第三章 由c h i p s e q 实验富集的转录因子结合位点附近的核小体分布2 7 3 1 前言2 7 3 2 方法和材料。2 8 3 2 1数据集2 8 3 2 2 软件2 8 3 3 结果和讨论。2 9 3 3 1 落在已知启动子附近的富集峰的核小体分布2 9 3 3 2 非启动子附近的富集峰的核小体分布3 0 章 。 2 3 4 璋 。 2 璋 j 2 3 4 璋 j 2 一 l l l l 二 2 2 第 第 东南大学硕士学位伦文 。 3 4结论j 3 l 第四章 用c h i p s e q 技术在全基因组范围鉴定e g r l 与m i r n a 基因的结合分析3 2 4 1 前言。3 2 , 4 2 方法与材料3 3 4 2 1细胞的处理及c h i p 。3 3 4 2 2 测序文库的制备3 3 4 2 3s o l i d 测序3 4 4 2 4 测序数据的比对,3 4 4 2 5 搜峰3 4 4 2 6m i r n a 启动子附近的e g r - i 结合位点注释分析3 4 4 2 7c h i p p c r 分析3 5 4 3 缛i 果3 6 4 3 1 鉴定k 5 6 2 细胞系中e g r l 在m i r n a 启动子附近的结合3 6 4 2 1p m a 诱导的k 5 6 2 细胞中e g r i 结合的m i r n a 的表达3 9 4 2 2e g r l 与m i r n a s 结合位点的c h i p p c r 分析3 9 4 3 讨论q 1 1 4 5结论4 3 第五章 用m e d i p s c q 技术研究人类全基因组的绝对甲基化水平谱。4 4 5 1 m e d i p 数据分析特点及绝对甲基化水平需求的提出4 4 5 2 材料和方法4 6 5 2 1 m e d i p s e q 4 6 5 2 2 数据分析步骤。4 6 5 3 结果和讨论。4 8 5 3 1 序列计数与耦合因子总和散点图4 8 5 3 2 m e d i p - s e q 所测得的所有甲基化水平区间分布。4 9 5 3 3 甲基化谱可视化5 0 5 3 4 k 5 6 2 甲基化谱中c p g 岛的覆盖率以及水平分布5 0 5 3 5 1 6 号染色体甲基化谱在各基凶组特征区间的覆盖率及水平分布。5 l 5 4讨论5 2 j 第六章总结和展望5 3 6 1 总结5 3 6 2 月民圭星s 4 参考文献5 6 论文发表情况。:6 1 j 酵【谢6 2 附二良6 3 第一章绪论 第一章绪论 下一代高通量测序技术的出现是测序技术的一次重大变革,在测序时间和成本上相对于 传统测序技术都大大缩减。基于新一代测序技术的c h i p q 应用是研究蛋白质- d n a 相互作 用和表观遗传学如组蛋白修饰,核小体定位,d n a 甲基化( m e d i p s e q ) 的有效手段。c h i p - s e q 技术的出现有其重要的历史背景,c h i p s e x l 数据分析正成为生物信息研究人员的一个热点。 各种算法的出现给实验生物学家提供了大量选择,但是须在理解算法的基础上选择合适的算 法用于分析特定的某次c h i p s e q 实验。 1 1 下一代测序技术的发展及应用 早在国际人类基因组大规模测序进入尾声时,生物科学家们便迫不及待地宣布生命科学 进入后基因组时代,又名功能基因组时代。国际人类基因组计划的完成所依赖的技术平台就 是测序仪,而随着测序技术的发展,在后基因组时代测序依然扮演着举足轻重的角色。 2 0 0 5 年和2 0 0 6 年,美国罗氏公司和i l l u m i n a 公司先后突破s a n g e r 测序法,分别推出新一 代测序技术的基因分析平台4 5 4 测序仪( r o c hg sf l xs e q u e n c e r ) 、s o l e x a 基因组分析仪 ( 1 l l u m i n ag e n o m e a n a l y z e r ) ,令测序技术再次成为关注的焦点。a b i 随后在2 0 0 7 年l o 月推 出其自主研发的s o l i d 测序仪( a b is o l i ds e q u e n c e r ) 。这些新型测序仪都使用了一种新的 测序策略循环芯片测序法( c y c l i c a r r a ys e q u e n c i n g ) ,即对布满d n a 样品的芯片重复进 行基于d n a 的聚合酶反应( 模板变性,引物退火杂交及延伸) 以及荧光序列读取反应。2 0 0 8 年g 月h e l i c ob i o s c i e n c e 公司的t i m o t h y 等人在s c i e n c e 上报道了他们开发的真正的单分子测 序技术l lj ,这项技术与上述三种测序技术一个最大的不同点在于避免了上述3 种高通量测序 依赖的基于p c r 扩增的信号放大过程,真正达到了读取单个荧光分子的能力,向1 0 0 0 美元 测定一个人类基因组的目标迈出了一大步。新一代的高通量测序技术一次可以对几十万条甚 至几百万条d n a 分子进行测序,所以被称为大规模并行测序( m a s s i v e l yp a r a l l e ls e q u e n c i n g ) , 又因为其相比于传统测序技术,无论在通量及效率上都有质的提高,也被称为下一代测序技 术( n e x tg e n e r a t i o ns e q u e n c i n g ) 。同时高通量测序使得对一个物种的转录组和基因组能进行 细致全貌的分析成为可能,所以又被称为深度测序( d e e ps e q u e n c i n g ) 。事实上,大规模平行 测序平台( m a s s i v e l yp a r a l l e ld n as e q u e n c i n gp l a t f o r m ) 已经发展为主流的测序技术,这项测 序技术的出现令d n a 测序费用大大降低,从而让基因组测序这项以前专属于大型测序中心 的“特权”能够被众多实验室分享。新一代d n a 测序技术有助于人们以更低廉的价格,更 全面、更深入地分析基因组、转录组及蛋白质之问交互作用组的各项数据。可以预计今后, 各种测序将成为一项广泛使用的常规实验手段,这有望给生物学和生物医学研究领域带来革 命性的变革2 1 。 个性化医疗的需求推动个人基因组时代的来临,第二代测序仪已经为基凶组学的发展做 出了重要贡献。第二代d n a 测序技术已广泛应用于生物学研究的各个领域。尽管由于下一 代测序技术读长的限制,使其暂无法独立应用于对未知基因组的从头测序( d en o v o 1 东南大学硕士学位伦文 s e q u e n c i n g ) ,但是由于其在通量,时间和成本方面巨大的优势,使得它在基因组重测序 ( r e s e q u e n c i n g ) ,全基因组m r n a 表达谱( r n a - s e q ) ,m i c r o r n a 表达谱,c h i p s e x ,以及 d n a 甲基化( m e d i p s e q ) 等方面的应用潜力巨大【3 ,4 1 ( 见图1 1 ) 。 图1 1 :高通量测序技术的应用范围。引自参考文献【3 1 。 1 2c h i p s e q 技术的发展背景 1 2 1 蛋白质与d n a 相互作用 真核生物的基因组d n a 以染色质的形式存在。染色质由核小体组成,而核小体的核心元 件是由d n a 链缠绕组蛋白八聚体1 6 5 圈而成。组蛋白和d n a 之间的1 4 个接触点使得核小 体成为是生理条件下最稳定的蛋白质d n a 复合物之一。此外,各种反式作用因子( t r a n s a c t i n g f a c t o r s ,各种蛋白质) 与基因组上的顺式作用元件( c i s a c t i n ge l e m e n t s ) 如启动子( p r o m o t e r ) 、增 强子( e n h a n c e r ) 、绝缘子( i n s u l a t o r ) 等的相互作用也是待研究的蛋白质d n a 结合现象。研 究蛋白质与d n a 在染色质环境下的相互作用是阐明真核生物基冈表达机制的基本途径。生 物体内基因表达调控主要发生在转录过程。研究表明转录调控受到多种因素的调节,包括基 因组d n a 的甲基化、组蛋白甲基化、乙酰化和磷酸化等修饰,核小体重新定位及染色体结构 重建。转录调控具有细胞类型、发育阶段和外界环境刺激的差异性,哺乳动物转录调控序列 分散在较大区域,组蛋白修饰状态达1 0 0 多种,这些因素都增加了转录调控的复杂性。 2 一一一 墨二里竺堡 e n c o d e ( t h ee n c y c l o p e d i ao fd n ae l e m e n t s ) 计划岭,6 j 和表观基因组学研究计划( h u m a n e p i g e n o m e p r o j e c t ) 是研究基因表达调控奥秘的国际合作项目r 7 一。其中,e n c o d e 计划旨在 鉴定人类基因组上1 的所有的功能元件,h e p 计划旨在鉴定、分类和描述人类组织特异性 的全基因组d n a 甲基化谱。 了解基因转录调控的关键是识别蛋白质与d n a 的相互作用,识别蛋白质与d n a 相互作 用的方法有很多,其中染色质免疫沉淀技术( c h r o m a t i ni m m u n o p r e c i p i t a t i o n ,c h i p ) 是识别活 体内蛋白质与d n a 相互作用的有效方法。第一个c h i p 实验由g i l m o u r 和l i s 完成,他们利 用此技术在大肠杆菌和果蝇中调节活体内r n ap o l i i 和转录的及准备转录的基因之间的相互 作用例。这些技术早期也曾用于研究核小体上d n a 和组蛋白的相互作用和组蛋白的修饰。近 年来,此技术经过不断的发展和完善,特别是与d n a 微阵列和d n a 分子测序技术相结合, 可用于高通量的筛选已知蛋白因子的未知d n a 靶点和研究反式作用因子在整个基因组上的 分布情况,还可以用来研究组蛋白的各种共价修饰与基因表达的关系以及核小体的动态定位 与基因转录的关系。 c h i p 利用抗原抗体反应的特异性,可以真实地反映体内蛋白因子与基因组d n a 结合的 状况。其基本原理是【lo 】在生理状态下把细胞内的d n a 与蛋白质交联在一起,通过超声或 酶处理将染色质随机切为一定长度范围的染色质小片段后,利用抗原抗体的特异性识别反应, 通过抗体捕获目的蛋白从而将与目的蛋白相结合的d n a 片段沉淀下来。染色质免疫沉淀技 术一般包括细胞固定,染色质断裂,染色质免疫沉淀,交联反应的逆转,d n a 的纯化,以及 d n a 的鉴定( 图1 2 ) 。 1 2 2 c h i p p c r 与c h i p - c h i p 用何种方式来鉴定目标d n a 决定了c h i p 技术的发展路线。c h i p 技术最先与半定量或定 量p c r 技术结合用来分析被感兴趣的蛋白结合的单个基因的情况。1 9 9 6 年,h e c h t 和 g m n s t e i n 首先利用c h i p p c r 技术在酿酒酵母中研究了s i r 蛋白的相互作用【l2 。,随后r u n d l e t t 等人用c h i p p c r 分析了特定位点的组蛋白修饰【1 3 1 。随着芯片技术的发展,2 0 0 0 年,r e nb i n g 研究组发明了c h i p - c h i p 技术,一种将免疫共沉淀( c h i p ) 与基因芯片相结合的新技术,他们 应用这项技术研究了当碳源和性信息素变化时转录因子g a l 4 和s t e l 2 在酵母基因组上的结合 位点的分布情况【1 4 j 。随后,利用c h i p c h i p 技术,研究人员对酵母中的转录因子进行了大量 研究,它也被广泛地应用于在全基因组范围鉴定重要的转录因子的靶点,分析基凶组范围的 组蛋白修饰和核小体定位,这使得大规模地研究基因的转录调控,包括转录因子调控和表观 遗传调控成为可能。可以说e n c o d ep i l o t 项目的完成主要的技术平台就是c h i p c h i p 。2 0 0 7 年,g u e n t h e r 等人用c h i p c h i p 实验发现基因的转录起始可能不是特异的,大多数的人类基因 包括原来被证明转录失活的编码基因都能启动转录,细胞通过对基因组的修饰( 组蛋白修饰 h 3 k 3 6 m e 3 ) 来控制转录的延伸过程,从而达到调控基因转录的h 的【b 】。2 0 0 8 年l u p i e n 等人 用c h i p c h i p 和一系列的实验,证实了基因组表观遗传学修饰能调控f o x a l ,通过f o x a l 改 变染色质的结构,从而控制基因的组织特异性表达【1 6 1 。同时,各种功能芯片的涌现,如启动 3 一 查塑查兰堡主堂篁丝茎 一 : 子芯片,c p g 岛芯片,叠瓦芯片( t i l i n ga r r a y ) 等也拓宽了c h i p - c h i p 的应用范围。通过染色 质免疫共沉淀( c h i p ) 技术和低成本的启动子芯片的有机结合,可以确定任何一个特定转录 因子的靶基因群。c h i p 技术与叠瓦芯片的结合被用来鉴定人类7 种细胞系的3 , 6 9 2 个启动子 的核小体分布情况【1 7 】。在用c h i p - c h i p 技术定位了人类基因组上的启动子,增强子和绝缘子 后,最近r e nb i n g 研究组仍然利用此技术鉴定了不同细胞中的这些反式作用元件以及它们在 , s | :x a i c a t ad n at o p r o d u c es h e a r e d , s o l u b l ec h r o m a t i n i m m u n o p r e c i p i t a t e a n dp u r i f y i m m u n o c o m p l e ) 0 s s r e v e r s ec r o s s - l i n k s , p u r i f yd n a a n d p r e p a r ef o rs e q u e n c i n g 图卜2 :c h i p 的流程示意图。首先在活体内将d n a 和蛋白质交联,随机打断d n a 蛋白质复合物后,用抗体将 目标d n a 蛋白质复合物沉淀,解交联后纯化。引自引文1 引。 细胞特异性基因表达所发挥的作用。他们发现,增强子具有高度细胞特异性的组蛋白修饰模 式,在全基冈组组范围与细胞特异性基冈表达高度相关,并以细胞特异性的力式活化实现其 功能【1 9 1 。 4 第一章绪论 1 2 3c h i p s a g e 与c h i p - p e t 尽管大规模的c h i p 研究首先依赖于微阵列芯片,但是对于分析大的哺乳动物基因组上( 如 人类) 的转录因子与d n a 结合情况和组蛋白修饰等,c h i p - c h i p 这种方法显得代价甚高,并 且由于人类基因组的复杂性及芯片技术本身的局限性( 如无法定位基因组中的重复序列) ,使 得这项技术还存在许多改进之处。相对于c h i p - c h i p ,基于深度测序技术的c h i p - s e q 在特异 性、敏感性和基因组的广泛性方面有着显著的优势【1 8 2 0 - 2 3 。c h i p s e q ( c h r o m a t i n i m m u n o l ! r e c i p i t a t i o ns _ _ e f l u e m c i n g ) 是将深度测序技术与c h i p 实验相结合分析全基因组范围内 d n a 结合蛋白结合位点、组蛋白修饰、核小体定位的另一种高通量方法,可以应用到任何基 因组序列已知的物种,并能确切得到每一个片段的序列信息。传统的s a n g e r 测序由于测序成 本和速率限制,直接被用来分析大量的免疫沉淀d n a 序列从时间和花费上都是不现实的。 s a g e ( s e r i a la n a l y s i so f g e n ee x p r e s s i o n ) 是一种可分析已知和未知基因的m r n a 定量水平的巧 妙技术。s a g

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论