(遗传学专业论文)三种人类新基因的克隆与功能初步研究.pdf_第1页
(遗传学专业论文)三种人类新基因的克隆与功能初步研究.pdf_第2页
(遗传学专业论文)三种人类新基因的克隆与功能初步研究.pdf_第3页
(遗传学专业论文)三种人类新基因的克隆与功能初步研究.pdf_第4页
(遗传学专业论文)三种人类新基因的克隆与功能初步研究.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(遗传学专业论文)三种人类新基因的克隆与功能初步研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要p ! 掘5,人类基因组计划的基本完成,标志着后基冈组时代的到来。多种模式生物与人的基因组数据的大量涌现,结合乍物信息学及常划分子生物学手段,克降基因已经不再是很困难的事。然而从序列到功能,对于不同类型基因的却是干筹万别的。7 本研究旨在寻找针对二类新基因4 i 同的研究方案和研究手段。d s c a m i 1 是一种典型的免疫球蛋白超家族类细胞粘附分子。通过不同组织p c r 验证,在胎脑r r l 其十度比成人脑中高数百倍,而在其它组织中未见明显表达,提示可能跟神经系统发育相关。在克隆获得其小鼠司源基因的基础上,采用原位杂交技术验证,结果表明,蹦翻m ,的表达主要集中在e 9 ,e 1 0 ,e 1 4 ,e 1 5 ,而出生前的e 1 9 中表达已经很少。说明d s ( 爿m l 的确是跟发育相关,而且其表达呈现时空特异性o v f 乃6 5 l 2 是一条与老年痴呆症相关的基因。其编码产物的磷酸酪氨酸结合结构域l ( p h o s p h o t y r o s i n eb i n d i n gd o m a i nl ,p t b l ) 结构域中存在四种剪接形式。分别表达四种剪接体,通过谷胱甘肽转移酶体外结合实验表明,其中只有f e 6 5 l 2 一i i i 跟低密度脂蛋白受体相关蛋白的胞内区有结合作用。( 根据r tp c r 结果,这种剪接形式在胎脑种的丰度最高,提示可能只有f e 6 5 2 一i i i 跟a p p的内化形成a - b e t a 有关。锌指蛋白是一类典型的转录因子o 艺n f 3 0 3 是一条具有转录抑制功能的新型锌指蛋白基因。n o r t h e r n 结果显示其在心脏、肝脏和骨骼肌中有表达。( 采用基因芯片技术进行整体研究表明,相对正常肝脏组织而言,肝癌组织中z n f 3 0 3 表达明显下降,推测可能跟癌变细胞生长失去控制有关。剪接是基因转录后前体m r n a 成熟必需经历的一个阶段,不同的剪接体来自于不同的剪接形式。y 丫关键词:人类基因组计划,后基因组时代,基因功能,细胞粘附分子,d s c a m l l剪接体,f e 6 5 1 2 ,转录因子,z n f 3 0 3 ,a b s t r a c tw i t ht h ec o m p l e t i o no fh u m a ng e n o m ep r o j e c t ,t h ep o s tg e n o m ce r ah a sc o m ea r o u n dt h ec o r n e r i t sn o1 0 n g e rd i f f i c u l tt oc l o n eg e n e sd u et ot h ee x p l o s i v eg r o w t ho ft h eg e n o m i cd a t ao fh u m a na n do t h e rm o d e lo r g a n i s m sa n dt h ec o m b i n a t i o no fb i o i n f o r m a t i c sa n dn o r m a lm 0 1 e c u l a rm e t h o d s t h es h if tf r o ms e q u e n c et of u n c t i o n ,h o w e v e r ,i sd if f e r e n tf r o mo n ek i n do fg e n e st oa n o t h e r t h i ss t u d ya i m st of i n do u tt h r e ed if f e r e n tm e t h o d st os t u d yt h r e ek i n d so fg e n e s ,r e s p e c t i v e l y d s c a m l lisak i n do fc e l la d h e s i o nm o l e c u l e s ,b e l o n g i n gt ot h ei m m u n o g l o b u l i ns u p e r f a m i l y t h et i s s u ed i s t r i b u t i o no fo s c l 1t r a n s c r i p t sw a ss t u d i e db vp c rm e t h o dw i t h t cp a n e l s i t se x p r e s s i o n1 e v e li nf e t a lb r a i ni sm u c hh i g h e rt h a ni na d u l tb r a i na n di td o e s n te x p r e s se x c e p ti nb r a i n ,w h i c hp r o p o s e si ti sr e l a t e dt ot h ed e v e l o p m e n to fn e u r a ls y s t e ma n dt h ee x p r e s s i o nh a ss p e c i a lp a t t e r ni nt i m ea n ds p a c e s p l i c i n gi san e c e s s a r yp h a s et ot h em a t u r a t i o no fm r n a ,a n da l t e r n a t i v es p ljc i n gr e s u l t si n t od i f f e r e n tt r a n s c r i p t s f e g s l 2i sag e n er e l a t e dt oa l z h e i m e r sd i s e a s e t h e r ea r ef o u rk i n d so fs p l i c i n gv a r i a n t si nt h ep h o s p h o t y r o s i n eb i n d i n gd o m a i n1 ( p t b l ) d o m a i no ff e 6 5 l 2 a c c o r d i n gt ot h eg l u t a t h i o es - t r a n s f e r a s e ( g s t ) p u ll d o w ne x p e r i m e n t ,o n l yf e 6 5 l 2 一l i ic a ni n t e r a c tw it ht h ec y t o p l a s m i cd o m a i no fl r p m o r e o v e r ,a m o n gt h ef o u rk i n d so fv a r i a n t s ,t h i sv a r i a n te x i s t so n l yi nf e t a lb r a i nb yr t p c r ,w h i c hi m p l i e st h a to n l yf e 6 5 l 2 一i l lh a sr e l a t i o n s h i pw i t ht h ei n t e r n a l i z a t i o no fa p p z i n c f i n g e rp r o t e i n sa r eat y p i c a lk i n do ft r a n s c r i p t i o nf a c t o r s z n f 3 0 3i san o v e lz i n c f i n g e rp r o t e i na c t i n ga st r a n s c r i p t i o nr e p r e s s o r t h er e s u l to fg e n ec h i ph y b r i d i z a t i o np r o v e st h ee x p r e s s i o nl e v e lo fz n f 3 0 3i nh e p a t i cc a n c e rt i s s u ei ss i g n i f i c a n t l yl o w e rt h a ni nn o r m a lt i s s u e ,f r o mw h i c hi ti sh y p o t h e s i z e dt h a tz n f 3 0 3i sr e l a t e dt ot h eo u t o t c o n t r 0 1o ft h ec a n c e rc e l lg r o w t hk e m o r d s :h u m a ng e n o m ep r o j e c t ,p o s tg e n o m i ce r a ,g e n ef u n c t i o n ,c e l la d h e s i o nm o l e c u l e ,d s c a m l l ,s p l i c i n g ,f e 6 5 l 2 ,t r a n s c r i p t i o nf a c t o r ,z n f 3 0 3a m pb s ae d n as o sd e p cd n t p sd t tk me d t ao dp a g ep c ra dd s c a mz n fm t nm t cd s英文缩写词表a m p i c i l l i nb o y i n es e r u ma l b u m i nc o m p l e m e n t a r yd n as o d i u md o d e e y ls u i f a t ed ie t h y lp y r o c a r b o n a t ed a t p ,d c t p ,d g t p ,d t t pd it h i o t h r e it o lk a n a m y c i ne t h y l e n d i a m i n e t e t r a a c e t i ca c i do p t i c a ld e n s i t yp 0 1 y a c r y l a m i d eg e le 1 e t r o p h o r e s i sp o l y m e r a s ec h a i nr e a c t i o na l z h e i m e r sd i s e a s ed o w ns y n d r o m ec e 1a d h e s i o nm o l e c u l ez i n cf i n g e rp r o t e i nm u lt i p l et i s s u en o r t h e r nb l o t t i n gm u l t i p l et i s s u ec d n ap a n e ld o w ns y n d r o m e后基因组学:从序列到功能1 9 5 3 年,沃森和克里克提出了d n a 分子的双螺旋模型,标志着生命科学的研究进入了分子生物学时代“3 。在近半个世纪的研究探索中,生命科学家们在生命起源、生命本质等方面取得了巨大的成就。d n a 作为遗传信息的载体,在生物体中通过其产物蛋白质来决定种种生命现象已得到广泛的确认”1 。1 9 8 6 年,诺贝尔奖获得者r e n a t od u l b e c c o 提出人类基因组计划( h u m a ng e n o m ep r o j e c t ) 。主要目标是测定人的遗传物质共约3 l f f 9 个核苷酸的全序列,使人类对自身的认识达到一个新的高度。经过约3 年的讨论,美国政府决定于1 9 9 0 年1 0 月正式启动这项将耗资3 0 亿美元的1 5 年计划,预期到2 0 0 5 年弄清人类基因组大约3 0亿个碱基的全序列。最初计划的目标是:描绘全部人类遗传物质( 即基因组) 的特征,即改进现有的遗传图和构建所有染色体的物理图,并最终确定全部碱基序列,发现总数超过5 0 ,0 0 0 的人类基因,使之适用于深入的生物学研究。这个计划还包括对一系列模式生物体基因组的测序。最初提出的由大肠杆菌、酵母、拟南芥菜、线虫、果蝇和小鼠。随着计划的顺利进行,h g p 于1 9 9 3 年和1 9 9 8 年分别提出了新的5 年计划,最终确定在2 0 0 3 年,庆祝d n a 双螺旋模型提出5 0 周年之际完成人类基因组计划。而研究的进展一日千里,2 0 0 0 年6 月2 6 日,人类基因组计划的“工作草图”绘制完成,它涵盖了人类基因组中9 7 的d n a 序列,其中8 5 已经基本正确排序。2 0 0 1 年2 月, n a t u r e 和 s c i e n c e ) 同时刊文:h g p 与c e l a r a 宣布,人类基因组计划又取得重大进展,9 9 的序列完全测定,而且填补了工作草图中的很多“间隙( 6 a p ) ”。与此同时,模式生物与致病微生物等的基因组研究也如火如茶地展开。自1 9 9 5 年支原体与流感嗜血杆菌基因组全序列发布以来,已相继有l o 余种原核生物的基因组序列完成。真核模式生物如酵母、线虫、果蝇的基因组研究也已告基本完成。人类基因组计划这具有划时代意义的工作的初步完成,标志着人体内所有遗传信息解读即将完成,控制人类生老病死的“天书”马上就要呈现在人们面前。1 9 2 0 年,h w i n k l e r 最早提出的基因组学( g e n o m i c s ) 是指生物体完整的染色体序列及其所有的基因。1 ,随着人类基因组计划的开展,人们对基因组学的认识也慢慢地由以前的基因组作图和序列测定转变为基因组的功能。为了与原来的基因组学概念相区分,基因组学被分成两个部分即结构基因组学( s t r u c t u r a lg e n o m i c s ) 和功能基因组学( f u n c t i o n a lg e n o m i c s ) 。前者也称为前基因组学( p r e- - g e n o m i c s ) ,指测定生物体完整的染色体d n a 序列;后者被称为后基因组学( p o s t - - g e n o m i c s ) ,指利用结构基因组学中获得的信息和数据,采用一些广泛性( g 1 0 b a l ) 的实验手段来探索基因功能“1 。后基因组学所面临的问题及对应的策略人类基因组计划即将完成,人体所有的染色体d n a 序列将出现在我们面前。如何将这些序列信息与生命现象联系起来就成为当前生物学家们所要迫切解决的问题。而寻找并确定基因所在的位置就成为解决这个问题的第一步。只有首先将基因从基因组序列中“提炼”出来,才能进行下一步的研究工作。因为仅仅拥有染色。体序列并不能揭示基因转录起始与终止的位置、内含子外显子区域、增强子、弱化子以及启动子的位置。在基因组d n a 序列的基础上,根据扈动子、剪接位点等位置的特征和同源蛋白质的结构特征,通过生物信息学手段“寻找基因( o r ff i n d e r ) 具有较高的错误率。这是因为生物体本身是十分复杂的,人类对于基因转录的机理还未能彻底阐明。例如,目前对外显子剪接位点的判断存在一定的错误率,则对于多外显子基因判断的准确性将大大降低,更不用说生物体普遍存在的可变剪接方式。同时,基因调控研究表明,纵使是简单的微生物( 如大肠杆菌) 其基因组的所有基因也不是同时表达。通常情况下,生物的基因组只表达少部分的基因,而且其表达的基因类型及表达程度随生物生存环境的变化而表现出极大的差异。生物在不同发育生长阶段其表达的基因也不尽相同。这样,为了寻找湮没”在大量染色体d n a 序列中的基因,早在人类基因组计划提出的时候,就有人提出全长e d n a 策略。而在1 9 9 4 年,更是提出了蛋白质组学研究策略来研究整体基因组的问题。1 从基因组学到转录组学大多数生物的遗传物质是d n a ,基因则是携带一定遗传信息的d n a 片段。因此对于一个生物体基因组的核心描述就是确定其d n a 序列并对所有的基因进行定位和功能表达分析。由于人的基因组中,仅3 编码蛋白质序列,所以从m r n a c d n a 着手分析哪些基因表达以及何时何地表达被认为是一种相对快速真接易行的方法。全长c d n a 是代表基因转录本的m r n a 序列体外反转录的产物,对于研究基因表达及基因功能很有帮助。但是由于人类基因组计划提出之时,c d n a 文库构建和筛选中的三个关键问题,既完整性、代表性和冗余问题尚未有合适的技术和策略加以解决,因而,全长c d n a 策略实际上无法象基因组测序那样大规模地开展。1 9 9 1 年,c r a i gg e n t e r 等提出e s t ( e x p r e s s e ds e q u e n c et a g ) 策略”1 ,指根据基因转录本末尾处的多聚腺苷酸( p o l ya ) ,用o l i g od ( t ) 引物构建文库或用随机引物构建文库后测序,前者主要是基因的3 端序列( 3 e s t ) ,后者可以是基因的任何位置,包括基因的5 端序列。e s t 的平均长度为3 0 0 - - 5 0 0 个碱基,但是只有大于1 5 0 个碱基的e s t 在同源查找和基因作图中的作用较大。由于3 u t r 序列重复性很小,因此,一段特异的3 e s t 基本上可以代表一种基因的转录产物。到1 9 9 9 年底,在公共数据库( h t t p :w 啊n c b i n l m n i h g o v d b e s t )中已经有2 6 1 0 6 个e s t 登录,它们主要来自子四个研究机构”“和一些私人组织。为了研究这些e s t 与基因的关系以及它们自身之间的关系,n c b i ( 美国国家生物技术信息中心) 采用相似性比较聚类的方法将这2 6 1 0 6 条e s t 归结为近3万个类别,称为u n i g e n e 。通过e s t 和u n i g e n e ,科学家们可以很方便地进行定位克隆,基因确证等方面的工作“。多数情况下,某个e s t 克隆并不跨越某基因的全长区。而利用许多生物信息学工具可以帮助获取某e s t 的全部转录本信息并可以在染色体作图种精确定位。同时,e s t 的数目也可以提示它所代表的基因表达的拷贝数。一个基因在组织或细胞种表达的量越高,其相应的e s t 就越多。但是由于这些e s t 大多数只经过轮测序,序列的准确性不好,有的是一端不可信,有的是整个e s t 都不可信( 在e s t 的说明文档中有提及) 。而且e s t 进行聚类的时候,由于其长度的局限性,比较容易产生不同基因的e s t 归于一类,或同一基因的e s t 归类于两种以上的u n j g e n e 的情况。此外,这种基因片段对于下游的基因功能方面的研究是不够的,例如预测基因功能,预测编码蛋白质的结构以及表达和纯化蛋白质方面的工作。这样,全长e d n a 策略被重新提出来。目前,公共数据库中所包含的有功能研究结果的全长基因序列约有6 ,0 0 0条,占全部编码基因的6 。随着e d n a 技术的不断进步”“,尤其是c d n a 建库技术的进步“2 1 “,结合目前基因功能研究对全长e d n a 的迫切需要,美国国立卫生研究院提出m g c ( m a m m a lj a ng e n ec o l l e c t i o n ) 计划。这一计划主要是针对转录本长度在3 - - 4 k b 的基因,同时着重解决稀少转录本、极长转录本以及转录本中带有特殊结构的问题,目标是每年至少测定2 万条c d n a “。这样,在既定的时间内( 1 9 9 8 2 0 0 3 ) ,人类全部的e d n a 序列测定将随着人类基因组计划的完成而同时完成。现在,全世界有许多实验室已经开展了全长e d n a 测序的工作,估计m g c 计划将提前完成。将来把已有的基因组d n a 序列( 基因组) 和全长c d n a 序列( 转录组) 相比较研究,在获得基因表达方面信息的情况下,同时对基因转录调控、转录剪接体以及跟相邻基因的相互关系进行深入探讨,有助于全面系统地阐明基因的功能。2 从基因组学到蛋白质组学通过m r n a 而衍生出来的全长c d n a 策略虽然能够非常直接地体现整个基因组的表达情况,但是m r n a 由于自身存在储存、转运、降解、翻译、调控和产物的翻译后加工,难以准确反映其最终产物蛋白质的情况。而且生物功能的最终体现者蛋白质,有其自身特有的活动规律,仅仅从c d n a 的角度来研究是远远不够的。9 8 的人类疾病是多基因和或后天获得的。疾病的诊断和治疗可能要完全依赖于后天的调节及患者所处的环境。组织中的m r n a 的丰度与蛋白质丰度的统计相关是不显著的。几乎所有的蛋白质都会经受翻译后的修饰。基于以上种种原因,为了在整体水平上研究细胞内蛋白质的组成及其活动规律,一个新兴的学科蛋白质组学( p r o t e o m i c s ) 就应运而生了。蛋白质组指一个细胞中所有表达蛋白质的总和。蛋白质组概念的雏形最早在1 9 8 6 年与人类基因组计划同时提出,但是由于技术上的原因,一直未得到充分发展。到1 9 9 4 年,蛋白质被重新完善地提了出来,作为基因组在蛋白质水平上的对应概念。同时,由c o r d w e l l 和h s m i t h 提出了功能蛋白质组的概念,指的是在特定时间,特定环境和特定实验条件下基因组活跃表达的蛋白质总和o ”。蛋白质组研究包括对蛋白质的表达模式的研究和对蛋白质组功能模式的研究两个方面。在当前,蛋白质组研究主要集中在表达模式上,建立了大量的两维电泳图谱数据库。自蛋白质组这个概念提出以来,已发表论文上百篇。1 9 9 7 年举行了第一次国际性的蛋白质组学会议,并出版了第一部蛋白质组学的专著。2 0 0 1 年4月,人类蛋白质组学组织在美国的弗吉尼亚召开年会,讨论了虽白质组学2 1 世纪的发展纲要。人类研究生命现象开始于蛋白质的研究,其间经历了d n a 发现后的分子生物学时代,现在又回到蛋白质水平上来,而这次已经不再是以前的盲目研究,而是有目的地,有计划地进行。这既是一次回归,也是一次飞跃。当然,目前蛋白质组研究还主要集中在原核生物以及简单的真核生物,尤其是些基因组已经完全或者大部分确定的生物上,如支原体,细菌,酵母等。后基因组学的研究方法即将完成的人类基因组计划,不但给下一步生命科学研究提供了必需的信息和材料,而且也改变了人们对基因功能概念的认识。早期分子生物学的研究主要表现在对个别基因的研究上。由于缺乏有效的整体的研究手段,象p 5 3 ,r b 等重要基因虽经历了l o 多年的研究,论文数以干计,但是其功能仍不十分明确。这种情况在人类基因组计划后基因功能的研究中显然是不适应的。而且象发育,肿瘤等重大生物学过程的发生发展需要大量基因的参与。传统的基因功能概念指对单一蛋白质分子性质的研究,而目前对蛋白质功能的界定更着重于把它作为参与功能网络的一个部分,这就是所谓基因组范畴的基因功能概念1 ( 如图1 ) 。这样,在后基因组时代,就要采用新的大规模高通量的方法同时研究多个蛋白质之间的功能联系及功能相关蛋白质形成作用网络的问题。这将有助于阐明代谢途径、信号传导通路、大分子蛋白质复台物结构等多个困扰在生命科学家面前的难题。bcxyz图1 蛋白质功能概念的演变左边指传统的蛋白质概念,右边是指后基因组时代蛋白质功能的概念。图中g 指基因,左图中的p 指翻译产物,右图中的a ,b ,c ,x ,y ,z 泛指后基因组时代单个基因处于作用的网络中,并不具有简单的一一对应关系。1 m r n a 水平上的研究方法基因芯片技术在一个细胞中,所有表达基因的转录结果总和称为转录组,它是细胞表型及其功能的决定性因素“。染色体d n a 转录为m r n a ,是蛋白质合成的第步,基因转录组的变化不仅跟细胞表型有关,而且也受外界环境刺激的影响,甚至细胞在不同的生长时期,其转录组也有所不同。获取基因表达时间、表达部位以及表达量的信息对于解释蛋白质功能是必不可少的。同时,研究多基因表达谱的变化对于探求基因调控机制和生物化学途径等方面也能提供必要的支持。目前,高密度基因芯片技术是研究基因转录组最有效的方法之一n 。1 9 8 7 年,a u g e n l i c h t 等在硝酸纤维素膜上点上4 0 0 0 个c d n a 克隆,用m r n a作探针的放射杂交揭开了大规模核酸分子杂交的序幕。现在的基因芯片从形式上讲由微矩阵和寡核苷酸芯片;从内容上看有表达谱芯片,疾病诊断芯片和其它专业芯片:在规模上,从4 ,0 0 0 到数万,预期在不久的将来可以包括全部的人类可表达基因,甚至是多种模式生物的基因,以便于比较研究。虽然,基因芯片技fg术本身存在设计,数据处理,数据稳定性,储存运输等方面的问题,但是它的发展前景是不可限量的。寡核苷酸:吝片是利用光指导d n a 合成的方法在硅晶体上原位合成特定的寡核苷酸,其密度可达到2 5 ,0 0 0 点平方厘米以上,具备大规模生产的可能。但是其设计的可变性较小,固定的寡核苷酸长度有限,成本偏高,很难在芯片技术发展阶段得到广泛的应用。而微矩阵基因芯片是利用微点样技术将大量的靶基因片段有序而高密度地( 点与点之间的距离小于5 0 0 n m ) 排列在玻璃、塑料、纤维膜等载体上,标记的探针通过分子杂交原理与载体上的靶序列结合,最后通过检测探针标记的强度来获得杂交图谱。其设计具有相当的可变性,成本较低,设备和技术也较成熟。通过分析比较表达谱,将表达下调( 或上调) 的基因归类,对于全局性( g i o b a l ) 研究基因功能是至关重要的”。与常规的n o r t h e r n 杂交和点杂交相比,基因芯片技术有大规模、高通量的特点,同时随着计算机技术、电子学技术的发展,基因芯片技术在材料选择。“、点样密度。“、检测灵敏度。”“1 及探针用量方面都有了长足的进步。随着人类基因组计划的完成以及全长e d n a 测序工作的开展,使用全长c d n a 作为靶序列,从细胞或组织中提取m r n a 反转录为e d n a 作为探针进行的基因表达谱方面的研究必将在基因转录水平上为基因功能研究提供大量的信息。自1 9 9 5 年,m s c b e n a 和p 0 b r o w n 等的第一篇应用基因芯片研究的论文发表以来。“,基因芯片技术已经广泛地应用到肿瘤发生的分子生物学方面、肿瘤的病理学分类、药物靶分子筛选以及代表基因筛选等方面2 蛋白质水平上的研究方法二维电泳技术随着国际互联网的迅猛发展,公共数据库中的d n a 序列也激增起来,但是仅仅这些全序列信息不能用来揭示生物功能。细胞的正常生长有赖于相互作用的代谢途径和信号传导途径,而染色体序列与蛋白质又不具备直接的联系。虽然在m r n a 水平上的研究可以揭示基因功能方面的信息,但是对于蛋白质翻译后修饰的问题就无能为力了。另外,m r n a 水平的变化并不能完全反映蛋白质水平的变化0 2 。3 “,而且蛋白质之间的相互作用以及细胞器的分子组成等方面的研究也只能在蛋白质水平上开展。一般细胞中含有数千乃至上万种蛋白质,新提出的蛋白质组学”的研究宗旨就是将组织或细胞中所有的蛋白质分离鉴定。1 ) 二维电泳技术1 9 7 5 年o f a r r e l l 和k l o s e 各自创建的蛋白质高分辩双向凝胶电泳技术是蛋白质组学研究的主要手段之一。二维电泳技术是根据等电点使细胞抽提液中的蛋白质组分在一个方向分离,再利用分子量差别在另一个方向使蛋白质分离。与传统的单向电泳相比,二维电泳的分辨能力和分辨率大大提高,在最合适的实验条件下可以分离到1 1 ,0 0 0 个蛋白质”。质谱技术最早应用在生命科学研究上是在2 0 世纪6 0 年代,在8 0 年代b a r b e r 等利用快原子轰击技术测定蛋白质的结构,从而使质谱技术应用于蛋白质和肽的测定上1 。目前,质谱一方面可以准确测定一个未知蛋白质或不纯蛋白质的分子量,同时又可以定出较复杂的蛋白质裂解片段中各个肽段的分子量和氨基酸顺序。这样经二维电泳技术分离的蛋白质通过蛋白酶消化后用质谱技术测定其序列可以为蛋白质组学的研究提供一个有效的研究手段”。应用这项技术已经在分离分析肿瘤组织中的分泌蛋白质方面取得了较大进展m ,将来可能用来分析不含m r n a 的体液样品,而且在蛋白质表达量跟m r n a无直接关系、蛋白质翻译后修饰( 如磷酸化作用、糖基化作用) 发挥生物功能等情况下的蛋白质表达谱研究中发挥作用。当然,应该看到的是,二维电泳技术毕竟分辨率有限。2 ) 蛋白芯片技术蛋白( 肽) 芯片是由固定于支持介质上的蛋白或多肽构成的微阵列。很多基因芯片的制备方法,如光引导聚合法、合成点样等,也可应用于蛋白( 肽) 芯片的制备。l u e m n g 等将已知蛋白点印在p v d f ( p o l y v i n y l i d e n ed i f l u o r i d e ) 膜上,制成蛋白微阵列,并将抗体与该芯片进行孵育反应,再将辣根过氧化物酶( h r p ) 标记的第二抗体与芯片一抗体复合物反应,通过显色反应检测抗体的存在情况,从而对抗体进行筛选。该方法不仅适合于抗原、抗体的筛选,同样也可用于受体一配体的相互作用的研究。蛋白质芯片的关键组成部分包括:表面化学作用用于使蛋白质或其他因子固定于载体表面;纯化蛋白质用作探针,检测蛋白质分子结合情况或表达水平;捕获因子用于与目的蛋白结合;检测手段检测蛋白质探针与芯片上蛋白或捕获因子结合水平。随着人类基因组研究的进展,人们越来越注重于在蛋白质水平上研究整体生物的生理过程,而蛋白芯片技术也得到蓬勃的发展。目前,蛋白芯片制备过程中出现的诸多问题,已经都有相应的方法解决。国外大生物公司也瞄准这一产业,纷纷投入研究力量进行技术攻关和技术转化。b i o i n s i g h t s 在( ( p r o t e i nc h i p s :t h er a c ef o rh i g h t h r o u g h p u tp r o t e i na n a l y s i s ) 报告中列出了六家已经或即将推出其蛋白质芯片检测平台的生产厂商,这其中除了早已进入市场的b i a c o r e 和c i p h e r g e n 两家外,还包括h t sb i o s y s t e m s ,p h y l o s ,s o m a l o g i c 和z y o m y x 等四家。更多的公司还处于早期开发阶段,b i o i n s i g h t s 列出的名单中有c o m b i m a t r i x ,d y a x ,p a c k a r db i o s c i e n c e 和p r o t e o m es y s t e m s 等大约1 2 家。b i o i n s i g h t s 也列出了6 个值得关注的研究项目,如l a w r e n c el i v e r m o r e 国家实验室j o a n n aa l b a l a 领导的小组,斯坦福大学p b r o w n 研究小组和哈佛大学g a y i nm a c b e a t h 小组等。3 生物信息学不得不提到的一个重要手段就是生物信息学。面对基因组计划产生的海量序列数据和相关信息,如何有效分析这些数据,如何从序列信息中推论出功能信息,是当前全世界生命科学家们所面临的重大课题。2 0 世纪8 0 年代兴起的生物信息学无疑为我们从大量的信息中探索未知基因的功能提供了有力的工具。现在,生物信息学已经象常规分子生物学方法一样成为实验室工作人员常用的手段。生物信息学的基础是基因组信息学,包括基因组信息的获取,处理,存储,分配和解释等方面。主要包括:1 ) 大规模的数据库;2 ) 传输信息的网络;3 ) 数据处理的软件。生物信息学是以信息科学技术为主要手段,以计算机及网络为主要工具,研究和开发生物信息,为生物技术和生命科学服务的一门学科。生物信息学数据库是其主要内容,各种数据库几乎覆盖了生命科学的各个领域。核酸序列数据库有g e n b a n k ,e m b l ,d d b j 三大数据库,包括约9 5 的新核苷酸序列。蛋白质序列数据库有s w i s s p r o t ,p i r ,o w l ,n r l 3 d ,t r e m b l 等。蛋白质结构域数据库有p r o s i t e ,b l o c k s ,p r i n t s 等。三维结构数据库有p d b ,b i 。m a g r e s b a n k ,c c s d 等。根据研究人员的不同要求,有大量的免费软件或分析手段可以选取。目前出现的生物学分析软件不计其数,本文附录中列出了部分常用的网址。到目前为止已经有近2 0 个物种的基因组序列测定完毕,其中包括四种模式生物:大肠杆菌、酵母、线虫和果蝇。在基因组水平上,利用生物信息学手段研究基因功能促使- f 新的学科比较基因组学的产生。比较基因组学最常用的方法就是同源比较,在物种之内或物种之间通过“相似性”原理比较寻找同源性高的蛋白质,这样根据同源蛋白质的己知功能来推导未知蛋白质的功能。在基因组水平上使用这种方法,大约只有4 0 - - 7 0 的基因可以跟功能联系起来,而且这种联系大多是关于已经研究的很清楚的原核生物“。”1 。这对于大规模研究基因功能来讲是不够的。g e r a l dm r u b i n 曾采用一种“全对全”( a 1 la g a i n s ta 1 1 )的方法对酵母、线虫和果蝇三种模式生物进行比较基因组方面的分析,得到许多有意义的结果“。在人类基因组序列全部测定以后,这种方法同样也适用于人跟其他模式生物的基因组比较。针对蛋白质之间的相互作用问题, f m a r c o t t e 构建了种系发育模式( p h y l o g e n e t i cp r o f i l e s ) “、结构域融合方法( r o s e t t as t o n e ) “”来研究在物种进化上保守的相互作用蛋白质之间的关系,也有用其它方法进行类似的研究。结论人类基因组计划是生命科学发展历史上一个里程碑式的工作。它的出现不仅为生命科学研究提供了大量的数据和材料,而且促进了一些新学科的产生,如肿瘤基因组学、药物基因组学、环境基因组学等。从基因组向基因功能研究的转变是认识发展的不同时期和阶段,认识的深入和提高依赖于技术的发展和创新,同时,认识事物的思想和策略又常常超前并指导技术的发明。人类认识生命经历了从宏观到微观的过程,在基因组全序列测定即将完成的今天,我们所面临的问题是从分子水平出发来认识生命现象,已经从原来的单一化、孤立性研究,变成系统化的、以基因组为基础的、各个层面综合研究的“大科学”。因此,特别强调研究思路的创新和技术手段的优化组合。在后基因组时代,针对不同的研究水平,有转录组学、蛋白质组学、比较基因组学等多种研究方法,与之相适应,有多种实验方法,如c d n a 芯片、二维电泳、蛋白质芯片、生物信息等正逐步建立起来并正在发展与完善。思想创新带动技术创新,才能更快更准确地研究基因功能、寻找基因药物、筛选药物作用标靶、探究生命机理。参考文献:1 w a t s o njd ,c r i c kfhc m o l e c u l a rs t r u c t u r eo fn u c l e i ca c i d s n a t u r b1 9 5 3 ,1 7 1 :7 3 7 7 3 8 2 a v e r y0t ,m a c l e o dcm ,m c c a r t ym s t u d ie so nt h ec h e m i c a ln a t u r eo ft h es u b s t a n c ei n d u c i n gt r a n s f o r m a t i o no fp n e u m o c o c c a lt y p e s i n d u c t i o no ft r a n s f o r m a t i o nb yad e o x y r i b o n u c l e i ca c i df r a c t i o nf r o mp n e u m o c o c c u st y p e s1 1 1 j e x p m e d j 1 9 4 4 7 9 :1 3 7 1 5 8 3 m c k u s i c kv o e n o m i c s :s t r u c t u r a la n df u n c t i o n a ls t u d i e so fg e n o m e s g e n o m i c s 1 9 9 7 ,4 5 :2 4 4 2 4 9 4 h i e t e rp b o g u s k im f u n c t i o n a lg e n o m i c s :i t sa 1 lh o wy o ur e a di t s c i e n c e ,1 9 9 7 ,2 7 8 :6 0 1 6 0 2 5 b u c k sc m o l e c u l a rb i e l o g yd a t a b a s e1i s tn u c e i ca c i dr e s ,1 9 9 9 ,2 7 ( 1 ) :卜9 6 d o e r i n gtl ,r a p e rj ,b u x b a u mlu ,e ta a na n a l o go fm y r i s t i ca c i dw i t hs e l e c t i v ef o ra f r i c a nt r y p a n o s o m e s s c i e n c e , 1 9 9 1 ,2 5 2 :1 8 5 1 1 8 5 47 w i l l i a m s o nar t h em e r c kg e n ei n d e xp r o j e c t d r u g d i s c o nt o d a y , 1 9 9 9 ,4 ( 3 ) :1 1 5 - 1 2 2 8 s t r a u s b e r grl ,d a h lca ,k 1 a u s n e rrd n e wo p p o r t u n i t i e sf o ru n c o v e r i n gt h em o l e c u l a rb a s i so fc a n c e r n a t u r eg e n e t ,1 9 9 7 ,1 5 :4 1 5 - 4 1 6 9 m a r r am ,h il1ie rl ,k u c a b at ,e ta a ne n c y c l o p e d i ao fm o u s eg e n e s n a t u r eg e n e t ,1 9 9 9 ,2 1 ( 2 ) :1 9 1 一1 9 4 1 0 d e l o u k a sp ,s c h u l e rgd ,g y a p a yg ,e ta 1 ap h y s i c a lm a po f3 0 ,0 0 0 h u m a ng e n e ss c i e n c e , 1 9 9 8 。2 8 2 :7 4 4 7 4 6 1 1 b o n a l d omf ,l e n n o ng ,s o a r e smb n o r m a l i z a t i o na n ds u b t r a c t i o n :t w oa p p r o a c h e dt of a c i l i r a t eg e n ed i s c o v e r y g e n o f l l er e s ,1 9 9 6 ,6 ( 9 ) :7 9 1 8 0 6 1 2 s e k im ,c a r n i n c ip ,n i s h i y a m ay ,e ta 1 h i g h e f f i c i e n c yc l o n i n go fa r a b i d o p s i sf u l l l e n g t hc d n ab yb i o t i n y l a t e dc a pt r a p p e r p a n t ,1 9 9 8 。1 5 ( 5 ) :7 0 7 - 7 2 0 1 3 c a r n i n c ip ,w e a t o v e ra ,n i s h i y a m ay 。0 h s u m it e ta j ,h i g he f f i c i e n ts e l e c t i o no ff u l l l e n g t hc d n ab yi m p r o v e db i o t i n y l a t e dc a pt r a p p e r 助wl e s ,1 9 9 7 ,4 ( 1 ) :6 i - 6 6 1 4 e d e r yi ,c h ull ,s o n e n b e r gn ,e ta 1 a ne f f i c i e n ts t r a t e g yt oi s o l a t ef u l 卜l e n g t hc d n a sb a s e do na nm r n ac a pr e t e n t i o np r o c e d u r e ( c a p t u r e ) m e c e _ i j 历o i ,1 9 9 5 ,1 5 :3 3 6 3 - 3 3 7 1 1 5 s t r a u s b e r grl ,f e i n g o l dea ,k l a u s n e rrd ,e ta 1 t h em a m m a l i a ng e n ec 0 1 l e c t i o n s c i e n c e , 1 9 9 9 2 8 6 :4 5 5 4 5 7 1 6 w a s i n g e rvc ,c o r d w e l lsj ,e ta 1 p r o g r e s sw i t hg e n e p r o d u c to ft h

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论