(生物医学工程专业论文)与dnarna结合的蛋白质及其残基分析.pdf_第1页
(生物医学工程专业论文)与dnarna结合的蛋白质及其残基分析.pdf_第2页
(生物医学工程专业论文)与dnarna结合的蛋白质及其残基分析.pdf_第3页
(生物医学工程专业论文)与dnarna结合的蛋白质及其残基分析.pdf_第4页
(生物医学工程专业论文)与dnarna结合的蛋白质及其残基分析.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(生物医学工程专业论文)与dnarna结合的蛋白质及其残基分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东南大学硕士学位论文 a b s t r a c t t h e s i st i t l e :a n a l y s i sa n dp r e d i c t i o no fd n a r n a - b i n d i n g p r o t e i n sa n d t h e i rb i n d i n g r e s i d u e s g r a d u a t es t u d e n tn a m e :w u h a n gt a o s u p e r v i s o rn a m e :s u n x i a o ( p r o f e s s o r ) s c h o o ln a m e :s o u t h e a s tu n i v e r s i t y p r o t e i na n dn n c l e i ca c i da r et w om o s ti m p o r t u n tm o l e c u l e si nc e l l n l ei n t e r a c t i o nb e t w e e n p r o t e i na n dd n a r n ai st h ek e yo fm a n yc e l lf u n c t i o n s ,s u c ha sg a n er e g u l a t i o n , d n ar e p a i ra n d p r o t e i ns y n t h e s i sa n dt r a n s l a t i o n t h i si n t e r a c t i o ni sa l s oo n eo ft h ec e n t r a lp r o b l e m si nm o l e c u l a r b i o l o g y i nt h i sp a p e r , w ec a r r i e do ns o m es t u f f s t i ca n a l y s i sa b o u tp r o t e i n - d n ai n t e r a c t i o nb a s e do na 儿 t h ed n a p r o t e i nc o m p l e xf r o mp d bd a t a b a s e w ea n a l y z e dt h ec a p e i t yo ff o r m i n gah y d r o g e n b o n db e t w e e nd i f f e r e n tp a r t so fp r o t e i nr e s i d u e sa n dn u c l e i ca c i d sr e s i d u e si np r o t e i n d n a 佩n a c o m p l e x e sa n dn o b - h o m o l o g o u sp r o t e i n - d n a r n ac o m p l e x e s r e s p e c t i v e l y 1 1 1 er e s u l t ss h o w t h a ta m i n oa c i ds i d ec h a i ni n c l i n e dt oi n t e r a c tw i t ht h en u c l e o t i d em o l e c u l e sb yh y d r o g e nb o n d si nt h e i n t e r a c t i o nb e t w e e np r o t e i na n dn u c l e i ca c i d , w h i c ha c c o u n tf o ra b o u t7 0 i n p r o t e i n d n a c o m p l e x e s ,p h o s p h a t ep a r to ft h en u c l e i ca c i di st h ee a s i e s tp a r tw h i c hi n t e r a c tw i t hp r o t e i nb y h y d r o g e nb o n d s ( a c c o u n t i n gf o rm o r et h a n5 0 ) ,f o l l o w e db yt h eb a s ep a r t ( a b o u t3 0 ) ,t h em o s t d i f f i c u l tp a r ti ss u g a r ( a b o u t1 7 ) b u ti np r o t e i n s - r n ac o m p l e x e s ,s u g a ri se a s i e s tp a r t ( a b o u t3 6 p e r c e n t ) ,f o i l o w e db yt h ep h o s p h a t ep a r t ( a b o u t3 5 ) ,t h eb a s ep a r t ( a b o u t2 8 ) w ea l s oa n a l y z e d t h eb i n d i n gc a p a c i t yb e t w e e nt h e2 0a m i n oa c i d sa n dt h e4n u c l e i ca c i d s b e c i d e s ,t h ec o b i n d i n g c a p i c i t yo f2 1 0 “d o u b l er e s i d u e s ”a n d4 2 0 0 “t r i p l er e s i d u e s ”w i t hd n aa l ea l s os t u d i e d 1 1 1 e r e s u l ts h o w st h a tt h eb i n d i n gc a p i c i t yo f4 2 0 0 “t r i p l er e s i d u e s ”a n d2 1 0 “d o u b l er e s i d u e s ”i n p r o t e i n - d n a r n ac o m p l e x e s a n d n o n - h o m o l o g o u sp r o t e i n - d n a r n ac o m p l e x e s a r e s i n g n i f i c a n t l yd i f f e r e n t w eu s e dl i l a c h i n el e a r n i n gm e t h o d st op r e d i c tt h ep r o t e i nr e s i d u e st ow h i c hd n am o l e c u l e s b i n d f o r ? t i mm e c h a n i s mo fp r o t e i n - n aj n t e r a c t i o ni st o oc o m p l i c a t e dt ob eu n d e r s t o o du s i n g o n l yt h et r a d i t i o n a ls t a t i s t i c a lm e t h o d s n t r a i n i n gd a t ai sd e r i v r e df r o ma l lt h ep r o t e i n sw i t h k n o w n3 ds t r u c t u r e sf r o mp d bd a t a b a s e b a s e do nt h i sd a t as e t , w ec a l c u l a t e d1 3p r e d i c t i o n f e a t u r e sw h i c hc o u l db ec l a s s i f i e di n t o3c a t e g o r i e s :t h ep h y s i c o e h e m i c a lp r o p e r t yo fa n l i n oa c i d s , s t r u c t u r ej n f o r m a t i o na n de v o l u t i o n a r yc h a r a c t e r i s t i c s a f t e rl o o a lf e a t u r eo p f i m i z a t i o n , w eg o ta n o p t i m a lf e a t u r es e t ,i n c l u d i n g4f e a t u r e s :p s s m s t h es e c o n d a r ys t r u c t u r e ,t h em i n i m u mf r e e e n e r g ya n d p i t h e nw ea p p l i e dt h i so p t i m a lf e a t u r es e tt os u p p o r tv e c t o rm a c h i n e ( s v m ) a n d r a n d o mf o r e s t ( r n 1 1 l e s u i t ss h o wt h a tt h ep e r f o r m a n c e so ft h et w oa l g o r i t h m sa r es i m i l a r , w h i c hp r o v e st h a tt h ef e a t u r es e ti n0 1 1 1 s t u d yi se f f e c t i v ei np r e d i c t i n gt h ed n a - b i n d i n gr e s i d u e s t h es v mm o d e li no u rs t u d ya c h i e v e sat o t u la c c u r a c yo f8 2 ,2 7 m a t t h e wc o r r e l a t i o n c o e f f i c i e n to fo 4 3 4 s e n s i t i v i t yo f7 0 4 0 ,a n ds p e c i f i c i t yo f8 4 0 3 c o m p a r e dw i t hw a n g s m e t h o d s o u rs v mm o d e li sn e a r l y1 0 h i g h e ri nt o t a la c c u r a c y s oi t i sc l e a rt h a to u ro p t i m a l f e a t t i r es e th a sb e t t e rc l a s s i f i c a t i o ne f f e c t st h a n w a n g sf e a t n l _ e s e tw h i c hi n c l u d e p k a , i i r e s p e c t i v e l ym o | e c 妇w e i g h ta n dh y d r o p h o b i cv a l u e w ea p p l i e do n rs v mm o d e lt oa n i n d e p e n d e n td a t as e tt oa n dt h e r e s u l ts h o w st h a tt h ep e r f o r m a n c eo f0 1 1 1 m o d e li ss t a b l ea n d r e t i a b l e w ea l s ou s e ds u p p o r tv e c t o rm a c h i n e ( s v m ) a n dr a n d o mf o r e s t ( r f ) c o m b i n ew i t ht h e f e a t a r es e tw h i c hi n c l u d ep s s m s ,s e c o n ds m l c t a r ea n do r t h o g o n a lb i n a r yv e c t o r st op r e d i c t r n a b i n d i n gr e s i d u e s 耵er e s u l ta c h i e v e sat o t a la c c u r a c yo f7 5 2 3 m a t t h e wc o r r e l a t i o n c o e f f i c i e mo f0 + 5 0 6 s e n s i t i v i t yo f7 4 6 8 a n ds p e c i f i c i t yo f8 4 0 3 c o m p a r e dw i t hp r e v i o u s m e t h o d s o u rm o d e li sa b o u t4 h i g h e ro na v e r a g ei ne v e r ye v a l u a t i o ni n d i c a t o r a n di ta l s op r o v e t h a tp s s m sa n ds e c o n ds 咖c t u r ef e a t u r e sh a sb e t t e rc l a s s i f i c a t i o ne f f e c to np r e d i c t i o no f d n a 佩n a - b i n d i n gr e s i d u e s k e yw o r d s :p r o t e i n n ac o m p l e x e s ,i n t e r a c t i o n , h y d r o g e nb o n d ,m a c h i n el e a r n i n g ,s u p p o r t v e c t o rm a c l l i n e ( s v m ) ,r a n d o mf o r e s t ( r f ) ,d n a - b i n d i n gr e s i d u e s ,r n a b i n d i n gr e s i d u e s 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 研究生签名: 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 研究生签名:了之;象芦。导师签名: 日期:口孑s 2 罗 第一章绪论 第一章绪论 蛋白质和核酸是构成生命体最为霓要的两类牛物大分子,它们各自具有其结构特征和特 定功能,核酸具有传递遗传信息等功能而蛋白质则贯穿生命的所有生理过程。蛋白质与 d n a r n a 相互作用是许多细胞功能的核心。例如,转录因子结合到启动子区的特异d n a 的m o t i f , 从而导致转录的表达或抑制;在核糖体中,蛋白质和r n a 相互作用对核糖体的装 配与行使功能起到了至关重要的作用。蛋白质与d n a r n a 的相互作用是分子生物学研究 的中心问题之一。近年来,随着x 射线晶体衍射和n m r 技术的日趋成熟与完善,越来越多 的高分辨率蛋白质核酸的复合物三维结构被测出,特别是近些年来核糖体这些超大分子的三 维结构被测出【l ,2 1 ,使我们能够从原子水平上来研究蛋白质和核酸的相互作用的 d l , $ f j 3 9 1 。 本课题研究的对象就是这些高分辨率的蛋白质核酸复合物。 1 1 蛋白质核酸复合物结构解析及其数据库 大部分生物大分子( 包括蛋白质核酸复合物) 的结构解析,主要靠x 射线衍射晶体学 技术( x - m y d i f f r a c t i o nc r y s t a l l o g r a p h y ) 和核磁共振波谱技术( n m r ) 1 1 1x - 射线衍射晶体学技术0 0 1 2 】 届微镜技术的进步使生物学进入细胞水平,而x 射线衍射技术则使生物学深入到分子 和原子水平。x 射线衍射分析利用x 射线的波长与原子的大小及原子间距同数量级这一特 征,当一束准直的x 射线入射到样品晶体分子时,组成分子的原子使散射的x 射线相互干 涉形成衍射图形。衍射点的位置和强度取决于分子中原子的排列和相互关系。很多生物大分 子样品都町以制成晶体样品,因而衍射图形能够提供有关分子结构的信息。晶体内部存在扈 复排列,晶体结构的特征是组成晶体的粒子( 原子、离子或分子) 的排列具有周期性和对称 性。晶体町以看成是由晶胞( 或者晶格) 堆积向成的。晶胞三个棱的长度a 、b 、c 称为晶胞 常数。也可以把晶体看成是由一组平行、等距、结构相同的原子面( 即晶面族) 组成。晶面 族的取向可以用密勒指数表示。 x 射线衍射方向决定于晶体的周期或晶面间隔,但是,在周期相同或晶面间隔相同的情 况下,由于晶胞内原子排布方式不同,则会造成衍射点强度不同。也就是说,衍射点强度的 大小包含着与分子结构有关的信息。分子结构中所有原子对每一个衍射斑点的强度都有各自 的贡献,因此通过分析x 射线衍射点的强度,可以得到有关晶胞内原子排布的信息。 常用的晶体衍射强度的记录有两种方式。一种是将晶体所产生的衍射光束点记录在底片 上,如经典的感光胶片,然后,用扫描仪阅读衍射强度。近年来发展起来的象板探测器,实 际上是用象板取代了感光胶片,免除了显影、定影等麻烦。另一种方法是多丝正比面探测器, 先将衍射光束光子信号转换为电子信号,再处理为衍射强度。还可以采用c c d 技术,使数 据采集精度和信号转换速度得到较大的提高。这非常重要,因为生物大分子晶体结构解析的 分辨率和精度主要取决于晶体衍射数据采集的质量和精度。 多波长反常散射法成为近年来发展较快的一种方法。生物大分子中通常含有金属离子或 重原子,不同的原子对不同波长的x 射线具有特征的反常散射效应。同步辐射光源具有强 度高、单色性好、波长连续可调的特点,在进行生物大分子晶体衍射实验时,如果晶体中含 东南大学硕士学位论文 有金属离子或重原子,则可以将同步辐射光源的波长调整到对应原子反常散射明显的位置, 获得反常散射数据,从而进行晶体结构的解析。 生物大分子的二级结构常常是螺旋结构( 如蛋白质中的伍螺旋和d n a 的双螺旋) ,其 特点是每一圈螺旋中( t l 1 每一周期) 包龠一定数量的、散射能力相同的结构单元。具有螺旋结 构的牛物大分子其x 射线衍射图有相麻的特点。凡是衍射图上具有这些特点的物质如 纤维状蛋白质、d n a ,其结构均为螺旋结构。 利用从衍射图得到的衍射数据,可以分析出晶胞内三维空间的电子密度分布,确定结构 模型。下面以肌红蛋白为例加以说明。肌红蛋白分子量为1 8 0 0 0 ,含有1 5 3 个氨基酸残基, 分子中有1 2 0 0 个原子( 不包括氢原子) 。为了定出分子中所有原子的位置,需要测量大约2 0 0 0 0 个衍射点的强度并计算其位丰目角。第一阶段分析到6 a 的水平,定出多肽链和正铁血红素的 位置,其中棒状结构符合一a 螺旋的特征,推算出n 螺旋约占残基总数的7 0 。进一步分析 提高到2 a 的水平,虽然不能定出每个原子的位置但可以肯定分子的主要部分足由o 【螺 旋组成,而且是右手螺旋,链必须弯曲、盘绕。其中大约1 3 1 8 个残基不是一a 螺旋,一半 以上的氨基酸残基能定出种类。再进一步分析到1 5 a 的水平,可以完全弄清楚氨基酸排列 顺序。这样,通过x 射线衍射的研究,可以确定蛋白质一级、二级、三级结构。可见x 射 线 i _ _ = 射分析是研究生物大分子结构的强有力的工具。 用x 射线衍射技术分析分子结构时,一般有以下几个步骤:( 1 ) 用实验测定单个品格 的线度和从衍射图中测量衍射点的强度;( 2 ) 根据上述数据,结合其它方法推断原子排列, 得到尝试结构模型,计算这种结构的衍射极大值,然后与实验观察值比较;( 3 ) 修正所提 出的模型,直到计算结果和实际所得到的数据趋于吻合。 x 射线晶体学方法是测定蛋白质结构的主要方法。球状蛋白质是多肽链卷曲成团的蛋白 质,它和纤维状蛋白不同构型般比较复杂。球状蛋白质分子量大,表面基团的构象不稳 定,要获得有序排列的晶体是比较刚难的。所形成的晶体不可能足完美的堆砌,而是会在分 子之问形成许多大的孔或通道。这些通道常常由占晶体体积一半以上的溶剂分子所占有,而 溶剂分子的绝大部分在晶体上又是无序的。晶体中的蛋白质分子之问仅有少量的区域发生接 触,这些区域的相互作用也是较弱的相互作用,通常是通过一个或儿个溶剂分子发生作用。 蛋白质晶体的形成依赖于一些参数,如p h 值、温度、蛋白浓度、溶荆的种类、沉淀剂的种 类以及金属离子和某些蛋白的配基等。 用x 射线衍射图分析d n a 的空间结构,出现螺旋结构的衍射图样,说明每一圈螺旋有 1 0 个重复结构单元,反映了分子间的排列情况。根据d n a 的x 射线衍射图结合其它技术, w a t s o n 和c r i c k 提出了d n a 的空间结构模型:两条多核苷酸链组成反平行的右手双螺旋, 磷酸在外,碱基在内;螺距为3 4 , g , ,每i 割螺旋包含l o 个核苷酸,每个核苷酸轴睦为3 4 a , 螺旋直径为2 0 a 。 1 1 2 核磁共振结构分析【1 0 1 2 】 进行晶体衍射结构分析的先决条件是获得高质量的、可供衍射分析用的晶体,但有时要 得到合适的晶体是非常困难的;另外,由于蛋白质通常是在水溶液中发挥其生物功能,而蛋 白质在晶体和溶液状态下的结构可能是不同的。如何在溶液中测定蛋白质的空间结构,一直 是人们所关注的问题。近年来,迅速发展的核磁共振技术( n m r ) 为在溶液环境中测定蛋 白质结构提供了可能。另一方面,蛋白质结构在生物系统中是不断变化的,认识蛋白质结构 2 第一章绪论 的动态特性对于了解生命过程是非常重要的。利用n m r 技术可以研究蛋白质结构的动态特 性。 核磁共振现象是1 9 4 6 年由美国斯坦福大学的b l o c h 和哈佛大学的p u r c e l l 研究小组发现 的。核磁共振波谱法是利用原子核的物理性质,采用当代最先进的电子学和计算机技术,研 究各种分子化学结构的一种有效工具。核磁共振技术在生物化学领域有重要的应用,这种技 术可以在不破坏生物样品并保持在溶液状态下研究生物大分子,例如分析蛋白质结构的动态 变化,研究分子结构与生物功能的关系。近年来,多维核磁共振技术迅速发展,已成为结构 生物学中除x 射线晶体衍射方法外最重要的实验技术。 核磁共振技术在分子生物学中的主要应用包括: ( 1 ) 测定生物大分子的空间结构,研 究生物大分子与配基的相互作用;( 2 ) 测定生物大分子的动力学性质;( 3 ) 跟踪量自质的 折叠过程,捕获折叠过程中瞬态的中问物。 核磁共振是指原子核吸收外界能量而产生的一种能级跃迁现象,这种能级跃迁实质上是 共振吸收( 或刺激吸收) 。共振吸收的特点是:通过外界能量檄励电磁场,其磁矢量在某一 平面内旋转。产生核磁共振的条件是,当激励磁场的磁矢量旋转圆频率等于原子核的运动频 率且方向一致时,原子核才会吸收能量,产生能级跃迁。 n m r 谱一般是由多条形状不同、间距和高度也不同的吸收线组成的。谱线给出了丰富 的信息,关键在于如何识别谱线将信息解译出来。谱线相对基准线的位置,叫做化学位移, 它与某种特定基团在谱线中的位置有关。谱线下所围成的面积,代表谱线强度,它与吸收的 等效核数成正比。谱线形状、宽度和数目,与弛豫时间、自旋一自旋分裂有关。谱线强度用 谱线下所围的面积表示。由于谱线不只是一条,所以通常用若干条谱线积分面积之比表示。 例如,甲醇的n m r 谱中,谱线秘分面积之比为i :3 ,它代表了自旋核的相对数值。在邻近 棱上存在自旋,可引起共振谱线的分裂( 自旋一自旋分裂) 。其表现在n m r 谱中的每条吸 收线分裂为若干条线( 有的吸收线不分裂) 。 n m r 利用核磁共振( n m r ) 谱的分析可得到如下生物材料结构与功能关系信息:共振谱 线的位置是所属化学基团的标志;潜线面积正比于产生共振的核的数目;谱线的细微分裂( 谱 线的多重性) 及其相对强度,反映出共振核的近邻环境:谱线宽度则与分子迁移率、分子刚 度及自旋一自旋弛豫和晶格一晶格弛豫等有关。弛豫是一个系统受到扰动失去平衡后恢复到 平衡状态的过程。自旋一自旋弛豫是自旋系统恢复到平衡态的过程。利用核磁共振技术研究 生物材料的优点是:能研究溶液和活体中生物分子的构象及其变化,了解动态过程。这对研 究组成生物体的主要元素氢、碳、氮、氧等轻元素特别有效。通过研究共振谱随温度的变化, 能辨别生物大分子中发生变构的部分。例如,具有输送0 2 、c 0 2 重要功能的血红蛋白,在 氧合和非氧合状态的核磁共振谱不同:非氧合状态具有相当于6 个矿强度的特征谱线,在 氧合状态却消失了。这反映了两种状态具有不同空间卷曲的三维结构。生命现象是复杂多变 的,生物大分子在溶液态的多变结构与生命活动紧密相关。n m r 新技术的发展,开辟了测 试并解析高分子量蛋白质、核酸、糖类等生命物质的新天地。 在分析生物大分子结构的动态特性方面,激光拉曼光潜和蛋白质荧光光谱也有着应用。 可以用激光拉曼光谱检测生物分子的振动运动,用蛋白质紫外荧光猝灭方法研究蛋白质分子 的涨落运动。 在实际应用中,究竟用x 射线晶体衍射分析,还是用n m r 技术,需要根据具体情况而 定。对于蛋白质结构测定而言,进行x 射线晶体衍射分析要求事先将蛋白质结晶,而这并 非是一件容易的事。n m r 虽然可以在溶液状态中检测而不要求结晶,但目前只能分析较小 3 东南大学硕士学位论文 的蛋白质。所以,根据待测蛋白质的情况灵活采用不同分析技术,才能快速、有效地得到所 需要的分析结果。 1 1 3 p d b 数据库 p d b ( p r o t e i nd a t ab a n k ) f 1 3 ,1 4 】是结构生物信息学研究联合实验室( t h er e s e a r c h c o l l a b o r a t o r y f o rs t r u c t u r a l b i o i n f o r m a t i c s ,r c s b ) 于1 9 7 1 年建立的争世界最完整的包括蛋白 质、核酸、蛋白一核酸复合物及病毒等生物大分子的三维结构数据库,网址为 h t t p :w w w r c s b o r g p d b 。p d b 生物大分子结构数据库向用户提供与每个结构相关的各种信 息,不仅包括生物学信息、文献信息,还包括序列详细信息、原子坐标、结晶状况、利用不 同方法计算的三维结构相邻元素、派牛的几何数据、结构因子、三维图像以及其他资源链接。 r c s b 与e b i 和n c b l 紧密合作,保持每个结构数据的一致性,并可以实现与蛋白质序列数 据库、核酸序列数据库的交叉检索【1 5 j 。截止2 0 0 8 年4 月8 日p d b 数据库共收录了5 0 1 6 0 生物大分子的结构数据,如图1 1 所示: m o h ,c u l et y p e i n u c l e i cp r o t e in f n a 强a i |p r o t e i n so i h e r a c i d s c o m p l o x o s x - r a y 3 9 7 射 0 2 41 8 1 32 4 4 2 6 5 2 l n镰r 6 2 9 8 0 41 3 77 7 2 3 9 e x p e 皓c l r o n 钉74 3o 7 1 m e 童l o dm i c r o s c o p y 1 0 t h e r8 84429 8 t o t a i4 6 2 8 71 8 4 31 9 9 73 36 0 1 6 0 图1 1 p d b 数据库收录明细 每一个p d b 数据在提交时都会分配个标识符,由数字和字母组成的4 位标识符,如 1 a a y ,4 h h b 。图1 2 左图显示了一个p d b 记录。 图1 2p d b 记录的一个示例及p d b 数据库的检索窗口 以1 a o a 的p d b 文件为例,其1 a o a p d b 文件中包含的部分信息如表1 1 所示: 4 第一章绪论 表1 11 a o a p d b 文件中部分信息 【e a d e rc o m p l e x ( t r a n s c r 【p t i o nf a c t o r ,d n a )2 7 一n o v 一9 71 a o a i t l ec r y s t a ls t r u ( 丁u r e0 fp h 0 4b h u d o m a i nc o m p l e x e dw hu a 班 1 t l e 2 ( 1 7 ) :o m p n dm o ll d :l : 1 0 m p n d2m o l e c u l e :p h o s p h a t es y 譬n :mp o s r r i v er e g u l a t o r yp r 0 吒i n :o m p n d3p h 0 4 : o m p n d4c h a v :a b : o m p n d5f r a g m e n t :d n ab f n d i n gd o m a i n : o m p n d6s y n o n y m :b h l h : 。o m p n d7e n g n 町e e r e d :y e s ; 0 m p n d8b i o l o g i c a lu n r r :d 订e r ; o m p n d 9 m o l i d :2 : 1 0 m p n d l om o l e c u l e :d n a : o m p n di lc h a i n :c d : o m p n d1 2f r a g m e n t :u p s t r e a ma c v a l l 0 ns i t ep 2 : 。0 m p n d1 3s y n o n y m :u a s p 2 ( 1 7 ) : o m p n d1 4e n g i n e e r e d :y e s ,o 7 、, 、j ,、“。、,帆1 、? 一j ,。7 ,。7 o 、7 、,、, e q r e s l a6 3m e t l y s a r g ( m us e r h i sl 叮s m s a l a g l u g l na l a a r g e q r e s 2 a6 3a r g a s n a r g l e u a l a v a l a l a l e u h i s g l ul e u a l a s e r e q r e s3 a6 3l e u i l ep r o a l a g l u t r p l y s g u q g u q a s n v a ls e r a l a e o r e s4 a6 3a l ap r 0s e r l y s a l a t h r t h r v a l g l u a l a a l a c y s a r g e q r e s 5 a6 3t y r i l e a r g h i sl e u g l n g l n a s n g l js e r t h r e q r e s l b6 3m e t l y s a r g g l us e r h i s l y sh i s a l a g l u g l n a l a a r g e o r e s 2b6 3a r g a s n a r g l e u a l a v a l a l a l e u h i s g l u l e u a l as e r e q r e s 3 b6 3l e u i l e p r o a l a g l u t r pl y s g i 烈g l n a s n v a ls e r a l a e q r e s 4 b6 3a l ap r os e r l y s a l a t h r t h r v a l g l u a l a a l a c y s a l l g e q r e s 5 b6 3t y r i l e a r g h i sl e u g i n g l n a s n g l ys e r t h r e o r e sl c1 7ctc a c a c gtg g g a e o r e s2 c1 7cta g e q r e s ld1 7ctagtcccacgtg e q r e s 2 d1 7tg a g o r m u l5h o h+ 8 讲h 2 0 lh l a g l u a3 2 h 1 l g l u a9 2 0ca l l g a 2 l0a r g a 2 2c ba r ga 2 3c ga l l g a 2 4c da r g a 2 5n ea r g a 2 6 晓a r g a 2 7n h la l l g a 2 8n h 2a l l g a 2 9ng u j a 3 0c ag u j a 3 lcg l u a 3 2og l u a 3 3c bg l u a 3 4c gg l u a 3 5c dg l u a 3 6o e lg l u a a l a a8 l e u a 2 6 28 3 2 4 29 3 0 0 28 9 9 4 29 4 4 7 28 3 0 7 28 7 3 9 29 5 3 l 29 9 7 0 29 9 9 2 37 3 3 7 37 3 2 9 36 2 2 8 36 4 9 6 37 0 5 5 35 7 0 6 35 4 1 5 3 6 1 2 0 1 2 ,2 7 3 2 9 7 7 2 5 1 4 1 7 3 5 1 3 8 7 0 3 4 2 0 5 4 2 1 7 6 6 0 5 0 4 2 0 2 1 2 4 5 l l _ 6 4 4 0 8 9 8 3 9 7 4 - 4 4 8 0 3 9 5 1 4 3 “ 5 1 6 1 6 5 1 3 4 6 5 4 0 1 8 5 5 2 6 5 5 6 2 1 2 5 7 1 3 2 5 8 1 7 8 5 8 4 7 5 5 88 5 1 5 0 7 6 l 4 9 3 7 7 4 8 6 7 2 4 7 7 3 8 4 9 2 8 4 4 9 8 5 8 5 1 2 6 7 5 2 2 3 9 2 3 6 8c 2 0 4 6o 2 8 2 8c 2 4 加 c 2 0 2 0c 2 2 4 ln 2 3 9 3c 2 3 4 1n 1 6 5 7 n 2 2 6 4n 2 3 6 7 c 2 7 7 lc 2 9 0 2o 1 8 9 7c 6 7 7c 1 4 5 4c 1 2 1 4o 6 1 8 其三维可视化的结果如图1 - 3 所示: 5 vmmmmmmmmmmmmmmmmm =蚕蚕黜嬲黜掰掰掰掰 东南大学硕士学位论文 图1 3i a o a 三维效果图( 该图由p y m o l 1 6 立用软件生成) 从1 9 8 9 年研究者首次测得蛋白质核酸复合物起,在近2 0 年时间里有1 9 9 7 个蛋白质核 酸复合物被测出。其中以x 射线晶体衍射技术获得的复合物数据为1 8 1 3 个,以n m r 技术 获得的数据为1 3 7 个,其他技术获得数据为4 7 个。在2 r r ) 年以前,由于x 射线晶体衍射 和n m r 技术水平的限制,研究者多是测的的一些分子量较小的蛋白质核酸复合物:近年来 随着这两项技术不断发展完善,越来越多的大分子量的蛋白质核酸复合物的结构被解析,例 如核糖体的结构i l ,2 】。在p d b 数据库中,蛋白质核酸复合物可以分为三类:蛋白质- d n a 复合物、蛋白质r n a 复合物以及蛋白质与d n a r n a 混合复合物。在己解析的蛋白质核酸 复合物结构中,蛋白质d n a 复合物占据主要部分,大约占到到6 5 以上,这主要也是由于 蛋白质d n a 的复合物分子量相对较小。目前研究者对蛋白质核酸复合物结构的研究重心主 要集中在一些具有特殊生物学意义的复合物,例如转录d n a 复合物( t r a n s c r i p t i o n d n a , 已测得的复合物数目为3 2 3 个) 、转移酶d n a 复合物( t r a m f e r a s e d n a ,已测得的复台物 数目为3 0 2 个) 、水解酶d n a 复台物( h y d r o l a s e d n a ,已测得的复合物数目为2 1 6 个) 、 核糖体( r i b o s o m e ,已测得的复合物数目为3 0 4 个) 等等。 1 2 蛋白质与d n a r n a 相互作用的一些基本机制 尽管蛋白核酸的相互作用在细胞中的功能多样,但他们的功能主要可分为四类:结构和 包装作用、运输和定位作用、代谢和霞排作用、基因表达作用。同核酸结合的蛋白可根据其 底物的特殊性分为三大类:非特异性结合蛋白,序列特异性结合蛋自、结合非正常结构的蛋 白。大部分核酸结合蛋白在一个内部结合位点以定位方式与核酸发生相互作用。与核酸作用 的识别因子在蛋白质的结构中具有特定的结构域,根据这些识别因子组件的结构,可以将核 酸结合蛋白分成不同的家族。l u s c o m b e 1 7 等人先利用人眼视觉,根据复合物中蛋白部分的 相似性把复合物分成了8 个组( g r o u p ) ,再进一步利用s s a p 结构比对软件 1 8 ,1 9 】比对复合 物中的蛋白部分根据分值,又分成了5 4 个家族( f a m i l y ) 。同一个家族中的复合物中的蛋 白有很高的相似性。同核酸作用的模式也很相似。 6 第一章绪论 图1 4 8 7 1 三种乇要的d n a 结合蛋白的d n a 结合结构域: ( a ) 螺旋转角一螺旋结构; ( b ) 锌指结构;( c ) 亮氨酸拉链结构。 灰色的带状为蛋白质,黑色的双链为d n a ,灰色小球为锌原子。 在分子水平上,核酸蛋白直接作用有四种途径,就是蛋白侧链同碱基的作用,蛋白主链 同碱基的作用,蛋白侧链同磷酸骨架的作用,蛋白主链唰磷酸骨架的作用。在基因表达调控 的转录起始过程中,转录因子结合调控元件是一个蛋白特异识别核酸的过程,而这个特异性 相互作用的主要形式是蛋白侧链同碱基间的相互作用。 许多序列特异性识别蛋白同d n a 的复合物的结构已经被解析,结合蛋白在其基因调控 过程中以同型二聚体或异型二聚体的形式识s t j d n a 。碱性区亮氨酸拉链( b z i p ) 是一类重要的 蛋白质结构域,它有两个特征功能区:位于c 端的称为亮氨酸拉链,通过形成螺旋盘绕结构 起:聚作用,与其相连位于n 端的称为碱性区, 直接参与d n a 结合。总体上,蛋白质同 d n a 相互作用可归为两种形式:直接解读和非直接解读。直接解读涉及在d n a 的大沟或小 沟处蛋白和碱基之间的相互作用:非直接解读涉及蛋白和糖、磷酸骨架之问的相互作用。在 这种情况下,由于一些序列造成的整个d n a 的特殊构象蛋白可以识别这些序列。 在蛋白质与核酸的相互作用中,存在着许多不用类型的非共价键相互作用:氢键、范德 华力、疏水作用、盐键、静电吸引或排斥作用等。蛋白和核酸的磷酸骨架的相互作用常常涉 及带负电的磷酸残基和带正电的氨基酸残基( 如l y s 、a r g ) 之问的静电相互作用。此外, 在磷酸骨架和蛋白侧链之间也可形成氢键。 在蛋白同核酸碱基之间的相互连接识别中,不管是开放性地( 同单链) 还是通过大沟、 小沟( 双链分子) ,主要是碱基和氨基酸残基侧链之间形成的氢键介导。这种接触可能是一 一对应的,但是几个侧链可以同一个碱基对连接,长的侧链还可以横跨好几个碱基对。序列 特异性的核酸结合蛋白倾向于利用其埋藏表面,例如一个插入大沟的螺旋,是它们之间的 接触最大化。蛋白残基和d n a 碱基之间的相互作用对于序列特异性识别是非常重要的,但 不是所有的接触都是特异的。例如,在糖皮质激素受体和d n a 的相互作用时就产生非特 异性识别而形成的广泛的碱基和蛋白侧链的接触。 近年来,l u s c o m b e 与t h o r n t o n 1 7 1 分析了蛋白核酸复合物中氨基酸保守性以及突变对 结合特异性的作用。p a b o 与n e k l u d o v a 2 0 开发了几何模型,描述氨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论