




已阅读5页,还剩103页未读, 继续免费阅读
(核技术及应用专业论文)单波长反常散射方法研究以及同步辐射研究平台建设.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 单波长反常散射方法研究以及同步辐射研究平台建设 姚德强 指导老师:冼鼎昌教授,范海福教授 本论文对直接法在单波长反常散射反面的应用作了较为详细的实例研究和 对比,同时也对北京同步辐射装置1 w 2 a 小角散射光束线的初步设计作了详细 介绍。论文共分为以下5 个方面: 1 )较高分辨率下的双空间碎片扩展和结构自动求解。利用单波长反常 散射实验技术解析蛋白质晶体的结构已经成为主流的分析手段,而 如何提高解析蛋白质结构的效率以及如何实现自动化是目前实现高 通量蛋白质结构组学的关键技术之一。在分辨率好于2a 左右的情 况下,双空间的求解相位对于蛋白质结构测定很有效,并且使求解 的整个过程简单易于实现自动化。包含o a s i s - 2 0 0 4 的双空间相位求 解和建模已经被实际应用于求解蛋白质结构。这种双空间流程包括 s a d 数据的直接法初始相位求解,通过电子密度图修正来改善相位,7 自动建模和利用己知部分结构信息的直接法相位求解。 2 )不同分辨率情况下的直接法和双空间碎片扩展。当数据的分辨率比 较低( 低于3a ) ,o a s i s 中的直接法仍然可以有效的破除单波长反 常散射中的相位双解,而程序不能够完成模型的自动搭建,可以利 用手工搭建模型实现双空间碎片扩展,使蛋白质结构分析的效率大 大提高。 3 )o a s i s 中合适的品质因子( f o m ) 。我们在这里探讨了o a s i s 的品 质因子的问题,由于o a s i s 的相位和o a s i s 的品质因子是从同一 组概率分布下计算得到的,所以多数情况下它们匹配的较好。但是 由于o a s i s 计算相位时采取的一些粗糙假定会带来较大的误差,我 们可以在某些情况下替换其品质因子,会得到更好的初始电子密度 图,经过电子密度修饰以后会有更大的改善。 中文摘要 射 4 )单波长反常散射求解晶体结构的一些实例。这里利用了当前流行的 处理单波长反常散射相位的程序,对一些数据例子进行求解和比较, 并且研究了在利用单波长反常散射求解相位的实验中,选择实验波 长需要兼顾反常散射信号以及晶体的耐辐射损伤和背景噪声,数据 的冗余度等影响数据质量的问题。 5 )i w 2 a 小角散射光束线的物理设计。北京同步辐射实验室( b s r f ) 4 8 9 a 光束线是我国目前唯一的一条小角散射光束线心1 ,该束线引自弯铁 光源,并且与衍射实验站分时共用,无论是光学性能还是机时都受 到很大限制。随着我国小角散射实验用户的不断增加,拓展原有线 站的需求越来越突出。2 0 0 4 年北京同步辐射实验室开始在储存环一 区新建w i g g l e r 插入件i w 2 ,并计划引出两条新的光束线b s r f 的第二条生物大分子束线( i w 2 b ) 以及小角散射光束线( i w 2 a ) 。 这里详细介绍新的小角散射光束线的设计方案,以及北京正负电子 对撞机二期改造完成后该束线能够达到的性能情况。 关键词:直接法、单波长异常衍射、大分子晶体学蛋白质晶体学,小角散 英文摘要 s t u d yo ns o l v i n gp r o t e i ns t r u c t u r e sw i t hs i n g l e w a v e l e n g t h a n o m a l o u sd i f h a c t i o nm e t h o da n dc o n s t r u c t i o no ft h en e wb e a m l i n e i nb s r f d e q i a n g y a o s u p e r v i s e db yp r o f d i n g c h a n gx i a na n dp r o f h a i f uf a n a p p l i c a t i o no fs i n g l e - w a v e l e n g t ha n o m a l o u sd i f f r a c t i o nm e t h o dh a sb e e ns t u d i e d t h r o u g hs o m ec a s e sa n dt h ep l a y s i c a ld e s i g no fs a x sb r a n c ho f1w 2 a i nb s r fi s i n t r o d u c e dh e r e f i v ea s p e c t sa r ei n c l u d e di nt h i sp a p e r ( 1 ) f r a g m e n te x t e n s i o n a n ds t r u c t u r ed e t e r m i n a t i o n a u t o m a t i c a l l y a th i g h r e s o l u t i o n s a dp h a s i n gb e c o m e si m p o r t a n ti np r o t e i ns t r u c t u r ed e t e r m i n a t i o n t o d a ya n dw eh a v ed o n em u c ht oi m p r o v et h ee f f i c i e n c yo f s t r u c t u r ed e t e r m i n a t i o n d u a l s p a c ef r a g m e n te x t e n s i o ni sv e r yp o w e r f u la n dl e a d st ot h ea u t o m a t i o no f s t r u c t u r ed e t e r m i n a t i o na ta b o u t2a r e s o l u t i o n d u a l s p a c ef r a g m e n te x t e n s i o n h a sa p p l i e di nm a n yc a s e so fs t r u c t u r ed e t e r m i n a t i o n i ti n c l u d e st h ep r o g r a m o a s i s ,d m ,r e s o l v ea n da r p w a r p ( 2 ) s a dp h a s i n ga n df r a g m e n te x t e n s i o na td i f f e r e n tr e s o l u t i o n a st h er e s o l u t i o n i sl o wa n da u t o m a t i c a l l ys t r u c t u r ed e t e r m i n a t i o nf a i l s w ec a nm a n u a l l yt r a c et h e m o d e la n dt h e nd ot h ef r a g m e n te x t e n s i o n i nt h i sc a s e ,w ec a na l s oi m p r o v et h e e f f i c i e n c yo ft h es t r u c t u r ed e t e r m i n a t i o n ( 3 ) f i g u r eo fm e r i t ( f o m ) i no a s i s p h a s e sa n da s s o c i a t e df o m si no a s i sa r e c a l c u l a t e df r o mt h es a m ed i s t r i b u t i o na n dt h e ym a t c h e dw e l li nm a n yc a s e s d u e t ot h ea s s u m p t i o no fd i s t r i b u t i o ni no a s i s ,s o m e t i m e sb i ge r r o r sa r ep r o d u c e d w ec a nr e p l a c et h ef o m si no a s i sb yo t h e r sa n dg e tab e t t e re l e c t r o nd e n s i t y m a p ( 4 ) s o m ec a s e si ns a dp h a s i n go fs t r u c t u r ed e t e r m i n a t i o n s o m ep o p u l a r 英文摘要 p r o g r a m so ns a dp h a s i n ga r et e s t e du s i n gs a dd a t a s e t s w eh a v ea l s o d o n e s o m et e s tt os t u d yt h ea f f e c t i o no fd a t ar e d u n d a n c ya n ds e l e c t e dw a v e l e n g t hi n s a de x p e r i m e n t s s o m ek n o w l e d g ea b o u tt h eb a c k g r o u n dn o i s ei sg o tt h r o u g ht h e c o n t r a s te x p e r i m e n t ( 5 ) t h ep h y s i c a ld e s i g no ft h es a x sb r a n c ho fi w 2 ab e a m l i n ei nb s r f an e w b e a m l i n e1w 2 af o rs m a l la n g l ex r a ys c a t t e r i n gi sg o i n gt ob ec o n s t r u c t e di n b e i j i n gs y n c h r o t r o nr a d i a t i o nl a b o r a t o r y i tc a r lp r o v i d eh i g h e ri n t e n s i t ya tt w o w a v e l e n g t h so f1 5 4 aa n do 9 7 a t h ed e s i g na n d t h eo p t i c a lc h a r a c t e r so ft h e b e a m l i n ea r ed e s c r i b e di nd e t a i l si nt h i sp a p e r a n da l s ow ep r o v i d et h ed e t a i l so f 1w 2 ab e a m l i n ea f t e rt h ec o n s t r u c t i o n k e y w o r d s :d i r e c tm e t h o d ,s a d ,p r o t e i nc r y s t a l l o g r a p h y , s a x s 巾国科学技术大学学位论文相关声明 本人声髓所矍交的学位论文,是本入在导舜指导下进行研究 工终所取褥黪成果。除殴特别鸯瑟以豁注和致谢懿地方外,论文中 不包含任何他人融经发表或撰写过的研究成果。与我一同工作的 同志对本研究所做的贡献均已在论文中作了明确的说明。 本人授权中蹋科学技术大学拥有学位论文的部分使用权, 即:学校有权按有关规定向国家有关部门或机构送交论文的复谤 髂耱毫子版,允诲论文被查阕麓借阕,霹以将学位论文缡入有关 数据库进行检索,可以采用影印、缩印或搁描等复制手段保存、 汇编学位论文。 保密的学位论文在解密后也遵守此规定。 幸誉者签名:磁篓 鼬q 年警胃。基 第一章引言 第一章引言 上世纪3 0 年左右,x 射线衍射被用于测定生物大分子晶体结构,自此产生 了一门新兴的学科蛋白质晶体学( p r o t e i n c r y s t a l l o g r a p h y ) 。1 9 3 4 年,b e m a l 和c r o w f o o t 在实验室获得了第一张蛋白质晶体( 胃蛋白酶) 的x 射线衍射的照 片,但是当时却对蛋白质大分子的衍射相位问题没有任何确实可行的解决方法。 到了5 0 年代,p e n a z ( 帕鲁兹) 和他的同事提出了“多对同晶置换法( m 取) ” 用以解决生物大分子晶体结构测定的相位问题。从此蛋白质晶体学得到了实际的 应用。1 9 5 9 年和1 9 6 0 年k e n d r e w ( 肯德鲁) 和p e m t z 分别利用这一方法得到了 鲸肌红蛋白和马血红蛋白的低分辨率( 6 a 和5 a ) 晶体结构。两人因此也获得了 1 9 6 2 年诺贝尔化学奖。他们的工作奠定的生物大分子晶体学发展的基础,人们 可以在原子的水平上了解生物物质,研究它们的三维空间结构以及一些生命现 象。他们二人的工作奠定了蛋白质晶体学发展的基础,此后创立了分子生物学这 门新兴科学。 随后的时间里,蛋白质晶体学又产生了许多实验分析方法,例如单对同晶置 换法( s i r ) ,分子置换法( 揪) ,多波长反常散射法( i a d ) 和单波长反常散射法 ( s a d ) 等x 射线晶体学实验分析方法。蛋白质晶体学的威力越来越强大,现在 已经成为蛋白质结构分析最主流的方法,蛋白质晶体学数据库( p d b ) 中的的绝 大多数蛋白质结构模型是依靠x 射线蛋白质晶体学的分析方法得到的。此外,核 磁共振( 眦r ) 和电镜技术也在蛋白质结构分析方面得到了很大的发展,成为蛋 白质结构分析技术不可或缺的手段。 蛋白质晶体学发展的同时,实验仪器方法也取得了飞速的发展。现在世界上 有很多仪器公司生产x 射线光源。r i g a k u ( 日本理学电机公司) 前几年刚推出的 一款转靶光源f r e 目前是世界上最强的实验室光源,用它来收集一套蛋白质衍射 数据通常只需要数个小时的时间,较之以前按照天甚至星期来计算,极大的提高 了实验的效率。此外,更为重要的是同步辐射( s y n c h r o t r o nr a d i a t i o n ) 技术的发 展,利用同步辐射产生的高强度,高准直性的x 射线可以为小颗粒( 0 0 3 m ) 的 晶体和易受辐照损伤的晶体收集衍射数据,另外,现在许多同步辐射实验室大力 发展微聚焦技术,缩小聚焦光斑的大小,可以收集更小体积蛋白质晶体的x 射线 第一章引言 衍射的数据。高强度的同步辐射光源的应用,为蛋白质晶体学的高速发展起到了 决定性作用。x 射线探测器伴随着x 射线光源的发展,也取得巨大的发展。从原 来的衍射计到现在的面探测器,从效率低下的只记录单个衍射强度到同时记录多 个衍射强度,无疑缩短了x 射线衍射数据的收集时间,极大提高了实验效率。例 如,目前主流的x 射线衍射的探测器是成像板( i p ) 和c c d ,它们空间分辨率很 高,读出时间也相对较短,尤其是c c d ,读出时间更短,只需要几秒种,在同步 辐射实验中大大节约了不必要的实验等待时间,提高了实验效率。现在的面探测 器空间分辨率很高,动态范围很大,而且计数读出精确度很高,可以有很低的实 验误差和背景噪声,这使得x 衍射强度中的共振效应就不可忽略了,这也为我们 测量反常散射信号的强度提供了有利的技术支持。反常散射效应是指当x 射线的 能量接近晶体中原子的吸收边时,衍射h l d 和h k 1 的强度产生差异,破坏了 f r i e d e l ( 费理德) 定律,即j 0 = h - ,。2 0 世纪5 0 年代初,b i j v o e t 等人就注意 到了这一点,并利用反常散射信号解决了一些问题,例如在测定酒石酸钠晶体结 构时,利用z r k a 射线接近铷的吸收限所产生的异常散射,定出( + ) 一酒石酸 的绝对构型,使人们了解到反常散射的作用。随着方法学的进一步发展,p e p i n s k y ( 比冰斯基) o k a y a 、r a m a c h a n d r a n r a m a n 、c a t i c h a - e l l i s 将反常散射应用 到解析晶体结构,开创了利用反常散射解析晶体结构。目前,人类结构基因组计 划提出利用1 0 年的时间解析1 0 0 0 0 个有一定功能的非同源未知蛋白的三级结构。 其中利用反常散射信号求解蛋白质晶体结构就成为主要的解决方法。 1 1 蛋白质三维结构的测定 蛋白质晶体中原子的周期性排列的空间尺度与x 射线的波长接近,x 光照 射到晶体上,当满足一定条件时就会发生衍射。衍射的x 光波中包含了晶体的 结构信息。理论上只要我们知道了衍射x 光的状态( 包括振幅和相位) ,我们就 能够得到晶体的结构。但实际上以目前的衍射实验手段无法直接测得相位信息, 只能记录光的强度,却丢失了衍射的相位信息,这就是晶体学中的相位问题。如 何恢复相位问题是x 射线晶体衍射法测结构的主要难题之一。 用晶体x 射线衍射法测定一个新的蛋白质分子结构的过程一般有以下几个 步骤:1 ) 蛋白质表达、纯化和结晶;2 ) 收集衍射数据;3 ) 求解相位;4 ) 电子 4 第一章引言 密度图分析及构建分子模型;5 ) 模型修正。 蛋白质结晶一直是蛋白质晶体学中最大的瓶颈。生物大分子的结晶过程非常 复杂,至今仍未有合适的理论来描述。但是经过多年的研究,人们还是获得了很 多的经验和技巧。与以前相比,得到蛋白晶体的速度大大加快了。蛋白质晶体的 晶胞比较大而晶体体积比较小,所以衍射比较弱( io c 圪。v 2 刎) 。与一般分 子晶体相比,蛋白质分子晶体的不同之处在于它含有很多的溶剂( 3 0 - - 7 5 ) ,因 此蛋白质晶体通常完美度较低。这样一来,蛋白质晶体在衍射时能够达到的分辨 率都不高。此外,由于氨基酸都是手性的,所以在蛋白质晶体中不存在对称面和 对称中心。这样一来,蛋白质晶体的空间群的个数只能是去除那些有对称面和对 称中心的6 5 个。 得到蛋白质晶体后,下一步就是采集晶体的x 射线衍射数据了。目前常用 的两种x 光源分别是x 光机和同步辐射。x 光机是利用高能电子打击标靶( c u , m o ,c r 等) ,产生的特征x 光谱线,一般来说强度较弱,且波长无法调节,但 优点在于使用方便。同步辐射是利用高速运动的带电粒子在速度改变时沿切线方 向发射的x 光。同步辐射x 光的优点在于高亮度、波长连续可调且准直性好。 相对于实验室光源,同步辐射上作衍射实验可以获得更高的分辨率,所需的实验 时间也可大大降低,而且可以做在实验室光源上无法完成的多波长异常散射实 验。但由于同步辐射装置是大型的科学研究装置,一般必须预先申请机时才能做 实验。有了合适的蛋白质晶体就可以收集衍射数据了。现在广泛采用的探测器是 成像板( i m a g ep l a t o ) 探测器和c c d 探测器,后者由于其读数速度非常快的优 点,应用的更加广泛。为了减少辐射损伤,通常要对蛋白质晶体样品进行低温冷 却。 衍射实验完成后,接下来一步是解相位【1 】【2 】。我们通过衍射实验得到的是衍 射振幅,并没有澳8 得衍射相位。现在主要有两种解相位的方法一同晶置换法p 】 和异常散射法【4 】。 同晶置换法是蛋白质晶体学的一个里程碑,第一个蛋白质就是用同晶置换法 解出来的嘲。到现在许多新的蛋白质结构也是用同晶置换法解出来的。同晶置换 法最关键的一步制作与母体晶体同晶型的重原子衍生物晶体。有了同晶衍生物 后,我们就可以通过x 射线衍射实验得到蛋白质母体的衍射振幅( | f p i ) 和衍生 第一章引言 物的衍射振幅( i 曩k i ) a 重原子的个数一般较少,可以用p a t t e r s o n 法或者直接法 找出它们的位置,经过精修,我们就可以先得到重原子的结构因子f h 。由母体 的结构因子和衍生物的结构因子我们可以得到一个矢量方程( i - 1 ) 。 一b = f h 方程( i 1 ) 可以用图1 1 来表示。由于我们从实验测得的是母体和衍生物结构 因子的衍射振幅,这个方程里还不足以解出体,只能得到纬两个可能的解( 图 1 - 2 ) 。这时我们可以用直接法破双解( s 瓜) 或者再制作一个衍生物( m i r ,见 图1 3 ) 来解出纯。事实上由于我们在实验测量时不可避免的带入了误差,所以 图1 - 3 中的矢量三角形是不会闭合的。b l o w 和c r i c k 提出了一个不闭合度( 占) 的概念来描述误差【6 】,即把误差都归结到f k 上并假设误差服从高斯分布。利用 不闭合度我们可以导出相位的几率分布: p ( o c t ) o :e x p ( - 8 2 2 e 2 1 ( 1 2 ) 其中e 是占的均方差,e = i f p b ( 。o - 乓h ( “) 2 ) 有了相位的几率分布我们可以 得到结构因子的最佳值f 0 ( 西b 甜) ,b l o w 稠lc r i c k 指出用l k ( & 耐) 计算得到的电 子密度图的误差最小。 6 第一章引言 图卜is i r 的矢量图图1 - 2s m 的相位双解 图i - 3 两个衍生物的m i r 法解相 位问题 当入射x 光的能量与原子的电子跃迁能量接近时,就会发生所谓的异常散 射,这时原子散射因子就不能用实数了来近似表示了,必须考虑异常散射效应, 其完整的表达式为: ,( 见名) = 工( 力+ 厂( 丑) + 矿。( d( 1 3 ) 当蛋白质晶体中含有重原子时,利用异常散射信号这一微小的差异,我们也 能够解相位问题。考虑原子散射因子的虚部后,f r i e d e l 定律( ,脚= 嘧) 不再 成立,而重原子的位置我们可以用p a t t e r s o n 法或者直接法解出来,这样我们也 能得到一个矢量方程( 1 _ 4 ) 。 7 第一章引言 e ( 厅,七,) 一e ( - i l ,一k ,一1 ) = 2 f x ( 而,七,) ( 1 4 ) 与同晶置换法类似,方程( 1 4 ) 也有两个可能的解。可以用直接法破双解( s a d ) 或者在多个波长下收集数据( m a d ) 解相位。对于自身不含重原子的情况下, 可以使用制作重原子衍生物或者硒代阴的方法来使蛋白质晶体样品中含有合适 的异常数射重原子。 用同晶置换法或者异常散射法得到的初始相位一般来说精确度比较差,还必 须经过相位修正。现在主要有三种相位修正方法:s o l v e n tf l a t t e n t i n g 、h i s t o g r a m m a t c h i n g 和n o n - c r y s t a l l o g r a p h i ca v e r a g i n g 。s o l v e n tf l a t t e n t i n g 方法是把电子密度 图中负值部分去掉,同时把溶剂区域的电子密度设为个典型值( o 3 3 e a d ) , 这样一来蛋白质分子和溶剂分子就可以分开( 蛋白质分子区域典型的电子密度为 0 4 38 a - 3 ) 。自动寻找蛋白质和溶剂区域边界的方法最早由w a n g t 8 】提出,后来 l e s l i e 把它推广到了倒空间。h i s t o g r a mm 出h i n g 【9 】方法是把电子密度改为期望分 布的电子密度值。当蛋白质晶体的不对称单位( a s y m m e t r i cu n i t ) 中有部分区域 的电子密度相同( 如有不止一个分子或者有结构相同的肽链等情况时) ,我们就 可以利用n o n - c r y s t a l l o g r a p h i ca v e r a g i n g 1 0 l 方法。此外还有s k e l c 吨o n i z a t i o n l l l 及 m a x i m u m - e n 仃o p ym o d i f i c a t i o n 等方法。通常相位修正都要经过多轮循环。 得到相位后,我们就可以计算电子密度图,根据电子密度来建立初始结构模 型。从电子密度图建立结构模型主要包括5 个主要步骤f 1 2 】:( 1 ) 构建主链,( 2 ) 找出残基序列和电子密度匹配的地方,( 3 ) 建立一个粗略的结构模型,( 4 ) 对结 构模型和电子密度的符合程度进行优化,( 5 ) 检验模型。目前已经有许多自动构 建模型的程序,如a r p w a r p 、r e s o l v e 等。当相位解的比较精确时,用这些 自动建模程序可以构建部分或大部分残基,再利用。等图形程序手工加入剩下 的残基,就可以构建完整的初始结构模型。接下来就是模型修正。蛋白质晶体需 要修正的结构常数非常多,而蛋白质晶体的衍射分辨率也不高,一般来说收集到 的衍射点数与需要修正的结构参数比值很小,所以在传统的最d , - 乘法修正并不 适用( 要求测量值和要修正的变量之间的比值达到1 0 以上) 。现在常使用受限最 小二乘法( c o n s t r a n i n e dl e a s t - s q u a r e s ) 及约束最小二乘法( r e s t r a i n e dl e a s t - s q u a r e s ) 或者两者相结合【”】。前者主要是利用蛋白质分子中一些我们可以确定的量( 如 3 第一章引言 氨基酸分子中的的键长、肽键平面等) 来减少我们需要修正的参数;后者是加入 一些条件来制约最小二乘修正( 如实验相位等) ,相当于增加测量值。此外还有 分子动力学修正等方法【1 4 1 c 1 5 1 。 蛋白质分子的模型构建完成后,我们还必须对其进行检验,以判断这个模型 是否合理。在蛋白质晶体学中,标志结构模型质量的主要有两个值:震因子及 置枷因子。置因子的定义为: l ( h ) 一k ( h ) | 肚l 哥丌 n 5 其中f k ( 狂) 是实验得到的结构因子的模,( h ) 是我们从模型计算得到的结构 因子的模,x 是一个比例因子,式( 1 - 5 ) 是对所有衍射点进行计算。r 因子实 际上是在假定所有衍射都独立的情况下,模型似然( 1 i k e l i h o o d ) 的对数的负值。 由于蛋白质晶体学中测量值与要修正的参数数目的比值很低,所以置因子并不 能很精确的表明模型的质量。另一个标志结构模型质量的值因子1 6 1 定义为: f ( h ) 一砜( h ) l 2 监哥丌 。固 其中r 表示不用于模型修正的一部分衍射( 通常取全部衍射的5 - 1 0 ) ,所以震触 是一个独立于修正过程的量。与r 相比,它更能反映结构模型的正确性。尽触 的值通常比r 要高。另一个常用来评估结构模型质量的标志是r a m a c h a n d 啪【1 7 】 图。在r a m a c h a n d r a n 图中的点是由两个二面角驴( 口碳原子和氨基一侧肽平面 间的二面角) 及】| i ,( 口碳原子和羧基一侧肽平面间的二面角) 为坐标组成。伊及 矿的值不是任意的,它们集中在r a m a c h a n d r a n 图中的特定区域,当肽链骨架中 某些妒及y 超出了范围,说明在此处的残基位置可能就是错误的。 1 2 反常散射效应 9 第一章引言 x 射线晶体衍射就是当x 射线晶体衍射入射到晶体中时,晶体中各个原子的 电子在x 射线的作用下进行受迫振动,形成新的电磁波发射源,向外发射球面 电磁波,由于晶体中的原子规则排列,其间隔距离和x 射线的波长也是可以相 比拟的,都在a 的数量级,这样多个球面波进行叠加,形成干涉的电磁波,这就 形成晶体的衍射。 当x 射线入射光的光子能量低于电子的跃迁能级,不能够激发电子跃迁到较 高的能级,此时晶体中的所有原子的电子在入射x 射线的作用下以相同频率的进 行振动,这些受迫振动的电子便向各个方向发射和入射光相同频率的电磁波。此 时的原子散射因子只包含正常散射部分,衍射h k l 的结构因子只。、表示为: a r o m a 五”= 瑞x e x p 2 n i ( h x t + k y , + 幺) 1 ( 1 7 ) 当x 射线的能量高于原子的吸收限时,原子中受束缚的电子就可能会被激发 到激发态,这部分受激发的电子不稳定,会重新跃迁到基态,并发出荧光,这部 分光子的相位会存在相位延迟,这时原子散射因子就包含了一些修正项,它用复 数可以表示为: f = f o + f t + 虿“ ( 1 8 ) 式中,和矿埽幂为反常散射校正项的实部和虚部,它们随着入射光波长的不同 而发生变化,在吸收边的附近,厂。和矿”有极大值。当存在原子的反常散射效应, 衍射h k l 和h - k - l 的强度会产生差异,破坏了f r i e d e l ( 费理德) 定律, 即 ih 季i 1 0 第一章引言 图l - 4 ,和异常散射的实部( ,) 共线,而,则发生 了9 0 度的相移。 一 一 f p 是蛋白质的结构因子,f a 是异常散射的实 郭校正量( ,) tf a ”是异常散射的虚都校正量 ( ,) 反常散射效应既可以通过理论计算给出,也可以通过吸收谱或者荧光谱的实 验测量得到,由于在实际的蛋白质晶体学实验中,原子附近的化学环境是未知的, 同时也是比较复杂的,所以通常采用荧光扫描的实验来测定和矿”的实际值, 同步辐射光源为我们提供方便的实验方法,在吸收边附近连续调节波长,记录晶 体的荧光谱,然后利用现有的程序软件就可以得到,和矿”的实际值。 1 3 利用单波长反常散射求解蛋白质晶体结构 目前,利用单波长反常散射( s a d ) 实验求解蛋白质晶体结构已经越来越成 为人们求解无同源性蛋白结构的主要分析方法。尤其是每个天然蛋白质几乎都含 有硫原子,这就促使人们考虑利用硫的单波长反常散射求解蛋白质。近些年来, 利用硫原子的单波长反常散射实验求解得到的蛋白质晶体结构越来越多,并且成 为一些实验室( 例如日本北海道大学) 的主要手段之一。还有些实验室利用高压 在蛋白质晶体中压入惰性气体原子,利用惰性气体原子的反常散射效应来求解相 位。 单波长反常散射求解蛋白质晶体结构首先要确定反常散射原子的位置,可以 第一章引言 利用p a t t e r s o n 法或者直接法进行确定。无论采用何种方法,都无法区分两种可 能的对映体,实验中我们常采用a b s 1 3 1 进行判断或者对两种可能的情况进行实 验,最后根据求解的结果判断反常散射原子位置。其中经常采用的程序是s n b , s h e l x d 等等。 然后,要根据已经求解得到的反常散射原子的位置推算衍射相位。理论上, 三个不同的测量值和适当的测量误差的模型才可以唯一地确定相位。但是,在单 波长反常散射中,每个非中心对称衍射指标只有两个不同的测量值( 一个f r i e d e l 对,最。和e 。) 。这时,相位的不确定性就产生了。 妒= 伊”+ 9 0 0 _ + c o s 一( a f 删2 f 。) ( 1 9 ) 其中f 4 ”是实验测量值,f 和仍是根据反常散射原子的位置得到的计算值。 这个公式就是对单波长反常散射中相位双解问题的描述。1 9 5 9 年b l o w 和c r i c k 等人考虑到实验误差,引入不闭合度误差的概念,利用概率的方法得到相位的概 率分布的公式, 嘶m o x p 肌2 n 叭产力磁2 n 1 0 其中n 是归一化因子。 利用相位做横坐标,区间是3 6 0 度整个区间,几率的数值是纵坐标,它可以表示 为对称分布的双峰分布曲线, 图1 - 5b l o w & c r i c k 的概率曲线 p 的相住 第一章引言 这张图可以告诉我们,单波长反常散射的相位问题就是双解问题。为了破除 单波长反常散射中的相位双解问题,大致可以分为三种方法: 1 ) 使用平均相位 最简单的一种做法就是把每个衍射的相位都用来做f o u r i e r 变换,并用来计 算电子密度图。其f o u r i e r 系数是: 孝( h ) = 三i f ( h ) l o x p 正妒”( h ) + a 伊( h ) + e x p 尹”( h ) 一( h ) ) ( 1 1 1 ) = 陟( h ) i c o s a 妒( h ) 唧 劬”( h ) 这种做法基于一个比较简单的思想:单波长反常散射的相位存在双解,其中一定 会有一个是正确,一个是错误的。如果把它们都用来计算电子密度图,那么正确 的一组必定会给出正确的结构,而错误的一组计算的电子密度图应该是随机的, 不会包含任何有规律的结构信息,形成无规的背景噪声。 1 9 6 1 年,b l o w 和r o s s m a n 改进了上一个公式, 善( h ) = p ( h ) | c o s 妒( h ) e x p 脚”( h ) ( 1 1 2 ) 其中使用c o s 矿( h ) 的平均值是为了考虑到实验误差对相位求解精度的影响, 也可以看作用来调节振幅值的一个因子。它的值可以利用概率分布求得: 硐= 臀 f c o s 妒e x p 一p + 2 f s i n ( 产妒) 2 脚2 却 f e x p f - 妒+ 2 f 。s i n ( 一明2 2 e 2 却 1 9 8 5 年,b c w a n g 提出了利用溶剂平滑的方法处理单波长反常散射中的 相位问题,他首先利用平均相位计算电子密度图,然后通过循环迭代的方法挑选 出正确的相位。b r i c o g n e 等人则是通过最大熵的方法把平均相位计算的电子密度 图中的噪声抹去。这些方法在一些软件中有所使用,当然也解决了一些实际的蛋 白质结构分析的问题。 2 ) 利用s i m 分布 已知反常散射的原子位置,可以利用反常散射原子的信息来破除相位的双解 第一章引言 她) = n e x p p ”列c o s 一) 其中( 巧) 是未知部分衍射贡献的期望值;i ,i 和l b l 分别是观测的蛋白质结构因 子的模值和计算的亚结构的结构因子模值;q 是一个任意的锐化因子。s o l v e 等 大部分程序采用了双峰概率艺。( 伊) 和s i r e 分布( 伊) 相乘方法得到相位的概率 分布曲线,然后通过对曲线积分的方法求出最优相位和相应的品质因子。r a n d y r e a d 1 9 ,刎等人则采用联合概率的方法处理双峰概率巴。( 缈) 和s i m 分布( 矿) 他们认为双峰概率只。) 和s i m 分布j k ( 妒) 是非独立的阢2 2 2 3 1 ,它们都和反常 散射原子的亚结构有明显的关系,因而不满足独立相乘的条件。他们采用多变量 统计技术,利用联合概率推导相位的分布。 :咿俐i ;阱虻槲町) ;掣 e x p 一q 。i ,+ 1 2 一n 趋l f 1 2 一( 码,一c 3 ,) 1 日j 1 2 一( 口“一) i 何1 2 2 i c l l 所l ( 一屯) c o s ( 一町) 一( 毛氏) s m ( 一町) 】 了e x p _ 2 p 一| i 上e | c 。s ( 口一一彭) 一屯s i n ( 口一一酊) e x p - 2 旷l l 所i 畅c 。sa 一一町) 一b s i n ( a 一一町) 厶闯r 一l ,吲,吲,町,一1 ) “2 d 口。 ;t t ;o e : 毒( 例,h ,i 彤 ,| 何l ,町,一1 ) - - 4 1 ,+ 1 2 x 【q :i f l e o s ( a 一) + 岛:i f l s i i l ( 口一) + q ,l 磁i c o s ( 口;) + 6 l ,i 彤l s i n ( ) + q 1 月:i c o s ( 口j ) + 岛。1 日:i s i n ( 町) 】2 + 【口i :f f i s i n ( 口一) 一6 l :f f 。i o o s ( 口一) + q ,1 月:i s i n ( 彰) 一6 1 ,i 嘭i c o s ( 彰) + q 1 月;i s i n ( 町) 一岛i 爿:i c o s ( a 2 ) 1 2 b p 3 程序也采用类似的方法,从很多的实验结果来看,用联合概率的方法处理双 蜂概率p 矾,( 伊) 和s i m 分布) 比起它们简单的相乘在许多实际的蛋白质结构 第一章引言 求解中精度更高些。但是无论是以上的何种计算方法,都没有从本质上解决单波 长反常散射中的双解问题,都是利用s i m 分布的信息,选择靠近负峰的一个相 位,最后利用电子密度修正的方法把错误的信号滤除。但是由于可能初始的电子 密度图所包含的错误相位较多,这样会导致初始的电子密度图的信嗓比会比较 低,这样也会给电子密度修饰带来一定困难。甚至在有些情况下,初始产生的电 子密度图信噪比太低,电子密度修饰根本无法起到作用,晶体结构无法求解。 3 ) 利用直接法 范海福教授( 1 9 8 5 ) 1 2 4 1 分析了反常散射和同晶置换的相位存在双解问题, 并且把它转换为矿“i 纠,使得在0 到3 6 0 度的区间选择相角简化为挑选正负号 的问题。直接法在判断正负号的精度总是大于在连续区间范围内选择相位,所以 范海福等人用直接法结合s i m 分布来处理相位双解问题,并在实验数据上取得了 很大的成功。1 9 9 0 年,范海福教授等人成功的破除了一个已知蛋白结构a v i a n p a n c r e a t i cp o l y p e p f i d e ( a p p ) 【2 5 l 的相位双解问题。1 9 9 5 年以此方法与蛋白质晶体 学中的相位修正方法相结合,从一个中等大小的已知蛋自s t r e p t a v i d i n 的s a d 数 据中得到了可以不参照任何已知信息进行骨架追踪的f o u r i e r 图1 2 q ;1 9 9 7 年则用 此方法从s a d 数据解决了一个大小为1 6 8k d a 的未知结构r u s t i c y a n i n l 2 7 , 2 舯。 截止到目前为止,范海福教授等人已经成功求解了数十套单波长数据,其中也包 括许多未知的蛋白结构。利用直接法的信息求解单波长相位中的双解问题,已经 在许多实验中被证明是优越的。 第二章单波长反常散射中的相位问题 第二章单波长反常散射中的相位问题 2 1 原理 当蛋白质晶体中存在反常散射原子时,结构因子可以表示为 f :芝e x p ( 2 疗峭) + 艺( + ) c x p ( 2 鹕) j - ij - i = f o ( ) + f ( ) + f ( ) f r i e d e l 对之一的f + 表示为 f + = f o + f 。+ f 。 f r i e d e l 对的另外一个f 一的共轭可以表示为 f 一= f o + f 一f ” 公式( 2 2 ) 与( 2 3 ) 相减可以得到 e f j = 2 f 一 它们之间可以构成如图l 所示的几何关系。 b 其中 ( i f i ) 2 = 扣+ 1 2 + i f 件i f 。j 2 尸 图1 l a ( 2 1 ) ( 2 2 ) ( 2 3 ) ( 2 4 ) 第二章单波长反常敢射中的相位问题 可以近似表示为 蠹如+ l + i f 一 ) ( i f i ) 的相位p 表示为: 妒;妒。i 叫 其中 ( 2 5 ) ( 2 6 ) 叫c o s 一1 吲新卜粕悱i o s - 1 旷 i 汜z , 妒”是异常衍射结构因子虚部校正量的相位。 范海福教授( 1 9 8 5 ) 分析了反常散射相位存在的双解问题,并且把它转换为 矿仕i 妒| ,也就是反常散射原子虚部校正量的相位加或者减去一个相角,使得在 0 到3 f i 0 度的区间选择相角简化为挑选正负号的问题,这就极大的简化了所要求 解的问题。同时,直接法在判断正负号方面与选择相位相比,具有极大的优势和 精确性。这一点在直接法的历史发展中已经被证明。这也就为直接法在单波长反 常散射中求解相位获得成功奠定了基础。 p 的相位 范海福教授 :2 9 1 等人认为以上的双峰概率分布可以看作为中心值是矿- + 矿和 妒- _ 9 的两个正态分布函数的叠加。所以原本的函数形式 1 7 第二章单波长反常散射中的相位问题 只。( ) = o x p 一 一( 纯) 2 j e 2 = e x p - 一( 纯) 2 ( + 2 吒。) u 柚2 瓣1 唧,慨f f + | 蚓) 2 ,2 彳j _(2。)1 云丽。印 一 纯一( 吼”一j 纸1 ) 2 ,z 蠢 晰) 2 糍叶如叫训2 ,2 露 + 他,。, 瓣o x p 一驴 z 2 彳 蜂位钯就 伊* 伊”三 p 的相经 旋警篆毳莳 _ 怨 有了相位分布的曲线,就可以在整个相位区间中对曲线进行积分,得到最优的相 位及其相应的品质因子。 1 8 第二章单波长反常散射中韵相位闯愿 2 , e 啾概。) = j 哪( 妒) p 和) 和 o ( 2 1 1 ) 公式( 2 1 1 ) 是复数形式,为了方便计算,我们把它的实部和虚部分开, 2 z s i n ,= f s i n 尸( 纯) 却 0 2 x c o s 纯埘= j c o s 户
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师招聘之《小学教师招聘》题库检测题型【能力提升】附答案详解
- 水产养殖业质量监管创新创业项目商业计划书
- 新时期水旱灾害防御思路与举措水利部水旱灾害防御司
- 2025年教师招聘之《小学教师招聘》题库高频难、易错点100题模拟试题带答案详解(轻巧夺冠)
- 2025年教师招聘之《幼儿教师招聘》预测试题及完整答案详解
- 2025内蒙古呼伦贝尔农垦谢尔塔拉农牧场有限公司招聘45人笔试及完整答案详解一套
- 教师招聘之《小学教师招聘》考试历年机考真题集附答案详解【综合卷】
- 演出经纪人之《演出经纪实务》能力提升题库(培优b卷)附答案详解
- 2025年教师招聘之《小学教师招聘》题库综合试卷及答案详解(全优)
- 教师招聘之《幼儿教师招聘》高分题库含答案详解【模拟题】
- 资产质量分析
- 计数型MSA的模板
- YY 0670-2008无创自动测量血压计
- GB/T 9798-2005金属覆盖层镍电沉积层
- GB/T 17669.3-1999建筑石膏力学性能的测定
- 压 实 度 试 验 记 录 表
- GA/T 1069-2013法庭科学电子物证手机检验技术规范
- 新版药品管理法培训培训课件
- 单位线法推求流域出口洪水过程工程水文学课件
- 幼儿园组织与管理讲座课件
- 2021年新疆第二医学院辅导员招聘试题及答案解析
评论
0/150
提交评论