




已阅读5页,还剩67页未读, 继续免费阅读
(计算数学专业论文)基于小波变换的膜蛋白跨膜螺旋区段预测研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 摘要 膜蛋白,尤其是跨膜蛋白在细胞的生命活动中扮演着极其重要的角色,因而 跨膜蛋白的结构和功能的研究受到了广泛的重视。但是,蛋白质结构测定需要相 当数量的纯化蛋白,而跨膜蛋白的肽链贯穿整个磷脂双层,有的还多次折返穿膜, 跨膜螺旋则与膜紧密结合,因此首先要用去垢剂使膜崩解才能将跨膜蛋白分离出 来,然后才能纯化及结晶。这不仅在技术上有相当大的困难,而且是高消耗的。 正是由于分离和纯化的困难,使得跨膜蛋白的高分辨率三维结构测定和解析远远 不能满足对跨膜蛋白功能研究的需要。而计算机预测和分析膜蛋白的跨膜螺旋区 段( t r a n s m e m b r a n eh e l i c a ls e g m e n t s ,t m i - i s ) 则可为揭示跨膜蛋白的结构与功能 关系提供重要信息。 享有“数学显微镜”美誉的小波变换是近2 0 多年来迅速发展起来的崭新的 数学技术,是当前数学科学中的一个迅猛发展的新方向。它既有丰富的数学理论 意义,又具有广泛的应用价值,给许多相关学科的研究领域带来了新的思想,为 众多应用领域提供了一种新的更有效的分析工具。迄今虽已有文献报道了多种预 测膜蛋白跨膜螺旋的方法,但在预测准确度和适应性方面都有不足之处。本文系 统地总结了目前膜蛋白跨膜螺旋预测的研究现状及进展,着重探讨小波变换的基 本原理及其在生物信息学研究中的应用,提出了基于离散小波变换( d i s c r e t e w a v e l e tt r a n s f o r m ,d w t ) 的膜蛋白跨膜螺旋区段预测的新方法,并把此方法称 之为w a v e p r d 。 首先,选用欧洲生物信息中心建立的跨膜蛋白数据集中的两类总共6 0 条蛋 白质序列构建独立的测试集,主要从三个不同层次对膜蛋自进行分析,得到详细 的预测结果,并从两类数据中各选出一条膜蛋白序列进行讨论,将两类数据的预 测结果与t m h m m 2 0 、m e m s a t 两种预测方法的主要结果进行比较,结果表明, 我们的方法具有较高的预测准确度。其次,从最新的m p t o p o 数据库中选取三维 结构已知的8 0 条膜蛋白序列作为序列分析的数据集,弓l 入交叉证实方法,利用 五种不同的常用疏水参数值从两个不同层次来预测膜蛋白跨膜螺旋区段的位置 和数目,结果表明,选用f p 疏水参数和k d 疏水参数预测膜蛋白的跨膜螺旋区 段效果最好;还以一条膜蛋白序列为例进行讨论,并结合其它七种方法的预测结 果进行比较,证实了w a v e p r d 方法的有效性:按照膜蛋白的功能和类型,我们 把8 0 条序列划分成1 3 组,运用k d 疏水参数对1 3 维膜蛋白序列进行跨膜螺旋 区段预测,达到了令人满意的结果。最后,对上述两个数据集的预测结果进行了 评价。 关键词:小波变换,多分辨分析,膜蛋白,跨膜螺旋区段,疏水性 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 a b s t r a c t m e m b r a n ep r o t e i n se s p e c i a l l yt r a n s m e m b m n e p r o t e i n sp l a ya ni m p o r t a n t r o l ei nt h el i f ea c t i v i t yo fc e i l s t h es t u d yo fs t r u c t u r ea n df u n c t i o no ft m p r o t e i n si s i n c r e a s i n g l ye m p h a s i z e d h o w e v e r , t h es t r u c t u r a ld e t e r m i n a t i o no fp r o t e i n sn e e d sa c o n s i d e r a b l en u m b e ro fp u r i f i e dp r o t e i n sa n di ti sah a r dt a s kb e c a u s et h ep e p t i d e c h a i n so ft h et m p r o t e i n ss p a nal i p i db i l a y e ra n ds o m e t i m e st r a n s v e r s em e m b r a n e m a n yt i m e s i na d d i t i o n , t r a n s m e m b r a n eh e 敬c o m b i n ec l o s e l yw i t hm e m b r a n e f t r s t o f a l l ,t h em e m b r a n em u s tb ed i s i n t e g r a t e db yd e t e r g e n tt os e p a r a t et mp r o t e i n s t h e n , t h et mp r o t e i nc a nb ep u r i f i e da n dm a d ec r y s t a l t h i si sn o to n l yd i f f i c u l ti n t e c h n i q u e ,b u ta l s oi se x p e n s i v e t h u s ,t h eh i g h - r e s o l u t i o n3 ds t r u c t u r a ld e t e r m i n a t i o n a n da n a l y s i so ft mp r o t e i n sc a n n o ta n s w e rt h en e e do ft h er e s e a r c hf o rt mp r o t e i n f u n c t i o n s t h ec o m p u t e rp r e d i c t i o na n da n a l y s i so ft h et r a n s m e m b r a n eh e l i c a l s e g m e n t s ( r m h s ) i sa b l et op r o v i d em u c hi m p o r t a n ti n f o r m a t i o nt od i s c l o s et h e r e l a t i o n s h i pb e t w e e nt h es t r u c t u r ea n df u n c t i o no f t mp r o t e i n s w a v e l e tt r a n s f o r mw h i c hi se l e g a n t l yc a l l e d m a t h e m a t i c a lm i c r o s c o p e h a sb e e n ag r e a t l yd e v e l o p i n gn e wt e c h n i q u ei nr e c e n tm o r et h a n2 0y e a r s w i t hr i c h m a t h e m a t i c st h e o r i e sa n dc o m p r e h e n s i v ea p p l i c a t i o nv a l u e s ,w a v e l e tt r a n s f o r mn o t o n l yb r i n g sn e w i d e a st ot h es t u d yo fm a n yr e l a t e ds u b j e c t sb u ta l s op r o v i d e san e w a n de f f e c t i v ea n a l y s i st o o l f o rt h ea m o u n t so fa p p l i c a t i o nf i e l d s s of a r , s e v e r a l p r e d i c t i o nm e t h o d sh a v eb e e nr e p o r t e d , b u tt h e r ea r es o m ed e f i c i e n c i e si np r e d i c t i o n a c c u r a c ya n da d a p t a b i l i t y i nt h e s em e t h o d s i n0 1 1 1 - t h e s i s ,w e s y s t e m a t i c a l l y s u m m a r i z e dt h ec u r r e n tr e s e a r c hs t a t u sa n dp r o g r e s so f t h ep r e d i c t i o no f t m h s a n d w ep r o b ei nt h eb a s i cp r i n c i p l e so fw a v e l e tt r a n s f o r ma n di t s a p p l i c a t i o no n b i o i n f o r m a t i c sw i t he m p h a s i s i nt h ee n dw ed e v e l o p0 1 , 1 1 o w nm e t h o db a s e do n d i s c r e t ew a v e l e tt r a n s f o r m ( d w 7 3t op r e d i c tt h et m h sw h i c hi sc a l l e dw a v e p r d f i r s t l y , t w oc l a s s e so f d a t a s e t si n c l u d i n g6 0t r a n s m e m b r a n ep r o t e i n sa r es e l e c t e d t ob u i l dt e s td a t af r o mt h ee u r o p e a nb i o i n f o r m a t i c si n s t i t u t ee s t a b l i s h e dd a t a b a s e w e a n a l y z et h e mi nt h 圮ed i f f e r e n tl e v e l sa n do b t a i nd e t a i l e dp r e d i c t i o nr e s u l t s m o r e o v e r , b o t ht r a n s m e m b r a n ep r o t e i ns e q u e n c e sf r o mt h et w oc l a s s e so ft e s td a t a s e t s r e s p e c t i v e l ya r es t u d i e da n dt h e i rp r e d i c t i o nr e s u l t sa r eu s e dt oc o m p a r ew i mt h a to f t m h m m 2 0a n dm e m s a tm e t h o d s t h cc o m p a r i s o nr e s u l t si n d i c a t et h a t0 1 1 1 m e t h o dp r e s e n t sg r e a t e rp r e d i c t i o na c c u r a c y s e c o n d l y ,8 0t r a n s m e m b r a n ep r o t e i n s 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 w i t hk n o w n3 d s t r u c t u r ef r o mm l p t o p od a t a b a s ea r ee h o s e na sd a t a s e t i n t r o d u c i n g c r o s s v a l i d a t i o nw em a k eu s eo ff i v ef r e q u e n t l yu s e db y d r o p h o b i c i t yv a l u e sa n d p r e d i c tt h el o c a t i o na n dn u m b e ro ft m h so i lt w od i f f e r e n tl e v e l s t h ea n a l y s i ss h o w s t h a tt h ep r e d i c t i o nr e s u l t sa r et h eb e s tw h e nu s i n gf pa n dk dh y d r o p h o b i c i t yv a l u e s t op r e d i c tt h et m h si nm e m b r a n ep r o t e i n s i no r d e rt op r o v et h ee f f i c i e n c yo f w a v e p r dm e t h o dw ep u to n es e q u e n c ea sa ne x a m p l et oc o m p a r et h ep r e d i c t i o nr e s u l t w i t ht l l a to ft h eo t h e rs e v e np r e d i c t i o nm e t h o d s i na d d i t i o n t h ea b e v e8 0m e m b r a n e p r o t e i n sa r ed i v i d e di n t o1 3g r o u p sa c c o r d i n gt om e i rf u n c t i o na n dt y p e i np a r t i c u l a r , t h ek dh y d r o p h o b i c 时v a l u e sa r eu s e di nt h ep r e d i c t i o no ft m h so ft h e1 3g r o u p s a n dt h er e s u l t sa r es a r i s f y f i n a l l y , w ed i s c u s sa n da s s e s st h ep r e d i c t i o nr e s u l t so n t h ea b o v ct w 0d a t a b a s e s k e y w o r d s : w a v e l e tt r a n s f o r m ,m u l t i r e s o l u t i o n a n a l y s i s ,m e m b r a n ep r o t e i n , t r a n s m e m b r a n eh e l i c a ls e g m e n t s ,h y d r o p h o b i c i t y i i i 本文的研究工作受上海市重点学科建 设项目及国家8 6 3 高技术研究发展计划项目 ( 2 0 0 2 a a 2 3 4 0 2 1 ) 资助。 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表 或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 签名:埠日期础 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即:学 校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 日期:渺jb l 移 2 0 0 5 年上海大学硕士学位论文基于小波变换的膜蛋白跨膜螺旋区段预测研究 1 1 引言 第一章绪论 历时十年的人类基因组计划不仅产生了海量的生物学数据,在人类探索生命 奥秘的征途上迈出了坚实的一步,而且孕育了一门崭新的学科生物信息学 ( b i o i n f o r m a t i c s ) 。生物信息学【1 1 是一门新兴的交叉学科,它包含了生物信息的获 取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算 机科学和生物学的各种工具,来阐明和理解大量数据所蕴含的生物学意义。目前 生物信息学的研究对象主要是d n a 和蛋白质序列,其主要任务是分析研究序列 数据中所含的各种信息,特别是d n a 序列中的遗传和调控信息,研究蛋白质序 列与结构及功能之间的关系。 随着人类基因组计划的完成,生命科学已经全面进入了后基因组 ( p o s t - g e n o m i c s ) 时代,生物学家的研究重心已从揭示生命的所有遗传信息转移到 在整体水平上对生物功能的研究。由于生物功能的主要体现者是蛋白质,而蛋白 质所具有的生物学功能在很大程度上又与其空间结构相关。因此,蛋白质结构的 确定将是研究其生物功能的基础口】。 在生物体中,按照中心法则,基因序列被翻译成氨基酸序列,氨基酸序列则 快速地折叠成一定的空间结构,从而完成了蛋白质的生成。基因的生物学功能通 常是通过它所编码的蛋白质实现的。在生物的进化过程中,一般说来,蛋白质的 空间结构比其氨基酸序列更为保守,而蛋白质的功能则与其空间结构有着密切的 联系。所以,掌握蛋白质的结构信息对于研究蛋白质的功能及作用机制具有重要 意义。由于分子生物学技术的飞速发展,大大加快了基因的测序速度,目前已蓄 积了海量的基因序列数据。x 射线晶体学方法和多维核磁共振( n u c l e a rm a g n e t i c r e s o n a n c e ,n 积) 技术是目前测定蛋白质结构的主要方法。用x 射线晶体学方法 测定蛋白质结构的前提是必须获得能对x 射线产生强衍射作用的晶体,而蛋白 质晶体的表达、提纯与结晶增加了结构测定的难度;多维核磁共振技术避免了这 些困难,不仅能够测定溶液中的蛋白质分子的构象,而且可以测定溶液中蛋白质 分子构象变化的全过程。但是,n m r 仅适用于分析长度不超过1 5 0 个氨基酸残 基的小蛋白,并且对样品的纯度要求较高。由于蛋白质分子三维结构测定的速度 仍远远落后于其氨基酸序列测定的速度,因此迫切需要一种不依赖于蛋白质提纯 和晶体培养、简便易行的预测蛋白质结构的方法。 由于蛋白质的一级结构很大程度上决定了其高级结构,因此,根据蛋白质的 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 氨基酸序列提供的信息预测其相应的高级结构就成为生命科学,特别是计算分子 生物学中一个重要的课题。特别是近年来随着各种软件及算法的改进使计算效率 大为提高。许多权威人士推测,随着这些新方法的进一步改进和完善,在今后不 远的时间里,蛋白质折叠这一分子生物学中的难题将有望得到解决,以计算为基 础来确定蛋白质的高级结构将最终实现,并将在蛋白质组学( p r o t c o m i c s ) 和药 物设计( d r u gd e s i g n ) 等领域中发挥巨大的作用2 3 ”。 著名科学家e b w i l s o n 口1 早在1 9 2 5 年就说过,“每个生物科学问题的关 键必须在细胞中寻找”。在当今生命科学蓬勃发展的时代,重温这句名言感到内 涵很深。细胞是有机体结构与生命活动的基本单位。在细胞中占了所有蛋白总数 2 0 一3 0 的膜蛋白,在细胞的生命活动中扮演着极其重要的角色,担负着多种 多样的生理功能,从而引起研究人员浓厚的兴趣。膜蛋白与膜结合较为牢固,很 难分离提纯和结晶,目前仅有少数几种膜蛋白的三维结构被实验测定。了解分子 结构是了解生物大分子功能的一个重要途径。因此,用计算机对其结构进行预测 是生物信息学领域中的一个重要研究内容。 1 2 膜蛋白结构预钡4 的意义 在所有基因组数据中,大约有2 0 一3 0 的基因产物被编码为膜蛋白h ,这 样的比重显示了膜蛋白在生物体中的重要性。膜蛋白,尤其是跨膜蛋白 ( t r s n s m e m b r a n ep r o t e i n ) 在生物体中担负着极其重要的功能,如光合作用、呼吸 作用、神经信号传导、免疫反应、营养物质的吸收等,同时它也是重要的药物靶 标。比如,g 蛋白偶联受体( gp r o t e i n - c o u p l e dr e c e p t o r s ,g p c r s ) 是一类具有1 条肽链,7 个跨膜螺旋区段( t r a n s m e m b r a n eh e l i c a ls e g m e n t s ,t m h s ) 的跨膜蛋白 受体,如图1 - 1 所示。它是一类非常重要的分子受体,是真核生物中最大的一类 跨膜蛋白家族喇。g p c r a 在动物基因组中有最大的基因家族编码。已知l 的果 蝇基因和5 以上的线虫基因负责编码g p c r s ,而人类基因组中则有1 以上的 基因用来编码1 0 0 0 多条g p c r s h 。 肽链的n 末端区在胞外,c 末端区在胞内,不同的g p c r 。s 末端区的长度有 很大差异;胞内外分别由3 个回环( 1 0 0 p ) 结构连接7 个跨膜螺旋,不同的g p c r s 各个回环长度和伸展取向有所不同j 。通过对膜蛋白序列的分析,发现不同 g p c r s 跨膜螺旋区域的氨基酸比较保守,而c 、n 末端和回环区域的氨基酸则 差异较大。此外,靠近膜的回环区和肽链n 末端多有糖基化现象。通过胞外的n 末端及跨膜螺旋问的回环区,g p c r s 可以结合胞外的多种信号分子由此引起 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 g p c r s 蛋白整体结构的变化,这种变化由胞外通过跨膜螺旋传递到胞内,导致 胞内偶联的g 蛋白异三聚体的解聚并由解聚产生的各个亚基启动胞内的信号传 递系统。 目1 - 1g 蛋白偶联受体结构示意图 ( 引自h t t p :w w w m u n c a b i o l o g y d e s m i d b r i a n l b i o l 2 0 6 0 c e l l b i o l l 0 1 c b l 0 h t m l ) g p c r s 的功能失调会导致许多疾病的产生,如阿尔茨海默氏症、帕金森综 合症、侏儒症、色盲症、色素性视网膜炎和哮喘,等等。通过调节有关g p c r s 介导的信号传导还可以治疗抑郁症、精神分裂症、失眠、高血压、肾功能衰退、 心脑血管等病症。大部分药物可通过靶向作用于g p c r s 来达到治疗效果,目前 世界小分子药物市场中有三分之一以上的药物作用靶点是g p c r - s t 卵】。超过5 0 的处方药是通过g p c r s 起效的口】。除了g p c r s ,还有另一些重要的跨膜蛋自家 族,包括离子通道、肌动蛋白和与生物能量有关的一些蛋白质,例如,那些与电 子运输系统有关的蛋白质o ”。 由于膜蛋白的疏水特性使其需要与生物膜共同形成稳定的自然构象,不利于 用x 射线晶体衍射法和核磁共振( 讧r ) 技术测定其三维结构。因此现有的蛋 白质结构数据库( p r o t e i n d a t a b a n k , p d b ) 中属于膜蛋白的结构数据仅占所有存 入数据的o 6 。直到现在,我们所知道具有高解析度的膜蛋白三维结构只有少 数几种,如细菌视紫红质( b a c t e r i o r h o d o p s i n ,b r ) 、光合反应中心( p h o t o s y n t h e t i c r e a c t i o nc e n t e r ) 、细胞色素c 氧化酶( c y t o c h r o m ec o x i d a s e ) 等。由此可见,已 知的膜蛋白序列个数与已知的膜蛋白结构个数之间存在着巨大差距,这大大制约 了对膜蛋自功能的深入研究。随着功能基因组学( p t m c t i o n a | g e n o m i c s ) 和蛋白 质组学研究的开展,有待分析的膜蛋白序列急速增加,迫切需要有效的、准确度 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 高的算法来预测膜蛋白的t m h s 和跨膜方向,以指导膜蛋白的研究;另一方面, 通过对不同算法的预测精确度的比较,能够揭示出隐含的生物学意义,从而指导 膜蛋白的生物学实验。因此,膜蛋白的结构预测,特别是膜蛋白的跨膜螺旋区段 预测目前在国际上引起了研究人员的浓厚兴趣。 | 1 3 论文的结构和内容安排 膜蛋白的跨膜螺旋区段预测是当前生物信息学研究领域的一个热点。本文总 结了膜蛋白跨膜螺旋区预测的研究现状及进展,着重探讨了小波变换的基本原理 及其在生物信息学若干领域中的应用,提出了基于离散小波变换( d i s c r e t e w a v e l e tt r a n s f o r m ,d w t ) 的膜蛋白t m h s 预测方法。 本论文共分五章,具体安排如下: 本章,简要介绍了蛋白质结构与功能之间的关系,指出根据蛋白质的氨基酸 序列信息预测其相应的高级结构的意义:然后简要地探讨了在细胞中占了所有蛋 白总数2 0 - 3 0 的膜蛋白,并以重要的g 蛋白偶联受体( o p c r s ) 为例详细 说明膜蛋白结构预测的重要意义。 第二章,对膜蛋白t m h s 预测进行了全面探讨。首先,我们较为详细地介 绍膜蛋白:认识膜蚩白的一些重要功能,膜蛋白与脂双层结合的几种方式,而多 肽链通常以a 螺旋穿过脂双层,并列出了少数几种三维结构已知的重要膜蛋白; 其次,结合当前国际主流的膜蛋白结构预测研究成果,详细论述了膜蛋白t m h $ 的常用预测方法,对预测方法的准确度进行了客观的评价,并对膜蛋白t m h s 预测的发展前景进行了展望;最后,总结出预测膜蛋白t m h s 的常用方法及对 应网址。 第三章,主要介绍了小波变换的基本理论及其在生物信息学若干领域中的应 用。首先,我们简要回顾了小波的发展简史及目前在几个重要领域的应用概况; 其次,重点介绍了小波变换的基本概念、主要特性和重要的m a u a t 算法,并对 几种常用的小波基函数作了简要描述,总结出八种小波函数的基本性质,为后面 的具体应用打下基础:最后,我们详细探讨了小波变换在目前生物信息学几个重 要研究领域中的应用:基因组d n a 序列分析、蛋白质结构研究、基因芯片的数 据分析。为今后的研究工作提供了有益的指导和帮助。 第四章,我们提出了一种基于d w t 的膜蛋白t m h s 的预测方法,把此方法 称之为w a v e p r d 。首先,选用欧洲生物信息中心创建的跨膜蛋白数据集中的两类 总共6 0 条蛋白质序列构建独立的测试集,主要从三个层次对膜蛋白进行分析, 4 2 0 0 5 年上海大学硕士学位论文基于,、波变换的膜蛋白跨膜螺旋区预测研究 高的算法来预测膜蛋白的t m h s 和跨膜方向,以指导膜蛋白的研究:另一方面, 通过对不同算法的预测精确度的比较,能够揭示出隐含的生物学意义,从而指导 膜蛋白的生物学实验。因此,膜蛋白的结构预测,特别是膜蛋白的跨膜螺旋区段 预铡目前在国际上引起了研究人员的浓厚兴趣。 | 1 3 论文的结构和内容安排 膜蛋白的跨膜螺旋区段预测是当前生物信息学研究领域的一个熟点。本文总 结了膜蛋白跨膜螺旋区预测的研究现状及进展,着重探讨了小波变换的基本原理 及其在生物信息学若干领域中的应用,提出了基于离散小波变换( d i s c r e t e w a v e l e tt r a n s f o r m 。d w t ) 的膜蛋白t m h s 预测方法。 本论文共分五章,具体安排如下: 本章,简要介绍了蛋白质结构与功能之间的关系,指出根据蛋白质的氨基酸 序列信息预测其相应的高级结构的意义:然后简要地探讨了在细胞中占了所有蛋 白总数2 0 - 3 0 的膜蛋白,并以重要的g 蛋白偶联受体( g p c r s ) 为例详细 说明膜蛋白结构预测的重要意义。 第二章,对膜蛋白t m h s 预测进行了全面探讨。首先,我们较为详细地介 绍膜蛋白:认识膜蚩自的一些重要功能,膜蛋白与脂双层结合的几种方式,而多 肽链通常以a 螺旋穿过脂双层,并列出了少数几种三维结构已知的重要膜蛋白; 其次,结合当前国际主流的膜蛋白结构预测研究成果,详细论述了膜蛋白t m - i $ 的常用预测方法,对预测方法的准确度进行了客观的评价,并对膜蛋白t m h $ 预测的发展前景进行了展望;最后,总结出预测膜蛋白t m i - i s 的常用方法及对 应网址。 第三章,主要介绍了小波变换的基本理论及其在生物信息学若干领域中的应 用。首先,我们简要回顾了小波的发展简史及目前在几个重要领域的应用概况; 其次,重点介绍了小波变换的基本概念、主要特性和重要的m a l l a t 算法,并对 几种常用的小波基函数作了简要描述,总结出八种小波函数的基本性质,为后面 的具体应用打下基础:最后,我们详细探讨了小波变换在目前生物信息学几个重 要研究领域中的应用:基因组d n a 序列分析、蛋白质结构研究、基因芯片的数 据分析。为今后的研究工作提供了有益的指导和帮助。 第四章,我们提出了一种基于d w t 的膜蛋白t m h s 的预测方法,把此方法 称之为w a v e p r d 。首先,选用欧洲生物信息中心创建的跨膜蛋白数据集中的两类 总共6 0 条蛋白质序列构建独立的测试集,主要从三个层次对膜蛋白进行分析, 总共6 0 条蛋白质序列构建独立的测试集,主要从三个层次对膜蛋白进行分析, 4 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 得到了详细的预测结果,并从两类数据中各选出一条跨膜蛋白序列进行了讨论, 将测试结果与t m i - i m m 2 0 、m e m s a t 两种方法的主要预测结果进行比较,结果 表明,我们提出的方法具有较高的预测准确度。其次,从最新的m p t o p o 数据库 中选取三维结构已知的8 0 条膜蛋白序列作为序列分析的数据集,引入交叉证实 ( c r o s s v a l i d a t i o n ) 方法,利用五种不同的常用疏水参数值从两个不同的层次来预 测膜蛋白t m h s 的位置和数目,结果表明,选用f p 疏水参数和k d 疏水参数预 测膜蛋白的t m h s 效果最好;我们还阻一条膜蛋白序列为例进行详细讨论,并 结合其它七种方法的预测结果进行了比较,来证实w a v e p r d 方法的有效性:以 及运用k d 疏水参数对划分的1 3 组膜蛋白序列进行n 懈s 预测,结果显示, w a v c p r d 方法预测膜蛋白t i v i h s 令人满意。最后,对两个数据集的预测结果进行 了综合评价。 第五章,对全文工作进行总结,指出了存在的问题,并对今后的研究工作进 行了展望。 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 第二章膜蛋白跨膜螺旋区段预测 2 1 认识膜蛋白t ”一2 虽然脂双层给作为通透屏障的所有细胞膜提供了基本结构,但是绝大多数膜 功能由膜蛋白执行。动物细胞中大多数脂膜约5 0 的物质是蛋白质成分,余下的 是脂质加上少量的糖类。然而由于脂质分子比蛋白质分子要小得多,所以典型的 细胞膜中脂质分子约为蛋白质分子数的5 0 倍,如图2 - 1 所示。 图2 - 1 细胞膜的两种视图i n ( 人红细胞的) 脂膜横切面显微镜照片。饵) 细胞膜的三维图像。 膜蛋白除了将特殊的营养物质、代谢产物或离子转运通过脂双层外,还有其 他许多功能,这些功能包括:一些蛋白质把膜锚连在两边的大分子上:其他一些 蛋白质作为受体,接收细胞周围的化学信号并把它们递送到细胞内部;还有其他 一些特殊功能,如催化特殊反应。如图2 - 2 及表2 - 1 所示。每一种类型的细胞膜 含有不同系列的膜蛋白,反映了其特殊功能。 图2 - 2 膜蛋白的一些功能。 2 0 0 5 年上海大学硕士学位论文基于小波变换的膜蛋白跨膜螺旋区段预测研究 表2 - 1 膜蛋白及其功能的一些例子 功能分类 蛋白质分子 特殊功能 转运蛋白n a + 泵主动地把n a + 泵出和k + 泵入细胞 连接体 整联蛋白 连接细胞内肌动蛋白丝和细胞外基质蛋白质 血小板衍生生长因结合细胞外p d g f ,结果产生引起细胞生长 受体 子( p d g f ) 受体和分裂的细胞内信号 酶腺昔酸环他酶催化细胞内产生c a m p 应答细胞外信号 2 1 1 膜蛋白阻多种方式与脂双层结合 膜蛋白与脂双层可以有以下三种主要结合方式( 图2 3 ) : ( 1 ) 许多膜蛋白伸展通过脂双层,将膜蛋白的一部分分别位于膜的两侧( 图 2 - 3 a ) 。像与它们相邻的脂质分子一样,这些跨膜蛋白既有疏水 ( h y d r o p h o b i c i t y ) 区域又有亲水( h y d r o p h i l i c i t y ) 区域。其疏水区域位于脂 双层的内部,与脂质分子的疏水尾部接触;其亲水区域则暴露在膜两边 的水溶液环境中。 ( 2 ) 另外一些膜蛋白整个分子都位于脂双层外部,只靠一个或多个共价连接 的脂质基团与脂双层连接( 图2 - 3 b ) 。 ( 3 ) 还有其他一些蛋白质,只是借助与其他膜蛋白的相互作用,间接地与膜 的一侧或者另一侧结合( 图2 - 3 c ) 。 圈2 - 3 膜蛋白与脂双层结合的方式【“1 ( a ) 跨膜蛋白能以单个盘螺旋、多个a 螺旋或封闭的声折叠( 桶) 延伸穿过双层。( b ) 一些膜蛋白仅以与脂质分子共价结合( 红色“之”字形线条) 的形式与双层连接。 ( c ) 还有许多蛋白质仅借助于较弱的与其他膜蛋白非共价相互作用而连接在膜上。 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 根据膜蛋白与膜脂相互作用的方式及其在膜中的排列部位,可以大体地将膜 蛋白分为两类:膜外在蛋白与膜内在蛋白( 图2 - 4 ) 。外在蛋白( e x t r i n s i c p r o t e i n 】 为水溶性球状蛋白质,约占总膜蛋白总量的2 0 3 0 ,又叫外周( p e r i p h e r a l ) 蛋 白,通过静电作用及离子键等非共价键与膜腊相连,分布在膜脂双层的内外表面。 内在蛋白( i n t r i n s i cp r o t e i n ) 占膜蛋白总量的7 0 8 0 ,又叫嵌入蛋白或整合蛋 白,其主要特征是水不溶性,在脂质双分子层中,有的横跨全膜也称跨膜蛋白 f t r a n s m e m b r a n e p r o t e i n ) ,有的全部埋入疏水区域,有的与外在蛋白结合以多酶复 合体形式与膜脂结合。最近,又在生物中发现一类新的膜蛋白,叫膜脂蛋白,它 们的蛋白部分不直接嵌入膜,而依赖所含的脂肪酸插入脂质双分子层中。 浆毫熬鞭稳靛瓣虢糟瓣糍蛾鬻释黼壤鞭崧壤鹣糍霸鞲璇戮壤 _ ,* _ _ 、 图2 - 4 细胞膜的构造 2 1 2 多肽链通常以a 螺旋穿过脂双层 跨膜蛋白伸展在脂双层外面的部分,靠多肽链中特殊的跨膜区段连接起来。 这些区段穿过脂双层内部的疏水环境,大多由带疏水侧链的氨基酸组成。因为这 些侧链不能与水分子产生良好的相互作用,所以这些片段宁愿选择不存在水的脂 质环境。 t 然而,与疏水侧链相比,蛋白质中连接氨基酸的肽键通常是有极性的,从而 使多肽主链呈亲水性。由于脂双层内无水,所以驱使形成主链的原子彼此间形成 氢键。如果多肽链形成一个有规律的口螺旋,那么氢键可增加到最大限度,所以 多肽链的绝大多数跨膜区段以a 螺旋穿过脂双层。在这些跨膜a 螺旋中,疏水氨 2 0 0 5 年f 海大学硕士学位论文 基1 讳波变撬的膜蛋白跨膜螺旋区段项测研兜 基酸侧链暴露在螺旋外侧面,与疏水脂质尾部接触,而部分多肽主链在螺旋内侧 面上彼此形成氢键,如图2 5 所示。 圈2 - 6 由多个d 螺旋形成的跨膜亲水孔 本倒中,5 个跨膜口螺旋形成横跨脂双层的 克满水的通道。位于每个口螺旋一侧上的疏 水氨基酸侧链( 绿色) 与疏水烃尾接触,而 其相反的一侧上的亲水侧链( 红色) 形成充 图2 - 5 横跨腊双层的一段瑾螺旋”满水的孔。 在众多跨膜蛋白中,多肽链仅一次跨膜( 图2 - 3 a ) ,其中许多是胞外信号的 受体:其胞外部分结合信号分子,同时其胞质部分把信号传递到胞内( 图2 2 ) 。 其余跨膜蛋白形成允许水溶性分子穿越膜的亲水孔。那些单一、巯水的仅有 单条跨膜口螺旋的蛋白质不能构成这类孔,而需要比较复杂的跨膜蛋白担任此任 务。在这些蛋白质中,多肽链不是以口螺旋就是以口桶多次穿过脂职层( 图 2 - 3 a ) 。其中许多蛋白质由既含疏水性又含亲水性氪基酸侧链的口螺旋形成一个 或多个跨膜区。疏水侧链位于螺旋的一侧,暴露于膜脂质。亲水倒链集中在另一 侧,形成亲水孔内衬的一部分,该亲水孔是由多个螺旋在脂双层的疏水环境内按 环形并肩排列组装而成,如图2 - 6 所示“”。 虽然。螺旋在多肽链穿过脂双层中是最普通的形式,但是有一些跨膜蛋白的 多肽链以芦折叠弯曲成一个圆柱的形状穿过脂双层,这个圆柱是一个无底的圆 筒,称为口桶。可以想象,朝向桶里面的、并因而衬在水通道里面的氨基酸侧链, 大多是亲水的;而在桶外表面上的、与脂双层疏水中心接触的氨基酸侧链,全是 疏水的。最引人瞩日的例子是膜孔蛋白( p o r t n ) ,它形成充满水的大孔道,穿过 线粒体外膜和某些细菌的外膜,允许营养物和小离子通过,而阻止大的抗生素和 毒性分子进入。与a 螺旋不同,口桶只能形成大通道,因为如此紧密的口折叠 要被弯曲成圆桶总是有限制的( 图2 7 ) ,在这方面,口折叠的可变性要比口螺 2 0 0 5 年卜海大学硕士学位论文基于小波变换的膜蛋白跨膜螺旋逸段预测研究 旋差些。 汹秘 汹 图2 7 应用x 射线衍射晶体分析法测得e c o i l o m p f 膜孔蛋白的三维结构“2 1 ( a ) 1 6 股单体的缎带示意图。( b ) 从三重对称轴约3 0 。方向观察三聚体a 碳主链,表明孔通 过每个亚基。( c ) 从垂直于三重对称轴方向观察三聚体空间填充模型( 垂直的绿线) ,n 原 子蓝色,o 原子红色,c 原子黄色,芳香族残基侧链的原子为白色。 2 1 3 已知的少数几种膜蛋白结构 前面已经说明,膜蛋白很难结晶,不利于用x 射线晶体衍射法和核磁共振 技术测定其三维结构。然而,有两个最引人瞩目的膜蛋白,它们是细菌视紫红质 ( b a c t e r i o r h o d o p s i n ,b r ) 和光合反应中心( p h o t o s y n t h e t i cr e a c t i o nc e n t e r ) ,两者都 是在捕获和利用太阳能方面具有重要作用的细菌膜蛋白。这两个蛋白质的三维结 构确切地揭示了口螺旋如何穿过脂双层,以及一系列不同的蛋白质分子如何在膜 内装配成功能复合物。 图2 - 8 显示了细菌视紫红质的结构。从生活在盐沼地中的一种嗜盐细菌 ( h a l o b a c t e r i u mh a l o b i u m ) 的脂膜中发现大量的这种小蛋白质分子( 有2 4 7 个氨 基酸残基) 。细菌视紫红质作为膜转运蛋白,把日+ 泵出细菌。泵的工作需要能量, 细菌视紫红质直接从太阳光获得能量。每个细菌视紫红质分子含有一个吸收光的 非蛋白质分子叫视黄醛( r e t i n a l ) ,它共价连接在蛋白质的2 1 6 位的l y s 上,它给 该蛋白质以深紫色。这个小的疏水分子与细菌视紫红质的7 个口螺旋中的一个共 价连接,它位于脂双层的平面上,并被7 个口螺旋完全包围着( 图2 - 8 ) 。每个口 螺旋约含有2 5 个氨基酸残基,它们以几乎垂直于脂双层平面的方向跨越脂双层。 视黄醛吸收光予时会改变其形状,同时引起嵌在脂双层内的蛋白质进行一系列小 的构象变化。这些变化导致日+ 从视黄醛向细菌表面转移:沿着安置得很策略的 极性氨基酸侧链途径跨越双层,然后从胞质摄取h + ,从而再生视黄醛,蛋白质 恢复到原来的构象,如此周而复始。最终结果把日+ 转移出细菌,降低了细菌细 2 0 0 5 年上海大学硕士学位论文 基于小波变换的膜蛋白跨膜螺旋区段预测研究 胞内的h + 浓度。 在阳光下,成千上万细菌视紫红质分子把h + 泵出细胞,产生细菌膜内外日+ 浓度梯度。这日+ 梯度用作能量储备,像堤坝内的水。正如水坝中的水向下冲击 通过涡轮机时能发电那样,当日+ 通过称为a t p 合酶的另一种膜蛋白流回到细菌 体内时,日+ 梯度能被用来产生大量a t p 。 图2 - 8 细菌视紫红质的三维结构”1 多肽链以7 个口螺旋横跨脂双层。这里显示了光激活的泵循环期间视黄醛的定位和质子所 取的可能途径。被认为参与日+ 转移过程的两条极性氨基酸侧链以黑色显示。 图2 - 9 显示了细菌光合反应中心的结构,紫色光合细菌的原发光化学过程就 是由它介导的。它是由4 个蛋白质分子组成的较大复合物:三个跨膜蛋白,其中 两个( m 和l ) 有多个穿过脂双层的口螺旋,而另一个( i - i )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 会计职业技能试题及答案
- 2025年驾校营销考试题及答案
- 南京市中储粮2025秋招面试专业追问题库综合管理岗
- 国家能源济源市2025秋招能源与动力工程类面试追问及参考回答
- 衡阳市中石化2025秋招笔试模拟题含答案财务与审计岗
- 2025年产后恢复考试题及答案
- 白银市中石化2025秋招笔试模拟题含答案炼油工艺技术岗
- 国家能源宁夏地区2025秋招笔试数学运算题专练及答案
- 鞍山市中石化2025秋招面试半结构化模拟题及答案油气储运与管道岗
- 2025年邮政远程培训题库及答案
- 人教版英语单词表-六年级上册689
- 南京市交通建设投资控股(集团)有限责任公司公司2024年半年度财务报表及附注
- 形势与政策(吉林大学)智慧树知到答案2024年吉林大学
- 中药活血化瘀成分的分子靶向作用
- 数字金融驱动区域技术创新水平提升的空间溢出效应研究
- 一次性餐具配送投标方案
- 《公共艺术设计》课件
- 2024年中国教育出版传媒集团有限公司招聘笔试参考题库附带答案详解
- 老年综合评估课件
- 冬季作业安全技术交底
- 代写公司简介范本
评论
0/150
提交评论