(细胞生物学专业论文)细胞内铜离子螯合蛋白质数据库的构建及数据分析.pdf_第1页
(细胞生物学专业论文)细胞内铜离子螯合蛋白质数据库的构建及数据分析.pdf_第2页
(细胞生物学专业论文)细胞内铜离子螯合蛋白质数据库的构建及数据分析.pdf_第3页
(细胞生物学专业论文)细胞内铜离子螯合蛋白质数据库的构建及数据分析.pdf_第4页
(细胞生物学专业论文)细胞内铜离子螯合蛋白质数据库的构建及数据分析.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得 ( 注:如没有其他需要特别声明的,本栏可 空) 或其他教育机构的学位或证书使用过的材料。与我一同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢 意。 学位论文作者签名: 导师签字:缀勿绚 签字日期:2 0 0 4 年垆月彤日签字日期:2 0 0 4 年牛月巧日 学位论文版权使用授权书 本学位论文作者完全了解堂撞有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许论文被查阅和借阅。本人授权堂撞可以将学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手 段保存、汇编学位论文。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 糊 7, 导师签字钰铷纳j v , 、 签字日期:2 0 0 4 年垆月“日签字日期:2 0 0 4 年仁月w 日 学位论文作者毕业后去向 工作单位: 通讯地址: 电话: 邮编: 摘要 近年来的研究表明,金属离子尤其是铜、铁等过渡金属离子的异常代谢与阿尔茨海默 氏病、朊病毒疾病等神经退行性疾病有关。而金属离子的异常代谢又是由于其转运蛋白正 常功能发生异常或者是丧失所导致,所以对金属离子螯合蛋白质的研究进行的如火如荼。 结合已有的生物信息学优势,本论文拟构建铜离子螯舍蛋白质数据库( t h ed a t a b a s eo f c o p p e r - c h e l a t i n gp r o t e i n s ,简称d c c p ) 。虽然国际上有些蛋自质数据库已经收录了部分 铜离子螫合蛋白质,但是收录信息不全面,更新速度较慢,蛋白质的结构信息涵盖较少是 其主要缺点,d c c p 则可以弥补其不足。在构建数据库的基础上,还对d c c p 收录的数据 进行初步分析,结果将对神经退行性疾病的药物研发有一定的帮助。 d c c p 的基本数据来源于g e n b a n k 、p i r 、s w i s s p r o t 、p d b 等国际上著名的生物 信息数据中心,依靠l a a 口- i i n u x 、a p a c h e 、m y s q l 、p h p 等语言平台的辅助,完成 了数据和计算机程序的有机组合数据库的构建。 d c c p 数据库收录了来自蛋白质三维结构数据库的结构信息,蛋白质序列数据库的序 列信息,蛋白质定位信息,结合金属离子信息等。创新之处是对d c c pi d 库中没有结构 的蛋白质序列进行同源模建,从理论上预测了蛋白质的高级结构,这些全新的蛋白质结构 可以用于创新药物研发。同时,数据库中还囊括了铜离子在酵母细胞内的代谢网络。用户 可以从网站上( h t t p :s d b i s d u t e d u c n d c c p c n i n d e x p h p ) 免费下载结构和数据。 铜离子螫合蛋白质和非螯合金属离子蛋白质功能各异,性质不同。通过对d c c p3 d 库的序列和负样本( 从s w i s s - p r o t 随机选取的相同数量的蛋白质序列) 进行氨基酸含 量的分析,形成折叠结构的倾向性分析,发现两类蛋白质的氨基酸组成和含量基本稳定, 无明显差异,这种进化机制可能对于保持物种稳定性有重要意义。 蛋白质的二级结构预测必须在一级序列的基础上进行,它与氨基酸的组成和含量有 关。通过对d c c p _ 3 d 的蛋白质序列进行二级结构预测,发现选取的几个二级结构预测软 件对铜离子螯合蛋白质的预测精度明显低于其所能达到的最高精度,说明这些二级结构预 测软件都有一定的适用范围。 铜离子螫合蛋白质多在氧化还原、电子传递、金属离子转运等过程中起重要作用。作 为一类特殊的功能相关蛋白质,它们之间可能是协同进化关系。对目前最为瞩目的p r i o n 1 蛋白与s o d ,c c s 蛋白质进行的初步进化分析印证了有直接物理接触的c c s 和s o d 是 协同进化的,而p r i o n 蛋白质则与其无直接相互作用。 在构建数据库的基础之上,对库中收录的数据进行的一级序列分析,二级结构预测, 高级结构模建,蛋白质功能分类和进化分析将对铜离子螯合蛋白质的基础研究和疾病治疗 的应用研究有一定的意义。 关键词:铜离子螯合蛋白质,数据库,同源模建,二级结构预测 论文分类号:0 2 5 2 a b s t r a c t i nr e c e n t y e a r s ,e v i d e n c eh a sb e e ng a t h e r e dt os u g g e s t t h a tt h ed y s f u n c t i o no ft h en e u r a l s y s t e ms u c h 勰a l z h e i m e r s d i s e a s ea n d p r i o n d i s e a s ei sr e l e v a n tt ot h ea b n o r m a lm e t a b o l i s mo f m e t a li o n se s p e c i a l l yt h et r a n s i t i o n a lo n e s , 8 gc o p p e ra n di r o n h o w e v e r , t h ed i s o r d e r so ft h e m e t a l - c h e l a t i n gp r o t e i n sa r e t h ed i r e c tc a u s e st ot h ea b n o r m a lt r a n s p o r to f i o n s m a n yi n t e n s i v e r e s e a r c h e sh a v e b e e nc a r r i e do u to nt h ea g e a s s o c i a t e dd i s e a s e sa n dt h em e t a l c h e l a t i n gp r o t e i n s t h u s ,w ec o n s t r u c t e dad a t a b a s eo ft h ec o p p e r - c h e l a t i n gp r o t e i n s ( d e e p ) w i t hm e t h o d si n b i o i n f o r m a t i c s a l t h o u g ht h e r ea r es o m ed a t a b a s e sw h e r es o m es a m p l e so fc o p p e r - c h e l a t i n g p r o t e i n sh a v e b e e ni n v o l v e d ,t h ei n f o r m a t i o ni sn o te n o u g ha n dt h er a t eo f u p d a t ei sv e r y s l o w l y t h em o s to 丑ei sl a c k i n gt h ea m p l es t r u c t u r a lf i l e sa n d y e td c c p c a n c o m p l e m e n t t h e s e b a s e d o nt h ec o n s t r u c t i o no fd c c p ,t h ep r e l i m i n a r ya n a l y s e so nt h ed a t aa l ed o n ea n dt h e ym a yb e h e l p f u l t ot h ed i s c o v e r yo f t h en e w d r u g s t ot h et r e a t m e n to f t h e n e u r o d e g e n e r a t i v ed i s e a s e s t h ed a t ai nd c c pa r ed e r i v e df r o mg e r d 3 a n k ,p m , s w i s s - p r o ta n d p d b ,t h ef a m o u s c e n t e r si nb i o i n f o r m a t i c sw o r l d w i d ea n dt h e ya r c o r g a n i z e db yt h el a m ps t r a t e g yw h i c h m e a n sa p a c h e ,m y s q la n dp h pa r er u no nt h el i n u xp l a t f o r m t h e nad a t a b a s ec o m e si n t o b e i n g t h ei n f o r m a t i o nf r o mp d bd a t a b a s ei n c l u d i n gt h es t r u c t u r a l f i l e s ,t h el o c a l i z a t i o n so f p r o t e i n s ,s e q u e n c e sa n dt h eb i n d i n gs i t e sw i t hc o p p e ri o ni si n v o l v e di nd c c eo n eo ft h e m a r k e dp r o p e r t i e si st h eh o m o l o g ym o d e l i n gt ot h en o n s t r u c t u r a lp r o t e i n si nt h ed c c pi d t h en e w l yp r e d i c t e ds t r u c t u r e sm a yb eh e l p f u lt ot h ed r u gd i s c o v e r y m o r e o v e r ,t h ek n o w n n e t w o r k so f c o p p e rt r a n s p o r t i n gi ny e a s tc e l la r ea l s oc o n t a i n e di nd c c et h e ya r ea v a i l a b l ei n t h ew e b s h e o a t t p :s s d b i s d u t e d u c n d c c p c n i n d e x p h p ) a n dc a n b ea c c e s s i b l e f r e e l y t h ec o p p e r - c h e l a t i n gp r o t e i n sa r em u c hd i f f e r e n tf r o mt h en o n - m e t a l c h e l a t i n g p r o t e i n si n t h ef u n c t i o n t h ea n a l y s e so ft h ea m i n oa c i dc o n t e n t so fd i f f e r e n t p r o p e r t i e sa n dp - s h e e t h y d r o p h o b i c i t ya r ed o n eb e t w e e nt h ed a t ai n d c c p 一3 da n dt h e c o m p a r i s o no ft h es a m e n u m b e ro fs a m p l e ss e l e c t e d r a n d o m l y f r o ms w i s s - p r o td a t a b a s e h o w e v e r ,t h er e s u l t a s s u m e st h a tt h e r ei sn ov i s i b l ed i f f e r e n c eb e t w e e nt h et w ok i n d so f p r o t e i n s h e n c e ,i tm a y b e 3 s i g n i f i c a n t t o k e e p t h es l a b i l i t yo f t h es p e c i e si n t h c c o u r s eo f e v o l u t i o n t h es e c o n d a r ys t r u c t u r ep r e d i c t i o ni sb a s e do nt h ea n a l y s e so f t h ep r i m a r ys e q u e n c e s t h e c o n s t i t u t i o n sa n dt h ec o n t e n t so ft h ep r o t e i nb o 也i n f l u e n c et h ep r e d i c t i o na c c u r a c y t h e p r e d i c t i o na c c u r a c i e sa r eo b v i o u s l y l o w e rt h a nt h o s ef o rc o m m o n p r o t e i n sb y1 0 ,s u g g e s t i n g t h a tt h ee x i s t i n gs e c o n d a r y - s t r u c t u r e - p r e d i c t i n gs o f t w a r c sa l en o tv e r ya p p r o p r i a t ei np r e d i c t i n g t h es e c o n d a r ys t r u c t u r e so f m e t a l l o p r o t e i n s t h e c o p p e r - c h e l a t i n gp r o t e i n sp h yi m p o r t a n t r o l e si nt h ec o u r s eo fr e d o x ,e l e c t r o n t r a n s p o r ta n dm e t a li o n st r a n s p o r t i ti ss p e c u l a t e dt h a tt h e r ee x r sc o o p e r a t i v ee v o l u t i o na m o n g t h o s ef u n c t i o n - a s s o c i a t e dp r o t e i n s t h ee l e m e n t a r ye v o l u t i o n a r ya n a l y s e sv e r i f yt h a ts o da n d i t sc h a p e r o n ec c sw h i c hh a v eat i g h tc o n t a c tw i ms o de v o l v ec o o p e r a t i v e l ya n dt h a tp r i o n p r o t e i nm a y h a v en od i r e c ti n t e r a c t i o nw i t ht h e m i nb r i e f , a tt h eb a s eo f t h ec o n s t r u c t i o no f t h e d a t a b a s e ,t h ep r i m a r ys e q u e n c ea n a l y s e s ,t h e e v a l u a t i o nt ot h ee x i s t h a gs e c o n d a r y - s t r u c t u r e - p r e d i c t i n gs o f t w a r e s ,t h em o d e l i n go ft h et h r e e d i m e n s i o n a ls t r u c t u r e s ,t h ef u n c t i o n a lc l a s s i f i c a t i o na n dt h e e v o l u t i o n a r ya n a l y s e sw i l lb c h e l p f u lt ot h eb a s i cr e s e a r c h e so nt h ec o p p e r - c h e l a t i n gp r o t e i n sa n dt h ea p p l i e dr e s e a r c h e so n t h et h e r a p yo f t h ed i s e a s e s k e yw o r d s :c o p p e r - c h e l a t i n gp r o t e i n ,d a t a b a s e ,h o m o l o g ym o d e l i n g , s e c o n d a r ys t r u c t u r e p r e d i c t i o n c l a s s i f i c a t i o nn u m b e r :q 2 5 4 塑塑塑塑塑王整全墨鱼堕垫塑壁塑塑塞垦墼塑坌堑 第一章问题的引出 随着人口老龄化问题的日益突出,与之相伴的各种常见病的发病率逐日升高,尤其是 各种神经退行性疾病。研究这些疾病的致病机理及寻找有效治疗途径的课题已经被提上科 研日程。 1 1 神经退行性疾病与药物设计 神经退行性疾病( n e u r o d e g e n e r a t i v ed i s e a s e s ) 是一类慢性进行性神经疾病。主要包 括阿尔茨海默氏病( a l z h e i r n e r sd i s e a s e ,a i d ) ,帕金森氏病( p a r k i n s o n sd i s e a s e ,p d ) , h u n t i n g t o n 舞蹈病( h u n t i n g t o n d i s e a s e ) ,不同类型脊髓小脑共济失调( s p i n a l c e r e b e l l a r a t a x i a s ) ,齿状核红核苍自球丘脑下核萎缩( d e n t a t o m b r o p a l l i d o l u y s i a na n t r o p h y ) ,肌 萎缩侧索硬化症( a m y o t r o p h i cl a t e r a ls c l e r o s i s ) 及脊髓肌萎缩症( s p i n a lm u s c u l a r a t r o p h y ) ,朊病毒疾病( p r i o r id i s e a s e ) 等【”。虽然这类疾病的病变部位及病因各不相同, 分别与不同的基因和相应的致病蛋白质分子有关,但是他们同属于蛋白质构象病( p r o t e i n c o n f o r m a t i o nd i s e a s e s ) 1 的范畴。这类疾病典型的特征是:自由基产生增多、蛋白质的 错误聚集在脑腔中形成抗蛋白水解酶水解的蛋白质纤维状沉积、神经细胞大批死亡【4 i 。 针对以上这些典型的症状,目前的研究多集中在形态学和理化性质分析上,自由基氧 化胁迫和蛋白质错误折叠机理研究地最为广泛。 1 1 1 自由基氧化胁迫 自由基是带有未成对电子的分子或离子,其化学性质活泼具有很高的反应活性,参与 很多维持基本生命活动的代谢反应。生物机体中最常见、最重要的自由基是活性氧自由基 ( r o s ,r e a c t i v eo x y g e ns p e c i e s ) ,包括超氧阴离子、羟基自由基和单线态氧等。在正 常的生理情况下,体内自由基不断产生,不断被清除,维持在一个稳定的生理水平上。生 物体清除自由基的体系有两类,一类是酶体系,包括s o d ( 超氧化物歧化酶) 、过氧化氢 酶和过氧化物酶等,一类是非酶体系,主要包括一些天然抗氧化剂,如维生素e 、b 胡萝 卜素、抗坏血酸和谷胱甘肽等,二者共同作用清除体内过多的自由基【5 1 。 自由基代谢异常会导致各种疾病,晚发a d 就与自由基氧化胁迫有关【6 ,7 ,8 1 。如氧化的 a p p - c u ( r ) ( a m y l o i d p r e c u r s o rp r o t e i n ,a p p ) 复合物可以与过氧化氢反应生成自由基,造 成脂质过氧化和神经毒害 9 1 。a b ( p - a m y l o i d p e p t i d e ) 可以结合c u 2 + ,引起氧化损伤,导 塑堕查塑塑王整鱼里旦堕墼塑壁塑塑堡垄塑堡坌堑 致细胞死亡,这可能是引发a d 的原因【1 0 l oa d 患者脑部的s p ( s e n i l e p l a q u e s ,s p ) 区域 蛋白质的氧化程度很高,证明蛋白质参与了氧化作用1 1 】。另外,抗氧化剂可以抑制a p 引 起的脑细胞膜脂质过氧化也说明了自由基在a d 发病中的作用 在p r i o n 疾病中,正常表达p r p 的组织尤其是大脑耗氧量都很大,说明p r p 可能作为 抗氧化酶系统的一部分发挥作用1 2 】。有实验证明提高肿瘤细胞内的活性氧水平,可以增 强p r p c 和c u ,z n - s o d 的表达,说明p r p 的表达是受r o s 调控,而且与抗氧化作用有关 1 1 3 1 。虽然没有直接的证据证明p r i o n 疾病的发病是由氧化胁迫引发,但是如果将p r p 基因 敲除以后,机体更容易受到氧化胁迫的伤害而引发各种疾病【1 4 】。 神经退行性疾病发病的主要部位是大脑,因其高耗氧量、高金属离子含量、高不饱和 脂肪酸含量、低抗氧化剂含量,所以易于受到氧化胁迫的伤害【l5 1 。同时,在脑细胞内, 线粒体受到氧自由基的攻击损伤产生过量的自由基,导致一系列的氧化反应,使抗氧化系 统功能受损而发病【1 6 , 1 7 】。 鉴于自由基在神经退行性疾病发病中的作用,寻找并施用有效的抗氧化剂将是防治 a d 等神经退行性疾病的重要手段【l 踟。因此,提高抗氧化剂的摄入量如食用富含抗氧化剂 的食物或服用抗氧化制剂( 如司来吉兰( s e l e g i l i n e ) 、艾地苯醌( i d e b e n o n e ) 、银杏叶提取 物和维生素e 等) 可以减轻氧化胁迫产生的损伤,延缓认知功能的下降,减少罹患a d 等神经退行性疾病的危斟1 9 0 0 1 。尤其是当多种抗氧化剂作用于细胞的不同部位时,将它们 结合施用效果更好【2 。 1 1 2 蛋白质的错误折叠、聚集 a d 病人的老年斑是以淀粉样蛋白a b ( 3 - a m y l o i dp e p t i d e ) 为核心,围绕已变性的轴 突、树突、神经胶质细胞及突起聚集而成。a 6 蛋白聚集后有毒性,在脑内沉积遍布整个 新皮质和海马。a d 病人脑中的神经元纤维缠结( n e u r o t i b r i l l a r t a n g l e s ,n f t ) 2 2 , 2 3 , 2 4 是由 异常细胞骨架组成的神经元内的包含体,含有双股螺旋细丝( p a i r e dh e l i c a l f i l a m e n t s , p h f s ) ,这种p h f s 由大量异常磷酸化的t a u 蛋白组成。可见,于扰变性a b 和t a u 蛋白的 产生和阻止其聚集是有效的预防和治疗途径,对于新药的开发具有重要意义。 p r i o n 疾病的致病因子朊病毒是一种蛋白感染因子,不含核酸。疾病是由正常细胞朊 病毒蛋白( p r p 。) 翻译后的错误修饰形式( p r p ”) 聚积导致。p r p 。对蛋白水解酶敏感,而 致病形式p r p ”抗蛋白酶水解。二者的一级序列相同,二级结构差别较大。p r p 。含4 0 的 螺旋,而含有很少或者几乎不含折叠;t , r p 8 。则含有4 3 的折叠及3 0 的螺旋。一般认为, 6 细胞内铜离子螯合蛋白质数据库的构建及数据分析 p r p s c 韵高1 3 折叠状态促使其相互聚集,并引起细胞凋亡,最终导致神经退行性疾病。能 否有效地抑制p r p s 。蛋白的聚集成为攻克该类疾病的核心问题1 2 5 】。 从抑制蛋白质的错误折叠的观点出发,目标就定位在寻找可以抑制这类蛋白质错误聚 集的小分子化合物,这就需要进行药物设计。 1 1 3 药物设计 药物设计是一个漫长的过程,长久以来在寻找新药的过程中,传统的方法是从动植物 体内分离生物活性物质或是对已有药物的优化改造。资料表明,筛选的成功率仅在1 1 5 0 0 0 ,找到一个新药的花费超过1 亿美元,周期长达8 1 2 年,其低效、费时、费钱和药 物作用机理不明确限制了新药的开发。 生物信息学的发展为我们提供了第二种设计方法,基本思路是:通过分析基因信息和 反映蛋白质结构及其相互作用的数据,进行蛋白质空间结构的模拟和蛋白质功能的预测, 从而为新型药物的设计拓宽思路并提供有力手段。具体讲,选定致病的蛋白质作为靶标, 利用生物信息学技术快速确定能够作用于靶标的小分子化合物,并结合计算化学基本原 理,通过模拟药物与受体生物大分子的相互作用或通过分析已知药物结构与活性的内在关 系,合理设计新型结构先导化合物,这就是计算机辅助药物设计( c o m p u t e r - a i d e dd r u g d e s i g n ,c a d d ) ( 如图1 1 所示) 【2 6 】。 图i ic a d d 的工作原理 f i g1 1t h ep r i n c i p l eo f c a d d 一般步骤是:首先,寻找靶点蛋白质及其活性中心,常用的方法是检索三维结构数据 库。随着蛋白质三维结构数据库( p r o t e i n d a t a b a n k ,p d b ) 2 7 1 的不断完善,其中收录的蛋 白质结构数据信息已经用于新药研制。如果没有已测定的受体结构可用,可以考虑用其他 方法来构建蛋白质的三维结构,例如已知其一级序列,可根据同源蛋白模建2 8 1 的方法推 测其三维结构;如果受体的同源蛋白质的结构也全然未知,可根据与这类受体作用产生类 似药理效果的不同药物的构象,来推测受体上活性部位的空间排列。目前已经有一些商业 7 细胞内铜离子螯合蛋白质数据库的构建及数据分析 软件可以从蛋白质的三维结构中寻找生物活性中心( 即蛋白质三维空间内与配体发生相互 作用的位点) 。 其次,寻找一个或多个先导化合物( 含有所需生物活性的已知化合物或母体分子) , 然后对其结构进行有目的地修饰,测定其活性变化,获得这类化合物的构效关系 ( s t r u c t u r e - a c t i v i t yr e l a t i o n s h i p s ,s a r ) 或定量构效关系( q u a n t i t a t i v es 缸u c t u r e - a c t i v i t y r e l a t i o n s h i p s ,q s a r ) ,以期寻找活性最高的化合物作为候选药物【2 9 3 0 1 。这种药物设计方 法的基础是假设药物的活性与其化学结构之间存在着某种( 定性或定量的) 关系,而且药物 受体的相互作用本质上是一种化学作用,这样才可以用描述化学作用的各种参数和模式 来描述药物一受体间的相互作用。换言之,诸如x 光衍射、核磁共振、分子模型化、分子力 学、分子动力学计算等用于化学研究的一切方法和手段都可以用来研究药物受体间的相 互作用。在寻找含某个特定药效团的活性先导化合物过程中,最常用的方法是3 d 检索和 活性结构自动生成法。前者在已有的活性化合物数据库中检索高效的母体分子。后者直接 建立与受体活性部位相匹配的结构( 当受体结构已知时) 或者由已知的“药效团”作为结 构核心衍生出一系列活性结构( 当受体结构未知时) ,此方法的巨大诱惑力在于它根据一些 基本的原理和假设来设计全新的活性化合物,其他方法本质上都只是对已有活性化合物做 结构上的修饰。因此,结构生成方法或许是今后寻找先导药物的一个有效途径。现存方法 的有机结合可能会更有效地辅助新药的开发口”。 判定药物与靶标的结合力强弱与否的标准是药物与生物大分子间相互作用强度以及 两者产生复合物能量的高低。结合较强,则其药理作用也可能较强【3 2 】。还要综合考虑药 物的化学合理性、合成难易性和经济合算性。最后,候选药物能否最终成为新药还需经过 一系列毒性试验和药力试验的测试。 近年来,随着理论计算方法和分子图形学的飞速发展,c a d d 技术日益成为现代药物 研究不可缺少的强大工具。在这个新思路的指导之下,寻找新的治疗神经退行性疾病药物 成了当务之急。 1 2 铜离子与神经退行性疾病 在真核生物有机体内,铜元素参与许多生化反应过程,如:可以作为电子传递链中的 供体或受体;参与细胞内的呼吸;维持铁元素的代谢平衡:用于色素、神经递质的合成; 作为具有氧化还原活性的金属酶( 如s o d 等) 的辅助因子参与体内的抗氧化过程等3 3 1 , 因此它的作用十分重要。但是体内过高的铜离子浓度却能产生毒性,如改变细胞内的氧化 8 细胞内铜离子螯台蛋白质数据库的构建及数据分析 还原状态;与某些氨基酸残基的侧链发生非特异的反应,导致蛋白质的错误折叠p 卅;与 其它物质竞争酶的活性位点,干扰酶的正常功能;产生活性氧,损害有机体的d n a 、蛋 白质和脂类物质。 多数神经退行性疾病和细胞内的金属离子代谢失调及参与金属离子代谢的蛋白质的 突变有关。实验证明,在a d 疾病发生时,c u 2 + 可能通过诱导p 转角的形成促进非纤维状 a p 的产生,抑制纤维状a p 形成。此外,从人脑中提取的a p 一般为二聚体,温育后会形 成粒状的沉积,而a p 单体在体外聚积则形成纤维状的结构,这表明c u 2 + 在a p 二聚化过 程中可能发挥着某种作用。但同时观察到,在c u 2 + 存在的条件下,可溶性的a b 对细胞的 毒性增加,这可能是由于具有氧化还原活性的铜的存在加强了细胞的氧化应激,因而提高 了a p 的神经毒性。由此可见,铜对于a p 介导的细胞毒性具有双重作用【3 5 1 。 在p r i o r i 疾病中,p r p 处在一个复杂的代谢网络中,与金属离子如c 0 2 + 、其它蛋白质 分子和活性氧分子等有着复杂的相互作用1 3 6 1 。p r p 与c u 2 + 的络合对于p r p 蛋白行使正常功 能和形成正确的高级结构至关重要。研究表明,p r p 有类似超氧化物歧化酶的活性,即具 有抗氧化作用可以保护细胞免受氧化损伤,这种作用与c u 2 + 密切相关阳。在p r p 折叠前 加入c u 2 + ,则络合产物p r v c c u 2 + 可以有效地清除超氧阴离子自由基,行使与s o d 类似的 抗氧化功能;而在p r p o 折叠后加入c u 2 + 或不存在c u 2 + 的情况下,p r p 。则没有这种活性。 在c u 2 + 存在的情况下,缺少八肽重复序列的p r p 突变蛋白,也不具有s o d 活性。这充分 说明c u 2 + 和八肽重复序列为p r p 。的抗氧化活性所必需。p r p c u 2 + 对p h 很敏感,降低溶液 的p h 值,c u 2 + 可从p r p 。上解离,从而催化溶液中的超氧阴离子产生羟基自由基,对 细胞造成损伤。 c u 2 + 还可以调节p r i o n 蛋白的存在状态。增加c u 2 + 浓度,p r p c 易从a 螺旋变为b 。折叠, 导致蛋白质的聚集、沉淀,引起一系列疾病【3 9 1 。c u 2 + 可能还参与p r p 自身的氧化,导致 p r p 结构的改变,发生聚集 4 0 】。可见,铜离子对于p f i o n 蛋白质的功能也具有双重性质。 综上所述,铜离子在神经退行性疾病的发病过程中发挥了重要作用,因此研究铜离子 螯合蛋白质具有重要意义。 1 3 构建铜离子螯合蛋白质数据库的意义 在研究神经退行性疾病的过程中,参与铜离子代谢的蛋白质就成为潜在的药物靶点。 面对人类基因组计划及其后续计划带来的如此海量的数据,首先想到将它们汇总、分类、 提取对研究有用的信息,从而能够更加系统地研究铜离子螯合蛋白质,寻找有效的治疗途 9 细胞内铜离子螯合蛋白质数据库的构建及数据分析 径。而数据库是生物信息学研究的基础,所以考虑构建铜离子螯合蛋白质数据库( t h e d a t a b a s e o f c o p p e r - c h e l a t i n gp r o t e i n s ,简称d c c p ) 。再者,目前国际上没有专门的铜离子 螯合蛋白质数据库,有的数据库虽然收录了部分蛋白质,但是收录信息不全面且更新速度 较慢。 本数据库不但收录了具有三级结构的蛋白质信息,还采用商业化的软件对只有一级序 列的2 2 0 0 多个蛋白质进行了结构模建,这些新的结构对寻找新的药物靶点有重要意义, 可以供相关领域的科研工作者免费使用,这样就可以避免重复劳动,节省资源。 另外,本数据库收录了铜离子和氨基酸的结合位点和蛋白质的细胞定位,便于作分子 进化分析和分子动力学计算。 以下各章将分别叙述本数据库构建过程中涉及到的生物信息学原理,计算机知识和细 胞内铜离子的代谢网络的基本知识,并对数据库的详细构建过程及对数据进行的基本分析 和讨论。 1 0 塑堕查塑塑王整鱼里旦堕墼塑壁塑塑塞垄塑堡坌堑 第二章生物信息学基础 近年来,随着基因组测序技术的日渐成熟,使得人类基因组计划和其他高等生物及微 生物的全基因组测序成为现实。结合原有的蛋白质测序技术和物质结构解析技术,国际公 共数据库中的数据呈指数递增。 数据经过加工、处理、提炼、升华,转化成知识的过程叫做数据挖掘( d a t am i n i n g ) 。 现在生物医学研究已经从传统的对单个基因、单个蛋白质的研究过渡到系统地对整个生物 体的基因组学、蛋白质组学、转录组学的研究:而研究方法也从以观察和实验为主,过渡 到数学、信息科学、计算机科学等多学科的交叉结合。这个过渡使得大量的数理科学工作 者投入到生命科学的研究领域中来,生物信息学这个新学科应运而生。美国人类基因组计 划实施五年后的总结报告对生物信息学作了定义:生物信息学是一门交叉科学,它包含了 生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、 计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。从上个世 纪8 0 年代末诞生以来,生物信息学以基因组信息学为核心,在分析基因数据、寻找新基 因、分析和预测蛋白质结构功能、分子进化、药物设计等方面确实发挥了实验所不可替代 的巨大作用d l 4 2 。 数据库是生物信息学研究的基础,所有的海量数据都被有序的存放在生物信息数据库 中。d b c m ( h t t p :w w w i n f o b i o g e n f i s e r v i c e s d b c a t ,t h ec a t a l o go f d a t a b a s e s ,生物学数据库 目录) 目前搜集了5 1 1 个数据库( 截止2 0 0 3 9 ) ,主要包括8 7 个d n a 数据库、2 9 个r n a 数据库、9 4 个蛋白质数据库、5 8 个基因组数据库、2 9 个基因图谱数据库、1 8 个蛋白质结 构数据库、4 3 个文献数据库及1 5 3 个其它数据库。 生物学数据库种类繁多,归纳起来分为4 类,即序列数据库( 如核酸序列数据库 g e n b a n k ,孙僻u d d b j ,蛋白质序列数据库s s s p r ( ) t 【4 3 ,“】和p i r 4 9 1 ) 、生物大分子 结构数据库( 如蛋白质结构数据库p d b ,蛋白质分类数据库s c o p 5 0 】和c a t h l 5 1 1 ) 、基因 组数据库( 如人类基因组数据库g d b i n ,线虫基因组数据库a c e d b 5 3 1 ) 和二次数据库( 如 蛋白质功能位点数据库p r o s i t e l 5 4 1 ,同源蛋白家族数据库p f a r o l 5 5 1 等) 。前三者称为一次数 据库,即存放直接来源于生物学实验的数据,如基因组数据库来自基因组作圈。二次数据 库是根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质 结构以及文献等数据进行分析、整理、归纳、注释,构建的具有特殊生物学意义芹哺门用 l l 细胞内铜离子螯台蛋白质数据库的构建及数据分析 途的数据库。数据库的详细信息参看表2 1 的相应主页。 表2 1 部分重要的生物信息学网络资源 t a b l e2 1t h ew e b s i t e so f s o m ef a m o u sd a t a b a s e sa n d s e r v i c e s d a t a b a s ea n ds e r v i c ew e b s i t e e l g e n b a n k d d b j n c b i s w i s s p r o t p r p d b p d b s u m e b i s r s e n t r c z h t t p :w w w e m b l h e i d e l b e r g d e h t t p :w w w n e b i n l m n i h g o v g e n b a n k g e n b a n k s e a r e h h t m l h t t p :l l w w w d d b j n i g a c j p h t t p :w w w n e b i n l m n i h g o v h t t p :u s e x p a s y o r g h t t p :p i t g e o r g e t o w n e a u p i r w w w l s e a r e h p i m r e f s h t m l h t t p :l l w w w r c s b o r s r ) d b h t t p :w w w b i o e h e m u e l a c u k b s m p d b s u m h t t p :w w w e b i a e u l d h t r p :u s e x p a s y o r g s r s 5 h t t p :w w w n c b i n l m n i h g o v e n t m z 2 1 基因组测序与核酸序列数据库 最初的d n a 测序只是针对引起人类疾病的单个基因。后来发现,某些疾病的产生往 往是多个基因共同作用的结果。于是,就出现了被誉为生命科学的“阿波罗登月计划”一 一人类基因组计划,目标是完整测定人类的整个基因组。 1 9 9 0 年,人类基因组组织( h u m a n g e n o m e o r g m f i z a f i o n , h u o o ) 和美国国家健康研究 所( t h e n a t i o n a l i n s t i t u t e s o f h e a l t h ,n i h ) 向美国国会提交了此项目的5 年计划,标志着人类 基因组计划1 5 年进程的开始。它旨在阐明人类基因组3 0 亿碱基对的序列;绘制出人类基因 组图谱;测定模式生物的基因组序列;建立分析d n a 的成熟的技术;研究道德、法律和 社会意义对基因组计划的影响1 5 6 1 。1 9 9 9 年9 月中国获准加入人类基因组计划,并于2 0 0 0 年 4 月完成了1 的人类基因组的工作框架图。2 0 0 1 年2 月1 2 日,人类基因组图谱及初步分析 结果首次公布,覆盖率达到9 5 ,平均测序精度9 9 9 6 【5 ”。在2 0 0 3 年d n a 双螺旋发 现5 0 周年之际,国际人类基因组测序组织宣布人类基因组序列图绘制成功。 伴随着人类基因组计划的实施,被称为“模式生物基因组计划”的微生物、植物、动 物等模式生物基因组研究也同步进行,并为人类基因组研究提供借鉴。最初确定的模式生 物有:大肠杆菌、酵母、拟南芥、线虫、果蝇和小鼠。后来又逐渐加入了一些其它的模式 生物,如只有重要生产价值的农作物( 水稻、小麦) 和畜禽虫类( 家猪、家鸡、家蚕) 等。 细胞内铜离子螫合蛋白质数据库的构建及数据分析 由于微生物的基因组相对较小,且与医疗健康事业密切相关,于是美国能源部在1 9 8 6 年启 动了微生物基因组计划( m i c r o b i a lg e n o m ep r o j e c t , m g p ) ,包括测定原核生物( 细菌、 古细菌) 和低等真核生物( 真菌) 的基因组,例如嗜血流感杆菌就是人类历史上第一个被 完全测序的生物【5 舯。根据数据库g o l d (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论