版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一节第一节 引言引言 一、诺贝尔奖与蛋白质结构分析一、诺贝尔奖与蛋白质结构分析 u1962年诺贝尔化学奖,佩鲁茨年诺贝尔化学奖,佩鲁茨(M.F.Perutz)和肯德鲁和肯德鲁 (J.C.Kendrew) 用用 射线衍射技术测定肌红蛋白和血红蛋白射线衍射技术测定肌红蛋白和血红蛋白 的原子排列的原子排列 u1982年诺贝尔化学奖,克卢格(年诺贝尔化学奖,克卢格(A.Klug)将)将射线衍射技术射线衍射技术与电子显微技术结合发明显微影象重组技术,研究结构分子与电子显微技术结合发明显微影象重组技术,研究结构分子生物学生物学u2002年,美国科学家约翰芬恩、日本科学家田中耕一(质谱质谱分析分析)和瑞士
2、科学家库尔特维特里希(核磁共振核磁共振)发明了对生物大分子进行识别和结构分析的方法。二、蛋白质高级结构信息二、蛋白质高级结构信息1. 1. 二级结构二级结构 (secondary structure)(secondary structure)2. 2. 超二级结构超二级结构 (super secondary structure)(super secondary structure)3. 3. 三级结构三级结构 (tertiary structure)(tertiary structure)4. 4. 四级结构四级结构 (quaternary structure)(quaternary stru
3、cture)三、蛋白质结构分析的主要目标三、蛋白质结构分析的主要目标 1. 1. 建立研究蛋白质结构信息发掘与预测的建立研究蛋白质结构信息发掘与预测的方法;方法;2. 2. 研究参与生命活动过程的蛋白质的物理研究参与生命活动过程的蛋白质的物理性质、空间架构、功能片段和相互作用;性质、空间架构、功能片段和相互作用;3. 3. 探索基于蛋白质结构表征蛋白质的生物探索基于蛋白质结构表征蛋白质的生物学意义;学意义;4. 4. 得到新的预测性的知识。得到新的预测性的知识。第二节蛋白质的高级结构第二节蛋白质的高级结构一、蛋白质的高级结构特征一、蛋白质的高级结构特征(一)二级结构的主要类型和特征(一)二级结
4、构的主要类型和特征 蛋白质的二级结构是指多肽链主链骨架盘蛋白质的二级结构是指多肽链主链骨架盘绕折叠而形成的构象,借氢键维系。主要分绕折叠而形成的构象,借氢键维系。主要分为为螺旋、螺旋、折叠、折叠、转角及无规卷曲等类型。转角及无规卷曲等类型。 1. 1. 螺旋螺旋(helix)(helix)的结构特征为:的结构特征为:(1 1)主链骨架围绕中心轴盘绕形成右手螺旋;)主链骨架围绕中心轴盘绕形成右手螺旋;(2 2)螺旋每上升一圈是)螺旋每上升一圈是3.63.6个氨基酸残基,螺距为个氨基酸残基,螺距为0.54nm0.54nm;(3 3)相邻螺旋圈之间形成许多氢键;)相邻螺旋圈之间形成许多氢键;(4 4
5、)侧链基团位于螺旋的外侧。)侧链基团位于螺旋的外侧。2. 2. 折叠折叠(sheets) (sheets) 的结构特征为:的结构特征为:(1 1)若干条肽链或肽段平行或反平行排列成片;)若干条肽链或肽段平行或反平行排列成片;(2 2)所有肽键的)所有肽键的C=OC=O和和N NH H形成链间氢键;形成链间氢键;(3 3)侧链基团分别交替位于片层的上、下方。)侧链基团分别交替位于片层的上、下方。 a. a. 反平行和平行的多个反平行和平行的多个折叠链形成一个完整折叠链形成一个完整折叠结构的氢键示意图;折叠结构的氢键示意图;b.b.来自人来自人pipi型谷胱甘肽型谷胱甘肽-S-S-转硫酶中单个亚基
6、中连续主链的部分转硫酶中单个亚基中连续主链的部分折叠结构折叠结构(2DGQ.pdb)(2DGQ.pdb)侧面视图,侧面视图,可见转角可见转角(turn)(turn); c. c. 来自人来自人pipi型谷胱甘肽型谷胱甘肽-S-S-转硫酶一个亚基中连续主链的部分转硫酶一个亚基中连续主链的部分折折叠结构顶部视图,可见转角叠结构顶部视图,可见转角(turn)(turn);d. d. 来自人信号传递蛋白来自人信号传递蛋白SMAD4(1DD1.pdb)SMAD4(1DD1.pdb)的一个的一个亚基中部分亚基中部分折叠结构顶部视图,可见到大的环区折叠结构顶部视图,可见到大的环区(loop)(loop)。
7、多肽链多肽链180180回折部分,通常由四个氨基酸残基回折部分,通常由四个氨基酸残基构成,借构成,借1. 41. 4残基之间形成的氢键维系。残基之间形成的氢键维系。 3. 3. 转角的结构特征为:转角的结构特征为:a. a. 人谷胱甘肽人谷胱甘肽-S-S-转硫酶转硫酶pipi第第5656到到5959位残基的位残基的转角连接了来自相同主转角连接了来自相同主链的两段链的两段折叠链,片层末端残基显示为粗枝状,折叠链,片层末端残基显示为粗枝状,转角中转角中GlyGly和和AspAsp显显示为细线,转角区域内第一个示为细线,转角区域内第一个AspAsp的的羰基氧与其后第三位羰基氧与其后第三位氨基成氢键氨
8、基成氢键(3DGQ.pdb)(3DGQ.pdb); b. b. 来自人细胞珠蛋白来自人细胞珠蛋白(2DC3.pdb)(2DC3.pdb)的两段的两段螺旋由螺旋由转角转角连接,用粗树枝状显示了两段螺旋末端的脯氨酸。连接,用粗树枝状显示了两段螺旋末端的脯氨酸。转角及其连接的转角及其连接的折叠链和折叠链和螺旋螺旋4. 无规卷曲的结构特征为:无规卷曲的结构特征为: 无规卷曲的特点为在主链骨架上无规则盘绕,其无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理化学原理,但波动性较大,构象状态仍遵循物理化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往往无法对温度变化敏感;实验测定三级结
9、构时往往无法识别无规卷曲识别无规卷曲( (缺失其座标缺失其座标) ),即使有座标则其温,即使有座标则其温度因子也较高。无规卷曲同度因子也较高。无规卷曲同环的区分主要是其环的区分主要是其长度和其形状的波动性。长度和其形状的波动性。 (二)超二级结构的主要类型和特征(二)超二级结构的主要类型和特征 超二级结构超二级结构(supersecondary structure)指位指位于同一主链的多个二级结构组装形成的特定组于同一主链的多个二级结构组装形成的特定组装体,可直接作为三级结构的或结构域的组成装体,可直接作为三级结构的或结构域的组成单元,是从蛋白质二级结构形成三级结构的一单元,是从蛋白质二级结构
10、形成三级结构的一个过渡结构形式,也称为立体结构形成的模体。个过渡结构形式,也称为立体结构形成的模体。 (1 1)转角或转角或环等连接连续四个环等连接连续四个螺旋形成的四螺旋形成的四螺旋螺旋捆;捆;(2 2)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端含有强亲水侧链氨基酸的、在螺旋两端含有强亲水侧链氨基酸的螺旋组成的螺旋组成的亮氨酸亮氨酸拉链拉链( (Leucine zipperLeucine zipper) );(3 3)一条主链中相邻七个两亲)一条主链中相邻七个两亲螺旋通过过度结构形成的螺旋通过过度结构形成的七次穿膜螺旋组;七次穿
11、膜螺旋组;(4 4)连续主链中两段)连续主链中两段螺旋连接三段螺旋连接三段折叠链形成的折叠链形成的RossmannRossmann折叠;折叠;(5 5)转角连接转角连接a a螺旋构成的螺旋构成的a-a-螺旋螺旋-转角转角-螺旋;螺旋;(6 6)环连接环连接螺旋构成的螺旋构成的螺旋螺旋-环环-螺旋等。螺旋等。(7 7)-折叠都为超二级结构。折叠都为超二级结构。 超二级结构的主要类型:超二级结构的主要类型: 三级结构(三级结构(protein tertiary structureprotein tertiary structure),),即蛋白质分子处于它的天然折叠状态的三维构象,即蛋白质分子处于
12、它的天然折叠状态的三维构象,它是在二级结构的基础上进一步盘绕,折叠形成的它是在二级结构的基础上进一步盘绕,折叠形成的。蛋白质三级结构的稳定主要靠氨基酸侧链之间的。蛋白质三级结构的稳定主要靠氨基酸侧链之间的疏水相互作用,氢键、二硫键、范德华力和静电作疏水相互作用,氢键、二硫键、范德华力和静电作用维持。不同类型的蛋白质尽管局部结构分解后具用维持。不同类型的蛋白质尽管局部结构分解后具有很高的相似性,但是由于其含辅助因子的全部共有很高的相似性,但是由于其含辅助因子的全部共价相连原子空间的相对位置,即其二级结构的组装价相连原子空间的相对位置,即其二级结构的组装(assembly)(assembly)模式
13、存在着差异,在三级结构层面不同模式存在着差异,在三级结构层面不同的蛋白质将体现各自整体的结构特征。的蛋白质将体现各自整体的结构特征。蛋白质三级结构中二级结构的折叠和组装蛋白质三级结构中二级结构的折叠和组装 按二级结构组装模式对蛋白质进行分类对解析蛋按二级结构组装模式对蛋白质进行分类对解析蛋白质高级结构形成规律和预测蛋白质功能有重要白质高级结构形成规律和预测蛋白质功能有重要帮助。蛋白质二级结构组装模式主要是全帮助。蛋白质二级结构组装模式主要是全螺旋螺旋、全、全折叠、折叠、螺旋螺旋/折叠,还有少量折叠,还有少量螺旋螺旋+折叠类。折叠类。 全全a-a-螺旋蛋白质螺旋蛋白质 人血清白蛋白人血清白蛋白(
14、 (上图上图a,b)a,b)和细菌视紫红质和细菌视紫红质( (下图下图 a-c) a-c) 全全-折叠蛋白质折叠蛋白质 人晶状体蛋白人晶状体蛋白( (上图上图c, d)c, d)和大肠杆菌和大肠杆菌NANCNANC离子通道蛋白离子通道蛋白( (下图下图f)f) a-a-螺旋螺旋/-/-折叠蛋白质折叠蛋白质 细胞表面标志蛋白细胞表面标志蛋白CD98(CD98(图图d)d)及糖酵解的绝大多数酶蛋白及糖酵解的绝大多数酶蛋白 ( (图图a) a) a-a-螺旋螺旋+-+-折叠类蛋白质折叠类蛋白质 人人TBPTBP与双螺旋与双螺旋DNADNA复合物复合物(1CDW.pdb)(1CDW.pdb)有独立三级
15、结构的单元通过非共价键聚集成的非共价有独立三级结构的单元通过非共价键聚集成的非共价复合物称为四级结构,其所含独立三级结构单位为亚复合物称为四级结构,其所含独立三级结构单位为亚基基(subunit)(subunit)。形成四级结构全部依靠非共价键相互。形成四级结构全部依靠非共价键相互作用,且来自不同亚基的二级结构间可发生强的相互作用,且来自不同亚基的二级结构间可发生强的相互作用以稳定四级结构,如生成跨亚基的更大作用以稳定四级结构,如生成跨亚基的更大折叠结折叠结构或构或螺旋聚集体;其中,氢键、疏水相互作用和静螺旋聚集体;其中,氢键、疏水相互作用和静电作用是主要维持力。为了形成稳定的四级结构,必电作
16、用是主要维持力。为了形成稳定的四级结构,必然要求相互作用的任两个蛋白质间在空间外形互补以然要求相互作用的任两个蛋白质间在空间外形互补以增加接触面且理化性质互补。这些特征也是预测蛋白增加接触面且理化性质互补。这些特征也是预测蛋白质间相互作用时有用的辅助判据。质间相互作用时有用的辅助判据。 (四)四级结构的主要类型和特征(四)四级结构的主要类型和特征 PBO-1PBO-1蛋白质呈现的对称结构蛋白质呈现的对称结构偶数亚基形成的四级结构具有较高的对称性偶数亚基形成的四级结构具有较高的对称性 二、蛋白质结构域与家族分类二、蛋白质结构域与家族分类(一)蛋白质结构域(一)蛋白质结构域 结构域是构成蛋白质亚基
17、的紧密球状区域,为结构域是构成蛋白质亚基的紧密球状区域,为介于二级与三级结构之间的一种结构层次;是蛋白介于二级与三级结构之间的一种结构层次;是蛋白质中可以具有独立三级结构的部分,通常由一个基质中可以具有独立三级结构的部分,通常由一个基因外显子编码,并可具有特定的功能。因外显子编码,并可具有特定的功能。 最常见的结构域约含有最常见的结构域约含有100100200200个氨基酸残基,个氨基酸残基,一般至少一般至少4040个、多的可至个、多的可至400400个以上;对于一个较大个以上;对于一个较大球状蛋白质分子来说,往往由两个或两个以上相对球状蛋白质分子来说,往往由两个或两个以上相对独立的三维实体缔
18、合而成三维结构体。独立的三维实体缔合而成三维结构体。 (二)蛋白质家族分类(二)蛋白质家族分类目前建立在结构域基础上的蛋白质家族数据库有目前建立在结构域基础上的蛋白质家族数据库有PROSITEPROSITE、PRINTSPRINTS、PfamPfam、SMARTSMART、SWISSSWISS、PROTPROT、ProDom ProDom 和和BLOCKSBLOCKS等,每个蛋白质结构数据库运用等,每个蛋白质结构数据库运用不同的原理来识别结构相似的蛋白质超家族;将它不同的原理来识别结构相似的蛋白质超家族;将它们结合起来可以更准确地归类蛋白质家族和描绘结们结合起来可以更准确地归类蛋白质家族和描绘
19、结构域。构域。InterProInterPro数据库,是联合数据库,是联合PROSITEPROSITE、PRINTSPRINTS、PfamPfam和和ProDom ProDom 四个独立完整的蛋白质结构域数据四个独立完整的蛋白质结构域数据库组成站点,它是将蛋白质的结构域和功能位点加库组成站点,它是将蛋白质的结构域和功能位点加以统一建立的数据库资源。以统一建立的数据库资源。 三、蛋白质高级结构的实验解析方法三、蛋白质高级结构的实验解析方法蛋白质结构实验分析主要有蛋白质结构实验分析主要有三大技术平台三大技术平台(一)(一)X-X-衍射蛋白质晶体结构分析衍射蛋白质晶体结构分析(二)核磁共振波谱分析(
20、二)核磁共振波谱分析(三)冷冻电镜技术(三)冷冻电镜技术 (一)蛋白质晶体结构(一)蛋白质晶体结构X-衍射分析衍射分析 摸索蛋白质结晶条件、快速处理晶体结构数据和摸索蛋白质结晶条件、快速处理晶体结构数据和减少差错是目前蛋白质晶体结构分析的两大难题减少差错是目前蛋白质晶体结构分析的两大难题或瓶颈。或瓶颈。是目前分辨率最高的结构测定方法,高通量晶体是目前分辨率最高的结构测定方法,高通量晶体结构分析中的几大重要环节是:数据处理与分析结构分析中的几大重要环节是:数据处理与分析、重原子的定位、密度修饰、分子替换、图形整、重原子的定位、密度修饰、分子替换、图形整合、模型加工和确认。合、模型加工和确认。晶体
21、结构分析的常用软件有晶体结构分析的常用软件有SOLVESOLVE,RESOLVERESOLVE等。等。 (二)核磁共振波谱分析(二)核磁共振波谱分析 利用核磁共振原理,检测分子质量小于利用核磁共振原理,检测分子质量小于60kd60kd的蛋白质,通过对其核磁共振谱线特征参数的测的蛋白质,通过对其核磁共振谱线特征参数的测定来分析蛋白质的结构与性质,就是将原始资料定来分析蛋白质的结构与性质,就是将原始资料利用傅里叶变换转换为不同的峰值,然后采集各利用傅里叶变换转换为不同的峰值,然后采集各种不同的峰组成图谱,并利用生物信息学方法筛种不同的峰组成图谱,并利用生物信息学方法筛选出具有特定结构特征的图谱。选
22、出具有特定结构特征的图谱。 常用常用NMRPipeNMRPipe和和SPARKYSPARKY软件处理这些过程,使软件处理这些过程,使用用XEASYXEASY,DYANADYANA和和GARANTGARANT等软件分析侧链或骨架等软件分析侧链或骨架结构。结构。 与与X-X-衍射晶体分析技术相比较,衍射晶体分析技术相比较,NMRNMR技术在蛋白质技术在蛋白质结构测定的速度上、和研究的对象上都存在一定的结构测定的速度上、和研究的对象上都存在一定的限制,成本太高,步骤繁多。但其无需制备晶体标限制,成本太高,步骤繁多。但其无需制备晶体标本,可在溶液中直接测定,也可进行固相测定,因本,可在溶液中直接测定,
23、也可进行固相测定,因此利用此利用NMRNMR法使得某些无法获得晶体结构的蛋白质法使得某些无法获得晶体结构的蛋白质或非液相蛋白质(如膜蛋白)的结构测定成为可能或非液相蛋白质(如膜蛋白)的结构测定成为可能。相对而言,。相对而言,NMRNMR技术更适合小分子质量以及水溶技术更适合小分子质量以及水溶性较好培养晶体困难的蛋白质结构的分析,对于蛋性较好培养晶体困难的蛋白质结构的分析,对于蛋白质折叠、局部动力学或构象分析、蛋白白质折叠、局部动力学或构象分析、蛋白- -蛋白相蛋白相互作用,互作用,NMRNMR更体现其优越性。更体现其优越性。 X-X-衍射晶体分析技术和衍射晶体分析技术和NMRNMR技术的比较技
24、术的比较(三)冷冻电子显微镜技术(三)冷冻电子显微镜技术 采用高压快速液氮冷冻方法使样品包埋在玻璃采用高压快速液氮冷冻方法使样品包埋在玻璃态的水环境中,使我们能够观察到生物大分子在天态的水环境中,使我们能够观察到生物大分子在天然状态下的结构;同时冷冻的速度极快,把细胞在然状态下的结构;同时冷冻的速度极快,把细胞在其生理活动的某些特定时刻固定下来,显示此时的其生理活动的某些特定时刻固定下来,显示此时的结构特点,进而可通过不同功能状态的瞬时构象变结构特点,进而可通过不同功能状态的瞬时构象变化来研究生物分子的功能。冷冻电镜获得的是处于化来研究生物分子的功能。冷冻电镜获得的是处于天然状态下未经染色的分
25、子的二维投影像。将样品天然状态下未经染色的分子的二维投影像。将样品进行不同角度的倾斜所获得的数据进行综合分析,进行不同角度的倾斜所获得的数据进行综合分析,并依据样品的不同特性使用不同的重构技术获得分并依据样品的不同特性使用不同的重构技术获得分子的结构,在此基础上观察多种成分的图像变化,子的结构,在此基础上观察多种成分的图像变化,追踪生物大分子的装配及其动力学过程。追踪生物大分子的装配及其动力学过程。 由冷冻电镜技术所获得的蛋白质三维结构与由冷冻电镜技术所获得的蛋白质三维结构与X X射线射线晶体技术非常相似,而且其信噪比非常低,并适合晶体技术非常相似,而且其信噪比非常低,并适合于内在膜蛋白的分析
26、。其独特优势为:可以用不同于内在膜蛋白的分析。其独特优势为:可以用不同的方法对均一的(如膜蛋白的二维晶体,二十面体的方法对均一的(如膜蛋白的二维晶体,二十面体对称的病毒等对称结构)和不均一的(如核糖体等对称的病毒等对称结构)和不均一的(如核糖体等)样品进行三维结构重构,同时,冷冻电子显微镜)样品进行三维结构重构,同时,冷冻电子显微镜是唯一的能研究小到蛋白质、蛋白质复合物,大到是唯一的能研究小到蛋白质、蛋白质复合物,大到细胞器甚至整个细胞的方法细胞器甚至整个细胞的方法 。冷冻电子显微镜技术与冷冻电子显微镜技术与X X衍衍射晶体结构分析方法比较射晶体结构分析方法比较四、蛋白质结构的可视化四、蛋白质
27、结构的可视化 可视化分析蛋白质的高级结构,有利于从原子可视化分析蛋白质的高级结构,有利于从原子间相互作用的层次理解生命活动过程的信息控制间相互作用的层次理解生命活动过程的信息控制机制,更加有效地揭示分子在完成其功能过程中机制,更加有效地揭示分子在完成其功能过程中的演化情况,了解蛋白质分子结构和各种微观性的演化情况,了解蛋白质分子结构和各种微观性质与宏观性质之间的定量关系。只要安装蛋白质质与宏观性质之间的定量关系。只要安装蛋白质分子图形学软件,并获得所需蛋白质结构数据,分子图形学软件,并获得所需蛋白质结构数据,配以商业软件或免费的小分子图形设计系统,就配以商业软件或免费的小分子图形设计系统,就可
28、开展结构生物信息学的探索性工作。可开展结构生物信息学的探索性工作。蛋白质可视化免费软件蛋白质可视化免费软件PymolPymol Pymol Pymol是强大的分子图形显示和基本特征测定系统是强大的分子图形显示和基本特征测定系统 PymolPymol可在可在//寻找链接下载,寻找链接下载,PymolPymol启动后显示双界面,对分子操作的常启动后显示双界面,对分子操作的常用命令界面,多种分析功能界面。用命令界面,多种分析功能界面。 1. 1. 图形界面左上侧列出主要的可操作对象并分成几个层次,包括所选对象、图形界面左上侧
29、列出主要的可操作对象并分成几个层次,包括所选对象、蛋白质、整体等;蛋白质、整体等;2. 2. 每个层次的对象有五种主要操作:动作每个层次的对象有五种主要操作:动作(A: action)(A: action)、显示、显示(S: Show)(S: Show)、隐、隐藏藏(H: hide)(H: hide)、标记、标记(L: Label)(L: Label)、上色、上色(C: Color)(C: Color)。3. Dispaly3. Dispaly下拉菜单中可显示蛋白质中每条肽链的序列和非蛋白质成分下拉菜单中可显示蛋白质中每条肽链的序列和非蛋白质成分 ,鼠,鼠标左键单击序列选中特殊待操作的残基可同
30、时显示对象所在位置标左键单击序列选中特殊待操作的残基可同时显示对象所在位置 ;还可设置;还可设置背景背景( (论文中这类图一般用白色背景,而报告中常用黑色背景以增加视觉效果论文中这类图一般用白色背景,而报告中常用黑色背景以增加视觉效果) );4. Wizard4. Wizard中有对分子常用性质测定模块,包括距离、电荷等以及尝试进行蛋中有对分子常用性质测定模块,包括距离、电荷等以及尝试进行蛋白质分子改造的功能。白质分子改造的功能。 蛋白质图形操作和性质测定蛋白质图形操作和性质测定 第三节蛋白质结构数据库一、蛋白质三维结构数据库一、蛋白质三维结构数据库PBD PDBPDB数据库收录条目一览表数据
31、库收录条目一览表实验方法分子类型总数蛋白质核酸蛋白/核酸复合物其他X-射线衍射48 225116822161751 626NMR699386915068018电他1305510150总数55 519205824363360 046 以人类泪液载脂蛋白为例,具体介绍下其以人类泪液载脂蛋白为例,具体介绍下其在在PDBPDB数据库中结构检索和可视化过程数据库中结构检索和可视化过程 第一步:第一步: 输入关键字输入关键字“HUMAN HUMAN TEAR LIPOCALINTEAR LIPOCALIN” 第二步:第二步: 选择人类泪液载脂选择人类泪液载脂蛋白蛋白1XKI 1X
32、KI 第三步:第三步: 点击点击Biology AssemblyBiology Assembly面面板展示其结构图板展示其结构图 第四步:第四步: 1XKI1XKI结构展示图结构展示图 二、蛋白质结构分类数据库二、蛋白质结构分类数据库SCOP SCOPSCOP数据库中数据库中1.75 1.75 版本中详细信息版本中详细信息蛋白质种类蛋白质种类(ClassClass)折叠子的数目折叠子的数目(FoldsFolds)超家族的数目超家族的数目(SuperfamiliesSuperfamilies)家族的数目家族的数目(FamiliesFamilies)全全 螺旋蛋白螺旋蛋白2842845075078
33、71871全全 折叠蛋白折叠蛋白174174354354742742 螺旋和螺旋和 折叠折叠147147244244803803 螺旋螺旋+ + 折叠折叠37637655255210551055复合结构域蛋白复合结构域蛋白666666668989膜蛋白膜蛋白5858110110123123小蛋白小蛋白9090129129219219总和总和119511951962196239023902三、蛋白质分类数据库三、蛋白质分类数据库CATH数据库的名称数据库的名称CATHCATH分别是数据库中四种分类类分别是数据库中四种分类类别的第一个字母,即别的第一个字母,即C C代表蛋白质的种类(代表蛋白质的种
34、类(classclass);A A代表蛋白质中二级结构的构架(代表蛋白质中二级结构的构架(architecturearchitecture););T T代表蛋白质的拓扑结构(代表蛋白质的拓扑结构(topologytopology);最后);最后H H代表数据库中最高层的分类类别代表数据库中最高层的分类类别- -蛋白质同源超家蛋白质同源超家族(族(homologous homologous superfamilysuperfamily)。)。CATHCATH蛋白质分类蛋白质分类数据库与另外一个蛋白质分类数据库数据库与另外一个蛋白质分类数据库SCOPSCOP相比,后相比,后者更注重从蛋白质进化的角
35、度来对蛋白质进行分类者更注重从蛋白质进化的角度来对蛋白质进行分类,而,而CATHCATH数据库偏重于从结构角度对蛋白质分类。数据库偏重于从结构角度对蛋白质分类。以蛋白质以蛋白质1ucr1ucr为例的搜索结果为例的搜索结果 点击上述查询结构页面点击上述查询结构页面domain IDdomain ID为为1ucrA001ucrA00的超链接,的超链接,CATHCATH数据库将列出数据库将列出该结构域相关的序列家族、结构、序列和数据更新历史记录等结果;并可进该结构域相关的序列家族、结构、序列和数据更新历史记录等结果;并可进一步获得三维结构。一步获得三维结构。第四节第四节 蛋白质结构的预测蛋白质结构的
36、预测蛋白质结构的密码隐藏在序列中蛋白质结构的密码隐藏在序列中 通过序列来解开蛋白质的结构通过序列来解开蛋白质的结构 一种氨基酸序列只可能有一种蛋白质结构,这就是计算机预测蛋白质结构的一种氨基酸序列只可能有一种蛋白质结构,这就是计算机预测蛋白质结构的意义所在。根据安芬森的热动力学原理,蛋白质在细胞中应该处在它与环境的自意义所在。根据安芬森的热动力学原理,蛋白质在细胞中应该处在它与环境的自由能最低态。这意味着可以根据物理、化学、生物学等知识来设计蛋白质的能量由能最低态。这意味着可以根据物理、化学、生物学等知识来设计蛋白质的能量函数,因此寻找这种最低自由能所代表的结构。函数,因此寻找这种最低自由能所
37、代表的结构。一、蛋白质二级结构预测软件一、蛋白质二级结构预测软件主要介绍主要介绍Jpred和和SOMPA的二级结构预测方法的二级结构预测方法以人基质金属蛋白酶以人基质金属蛋白酶MMP14(Matrix metalloproteinase ) 为例为例gi|4826834|ref|NP_004986.1JpredJpred二级结构预测方法二级结构预测方法 (1 1) 进入进入JpredJpred首页首页(http:/pbio.dundee.ac.uk/_www-jpred/http:/pbio.dundee.ac.uk/_www-jpred/),), (2 2) 在在“SequenceSeque
38、nce”下的下的空白处直接输入序列空白处直接输入序列;也可以选择也可以选择“AdvancedAdvanced”高级模高级模式式,选择选择EmailEmail提交方式或留空为网页结果显示提交方式或留空为网页结果显示,输入蛋白质序列或者从电脑文件输入蛋白质序列或者从电脑文件夹中获取夹中获取,最后点击最后点击“Make PredictionMake Prediction”;(3 3) 在电子邮箱中找到结果地址,在弹出的结果显示界面选择进行简单结果在电子邮箱中找到结果地址,在弹出的结果显示界面选择进行简单结果浏览、图形化输出等操作;浏览、图形化输出等操作;(4 4) 分析结果分析结果 H H:代表:代
39、表-螺旋;螺旋;E E:代表:代表-折叠;折叠;- -:代表无规则卷曲。:代表无规则卷曲。由图看出:由图看出:JpredJpred方法预测的方法预测的MMP14MMP14二级结构有二级结构有8 8个个螺旋区(螺旋区(H H)和)和2323个个折叠区折叠区(E E),其他区域均为无规则卷曲区(),其他区域均为无规则卷曲区(- -)。)。 JpredJpred二级结构预测二级结构预测SOMPASOMPA二级结构预测方法二级结构预测方法(1 1) 进入进入SOMPASOMPA主页主页(http:/npsa-pbil.ibcp.fr/cgi-(http:/npsa-pbil.ibcp.fr/cgi-b
40、in/npsa_automat.pl?page=/NPSA/npsa_sopma.html)bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);(2 2) 在在“Paste a protein sequence belowPaste a protein sequence below”下的空白处提交蛋白序列(原始下的空白处提交蛋白序列(原始序列),可以在参数中进行符合我们要求的设置,然后点击序列),可以在参数中进行符合我们要求的设置,然后点击“SUBMITSUBMIT”按钮进行分按钮进行分析;析;人民卫生出版社8年制及7年制临床医学等专业用生物信息学(
41、3 3) 查看结果,主要含有查看结果,主要含有alpha helix (h)alpha helix (h) - -螺旋,螺旋,Extended strand (e)Extended strand (e)延伸延伸链,链,Beta turn (t)Beta turn (t) - -折叠,折叠,Random coil(c)Random coil(c)无规卷曲。其中无规卷曲。其中HhHh有有150150个氨基酸,占个氨基酸,占25.77%25.77%;EeEe有有110110个氨基酸,占个氨基酸,占18.90%18.90%;TtTt有有5252个氨基酸,占个氨基酸,占8.93%8.93%;CcCc有有
42、270270个氨个氨基酸,占基酸,占46.39%46.39%。HhHh、CcCc和和EeEe贯穿于整个氨基酸贯穿于整个氨基酸链链,TtTt主要分布在氨基酸链的第主要分布在氨基酸链的第300300个氨基酸之后。个氨基酸之后。SOMPASOMPA预测结果预测结果二、蛋白质三维结构预测软件及服务器二、蛋白质三维结构预测软件及服务器蛋白质三维结构预测服务通过因特网对蛋白质三维结构预测服务通过因特网对公众免费开放公众免费开放( (同源建模同源建模) ):瑞士生物信息研究所瑞士生物信息研究所 SWISS-MODELSWISS-MODEL丹麦技术大学生物序列分析中心丹麦技术大学生物序列分析中心 CPHmod
43、elsCPHmodels比利时拿摩大学比利时拿摩大学 ESyPred3DESyPred3D英国癌症研究中心英国癌症研究中心 3DJigsaw3DJigsawAccelrys Discovery Studio 软件软件InsightIIFAMS第一步:进入第一步:进入SWISS-MODELSWISS-MODEL三级结构预测服务器主页三级结构预测服务器主页 仍以人仍以人MMP14MMP14序列为实例序列为实例应用应用SWISS-MODELSWISS-MODEL服务器自动模式服务器自动模式第二步:选择第二步:选择“Automated ModeAutomated Mode” 粘入粘入MMP14MMP1
44、4蛋白蛋白质序列;在这里可以填写质序列;在这里可以填写E-mailE-mail地址,将结果发送地址,将结果发送至电子邮箱,也可以在新的网页上直接展示;至电子邮箱,也可以在新的网页上直接展示;/第三步:点击第三步:点击“Submit Modeling RequestSubmit Modeling Request”即可;即可; 第四步:直接在页面上查看第四步:直接在页面上查看MMP14MMP14蛋白质的三蛋白质的三级结构信息。级结构信息。 第五步:结果分析:通过查询第五步:结果分析:通过查询ExpdbExpdb数据库,共得数据库,共得到到218
45、218个击中项。我们选用其中相似性最高的两个个击中项。我们选用其中相似性最高的两个模型。分别是模板模型。分别是模板1 1:1bqqM1bqqM,模板,模板2 2:1su3B1su3B, 第五节第五节 基于结构预基于结构预测蛋白质功能测蛋白质功能 如蛋白质间序列相似性高于如蛋白质间序列相似性高于40%40%,该蛋白,该蛋白质同其相似序列蛋白可能有保守序列发挥的相质同其相似序列蛋白可能有保守序列发挥的相同生物化学作用;但当序列保守性低于同生物化学作用;但当序列保守性低于40%40%时时,可从高级结构预测功能。蛋白质有多个功能,可从高级结构预测功能。蛋白质有多个功能域和结构域,从高级结构预测功能实际上是预域和结构域,从高级结构预测功能实际上是预测蛋白质的每项基本生物化学作用。测蛋白质的每项基本生物化学作用。 一、基于结构分类的蛋白质功能预测一、基于结构分类的蛋白质功能预测 1. 1.基于结构进行蛋白质功能注释的方法基于结构进行蛋白质功能注释的方法是搜索与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业客户服务接待规范方案
- 2026年智能客服现场客服笔试题库含答案
- 2026年云南省临沧市高职单招综合素质考试题库及完整版答案解析考点版
- 2026年卫生副高级职称考试(普通外科)经典试题及答案-全国高级
- 塑料制品生产项目职业病危害评价
- 2026年南京交安b证考试考试试题及答案
- 2026年江西有色智联科技有限公司招聘6人笔试参考试题及答案解析
- 湿地生态修复及保育工程农用地转用方案
- 2026年湖南省中考化学试卷(含答案及解析)
- 2026年病理学技术考试备考冲刺模拟试卷含答案解析
- -腹腔镜下肝部分切除术的护理查房
- 地基基础-001-国开机考复习资料
- 2024年浙江省温州市龙湾区委龙湾区人民政府信访局招聘编外1人【重点基础提升】模拟试题(共500题)附带答案详解
- DZ∕T 0213-2020 矿产地质勘查规范 石灰岩、水泥配料类(正式版)
- MOOC 信号与系统-哈尔滨工业大学 中国大学慕课答案
- 2024年陕西华特新材料股份限公司社会招聘技能操作人员6人高频考题难、易错点模拟试题(共500题)附带答案详解
- 中国抗日战争史智慧树知到期末考试答案2024年
- 劳动实践活动实施方案及流程
- 道德与法治统编版六年级下册全册表格式教案
- 老年人护理风险管理
- 2024届山东省青岛市青岛第二中学化学高二第二学期期末学业质量监测试题含解析
评论
0/150
提交评论