「实验五蛋白质序列分析[课件参考]」.ppt_第1页
「实验五蛋白质序列分析[课件参考]」.ppt_第2页
「实验五蛋白质序列分析[课件参考]」.ppt_第3页
「实验五蛋白质序列分析[课件参考]」.ppt_第4页
「实验五蛋白质序列分析[课件参考]」.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验五 蛋白质序列分析 杜娟dujuannx 基因与蛋白质组学数据分析 实验项目五 蛋白质序列分析一 实验目的和要求 掌握蛋白质基本性质分析 基本理化性质和疏水性分析 掌握蛋白质信号肽的预测 亚细胞定位的预测 跨膜结构及卷曲螺旋结构的预测 了解基于motif 结构位点 结构功能域数据库的蛋白质功能预测掌握基于序列同源性分析的蛋白质功能预测 2 精选课件 一 蛋白质基本理化性质分析 蛋白质理化性质是蛋白质研究的基础蛋白质的基本性质 相对分子质量氨基酸组成等电点 PI 消光系数半衰期不稳定系数总平均亲水性 实验方法 相对分子质量的测定 等电点实验 沉降实验缺点 费时 耗资基于实验经验值的计算机分析方法软件Bioedit网络工具ProtParam ComputePI 3 精选课件 基于一级序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考ExPASy ExpertProteinAnalysisSystem 开发的针对蛋白质基本理化性质的分析 Protparam工具http www expasy org tools protparam html 4 精选课件 蛋白质理化性质分析 Protparam工具http www expasy org tools protparam html计算以下物理化学性质 相对分子质量理论pI值氨基酸组成原子组成消光系数半衰期不稳定系数脂肪系数总平均亲水性 5 精选课件 主要选项 参数 序列在线提交形式 如果分析SWISS PORT和TrEMBL数据库中序列直接填写Swiss Prot TrEMBLAC号 accessionnumber 如果分析新序列 直接在搜索框中粘贴氨基酸序列 6 精选课件 输入Swiss Prot TrEMBLAC号 分不同的功能域肽段以P02699为例 输出结果 7 精选课件 点击不同功能域得到以下结果 8 精选课件 9 9 精选课件 40unstable 10 精选课件 二 蛋白质疏水性分析 疏水作用是蛋白质折叠的主要驱动力分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的第一步氨基酸疏水分析为蛋白质二级结构预测提供佐证是分析蛋白质跨膜区重要一步 11 精选课件 ProtScale工具http ca expasy org tools protscale html氨基酸标度表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异 如疏水性 亲水性等收集50多个文献中提供的氨基酸标度默认值以Hphob Kyte Doolittle做疏水性分析ProtScale能计算超过50种蛋白质的特性 仅一项需要额外设定的参数是输入框的宽度 该参数将指示系统每次运行计算和显示的残基数 其缺省值为9 如果想考虑跨膜螺旋特性 该参数设置应为20 因为一个跨膜螺旋通常有20个氨基酸长度 蛋白质亲疏水性分析 12 精选课件 主要选项 参数序列在线提交形式 如果分析SWISS PORT和TrEMBL数据库中序列直接填写Swiss Prot TrEMBLAC号 accessionnumber 如果分析新序列 直接在搜索框中粘贴氨基酸序列以P02699为例 13 精选课件 14 精选课件 输出结果 15 精选课件 16 精选课件 三信号肽预测 蛋白质合成后要运送到细胞中不同的部位 有的蛋白质要通过内质网膜进入内质网腔内 最终成为分泌蛋白 分泌蛋白的N端都有一段约15 35个氨基酸的疏水性肽段 其功能是引导蛋白质多肽链穿过内质网膜进入腔内 称为信号肽 signalpeptide 按照氨基酸组成及其位置特征 可将信号肽分为4大类 分泌信号肽2 脂蛋白信号肽3 Pilin like信号肽4 细菌素和细菌素信号肽 蛋白质序列分析 17 精选课件 信号肽主要由三个domain组成 N region H regin和C region N region为正电荷区域 至少含有一个精氨酸 R 或赖氨酸 K H region为疏水核 一般长为12 14个氨基酸 C region包含信号肽酶 SPase 的剪切位点 在剪切位点的 1位和 3位上多为中性的丙氨酸 该区域也称为富含丙氨酸区域 NHCN端C端 蛋白质序列分析 18 精选课件 常用工具SignaIP http www cbs dtu dk services SignalP 通过神经网络方法的组合预测信号肽的位置及相应切点 三信号肽的预测 19 精选课件 人的内质网驻留蛋白信号肽预测Q9BS26 输入序列的FASTA文件 20 精选课件 人的内质网驻留蛋白信号肽预测 曲线颜色 此处C值最大 S值陡峭 Y值最高峰 预测为信号肽剪切位点 文本结果 YES代表该蛋白包含信号肽 剪切位点位于29 30残基处 Cscore 剪切位点分值Sscore 信号肽分值Yscore 综合剪切位点分值 21 精选课件 四蛋白质亚细胞定位预测 亚细胞定位与蛋白质的功能存在着非常重要的联系 亚细胞定位预测基于如下原理 1 不同的细胞器往往具有不同的理化环境 它根据蛋白质的结构及表面理化特征 选择性容纳蛋白 2 蛋白质表面直接暴露于细胞器环境中 它由序列折叠过程决定 而后者取决于氨基酸组成 因此可以通过氨基酸组成进行亚细胞定位的预测 推荐使用PSORT http psort nibb ac jp II软件对PDCD5蛋白的细胞内定位进行预测 PSORT将动物蛋白质定位于10个细胞器 1 细胞浆 2 细胞骨架 3 内质网 4 胞外 5 高尔基体 6 溶酶体 7 线粒体 8 胞核 9 过氧化物酶体 peroxisome 和 10 细胞膜 22 精选课件 输入蛋白质序列FASTA文件 23 精选课件 24 精选课件 细胞外 细胞壁 线粒体 细胞骨架 细胞核 25 精选课件 五跨膜区预测 各个物种的膜蛋白的比例差别不大 约四分之一的人类已知蛋白为膜蛋白 由于膜蛋白不溶于水 分离纯化困难 不容易生长晶体 很难确定其结构 因此 对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用 推荐使用TMHMM软件 http www cbs dtu dk servICEs TMHMM 对蛋白进行跨膜预测 TMHMM综合了跨膜区疏水性 电荷偏倚 螺旋长度和膜蛋白拓扑学限制等性质 采用隐马氏模型 HiddenMarkovModels 对跨膜区及膜内外区进行整体的预测 TMHMM是目前最好的进行跨膜区预测的软件 它尤其长于区分可溶性蛋白和膜蛋白 因此首选它来判定一个蛋白是否为膜蛋白 所有跨膜区预测软件的准确性都不超过52 但86 的跨膜区可以通过不同的软件进行正确预测 因此 综合分析不同的软件预测结果和疏水性图以获得更好的预测结果 26 精选课件 输入蛋白质序列FASTA文件 铝激活苹果酸转运蛋白的跨膜区预测 27 精选课件 跨膜区 起始氨基酸 终止氨基酸 文字结果 28 精选课件 跨膜区 膜外区 膜内区 图形结果 29 精选课件 卷曲螺旋 coiledcoil 是蛋白质中由2 7条 螺旋链缠绕成麻花状结构的总称存在于多种天然蛋白质中 如转录因子 结构蛋白 膜蛋白中 在生物体内执行着代谢调控 分子运动 膜通道 分子识别等重要的生物功能 六蛋白质卷曲螺旋域分析 典型的有亮氨酸拉链 存在7残基重复结构 heptadrepeat 以a b c d e f g位置表示 其中a和d位置为疏水性氨基酸 而其他位置残基为亲水性 30 精选课件 卷曲螺旋控制蛋白质寡聚化的元件 存在于转录因子 蛋白融合多肽等一种很简单的三级结构 容易预测常用工具COILS PredictionofCoiledCoilRegionsinProteins http www ch embnet org software COILS form html 31 精选课件 选择滑动窗口大小 选择打分矩阵和权重 选择输入格式 选择 SwissProtIDorAC 查询内容 输入Q9H2G9 http www ch embnet org software COILS form html 32 精选课件 33 图形结果 33 精选课件 预测为卷曲螺旋的区域 34 精选课件 七结构域分析 结构域 structuredomain 是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元 每个结构域自身形成紧实的三维结构 可以独立存在或折叠 但结构域与结构域之间关系较为松散 结构域通常由25 300个氨基酸组成 不同蛋白质结构域数目或同一蛋白质结构域相似度差异较大 蛋白质序列分析 35 精选课件 常见的结构域主要有5种 全平行结构域反平行结构域 结构域 结构域其他折叠类型结构域是蛋白质的功能 结构和进化单元 结构域分析对于蛋白质结构的分类和预测有着重要作用 蛋白质序列分析 36 精选课件 七基于结构域 模体 的蛋白质功能预测 一类基因具有转录功能 且它们所编码的蛋白质都具有Y结构域 模体 蛋白质B也具有Y结构域 模体 因而蛋白质B的功能也应该与基因转录相关 蛋白质B 转录活性 37 精选课件 蛋白质模体或结构域在氨基酸序列水平比其他区域保守 通过对序列比对可以发现这些在进化上较为保守的区域 蛋白质模体或结构域通常与该蛋白质的功能直接相关 根据模体或结构域信息可以对同源水平较低的蛋白质的进行功能预测 基于结构域 模体 的蛋白质功能预测 38 精选课件 七蛋白质序列分析蛋白质家族 结构域 位点及功能分析 绿脓假单胞菌RpsA层粘连蛋白受体 39 精选课件 蛋白质序列分析 保守结构域以及功能分析 RNA结合结构域 核酸结合 40 精选课件 七基于同源序列的蛋白质功能预测 蛋白质A具有转录功能 蛋白质B与A在氨基酸序列上相似 直系同源 因而蛋白质B也具有转录功能 A B 转录活性 转录活性 蛋白质A 蛋白质B 41 精选课件 至少80个氨基酸长度范围内具有25 以上的序列一致性才提示可能的显著性意义 未知功能序列对库检索的一般分析策略如下 和运行Blastp程序的服务器 http www ncbi nlm nih gov blast 连接 将目的序列粘贴到序列输入框中 选择BLOSUM62记分矩阵运行BlastP程序 NCBI的BlastP程序要求输入格式为FASTA格式 如果BlastP检测到了高度同源的序列 将有可能提示目的序列的生物学功能 七基于同源序列的蛋白质功能预测 42 精选课件 序列相似性比较作为一个非常有效的工具用于同源基因的发现 基于序列同源的蛋白质功能预测 43 精选课件 基于序列同源的蛋白质功能预测 44 精选课件 在uniprot数据库中检索人脂联素 adiponectin 蛋白质序列 写出检索号 使用在线分析平台ExPASy对上述蛋白质序列进行分子质量 氨基酸组成 protparam 和疏水性等基本性质分析 protscale 写出分子质量是多少 氨基酸组成情况 哪个氨基酸所占比例最高 哪个最低 不稳定系数是多少 根据该系数判断 该蛋白质稳定吗 带正负电荷氨基酸个数分别是多少 疏水性分析结果如何 截图报道图形结果 在图中标出疏水性高的位点三个 疏水性低的位点3个 并在文字结果中找到这些位点对应的的氨基酸编号和类型 格式例如6号亮氨酸 作业 45 精选课件 作业 预测海参溶菌酶A0MT08的信号肽 并分析结果 指出信号肽位置 预测P69332的亚细胞定位 并翻译 分析 截取最终结果 指出该蛋白质在那些位置表达 预测P69332的跨膜区 并分析预测结果 指出哪些区域是跨膜区 使用COILSServer对对水稻瘤矮病毒RGDVP2蛋白卷曲螺旋预测分析 指出预测为卷曲螺旋的区域 46 精选课件 作业 利用In

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论