




已阅读5页,还剩59页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学第六章蛋白质结构预测及分子设计 引子 单个蛋白涉及的问题结构预测 2D 3D 物理化学性质功能空间位置研究方法提取纯化制作晶体 决定结构理解机制 功能 多个蛋白涉及的问题表达过程 DNA RNA 蛋白 调控网络 相互作用 yeasttwo hybrid 亲和层析 蛋白家族 family 检测 2D PAGE 质谱仪 蛋白质芯片 研究方法基因组测序蛋白预言计算机分析结构理解机制 功能 一级结构 primary 氨基酸序列二级结构 secondary 螺旋 片层 三级 维 结构 tertiary 亚基 结构域四级结构 quaternary 亚基之间特定的空间关系 蛋白质的结构 一些单氨基酸 aa 突变可引起蛋白结构的重大变化CFTR的 F508突变改变螺旋结构 从而改变其功能另一些变化则不明显一些蛋白引起的疾病囊肿性纤维化 cysticfibrosis CFTR镰刀性贫血 血红蛋白疯牛病 朊蛋白阿尔兹海默氏征 淀粉样前体蛋白 蛋白结构与人类疾病 重要性 蛋白结构的主要仓库 PDB 始建于1971 32000个结构数据 其中约3万是蛋白 读取PDB文件的门户网站Swiss Prot NCBI EMBL PDB CATH Dali SCOP FSSP解释PDB文件的数据库 用 PubMed 搜蛋白结构 NCBI 1 进入 PubMed 2 选择 Structure 3 输入要找的蛋白名称或ID号等 如RecBCD E coliDNArepair 4 点击 Go 5 点击感兴趣的结果 1W36 进入MMDB 结果列表中包含相关蛋白 poweredbyBLAST 文献 结构域 domain 配体 ligand 3D缩略图 三维查看器 在MMDB看搜到蛋白的结构 NCBI MMDB MolecularModelingDatabase NCBI的大分子三维结构数据库 数据来自PDB打开的单个蛋白的页面中包括文献 简单描述 入库日期 物种 taxonomy 该蛋白的PDB VAST链接 entirechain View3DAlignment 三维查看器 Cn3D 分子成分 图 chain 3Ddomain classification family ligand 点击其中的PDB RCSB 链接 显示 三维结构实验数据蛋白分类SCOP链接 结构域 家族 超家族 CATH链接 域 Class Architecture Topology HomologyGO链接 功能 过程 细胞组成更多信息生化性质 配体 SNP SequenceDetails 图形显示各域的分布 类别 DSSP二级结构 PDP域更多外部链接 对于RecBCD多达26个 更多有用的链接 PDB的外部链接中ComputepIMw点击ChainB 可计算各链分子量 在打开的ComputepI Mw页面中点击EX5B ECOLI ExPASy 大量信息 链接 在打开的UniProtKB Swiss Prot页面中点击EcoCyc EG10824 MONOMER biocyc 参与的反应 路径图 蛋白质结构预测及分析的主要内容 蛋白质结构预测过程 ORF翻译 蛋白质的基本性质 蛋白质的基本性质 相对分子质量氨基酸组成等电点 pI 消光系数半衰期不稳定系数总平均亲水性 蛋白质理化性质分析工具 ProtParam工具简介 基于蛋白质序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考Expasy开发的针对蛋白质基本理化性质的分析 ProtParam工具 计算以下物理化学性质 相对分子质量氨基酸组成等电点 pI 消光系数半衰期不稳定系数总平均亲水性 如果分析Swiss Prot和TrEMBL数据库中序列直接填写Swiss Prot TrEMBLAC号 accessionnumber 如果分析新序列 直接在搜索框中粘贴氨基酸序列 输入Swiss Prot TrEMBLAC号 将protein txt蛋白质序列粘贴在文本框中 返回结果 氨基酸数目 相对分子质量 氨基酸组成 正 负电荷残基数 消光系数 半衰期 原子组成 分子式 总原子数 E Prot Num Tyr Ext Tyr Num Trp Ext Trp Num Cystine Ext Cystine proteinsinwatermeasuredat280nm Ext Tyr 1490 Ext Trp 5500 Ext Cystine 125Absorb Prot E Prot Molecular weight 不稳定系数 脂肪系数 总平均亲水性 40unstable 注意 ProtParam没有考虑蛋白质翻译后修饰 蛋白质多聚体等情况 故用户在预测和分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果 蛋白质结构预测 跨膜区预测 膜蛋白是一类结构独特的蛋白质 在各种细胞中普遍存在 同时发挥着重要的生理功能 一 跨膜区分析 a TypeImembraneprotein b TypeIImembraneprotein c Multipasstransmembraneproteins d Lipidchain anchoredmembraneproteins e GPI anchoredmembraneproteins 蛋白质跨膜区特性典型的跨膜螺旋区主要是由20 30个疏水性氨基酸 Leu Ile Val Met Gly Ala等 组成 亲水残基往往出现在疏水残基之间 对功能有重要的作用 基于亲 疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性 跨膜蛋白序列 边界 原则胞外末端 Asp 天冬氨酸 Ser 丝氨酸 和Pro 脯氨酸 胞外 内分界区 Trp 色氨酸 跨膜区 Leu 亮氨酸 Ile 异亮氨酸 Val 缬氨酸 Met 甲硫氨酸 Phe 苯丙氨酸 Trp 色氨酸 Cys 半胱氨酸 Ala 丙氨酸 Pro 脯氨酸 和Gly 甘氨酸 胞内 外分界区 Tyr 络氨酸 Trp 色氨酸 和Phe 苯丙氨酸 胞内末端 Lys 赖氨酸 和Arg 精氨酸 常用蛋白质跨膜区域分析工具 TMpred工具简介 依靠跨膜蛋白数据库TMbase预测跨膜区和跨膜方向 主要参数 选项序列在线提交形式 直接贴入蛋白序列填写SwissProt TrEMBL EMBL EST的ID或AC 输出格式 最短和最长的跨膜螺旋疏水区长度 输入序列名 可选 选择序列的格式 贴入protein txt蛋白质序列 输出结果可能的跨膜螺旋区相关性列表 可能的跨膜螺旋区 位置 分值 片段中点位置 26 建议的跨膜拓扑模型 最优拓扑结构 每一位置计算分值 TMHMM 二 信号肽分析 信号肽 指分泌蛋白表达时氨基端 N 有时不在N端 的20余个氨基酸 将引导该蛋白质最终分泌到细胞外 但这段信号肽会被信号肽酶切掉 所以成熟的分泌蛋白是不含这段信号肽的 信号肽可以指导蛋白质的跨膜转移 信号肽预测工具 SignalPserver 三 蛋白质二级结构分析 螺旋 折叠 蛋白质二级结构及类型二级结构取决于氨基酸侧链结构 由氢键形成1 螺旋 helix 4 40aa2 折叠 sheet 5 10aa 平行或反平行 C N端方向一致或相反 3 转角 turn 4 无规则卷曲 randomcoil 蛋白质二级结构分析工具 PredictProtein 可以获得功能预测 二级结构 基序 二硫键结构 结构域等许多蛋白质序列的结构信息 该方法的平均准确率超过72 最佳残基预测准确率达90 以上 因此 被视为蛋白质二级结构预测的标准 用户需要注册ID 验证E mail后 才能使用PredictProtein工具 如何使用PredictProtein工具 将protein txt蛋白质序列粘贴在文本框中 分析方法 重要的算法 PROFsec 螺旋 折叠等基本二级结构预测 PHDhtm 典型跨膜螺旋区预测 ProSite 特征Motif识别方法 ProSitemotif搜索结果 置信度 二硫键位置 二硫键位置预测结果 PHD跨膜螺旋区预测结果 跨膜螺旋区 非跨膜螺旋区 PROF二级结构预测结果 螺旋结构 片层结构 无规则卷曲 四 蛋白质结构域预测 结构域 StructuralDomain 是蛋白序列的功能 结构和进化单元 结构域通常都是几个超二级结构单元的组合 即蛋白质多肽链在二级结构的基础上进一步卷曲折叠成几个相对独立的近似球形的组装体 结构域是介于二级和三级结构之间的另一种结构层次 结构域的实质是二级结构的组合体 充当三级结构的元件 基本类型 折叠 折叠 折叠 折叠 蛋白质结构域数据库 InterPro数据库简介 InterPro InterPro数据库由EBI开发 整合蛋白质家族 结构域和功能位点等资源 整合UniProt PROSITE Pfam等12个成员数据库 检索结果准确 目前最新的InterPro34 0版本包含22245个条目 涵盖6309个结构域 14854个蛋白质家族 截至2011年11月底 序列提交框 InterProScan http 提供在线提交和本地分析工具 Linux系统 分析工具 InterProScan工具结果反馈 图形化结果 VisualOutput 以示意图的形式显示保守区和结构域表格式结果 SummaryTable 显示保守区和结构域的具体位置以及蛋白家族信息和GO分类号GO分类号 GO GeneOntology 基因本体论 用于蛋白的功能分类 包含基因产物的相关分子功能 生物学途径和细胞学组件 根据这三个方面的内容对基因进行分类 保守区示意图 InterPro蛋白家族信息 该家族蛋白在不同种类生物体中出现情况 其他家族与该家族的重叠情况 五 蛋白三级结构研究方法 实验方法1 X光晶体衍射2 核磁共振 NMR 计算方法1 从头算方法 abinitio denovo 理论分析法分子动力学能量最低假设2 比较建模 comparativemodeling 基于同源性 1 从头算方法 abinitio denovo 理论分析法 根据物理化学原理 如原子之间作用力 建立模型 预测结构一些问题自然的蛋白质结构和未折叠的蛋白质结构 两者之间的能量差非常小 1kcal mol数量级 蛋白质可能的构象空间庞大 针对蛋白质折叠的计算量非常大计算模型中力场参数的不准确性待测蛋白没有同源性时可用此法 2 比较建模 同源模型化方法 统计方法 通过同源序列分析或者模式匹配预测蛋白质的空间结构或者结构单元 如 锌指结构 螺旋 转角 螺旋结构 DNA结合区域等 motif 原理 许多不同的序列会采用同一个基本的折叠 具有相似序列的蛋白倾向于有相似结构 一对自然进化的蛋白 如果它们的序列具有 25 30 的等同部分 可以假设它们结构相似 步骤Step1 识别结构保守域Step2 将待测蛋白与模板比对 保留 30 同源性的结果Step3 建模Step4 评价模型 一般而言 同源性越高 结构预言越精确 50 同源性 精确度可达1埃 比较建模网站 蛋白质结构预测精度 同源建模法分析步骤 1 多序列比对与已有晶体结构的蛋白质序列比对2 确定是否有可以使用的模板序列相似度 30 序列相似度 30 结合功能 蛋白质一级序列 二级结构或结构域信息3 构建三维模型4 三维模型准确性检验Whatcheck程序Ramachandranplot计算检验5 手工调整多序列比对 重新拟合 构建新的模型 SWISS MODEL工具 同源建模方法与PDB数据库已知结构的蛋白质序列比对进行预测 SWISS MODEL工具简介 自动模式 比对模式 工程模式 SWISS MODEL工作模式 主要参数 选项 粘贴SWISS MODEL txt中的蛋白质序列 输入用户E mail 选填 模型和模板信息 下载pdb格式文件 模型和模板信息 模型质量参数 比对结果 模型评估 略 Anolea AtomicNon LocalEnvironmentAssessment isaserverthatperformsenergycalculationsonaproteinchain evaluatingthe Non LocalEnvironment NLE ofeachheavyatominthemolecule Theenergyofeachpairwiseinteractioninthisnon localenvironmentistakenfromadistance dependentknowledge basedmeanforcepotentialthathasbeenderivedfromadatabaseof147non redundantproteinchainswithasequenceidentitybelow25 andsolvedbyX Raycrystallographywitharesolutionl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 4491-3:2025 EN Metallic powders - Determination of oxygen content by reduction methods - Part 3: Hydrogen-reducible oxygen
- 西藏支教活动方案
- 河南焊工考试题及答案
- 国企金融考试题及答案
- 关于林果考试题及答案
- 股票期权考试题及答案
- 高考日语考试题及答案
- 幼儿园教学教案设计:安全用书包
- (正式版)DB15∕T 3643-2024 《气象灾害风险评估技术规范 暴雨》
- (正式版)DB15∕T 3393-2024 《绿色勘查技术规程》
- 2025至2030年中国主题公园及旅游地产市场供需格局及未来发展趋势报告
- 2025年事业单位工勤技能-甘肃-甘肃园林绿化工一级(高级技师)历年参考题库含答案解析(5卷套题【单选100题】)
- 高尿酸血症肾病的临床护理(模板)
- 案场退场协议书
- 百年邮政儿童课件
- 人工造林项目投标书
- 附睾结核护理查房
- 廉洁考试试题及答案
- 儿童飞盘教学课件
- 空调使用培训
- 电气安装工程培训课件
评论
0/150
提交评论