蛋白质蛋白质相互作用_第1页
蛋白质蛋白质相互作用_第2页
蛋白质蛋白质相互作用_第3页
蛋白质蛋白质相互作用_第4页
蛋白质蛋白质相互作用_第5页
已阅读5页,还剩187页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学面临的挑战 已经有超过1000个物种的基因组已经完成测序 如何进行数据的分析与整合在多数的物种中只有大约45 的基因通过同源序列获得注释信息那些非同源基因可能与物种特异的表型相关 它们将成为最重要的研究项目之一 如何注释这些基因的功能 蛋白质相互作用研究方法 实验方法计算方法 实验方法 免疫共沉淀 Co immunoprecipitation 酵母双杂交 Yeasttwohybrid 噬菌体展示 Phagedisplay 亲和层析和质谱 Affinitypurification massspectrometry 蛋白芯片 Proteinchip 将相互作用蛋白其中的一个通过抗体连接在固体颗粒上 与之相互作用的蛋白就能通过免疫共沉淀的方法沉淀出来 免疫共沉淀 酵母双杂交 高通量的酵母双杂交 果蝇 ScienceVol 302 1727 1736 2003GenomeResearchVol 15 376 384 2005线虫 ScienceVol 303 5657 540 3 2004酵母NatureVol 425 686 691 2003 PhageDisplay 1 噬菌体是一种仅感染细菌的病毒 它由两部分构成 遗传物质和蛋白质外壳 噬菌体中的基因3能够利用细菌的翻译系统生产噬菌体蛋白质外壳一端的组分 Proteincoat PhageDisplay 2 噬菌体展示通过在基因3位点插入新的核酸序列能够在噬菌体的表面展示新的蛋白或肽段 PhageDisplay 3 这些噬菌体群体能够展示十亿种以上的蛋白或肽段 这个群体被称为噬菌体展示文库 每个展示的蛋白或肽段都对应于一段基因序列 将噬菌体文库与固定在固定相上的的目标蛋白混合 能够与目标蛋白相互作用的展示蛋白或肽段将结合到这些目标蛋白上 洗脱非特异结合噬菌体 对结合的噬菌体插入序列进行测序 则能知道该相互作用的蛋白或序列是由哪些核酸编码 进而可以克隆该基因 亲和纯化和质谱 鉴定能够相互作用形成复合体的蛋白把一个配体通过化学交联的方法结合在固相载体上 让蛋白混合液流过固相载体 能够与配体结合的分子具有较高的亲和力 通过适当的洗脱条件将亲和力弱的分子洗脱掉 这样与配体亲和力较高的分子就被纯化了出来 纯化出的分子随后用凝胶电泳的方法分离 用质谱的方法鉴定是什么蛋白 Eur J Biochem 270 570 578 2003 串联亲和层析纯化方法Thetandemaffinitypurificationmethod 序列标签的结构 B 纯化方法 通过两步的亲和纯化步骤获得蛋白复合体 蛋白质芯片 目前 多数的蛋白芯片是将捕获蛋白固定在芯片上 而待分析的蛋白混合物与芯片进行杂交 酵母蛋白芯片的制作及激酶检测 NatureGenetics26 283 289 2000 蛋白芯片的应用蛋白芯片通常分为两类 分析型蛋白芯片和功能性蛋白芯片分析型芯片通常会有高密度的亲和试剂组成的点 例如用于检测混合溶液中的蛋白的抗体或抗原 功能型芯片则在芯片的固相基质上连接有大量的纯化后的蛋白 ScienceVol 302 1727 1736 2003 PPIofDrosophila 1 4679个蛋白 4780个相互作用 GenomeResearchVol 15 376 384 2005 PPIofDrosophila 2 1727个蛋白 2300个相互作用 24pairs 利用不同方法高通量筛选酵母蛋白质 蛋白质相互作用结果的比较 蛋白质相互作用的实验方法 酵母双杂交蛋白复合体纯化技术及质谱蛋白芯片杂交技术 对实验室条件要求很高 实验周期长 费用高 准确性低 缺点 利用计算的方法预测蛋白 蛋白相互作用 基于结构的预测基于序列的预测相互作用的直系同源蛋白相互作用的结构域对基于基因组的预测基因位点的上下文基因临近聚集分散基因融合 Rosetta Stonemethod 电子双杂交系统发育上下文系统发生谱方法系统树相近 Mirrortree 基因表达 mRNA共表达 一些重要的概念 Ortholog 直系同源 是指不同物种中来自同一个祖先的基因和蛋白质 意义 直系同源在各种物种进化中保持相同的功能 informationfromonemembertotheothers Paralogs 旁系同源 指的是一个物种内通过基因重复而产生的基因或蛋白质 意义 旁系同源在进化中可以形成新的功能 COGs 直系同源簇 用两个物种的蛋白质进行交互Blast 即利用一个物种的一个蛋白质对第二个物种的所有蛋白质进行Blast 再将在第二个物种中得到的E值最小的蛋白质序列对第一个物种的所有蛋白质进行Blast 如在第一个物种中E值最小的蛋白质是原来用来对第二个物种进行Blast的蛋白质 则这两个蛋白质互为直系同源蛋白质 在应用中 通常利用三个物种进行交互Blast以便更好地确定直系同源蛋白质 IleS MG345 MJ0947 sll1362 MG345 MJ1362 P2withsmallestEvalue P1withsmallestEvalue 基于结构的预测 ProteinX ProteinY ProteinA ProteinB ProteinX ProteinY ProteinA ProteinB 已知有相互作用 预测有相互作用 结构同源 基于序列的预测 相互作用直系同源蛋白假如A蛋白与B蛋白相互作用 在在其它物种中A与B的直系同源蛋白可能会相互作用 相互作用的结构域对结构域是相互作用的蛋白质中结构与功能的基本位 每个蛋白中都是由各种结构域组成的 因此通过相关结构域的相互作用信息 可以预测蛋白质的相互作用 假如两个基因在多个基因组中都处于相邻位置 则这两个基因编码的蛋白可能存在相互作用 基因组临近 基因临近 1 基因组临近 基因临近 2 NatureBiotechVol22 7 912 917 2004 基因融合方法 电子双杂交 InSilicoTwoHybrid 方法 一些相互作用的蛋白质应该保持同步进化 从而保持其相关的功能 即一对相互作用的蛋白质中一个蛋白质的氨基酸发生改变 可能会促使与其相互作用的另一个蛋白质中的相应氨基酸位点发生相适应的互补突变 从而保持相互作用的完整性 否则 在进化的过程中 这些蛋白质会由于选择的压力而被清除 因此 利用这种关系来预测蛋白质的相互作用 MirrorTreesMethod 该方法的假设前提是 相互作用的蛋白可能是共进化的 方法是 计算包含不同物种的蛋白质家族间的进化距离 构建各自相应的进化树 在进化树之间相似性距离的基础上 构建镜像树 然后由镜像树之间的相似性距离和蛋白质在镜像树上的位置确定蛋白质之间的两两相互作用 系统发育谱 phylogeneticprofiles 的概念 假定有四个基因组 每个上面都有几个蛋白标记为P1 P7 在该基因组上是否存在其中的一个蛋白分别用1或0表示 具有相同系统发育谱的蛋白被放在一个方框内 系统发育谱差一位的用线连接 结果是具有相同系统发生谱的P2和P7以及P3和P6具有功能相关性 利用这种方法分析蛋白的功能相关性 不需要序列的相似性 系统发育谱方法中的两个重要因子 参考基因组的选择同源的定义在已发表的文章中 利用这种方法研究蛋白质相互作用还没有人系统的研究过不同的基因组组合以及E值的阈值对结果的准确性以及蛋白覆盖率的影响 方法研究设计 1 目标基因组和参考基因组 163个具有全基因组信息的物种 按照系统发育关系分成9组 18个物种 35个物种 55个物种 65个物种 86个物种 106个物种 128个物种 145个物种及162个物种 2 同源性的定义BlastpEvalue设定 1 10 1 E01 1 10 2 E02 1 10 3 E03 1 10 4 E04 1 10 5 E05 1 10 6 E07 and1 10 10 E10 3 63种组合例如 18E01 18E10 162E01 162E10 ResultsThereferencegenomessets 1835556586106128145162 如何选择基因组子集 一些概念 精确性 Precision 用于描述实验重复性 通常用标准差或平均重复误差表示 准确性 Accuracy 描述测定值与真实值之间的差别 特异性 Specificity 描述报告信号来自预定目标的比例灵敏度 Sensitivity 描述能够获得可检测信号下目标的最低量 Discussion Thenumberofreferencegenomes Pellegrinietal 1999 16genomesDateandMarcotte2003 57LimitednumberofgenomesZhengetal 2002更多的基因组能够获得更多的功能相关蛋白结果对于系统发育方法预测蛋白功能的准确性可能有基因组数量上限 Discussion 参考基因组的数量确实能够影响预测能力数量较少的基因组 18or35多一些的基因组 86更多的基因组 162 Discussion Exploitingthephylogeneticrelationshipofgenomes系统发育树分支异常值参考基因组 Howtoapplytherefinedmethod 首先 从http www ncbi nlm nih gov genomes Complete html下载Eubacteria的 phyliptree 文件其次 用TreeView软件打开 phyliptree 文件第三 选择欲其他所有物种亲缘关系最远的一个物种作为异常值 outlier 最后 加入所有Archaea和Eukarytoes物种的基因组 这些选定的参考基因组用于其后的计算 系统发育谱的局限 仅能预测拥有全基因组序列的物种 对于一些关键蛋白和共有蛋白中 由于在多数物种中没有系统发育树差别 而无法判断蛋白之间的相关性 电子预测蛋白质相互作用方法的评估 评估PPI数据的重要性 假阴性和假阳性蛋白质相互作用的动力学本质 蛋白表达和相互作用模式在不同生物学条件下是不同的 而目前所有的实验方法或计算方法都不能做到动态检测或预测 因此只能对真实存在的蛋白质相互作用 得到一个粗略的描述实验方法或计算方法的局限性 每一种实验或计算方法所依据的生物学原理不同 因此每一种方法预测的结果也只能部分描述真实的相互作用 在实验或计算过程中产生的错误 这3个因素使得应用不同方法得到的蛋白质相互作用网络不同 或者不同的实验室应用相同的方法也不能得到相同的蛋白质相互作用网络 蛋白质相互作用数据的重叠和相互补充不同技术得到的蛋白质相互作用之间的重复性很低 由不同实验室应用相同的技术得到的数据差别也很大 前期的方法 利用不同的方法验证同一对相互作用 Uetzetal 2000文献阅读 Jenssenetal 2001计算机计算Deaneetal 2002表达谱可靠性指数平行进化同源方法局限 需要复杂的芯片杂交数据 蛋白质相互作用与其他生物学数据的关系 亚细胞定位 SubcellularLocalization 功能分类 FunctionCatalogue 蛋白质复合体 Proteincomplexes 代谢途径 Pathway 基因表达数据 GeneExpressionData 已知的蛋白质相互作用数据 Knownprotein proteininteractionsdata 已知的生物学数据库 蛋白质复合体 EcoCyc代谢途径 KEGG已知的蛋白质蛋白质相互作用数据 DIP Whichoneisthebestandhow MethodsandMaterials 精确的系统发育谱方法Score mutualinformationvalue225genomes completesequence基因融合Score phylogeneticdistance101genomes completesequence101genomes 16sRNAforphylogeneticdistance基因顺序Score phylogeneticdistance101genomes completesequence101genomes 16sRNAforphylogeneticdistanceAllcomputationandCOGannotationbasedonproteinsequenceofE coli MaterialsandMethods 阳性数据Pathwayinformation KEGGKnownPPI DIPComplexes EcoCyc阴性数据ProteinsfromthedifferentfirstlevelofKEGGorthology KO compiledtobefalsePPIs ResultsProtein proteininteractionpredictedbyinsilicomethods Numberofoverlapbetweeninvolvedproteins 通过三种方法预测蛋白相互作用的功能分类 Cat1 Informationstorageandprocessing Cat2 Cellularprocessesandsignaling Cat3 Metabolism 评估 PP 系统发育谱 GN 基因临近 GF 基因融合 Conclusion 三种方法具有不同的预测能力 基因临近具有最高的准确性与覆盖率 每种方法都有它的偏差 利用蛋白复合体信息获得的蛋白质相互作用数据相对简单且准确 ResultsGenome wideproteinnetworksofE coliO157H7 基因表达 相关mRNA的表达 假如在不同实验条件下不同基因按照其表达水平能够被聚类到一组 那么这些基因可能具有功能相关性 这样预测的功能相关性能够用来预测蛋白质间可能的相互作用 Microarrays用于大规模检测基因表达 Introduction 流程 疟原虫 P falciparum 侵入人体红细胞后基因的共表达 ForestGreen earlyPurple middleGray lateGreenYellow early middleBlue early lateBlack middle latePink early middle late GenomeResearchVol14 1060 1067 2004 综合运算 MarcotteE etcNatureVol 402 83 86 1999 blue membranefusiongray chromatinstructureGreen cellstructureyellow lipidmetabolismred cytokinesis Results genome scaleproteininteractions Results Crosstalkbetweenandwithinfunctionalgroups Results Crosstalkbetweenandwithinfunctionalgroups 移动性与趋药性 Results Crosstalkbetweenandwithinsubcellularcompartment PNAS Vol 104 8685 90 2007 人类疾病网络 与相似病症相关的基因表现出更高的相互作用可能性 它们的转录本表达谱也表现出相似性 预示着存在疾病特异性功能模块 人类关键基因似乎编码在多种组织中都表达的节点蛋白 这预示着在人类相互作用组中疾病基因也可能扮演着中心角色 然而 大量的疾病基因并不是关键基因 也并非节点蛋白 它们的表达模式表明它们通常位于功能网络的边缘 基于选择的模型能够解释关键基因与疾病基因之间这种观测的差异 并预示由体细胞突变产生的疾病不应在功能网络的边缘 PPI网络的特点 功能相关蛋白模块一起执行功能的蛋白质群体被定义为一个模块 例如一个代谢途径或趋药性控制网络 在不同生物体内蛋白质相互作用具有共同的拓扑结构 无限网络 ScaleFreeNetwork 蛋白质之间的联系分布符合幂律分布 P k k 既存在许多蛋白之间可能只有少数的相互作用 而少数蛋白之间可能存在大量的相互作用 高联结度的蛋白 hubproteins 可能比低联结度蛋白更重要 在PPI网络中 顶点之间的路径倾向于最短且基因组位点临近的趋向于密集相关 蛋白质相互作用数据库 BIND BiomolecularInteractionNetworkDatabaseDIP DatabaseofInteractingProteinsPIM HybrigenicsPathCallingYeastInteractionDatabaseMINT aMolecularInteractionsDatabaseGRID TheGeneralRepositoryforInteractionDatasetsInterPreTS proteininteractionpredictionthroughtertiarystructureSTRING predictedfunctionalassociationsamonggenes proteinsMammalianprotein proteininteractiondatabase PPI InterDom databaseofputativeinteractingproteindomainsFusionDB databaseofbacterialandarchaealgenefusioneventsIntActProjectTheHumanProteinInteractionDatabase HPID ADVICE AutomatedDetectionandValidationofInteractionbyCo EvolutionInterWeaver proteininteractionreportswithonlineevidencePathBLAST alignmentofproteininteractionnetworksClusPro afullyautomatedalgorithmforprotein proteindockingHPRD HumanProteinReferenceDatabase ManuallycuratedInPrePPI ThePlatformforPPIformicrobial http atpid biosino org UniHI 统一的人类相互作用组UnifiedHumanInteractome UniHI是一个包含计算的以及实验得出的人类蛋白质相互作用综合数据库 建立该数据库的目的是整合多个功能图谱 从而为研究人类相互作用组提供灵活而直接的接口 其第一个版本中包含18500个人类蛋白和178000个直接相互作用对 目前的蛋白总数已经达到了55 942个 非冗余蛋白数量为21 275个 包含192 77对相互作用 构建相互作用图谱的方法 酵母双杂交 Yeasttwo hybrid Y2H basedmaps 酵母双杂交的方法利用两个融合蛋白进行筛选 其中一个诱饵蛋白与结合域融合 一个捕捉蛋白与激活域融合 当两个蛋白相互作用的时候能够启动报告基因的表达 文献读取 Literature basedinteractionmaps 蛋白质相互作用用人工读取或计算机文本挖掘的方法查找文献中的蛋白质相互作用 直系同源 Orthology basedinteractionmaps 该计算方法假定相互作用的蛋白共进化 利用其它物种中的直系同源蛋白的相互作用来推测人类的蛋白质相互作用 UniHI中包含的蛋白质相互作用图谱 MDC Y2Hmap 利用酵母双杂交方法筛选4456个诱饵蛋白和5632个捕获蛋白 CCSB Y2Hmap 利用酵母双杂交的方法筛选8100个蛋白中存在的相互作用 HPRD COMPmap 利用人类蛋白参考数据库监督的文献搜索构建 HPRD BINmap 利用监督的文献搜索构建 BioGridmap 利用监督的文献搜索构建 IntActmap 利用监督的文献搜索构建 REACTOMEmap 利用监督的文献搜索构建 BINDmap 利用人工读取及监督的文献搜索构建 COCITmap 利用计算机文本挖掘方法构建 依据是相应的蛋白在NCBI的Medline文献数据摘要中频繁的同时出现 该方法无法界定两个蛋白之间是物理相互作用还是功能相互作用DIPmap 利用人工读取文献中的相互作用蛋白 ORTHOmap 利用酵母 果蝇及线虫的相互作用推测的人类蛋白质相互作用 HomoMINTmap 利用其它物种以及存储在MINT数据库中的数据 应用直系同源的方法预测人类蛋白质相互作用 OPHIDmap 利用实验中得到酵母 果蝇 线虫及小鼠中的蛋白相互作用预测人类蛋白相互作用 UniHI中包含的相互作用图谱 UniHI数据库中的网络描述 不同网络之间共有的相互作用 不同网络之间共有的相互作用 Graphicalrepresentationofthecombinednetworks 包含相互作用 分子复合体 和代谢途径等信息利用COG数据库中的直系同源信息最新的基因组和蛋白信息有SwissProt维护 http string embl de Domine 蛋白结构域相互作用数据库 DOMINE是一个用于预测蛋白结构域 domain domain 相互作用的数据库 其中包含来自PDB中的相互作用信息 还有一些利用8中不同计算方法预测的蛋白质相互作用信息 DOMINE包含从4349种蛋白中预测的20 513个结构域 结构域 domain domain 相互作用信息 其中17 781个至少来自两种计算预测方法 在17 781个预测的蛋白质相互作用对中 3 143个是高可信度的预测结果 预测采用了多种信息资源 730个是中可信度的预测结果 两个结构域属于同一个生物学过程 具有相同的GO分类 余下的13 908个是低可信度的结果 PF00049 ThemammalianPPIs resourcesarefromtheirownPPIassays extractedandprocessedfrompubliclyavailabledatasources theDIPandBINDdatabasesandMEDLINEabstracts PPI的应用 蛋白质功能的预测PPI物理相互作用蛋白质相互作用网络遗传互作 调控关系代谢途径重建调控网络网络进化蛋白进化 不同蛋白具有不同的进化速率分子进化 多数规则分配 Majorityruleassignment NatBiotechnol18 12 1257 61 2000 Guiltbyassociation 全局最优化原则 Globaloptimizationprinciples NatBiotechnol21 6 697 700 2003 蛋白质功能预测 多数规则分配MajorityRuleAssignment Anetworkofprotein proteininteractionsinyeastBennoSchwikowskietal NatureBiotechnology18 1257 1261 2000 通过直接或间接蛋白质相互作用预测蛋白质功能 YHR105W YPL246C和YGL161C是未知功能蛋白 Akr2是是一个参与胞吞作用的蛋白 因此预示YHR105W蛋白可能与此相关 这种潜在的功能也有非直接相互作用的Ypt1 Vam7 Yip1和Pep12提供辅助证据 这些蛋白都参与囊泡运输和 膜融合 有哪些功能分类 YPD MIPS GO COG 在分类组合中使用越强的限定条件 功能预测的成功率越低 Howtoassignthefunctionstothoseproteins 全局最优化原则 Globalproteinfunctionpredictionfromprotein proteininteractionnetworksVazquezAetal DepartmentofPhysics UniversityofNotreDame NotreDame Indiana46556 USA avazque1 nd eduNatBiotechnol21 6 697 700 2003 Majorityruleassignment 在多数情况下 只有少数未分类蛋白能与一个或更多已知功能蛋白之间存在相互作用 与已知功能蛋白相互作用的蛋白并不普遍地具有共同功能 为分类的蛋白如果与一个或多个未分类蛋白相互作用 那么这个未分类蛋白进行功能分类的时候 先对其它的未分类蛋白进行分类 然后这个未分类蛋白的分类必须与那些经过分类预测的未分类蛋白功能相一致 Globaloptimizationprinciples 具有相同功能分类的相互作用蛋白的数量的得分与整个未分类蛋白的功能分类相关 模拟退火技术 GlobalNetworkMethod YNL127W 2 4 YDR200C 3 4 10 YLR238W 12 细胞生长出芽 细胞极性 纤维形成细胞周期检查点蛋白细胞质分裂其他转录活性 出芽 细胞极性 纤维形成 信息素相应 性别特异性细胞质分裂其他信息素相应活性 RNA合成tRNA合成其他信息素响应活性 转录调控胁迫相应其他信息素响应活性 全局最优化原则与多数规则成功率的比较 成功率的定义是预测的功能与实际功能分类一致的蛋白的百分比 在全局最优化原则中应用了两个不同的分类级别 分类级别1包含了424个类别 分类2包含20个类别 k为相互作用蛋白的数量 nk是有多少蛋白具有k个相互作用蛋白 Results Predictionoffunctions FromPNAS101 2888 2893 2004 PPI网络的构建 将实验数据与生物信息学预测数据整合在一起 FunctionalComplexesoftheHumanNucleolome MolCell22 285 95 2006 HumanExosome Na veBayesClassifierApproach 1 Thepriorodds thechanceofchoosingapairofinteractingproteinsfromallproteinpairsThelikelihoodratio theprobabilityofobservingthevaluesinthepredictivedatasetsgiventhatapairofproteinsinteractsdividedbytheprobabilityofobservingthevaluesgiventhatthepairdoesnotinteract f2 Inthespecialcaseinwhichthepredictivedatasetsareconditionallyindependentornonredundant thelikelihoodratiocanbecalculatedastheproductofindividualdata setlikelihoodratios f3 Na veBayesClassifierApproach 2 Knowninteractionsareshowningrayandpredictedinteractionsinred ZNF207waspredictedandexperimentallyconfirmedtointeractwithBUB3RSU1waspredictedandexperimentallyconfirmedtointeractwithLIMS1 NatureGenetics38 285 293 2006 ComparisonofanmRNA3 endprocessingsubnetworkfromwormY2Hstudy left andcorrespondinghumansubnetwork right DistributionofPPIsforessentialornonessentialgenes log10scale a CorrelationofsubcellularlocalizationofproteinswithPPIs b CorrelationofdiseasecategorieswithPPIs GeneRegulatoryNetworkAnalysis REGULATORYCIRCUITAreactionnetworkthatcaninvolvetranscriptionfactors promoters enzymes structuralgenes functionalRNAsandmetabolites Regulatorynetworkscontrolactivationofgenesindevelopment inthecellcycleandintheactivationofmetabolicpathways WearesnowedunderbyallthelittleArrows PNASVol101 16 5934 39 2004 构建相互作用网络的资源 IntegrationoftheavailabledataPubMed蛋白质蛋白质相互作用代谢和信号转导途径来自蛋白质组和其他资源的实验数据转录因子和它们结合位点信息 PPI数据 Howtocombinethesedataefficientlytoimprovethepredictionaccuracy ThreeMethods TocombinethesedatatoselectsetsofgenesTocombinethesedatatogivetheconfidenceofdifferentgeneregulatorystructureToadjustthenetworkstructureadaptivelyaccordingtotheexperimentaldata HowtoInfer ExistingmethodsCARRIE NucleicAcidsRes 2004 32 179 188 GRAM Nat Biotechnol 2003 21 1337 1342 Correlatinggenepromotersandexpression Bioinformatics 18 s172 s180 Selectclustersofcoexpressedgenesandlookintothepromotersequencesaroundthesegenesorgenome widelocationdatafora signal thatcouldpotentiallyexplaintheircoregulation Tec1 Ste12 Sok2 Phd1 Mga1 andFlo8bindtodiscretesitesacrossall16chromosomesofS cerevisiae Tec1 red Ste12 blue Sok2 yellow Phd1 pink Mga1 orange Flo8 green GENES DEVELOPMENT20 435 448 2006 BindingbyTec1 Ste12 Sok2 Phd1 Mga1 andFlo8correlatewithpseudohyphal expressedgenes Acomplexnetworkisformedbythepseudohyphalfactorsandtheirdownstreamtargets 鉴定杨树和拟南芥中新的调控模块 GenomeBiol 7 R103 数据和方法 DetectionofTFBSusingTwo wayclustering IdentificationofindividualTFBSsusingco expressedgenes ApplytheClusterAffinitySearchTechnique CAST algorithmtothedatasetmeasuringtheexpressionof19 173Arabidopsisgenesover489differentexperiments 1 168AffymetrixATH1slides Yield122clustersofco regulatedgenescovering5 664genes RunMotifSampler applyingthenetwork levelconservationfilterandremovingredundantmotifs 34motifswithasignificant pvalue 0 01 Network levelConservationscore NCS 25oftheidentifiedTFBSscanbefunctionallyannotatedbasedonoverrepresentedGOBiologicalProcessorMolecularFunctiontermsinthesetofputativetargetgenes Nearly60 20 34 ofallmotifscorrespondwithknownplantregulatoryelements Correlationbetweencis regulatorymodulesandclustersofco expressedgenes 代谢途径重建 CellWallBiogenesis Exampleofabacterialregulatorycircuit MetabolicNetworks Metabolicnetworksindifferentorganismshavethesametopological ScaleFreeNetwork forwhichP k followsapower law P k k Newnodesarepreferentiallyattachedtoalreadyestablishednodes Strongrobustnessagainstrandomerror Someofthesubstratesexistinalltheorganismsandhavethehighconnectivity Thenetworkdiameters theshortestbiochemicalpathwayaveragedoverallpairsofsubstrates areconservedinallorganisms efficientlyrespondtoexternalchangesorinternalerrors 拟南芥 Arabidopsisthaliana 全基因组水平蛋白质相互作用注释 蛋白质相互作用预测的方法 直系同源相互作用数据集Orthologinteractiondat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论