




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、drug-target network chensheng 摘要 the global set of relationships between protein targets of all drugs and all disease-gene products in the human proteinprotein interaction or interactome network remains uncharacterized. we built a bipartite graph composed of us food and drug administrationapproved d
2、rugs and proteins linked by drugtarget binary associations. the resulting network connects most drugs into a highly interlinked giant component, with strong local clustering of drugs of similar types according to anatomical therapeutic chemical classification. topological analyses of this network qu
3、antitatively showed an overabundance of follow-on drugs, that is, drugs that target already targeted proteins. by including drugs currently under investigation, we identified a trend toward more functionally diverse targets improving polypharmacology. to analyze the relationships between drug target
4、s and disease-gene products, we measured the shortest distance between both sets of proteins in current models of the human interactome network. significant differences in distance were found between etiological and palliative drugs. a recent trend toward more rational drug design was observed.1.人类药
5、物靶标蛋白与疾病相关基因产物之间蛋白-蛋白互作关系的研究还不是很明朗。2. 我们建立了一个经fda认证的药物与药物靶标蛋白的关联图。3. 网络中的最大组分包含了大部分的药物;按照atc分类的一类药物在局部有非常高的聚类系数;药物倾向于连接已经作为靶标的蛋白。4. 通过对fda正在进行调查的药物进行分析,发现实验中的药物倾向于关联不同功能的靶标蛋白。5. 通过分析配对的药物靶点与疾病相关基因产物的最短路径,发现治标药与治本药之间有很大的差异。方法n药物数据库:从drugbank数据库中下载了4252种药物(药物信息以及靶点信息),其中1178已经经fda认证,另外3074个实验性药物。(dtn)
6、nomim:包含被归为22类的1284个病症,以及1777个疾病相关基因。(hdm) 药物及靶点信息n拓扑学测度度:连接节点的边数最大组分:网络中相互连接的最大组分聚类系数:ci = 2n/ki (ki 1),ki指节点i相邻接的节点数;n指ki个节点间边数。ci=1表明它是这个完全连接类的中心。n随机网络:随机的dt或tp网络,必须保证药物的数目和药物靶点蛋白的数目一致。n药物时戳:drugfda数据库提供药物被认证时间,emot数据库筛查具有明确靶点信息的药物。nppi:通过文献找寻蛋白互作,酵母双杂交进行验证(酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白蛋白的相互作用 ),整
7、合后的网络包含了22052条边,7533个基因,最大组分包括7279个蛋白,其中253个是已被认证的药物的靶点并且1159个与疾病相关。n小鼠表型数据:通过对小鼠的基因剔除,如果提出的基因造成致死率比较高,这将这个基因在人类的同源基因作为必需基因,1267个必需基因,其中77个是已经认证药物的靶点,其中149个是药物(approved experimental)的靶标。nppi上药物靶点与疾病相关基因产物关系,通过药物指导找相关疾病,在找疾病相关基因,找出配对之间的最小距离。drug-target network靶点的名称,类型为膜受体心血管类药物药物分布横坐标是靶标数目;纵坐标是药物数。靶点
8、的分布横坐标为药物数纵坐标为靶点数1说明这个靶标只对应到一种药物,其纵坐标值说明这样的靶点的个数连接同一靶点的蛋白其化学有一定的相似蓝色、橘色红色分别代表不同的化学相识得分n由上面的两个表我们可以看出,部分药物对应很多靶标,同时也有些靶标对应很多药物,所以我们可以以此生成靶点蛋白网络(tpn)和药物网络(dn)drug network同类药有比较高局部聚类系数分为一类的药物区域分布一致最大组分中包含了476个药物nc图中每一条标示这一年新被认证通过的药物包含的靶点数,平均为27.7个每年,其中新引进的靶点数为平均每年6.3个nd图中蓝颜色的表示与以前药物有共同靶点的药物,红色表示这些药物的靶标
9、是都是新靶标。每年19.6个药物被认证通过其中17%是“jump drug”但是其包含了67%的新靶标。(crawling drug 可能也包含新靶点,但是他只要有就得靶点,他就不是jumping drug)n图中说明了新药物趋向去关联已知的靶点,针对新靶点的药物只占一少部分。tpnexperimental drugsn3074个药物为实验性药物,其中至少包含一个已知的靶点的药物有808个,加入这些药物,药物靶点将增加到1011,tp网络的最大组分将达到725;d网络的最大组分包含的节点达到了1259。app药物网络的最大组分是476;随机网络是788,说明该网络的组分比较多。从tp网络中也能
10、看到这种趋势。随机网络与药物网络最大组分发生变化,但幅度不同。n从图a中我们可以看出了,药物网络的最大组分包含的节点数明显小于随机网络的最大组分。说明相对一个随机的网络来说,药物网络是一个包括了更多小类的网络。n从图c中我们可以看出,随机网络最大组分数增加了1倍,但是药物网络的最大组分增加到了大约3倍。最大组分相对来说变大了,说明这些实验性的药物偏向于连接已经被接的靶点。n从图b和d的比较能看出这种趋势。从上面的两个图中我们可以看出ed的最大组分和随机的差不多大,显著的比app药物网络最大组分大,说明药物趋向于更多的聚在一块,这就要求这些药物必须包含多个靶点。从右图我们可以看出et最大组分数大
11、于随机网络说明更多的靶点连接在一起,也能说明药物的靶点多样化。ep随机增加了靶点之间的链接图中非常明显的是tpnexp的聚类系数明显大于了tpn;由聚类系数的算法我们知道:平均聚类系数增高说明靶点与靶点之间的关联增多,靶点之间的关联增加说明共享这几个靶点的药物争多,也说明药物靶点多样化。从左图中我们看到膜靶点占了62%,加上et之后,膜靶点占了42%有一个显著的变化,但从右图我们可以看出从96-06年之间通过认证的药物膜靶点的比例是69%,并没有太大的变化。这是由于膜靶点的药物更容易与药物结合,发挥作用。但从et来看新药的研发也更注重于其他位置的靶点。drug targets and esse
12、ntialityessentiality:通过基因剔除的方法确定基因是否是必须基因,通过小鼠基因追溯人的必须基因,其基因产物一般在网络中形成hub。并且与其他gene共表达,没有组织特异性。n全部蛋白中必须蛋白大约占40%,而药物靶点蛋白中必须蛋白只占大约17%,从ep来看,必须蛋白所占比例更小,表明新药研发并不趋向于必须蛋白。图中第一列是全部蛋白的平均度;第二列为tp的平均度,第三列为tp+exp的平均度,第四列是疾病的平均度,第五列是必须蛋白的平均度。通过检验靶点蛋白的互作明显高于全部蛋白的平均度,但明显低于必须蛋白的平均度。从tp和tp+exp比较来看,exp蛋白互作相对来说比较低。b:
13、通过共表达系数的比较tp明显低于必须基因tp的组织特异性比较高但exp的组织特异性低drug targets and human disease gene1284个病症,1777疾病基因,166个基因编码药物靶点蛋白,其中71(43%)个基因对应多种疾病,对于ed来说210个靶点蛋白在hdg网络中,其中54(26%)与多种疾病相关。说明基于疾病基因靶标的药物更倾向于只针对某一特定疾病。hdntp的平均度低于疾病相关蛋白的平均度;ep更低于疾病相关平均度;ep的特异性高。由于ep包含的疾病相关蛋白多于app靶点,表明现在的药物研发开始针对疾病相关基因。从hdg网络中我们可以看出,药物靶点曾区域性
14、特点;如果靶点不倾向于聚类,则从靶点自身出发与从随机的节点出发将一致;但我们从图中可以看出:在从靶点出发的其附近靶点的比列明显高于随机出发的节点。说明药靶在hdg网络中倾向于聚在一起fraction of target proteins while applying a breadth-firstsearch starting from either a target protein or a random protein in the hdg network with respectto distance.n药靶在各种疾病中的分布drug targets and disease genes
15、on ppin根据药物说明关联药物靶点与疾病基因;n计算靶点与疾病基因产物在ppi上的最小距离。n按照距离计算配对药靶与疾病基因所占的比列。对照组是随机的匹配药靶与疾病基因。na中距离为0和1的比例要大于随机部分,说明一些药物设计是针对疾病基因的;nb中96之后短距离的比重有明显升高,说明了药物设计的进步,治本药的比重由所提高。n图中距离远的部分几乎和随机一致说明姑息药物占大部分。n从图中我们可以看出癌症、内分泌、精神类疾病的平均距离小于随机;而代谢、肌肉类的大于随机的。n这是由于大部分的抗癌药是针对致癌基因或肿瘤抑制因子设计,所以平均路径会小于随机。 而代谢类药物可能在代谢网络中会比较近。npcc皮尔森相关系系数,靶点与靶点蛋白间表达相关系数,可以看出靶点蛋白间趋向共表达。n药物与疾病基因配对的pcc,取最大值n总体小于随机pcc;但在尾部有一个峰值,是由于部分药物的靶点就是疾病相关基因产物。n神经、呼吸道、内分泌相关系数比较高;肌肉、免疫的相关系数比较低,这个结果与上一结果(36)页有一定的相识性。小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论