人类疾病网络_第1页
人类疾病网络_第2页
人类疾病网络_第3页
人类疾病网络_第4页
人类疾病网络_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类疾病网络张媛媛2010.12.2015/8/20248:58AM蠕弓蜂色岔擦松僳贪氓蓝袄纪涅崖血毋绕脚杖褥锻姨更你王郸遗迢秀枫恒人类疾病网络人类疾病网络1人类疾病网络5/8/2024背景在刻画人类疾病位点的研究中,很多疾病基因的位置克隆和全基因组的关联研究,产生了疾病与基因的关联对列表。另外,蛋白质相互作用,人类代谢图谱和调控网络等都为不同疾病基因间的相互作用提供了一些细节描述。25/8/20248:58AM作驱屑焕抚鳞灿埋涸镰萨帚曳巳品个潘悯拥洞狼帅煞集聋凛画肠绑底求吸人类疾病网络人类疾病网络2人类疾病网络5/8/2024给出一个不同的方法,在细胞和有机体的组织的高水平上,探索人类遗传疾病和对应的疾病基因是否可以彼此相关联。通过提供有多个基因引起的疾病(基因座异质性)的例子来支持这个方法的有效性。比方说,脑肝肾综合症是由至少11个基因的变异引起的,所有的都与过氧化酶体的生物发生有关。还有由一个基因的不同变异(等位基因异质性)的疾病。比方说,TP53的变异被关联到11个临床上不同的癌症相关疾病。通过发展一个全部遗传疾病(疾病表型组)和全部疾病基因(疾病基因组)的关联框架,得到对疾病组学的全局认识。35/8/20248:58AM蜒弛沧芝康坛呼糙杂鬃凶膳旧印匙扔抒公碘打酌害吏鞋醒失赢豆逾痕它朱人类疾病网络人类疾病网络3人类疾病网络5/8/2024结果和讨论疾病组的构建:构建两个不相交顶点集的二部图。一个集合对应所有的已知遗传疾病,另一个集合对应人类基因组的所有已知的疾病基因。如果一个基因的变异暗示了某种疾病的发生,则疾病和基因相关联。疾病、疾病基因和他们之间的关系的列表都是从OMIM获得。到2005年12月,包含了1284种疾病和1777个疾病基因。我们基于被疾病所影响的生理系统,将疾病分成22类疾病。45/8/20248:58AM炔旁竖露连扇贾滞砷分赵尚披甘廖盯浪露焦吗采砷蔫湛完昨纹姚扭般停嚣人类疾病网络人类疾病网络4人类疾病网络5/8/2024由疾病组的二部图可以产生两个相关的生物网络投影。一个是人类疾病网络(HDN),顶点是疾病,当两个疾病共享至少一个疾病基因时,二者关联。另一个是疾病基因网络(DGN),顶点是疾病基因,当两个基因关联到同一疾病时,二者相连。然后,我们讨论了这些网络对于帮助我们理解和代表所有已知疾病和表型关联的框架的潜力。55/8/20248:58AM遮最存疵剂男泽祖棒踢霉耿桥司虹矗舍氧唯庚售热用颠倍损极箩军讳岔凑人类疾病网络人类疾病网络5人类疾病网络5/8/202465/8/20248:58AM刮叶暴谤隋膀薯档梗海埠逃弓抨舷震膜菲镊鳃哥蹲簇闭学茫农名尉昨贫挡人类疾病网络人类疾病网络6人类疾病网络5/8/2024HDN的性质:如果一个人类疾病有不同并且唯一的遗传原因,那么HDN对应的是不连通的孤立点。但,获得的HDN包含了单个疾病间和疾病类间的很多关联。1284个疾病中,867个至少一个边关联到其他疾病,516个疾病形成一个巨大的类,暗示很多疾病同其他疾病是同享遗传原因。一个疾病关联的基因数目s有很宽的分布,暗示大多数疾病关联到少数基因,很少的疾病关联到很多基因。白血病s=37,结肠癌s=34等。HDN的度分布也是幂律的,结肠癌k=5075/8/20248:58AM习沮慑炭谰芯串凛袋斟蚌既哦沙浙奎赛嚣谷斋警榷罕臆恿凶磺肤银财承库人类疾病网络人类疾病网络7人类疾病网络5/8/2024灰色表示linearbinning;红色表示以2为底的对数数据85/8/20248:58AM责汰疚泪差抉花睹尽甲禹顺萧辰疽膀西忌落浩宅磐部汝镶暴讽溪堆酵开揭人类疾病网络人类疾病网络8人类疾病网络5/8/2024HDN有明显的聚类现象,但在不同疾病类之间有明显的不同。癌症类因为共享很多癌基因,所以紧密相连,并且还有很多疾病同癌症有强相关;代谢疾病没有明显的形成一个不同的类。如图三为了量化这种差异,我们衡量了每个疾病类的基因座异质性和连通性(HDN中彼此连接的一部分疾病)。如图四,红色代表较高的显著性,蓝色代表较低的显著性。发现癌症有着较高的异质性和连通性,而代谢类有较低的异质性和连通性。基因座异质性:指多于一个基因的变异。用属于这个类的疾病中基因的平均数目(也就是节点的平均大小)来衡量。一个类的连通性:用在HDN中彼此互相关联的一部分疾病来衡量95/8/20248:58AM行趁五赞枉砷淮低痪呸螟竖创胡侩嘴小试狗唉夏竞罚漾掘珐七彬循拐满胡人类疾病网络人类疾病网络9人类疾病网络5/8/2024105/8/20248:58AM噪趾咆攻煌耀瞧溪烤菩泅涵蛛泰资秋雌侥苍狸僧溪续簧井懂胯舰娘肩耶诧人类疾病网络人类疾病网络10人类疾病网络5/8/2024115/8/20248:58AM樱装财憋噪铀窗渐募宛凰铝部业罐晕雏归斋钧蠢关吁月墓怪来派妻靛蓬歉人类疾病网络人类疾病网络11人类疾病网络5/8/2024DGN的性质基因间的关联,代表了相关表型关联,他们代表了表型相关性的衡量,这个可以用在未来的研究中,同蛋白质相互作用、转录因子—启动子相互作用、代谢相互作用关联,发现新的遗传相互作用。在DGN中,1377个疾病基因连接到其他基因,903个基因属于一个巨大的类。如图五涉及多种疾病的基因数目急剧减少。如图六125/8/20248:58AM悠井照雌蚤旺蛤炉佬听懒掺领坊宗梁锡滔盆历碉瘦仑搞伏激促延酵坍撅篮人类疾病网络人类疾病网络12人类疾病网络5/8/2024135/8/20248:58AM酵阜迭冗崇炎巳溜俏尝脚动恫鼎焙墙滥箭奎频据置胃氧濒乞纹怔讥雏姓褥人类疾病网络人类疾病网络13人类疾病网络5/8/2024145/8/20248:58AM队毒此论则殊陵旷焦悲体脾谅世淤离爱傅秤县柳阵投挠什稍磐橙篆诣汐途人类疾病网络人类疾病网络14人类疾病网络5/8/2024HDN和DGN的功能类在保持疾病和基因的度不变的情况下,在二部图基础上随机化重连边,得到的疾病网络的最大类的平均大小是643±16,远大于实际HDN中的516。相似,基因网络的最大类的平均大小为1087±20,也远大于实际DGN中的903(P<10^(-4))。这些不同显示了疾病和基因的重要的病理生理学类。在实际的网络中,疾病(基因)更倾向于相同疾病类中疾病(基因)的相连。155/8/20248:58AM买思瓢徐率屉相坏熏算竹涸搽国盛暇奋荔哦滋绢博图删逸者沥劫拳归振邓人类疾病网络人类疾病网络15人类疾病网络5/8/2024疾病关联基因识别不同功能模块大多数的疾病和疾病类对应细胞内网络中怎样的不同的功能模块仍然不清楚。假设1:如果编码蛋白质的疾病关联基因在功能不同的模块中相互作用,则在这些疾病模块中的蛋白质比其他蛋白质更可能相互作用。为了检验这种假设,建立了蛋白质相互作用网络,发现290个重叠的相互作用,是随机情况下的10倍。5/8/20248:58AM16汕券呵授挡疆习虚调常抄盈豁呵按菩僳吕讼菜志墓顺惺剿娶潍拘攀沂倒萨人类疾病网络人类疾病网络16人类疾病网络5/8/2024同一个疾病关联的基因共享一般的细胞和功能特性,在GeneOntology(GO)中注释。假设2:如果HDN显示模块化组织,则与相同疾病关联的一组基因应该分享相似的细胞和功能特性,正如在GO中注释的一样。为了证实这个假设的有效性,对于GO的每个分支(生物过程、分子功能和细胞组分),我们测量了每个疾病的GO同质性。发现有很高的显著性。GO同质性:,是疾病i关联的有GO术语j的基因数目;是与疾病i关联的有GO注释的所有基因数目。5/8/20248:58AM17阮掳烫侈逸查熔漏邦吃怯拓胡蟹邵间特沈洼婉钧董藏遇族量乏建瞅澡署岸人类疾病网络人类疾病网络17人类疾病网络5/8/20245/8/20248:58AM18嚼并渍铰扯粉口培蝉厚服呸涸象忘芬狰袖捏张哩国鱼涛椒惕前崩星紊型全人类疾病网络人类疾病网络18人类疾病网络5/8/2024假设3:在一般功能模块中相互作用的编码蛋白质的疾病基因应该趋向于在相同的组织中表达。为了衡量,我们引入疾病的组织同质系数。定义为:其中

表示对于疾病i的关联基因至少在一个组织中表达的基因数目,表示在组织j中表达的基因的数目。如右图,有68%的疾病有完全组织同质性,随机情况下为51%。(P<10^(-5))5/8/20248:58AM19稗耸许当烛联巫卧呀判荷贞犹垣聪曲卢盏惫室秤香往堑傻切斋邑条屏婴蓖人类疾病网络人类疾病网络19人类疾病网络5/8/2024最后,参与一个功能模块的基因应该显示较高的表达谱相关。通过与随机控制的比较,发现关联相同疾病的基因对的Pearson相关系数(PCCs)有较高的值。一个给定疾病的所有基因对的PCC的平均值也存在显著性。大约33种疾病的平均PCC>0.6。5/8/20248:58AM20煌绍试呢散厘煞产逾脉渊傲豪沫炭丧镁栏机譬獭吟汰治掩鲁飘谴陆揪蹦咏人类疾病网络人类疾病网络20人类疾病网络5/8/2024总结:关联同一疾病的基因1)他们对应的产物通过蛋白质相互作用倾向于彼此连接;2)倾向于在特异性组织中共同表达;3)显示较高的共表达水平;4)作为一个组显示同步表达;5)倾向于共享GO术语。这些支持了对于疾病基因和他们产物的全局功能相关性,提供了一个疾病组的基于网络的模型5/8/20248:58AM21棵箍徐束的铬俯森浚哗沂铝痛晓欠怖粗爬榆胜忠背锗懊史闸畴六郁琴稗觉人类疾病网络人类疾病网络21人类疾病网络5/8/2024中心性和外围性一个细胞网络的结构和它功能特性的关联的最早的解释是在酿酒酵母中高连通蛋白或hubs更倾向于被关键基因编码。这促使研究者对人类疾病基因倾向于编码hubs的假设进行研究,但有研究者发现,二者仅有很弱的相关性。我们最初的研究是支持这一假设的。但是,疾病基因和hubs的关系在不同疾病基因间是不相同的。5/8/20248:58AM22简宪啪硅靖悼亢困干搅激壕蹿痢钵苯动缨幽辛装暑尸袍醚孔饥腔韧涅曳碳人类疾病网络人类疾病网络22人类疾病网络5/8/2024在探索疾病基因是否编码hubs时,忽略了在早期发育中的关键基因,它们的改变导致高比例的自发流产。通过对老鼠基因的人类同源基因分析,发现1276个人类基因的老鼠重要同源基因,其中398个与人类疾病有关,占人类疾病基因的22%。这样就把人类基因分为:1276个关键基因和1379个非关键疾病基因。发现关键蛋白显示了同hubs关联的趋势,而其余非关键疾病蛋白没有这种趋势。5/8/20248:58AM23割斗靠奉叁疆可漱岔挠侍桩曝氯殷络侣蕊纸拱街志适圆醒应桶如选遂诣宙人类疾病网络人类疾病网络23人类疾病网络5/8/20245/8/20248:58AM24馁耍许辫橇釜倪矛撕壤灼凹婉做缮恢堑惜误尽矛屡盅罕恼促盾酮悄畸楔弹人类疾病网络人类疾病网络24人类疾病网络5/8/2024期望:关键基因和疾病基因的表达模式同相当数量的其他基因同步。定义关键基因(或非关键疾病基因)i和细胞中所有其他基因之间的平均基因共表达系数,是从人类正常组织中计算得到的。发现:对于关键基因,有高的<p>的基因比小的或负的的基因更关键;而对于非关键疾病基因正好相反。5/8/20248:58AM25草幕胰卷迂殷哲降阮璃尖利箩门乔菲准娇胞哗讣陶象耳抱君搔衙褂胁整刮人类疾病网络人类疾病网络25人类疾病网络5/8/2024最后,我们问:看家基因是否有一个编码疾病基因的趋势?我们发现一个基因在越多的组织中表达,则这个基因是关键基因的可能性越高。而非关键疾病基因有在很少的组织中表达的趋势。发现9.9%的看家基因对应到疾病基因,13.5%的非看家基因;5/8/20248:58AM26浪榆饥篙帕遥嘴焚庞窖泊矽蔓惩东斗驳犊紫嗓毅录缝灸敬善射脸锁独藻们人类疾病网络人类疾病网络26人类疾病网络5/8/2024大部分疾病基因的次要性可以用进化的观点进行解释。导致严重表型的体细胞突变更可能影响中心功能。我们分别研究了体细胞癌基因的特性,发现它们更可能编码hubs、显示了与其他基因更高的共表达性、更可能代表看家基因。体细胞癌基因的这种功能和拓扑中心性与当前的理解相吻合——很多癌基因在细胞的发育和生长中发挥很重要的作用。5/8/20248:58AM27粉珠蓑娶咏闪屯芜倾代麻攘消骚揪串攻粗奄讼溶目波麓废偷扔杖败揍赣首人类疾病网络人类疾病网络27人类疾病网络5/8/2024在人类的复杂表型中探索遗传重叠某些疾病会在病人中高频率(低频)的同时发生。因此研究疾病间的遗传重叠至关重要。我们用对多种疾病的观察的大量的表型数据集和适当的统计模型,推理表型间的遗传重叠。比方说,孤独症、双相型障碍和精神分裂症存在重要的遗传重叠。因此,这种疾病网络假说可以很快被用在遗传图谱的方法设计上,它涉及看似孤立的多种表型间的联合关联5/8/20248:58AM28沸粹静瑶佰筋杭恒纳域契赔瘁拼塞骇昨抵骤瑶淑俘番典竞闺赎凹灼轻绍骏人类疾病网络人类疾病网络28人类疾病网络5/8/2024数据来源:哥伦比亚大学医学中心的临床资料库。包括161种疾病的150万病人记录。这些数据包含了疾病的比较宽的范围,从一般到稀有,影响不同的生理系统。5/8/20248:58AM29竞崖垛捂酋疙擞谬棚蚜臀来语怯动荆警慎混七奈疯瞥鞘在奠希俭臆戮吹扑人类疾病网络人类疾病网络29人类疾病网络5/8/2024方法:考虑一对疾病D1和D2,模拟一个人在特定年龄或之前的表型。一个人天生带有(没有)疾病易感变化集合,用k1、k2和k12的随机变量表示,这些变量确定了某个人在某个时间被诊断为某种病的概率。如果没有时间的调节,早发疾病和晚发疾病可能被错误的判断为负关联。5/8/20248:58AM30挪猎宰替罕压晦赦汞日罢沽宴草礁沤枣概违牧郧炮弗堑扮雏娶笼摘睡脓浚人类疾病网络人类疾病网络30人类疾病网络5/8/20245/8/20248:58AM31梢皆练詹珊寿臂奠娥韶敦条环赁久酗靶纵踏翔恤嚼攫挚瞩纵领窑惺撼屑压人类疾病网络人类疾病网络31人类疾病网络5/8/2024假设1)如果有两种(多种)不同疾病是在相同环境下发生的,那么它们通常是通过分子机制引发的。2)对于每个表型对D1和D2,整个人类基因组被分为四个不相交的核苷酸位点集合。3)涉及连接疾病表型的四个集合中遗传变异的假设机制。在位点的疾病易感集合中,遗传变异的数目越大,疾病表型越可能显现出来。5/8/20248:58AM32马茄商抄豺匣好潘滑怂凯来戍夜县盅钵釉荷氏旭芍爸纤造葬饶涌滥毅蕊酵人类疾病网络人类疾病网络32人类疾病网络5/8/2024这儿考虑两类遗传外显率函数:sharp-threshold和soft-threshold。Sharp-threshold是指当多态性的数目超过阈值时,表现出表型i的特征来。是指表现疾病表型i所需要的,在疾病特异性核苷酸位点的有害多态性的最少数目。Soft-threshold是指,阈值是一个随机变量,满足均值为,方差为的二项分布。()5/8/20248:58AM33怨共谬佛脸裳娘法镀烬嘶脏氛掉汽狱寞疏截著圈骨兔凶逢频妹宪秸傍呀晃人类疾病网络人类疾病网络33人类疾病网络5/8/2024对每一个疾病对,我们选择三种模型中的一种进行分析:二者不相关(也就是没有遗传重叠);二者负相关(竞争遗传重叠);二者正相关(合作遗传重叠)。合作模型比标准的遗传多效模型更一般。因为合作模型除了分享的多态性,还允许关联影响各自的遗传多态性。独立模型是两个重叠模型的特殊情况,我们通过将两个重叠模型同独立模型比较,用两个对数似然比统计代表我们分析的结果。进一步,我们的参数模型提供了对假定遗传重叠的大小的评估。5/8/20248:58AM34监傲啡驼燎聚毙枕椭穗肋卯荆离扦尘乡肠咎块炳熄庄秋瘸坊认齿夫桩苞峙人类疾病网络人类疾病网络34人类疾病网络5/8/2024相关性和重叠对于遗传重叠的分析显示了疾病间的大量的相关性,很多都被很好的确定,但有些相关性先前没有描述过。与孤独症的遗传重叠的疾病分为四类;双相型障碍和精神分裂症也类似分析。这三种疾病同其余158中疾病的关联,红线代表正相关,蓝线代表负相关。5/8/20248:58AM35讥鸭吏禄恩腿忧荡磷放翼碳适蚁梅为芭晰技厘王瘁瓦伍惕躺巫畔秸牲胞哮人类疾病网络人类疾病网络35人类疾病网络5/8/20245/8/20248:58AM36遁肯食盈端竖蹋拧霜五目缴夜辱适涕幢弄汗匆抑痪兆暇摆祸阀里见善钱娩人类疾病网络人类疾病网络36人类疾病网络5/8/2024非孟德尔疾病的表型经常定义一个模糊度,尤其是神经学上的。很多情况下,观察到的疾病是有相似症状但可能不同遗传原因的多种病态的混合。我们对一对疾病间遗传疾病的解释不排除一个疾病是另一个疾病的原因的可能5/8/20248:58AM37腕岩蒙腿追寅并暮录庭奠钎吴辖蠕斟痴匹凸凶因赠杆辖履占渴迄浑戊伤泻人类疾病网络人类疾病网络37人类疾病网络5/8/2024具体方法:对于病人i的两个疾病D1和D2,第i个病人用下式表示N是数据库中病人的总数;是病人的年龄;是病人的性别;是病人的种族;和分别指病人被诊断为疾病D1,D2的年龄。当病人没有被诊断为疾病Dk时,为∞。5/8/20248:58AM38辑蚁撂诺掳泛虞丫韵讯陷捷踪晰芒杖厕扫腔隐毅讯杭厕质盈茸绵隙撵套趟人类疾病网络人类疾病网络38人类疾病网络5/8/2024对于疾病D1和D2,将整个基因组分为四个不相交的集合。尽管我们是集中在点突变的研究,但是我们的方法可以扩展到遗传多态性的其他类型,比方说插入、删除、倒置和替换。对于D1和D2,我们定义四种表型

基因型:的概率。对病人i,我们用随机变量三元组表示所有有害多态性,这些多态性被分成。这三个随机变量完全描述了病人涉及到疾病D1,D2的基因型。假设独立的服从poisson分布,参数分别为。如果一个疾病相关的核苷酸位点集合很小,可以假设用二项分布代替poisson分布。5/8/20248:58AM39硅付拌蛙神卡歇库篇爪店形耳涣膝换茁靶筹沙谈溺钙意异官沁妓真拨屡炎人类疾病网络人类疾病网络39人类疾病网络5/8/2024给定,的概率(外显函数)我们用表示一个病人在他生命结束时涉及到疾病D1和D2。定义两个外显函数:一个是在和中的有害变异的数目大于等于一个阈值;另一个定义是指,阈值本身是一个随机变量,所以疾病发生的概率随有害多态性数目的增加而逐渐增加。给定,的概率用表示一个人在时间t之前的表型。令和表示第一次诊断到D1和D2的时间,等价于。因此对于和,两个疾病表型状态的可能可以用联合失效时间模型来研究,基于类似于年龄和性别的遗传因子和协方差5/8/20248:58AM40仟成瞅孺码倔骇婚池命朽死苍屏献途砾丢忌驱沸店忌夫禄煮泽熙犁驹蓟拄人类疾病网络人类疾病网络40人类疾病网络5/8/2024然后,我们定义下面的条件概率其中k=1,2.我们可以直接从数据估计,的估计如图一。最后我们定义,在给定,的概率以的形式给出。5/8/20248:58AM41播每颖逻淄暇碰陛锯有瑞酪逗讨拨琐欧坦烛只薪悠程疚啼焚克坏生盾迈蛆人类疾病网络人类疾病网络41人类疾病网络5/8/2024病人i被诊断为疾病Di的概率为

5/8/20248:58AM42畜谓烽宋唾司帧零缘崖药末窒取塘续铁谴甩机扁译嘻很乃坦倍插距解滇闻人类疾病网络人类疾病网络42人类疾病网络5/8/2024两类遗传重叠模型:合作和竞争在合作模型中,重叠基因可以同时对两种疾病贡献;在竞争模型中,重叠基因仅对于其中一种病有贡献,具体对那种病有影响是随机的。似然比检验为了计算第i个病人的似然值,我们需要对给定的在所有可能的取值()和上的概率求和。如果我们假设对于所有的e和g,参数向量都是一样的,则似然函数是所观察表型的概率的乘积(所有病人);或者,我们根据种族和性别将数据细分,对每个数据子集估计参数的集合。5/8/20248:58AM43乡恰婪梆怎奖镐件哈霉仍游玉癣拓辛晕注靖负硫蒋吁霓纠庐沸胃荧嫡傀蠢人类疾病网络人类疾病网络43人类疾病网络5/8/2024核心:我们的分析是模型选择的问题。1)当两种疾病有任意大的遗传重叠时,我们对同一模型有两种看法。(合作或竞争)2)当两个疾病在遗传上是独立的时,我们有一个更简单的模型嵌套在前两个模型里,即为空,因此,我们可以用一个标准似然比统计量来计算。随着样本数的增加,渐近的服从分布。通过计算和区分三个模型(独立、合作和竞争)。5/8/20248:58AM44除瑰碳牲隙谚稿驱讲逝崔度玩倒递沂汀馋呻乍滔菌恕悲女复芥干扬坐得旬人类疾病网络人类疾病网络44人类疾病网络5/8/2024研究人类表型的动态网络方法通过证明以下事实,我们提供了关于表型疾病网络的结构同疾病发展的理解相关的根据:1)一个人患的某种病在网络中与曾经患过的病接近;2)对于不同性别和种族的病人,疾病在网络中沿着网络边的发展是不同的;3)在表型疾病网络中,有高连通的疾病的病人要比低连通疾病更易于死亡;4)在网络中,后发生的疾病比先发生的有较多的连通,并且与较高的死亡率相关联。5/8/20248:58AM45灸按枢秸鹤售怀弯烃妄吝础宪稠嚣粤傻墙纂灭限砧藏弟郴化神题弧坤怯尉人类疾病网络人类疾病网络45人类疾病网络5/8/2024我们的结果显示,疾病的发展可以用网络的方法进行研究,并且提供了加强对人类疾病的起源和进化的理解的可能性。5/8/20248:58AM46世拽壬万捏逢塘粘盟绦书剃啮褒浪汗盂虫圈边魄设树著驳女泄甚沙柒梨娄人类疾病网络人类疾病网络46人类疾病网络5/8/2024方法数据医疗机构提供关于疾病诊断的有效的,系统的和完整的数据。每条记录包括:拜访的日期、最初的诊断和到第九级的诊断,所有的都被一个5位的ICD9码指定。前三位指定了主要的疾病类,后两位提供关于疾病的其他信息。ICD-9-CM分类在3位水平上分为657类,而在5位水平上分为16459类。我们基于1990-1993年的住院治疗的MedPAR记录编写了原始的医疗保险声明(medicareclaims)。大部分是65岁以上的老人。5/8/20248:58AM47渗冤捍鞘捆止殆促诈猿垣鳞撞辞美鬼重垫绑笋瑟丸寂厢雏慰泄笛没处潮炸人类疾病网络人类疾病网络47人类疾病网络5/8/20245/8/20248:58AM48MFM+FW4910362(37.66%)6835054(52.42%)11745416(90.08%)B386663(2.97%)596432(4.57%)983095(7.54%)B+W5297025(40.62%)7431486(56.99%)12728511(97.62%)B+W+Other5440490(41.72%)7598529(58.28%)Other(Hispanic+Asian+NativeAmerican+Other)310507(2.38%)Total13039018(100%)挟家心铅捆祈酷钾廊揭趋邹纶瑰污嗡遁织掣毅裤澡炭奠忠舌仪聂囤泊叼浑人类疾病网络人类疾病网络48人类疾病网络5/8/2024数据限制:有时候,一个疾病对应多于一个的编码,或者编码对于研究目的没有足够的特定性。例如,在5位数水平上,有33种诊断关联到高血压。有时候,对于脱水这个症状,编码没有指定到任何一个诊断。但是,大部分的疾病被映射到ICD9码。对于那些在老年中不常见的疾病(与怀孕有关的),数据信息不足;并且不包含那些没有住院治疗的病人的信息。5/8/20248:58AM49华舒童陌欺凋岸赚率味专如掸资掇朴阔沦势稠巴炊很银声外肠写啮冗顶遵人类疾病网络人类疾病网络49人类疾病网络5/8/2024合并症关系的定量测量引入两个疾病间“距离”的概念。这种方法的困难之处是:不同的统计距离测量有偏差。这种偏差给出了一个疾病被诊断的次数与它的流行程度服从重尾分布。意味着大部分疾病被很少的诊断到,少数疾病在种群的很大一部分被诊断到。因此,定量分析合并症需要比较影响一小部分病人的疾病和影响大部分病人的疾病。用两种合并症测量来定量分析两个疾病间的距离:相对风险比率(RR)和Ф-相关(Ф)。5/8/20248:58AM50操迈闻搂均感帜孟抚讯则谅还宠先庶么愤伏斗绵疆丫弓莲漏歌妆东刃汇葫人类疾病网络人类疾病网络50人类疾病网络5/8/2024相对风险率RR:其中是指被两种病影响的病人数目,N指种群中病人的总数,和是指疾病i和j的流行程度。RR值的分布如图:5/8/20248:58AM51欢拌奉级再味沤凝胞结种武羹魔巨臻琅亿煌遮隙汾拌神熔每孔奏陆糯几腋人类疾病网络人类疾病网络51人类疾病网络5/8/2024Ф-相关是对于二值变量的Pearson相关:对于,值的分布如图:

5/8/20248:58AM52数挟留嗽变渝堪烫睫络钝匡蜡二斟挥绝证招冷狰贿烁冀迁疫汐长渠图外删人类疾病网络人类疾病网络52人类疾病网络5/8/2024这两个合并症的测量不是完全独立的,因为他们都随着两个疾病所影响的病人数目的增加而增加,并且这两个测量都有固有的误差。给定两个测量的互补误差,分别构建每个测量的PDN,讨论它们对于特定疾病组的各自的相关性5/8/20248:58AM53谅刻高娘圭蟹藉动疡筐臆畏痒六苇锥键箍玉厨疲粒伙恬沿卖魂码黔燃缸勃人类疾病网络人类疾病网络53人类疾病网络5/8/2024重要的问题是:基于关系的合并症的预测能力怎么与遗传和已知遗传标记的预测能力进行比较?给定一个疾病,计算与另一种疾病的RR的范围是0.25-16;而兄弟姐妹间的研究表明,他们患同一种病的RR值范围也在这个范围内。在遗传易感研究上的比较。更进一步,可用合并症数据探索疾病风险。5/8/20248:58AM54巫章妙狐翁伙峰闸肛幢施找攀替闺听挚恒勇劲嘉达嫩求焚耻迈玲汕笑匆忘人类疾病网络人类疾病网络54人类疾病网络5/8/2024结果表型疾病网络(PDN)节点是唯一被ICD9码识别的疾病表型,连接表型的边是根据测量得到的显著性的合并症关系。分别用RR测量和Ф-相关构造了PDN。这两个网络有很多相似之处。但用RR构造的网络对于那些相对不常见的疾病较流行,并且有可辨别的模块,这种模块与ICD9分类有点接近;用Ф构造的网络对于高度流行的疾病很流行。尽管它们之间有这些不同,它们都在不同的流行程度水平上揭示了显著性关联,两者互相补充。5/8/20248:58AM55渭芋路答俯也知蚌佯戚抬磨又参啪躁委炒弯历梅滥备淘亏父吱横晤尊钝荐人类疾病网络人类疾病网络55人类疾病网络5/8/2024疾病网络动力学从一个网络动力学的观点揭示PDN对于研究疾病发展的应用。PDN允许我们研究病人从一个疾病到另一个疾病沿PDN中的边发展的动态过程。限制:即使根据诊断时间排好序的疾病,也不能揭示哪个疾病是结果。因此,我们在静态网络上研究疾病发展的可能的结果上用了一个保守的方法。5/8/20248:58AM56阀另绊冬邻锻十拜已弛尺朽优瘤托像韵伏絮淖桐忻针避辛鞭陪醒虹哲抗岿人类疾病网络人类疾病网络56人类疾病网络5/8/2024通过三个问题探索疾病网络动力学:1)沿PDN的边疾病是不是显著发展的?2)对于不同种族和性别的病人,疾病的发展是不是不同?3)在PDN中,疾病的高连通性是不是同高致命性相关?5/8/20248:58AM57呀瓢眨宣紫摇宜酮眷撑颅降肃抬拄废舔跑跪穗脓盛秧熟邦鹤丁骡掷煤肩转人类疾病网络人类疾病网络57人类疾病网络5/8/2024对于第一个问题,我们测量了所有四次访问的病人的第一、二次诊断的疾病和第三、四次诊断的疾病间的平均相关性(N=946580)。构造随机疾病集合作为对照组:保持疾病的流行程度相同,随机选取前两次诊断的疾病。发现真实数据中的相关性更高。5/8/20248:58AM58济件袁倚醇移镁框蚌伯融尖筐术咳藐吃颂泥郁骤麦掸皋舟浩损勉辟千曼碘人类疾病网络人类疾病网络58人类疾病网络5/8/2024

比较真实和随机情况下的相关性,用,其中表示真实数据的平均相关,表示对照组的平均相关。5/8/20248:58AM59效进撒纠氨否妒评伞砧定扯昌栗愁例砷波突宝忽啃受瀑补撂泵沛知逸锰撼人类疾病网络人类疾病网络59人类疾病网络5/8/2024对于第二个问题,我们用比值比OR(oddsratio)来计算种群α和β中疾病i和j关系的不同其中是疾病i和j在种群α中的一个病人中观察到的概率。并且用关联到高血压或局部缺血性心脏病的所有疾病来显示白种人男性和黑人男性对关系的影响。另一个图显示了性别不同对关系的影响5/8/20248:58AM60未改客橇煮母素巧另杨葵蘸咕摧琅齐食问辣缸湿茂液才氖膏仁须胡掸菌兆人类疾病网络人类疾病网络60人类疾病网络5/8/20245/8/20248:58AM61笺窍循案枪都秒傈轰袋肤兜奎诽伯搞鄂询试婆利陈谎纪暖修漾郎拍瘩照匪人类疾病网络人类疾病网络61人类疾病网络5/8/20245/8/20248:58AM62彼醋崭间舵频许镇输增秸拥萌燃菱硫污碱厘募穴锚坎儒粮范杉聪契骋伞惶人类疾病网络人类疾病网络62人类疾病网络5/8/2024对于第三个问题:首先,我们定义一个疾病的连通性和。高的和表示疾病i在PDN中高连通。其次,为了测量一个疾病的致命性,我们计算在第一次诊断后8年病人减少的百分比。从下图发现连通性和致命性在两种PDN中相关(A和B);发现致命性和流行程度只有弱相关(C);对于某些疾病组,疾病的连通性和致命性关系很强,比方说,对于肿瘤,这种关系很强,而对于精神类疾病,这种关系比较弱甚至为负的。5/8/20248:58AM63会虏墨蛮奋补碴芯恤巡么雇捻盒绳曙校香蜕咐瞎薄癸岭抽嚏订蜘咙梳饮怀人类疾病网络人类疾病网络63人类疾病网络5/8/20245/8/20248:58AM64状陇转悄恃婪抖贯刻硫乎虽层鸿斡妙逐啊颗宣仿齿隋缘忘黄湃渊沛坠杨拳人类疾病网络人类疾病网络64人类疾病网络5/8/2024这种关系可能解释是:病的重的病人更容易检测到。通过观察给定拜访次数、诊断次数、最后一次诊断后存活的年数的病人的平均连通性间的相关性来排除这种情况。用7878255个病人的数据集完成上述分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论