传染病预测预警方法和模型_第1页
传染病预测预警方法和模型_第2页
传染病预测预警方法和模型_第3页
传染病预测预警方法和模型_第4页
传染病预测预警方法和模型_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,传染病预测预警 方法和模型,湖北省疾病预防控制中心 黄淑琼,2,主要内容,一、国内外传染病预测预警现状 二、传染病预测常用方法 三、传染病预测方法新进展 四、传染病预测预警体系发展方向探讨,3,世界卫生组织(WHO)大力宣传建立传染病预警系统的重要性和必要性,致力于强化现有的传染病监测系统,发展早期预警系统。 传统监测系统与早期预警系统的区别: 传统监测系统主要依靠医务人员的诊断信息追溯疾病的流行状况 早期预警系统主要利用疾病诊断之前的临床证据以及其它一些相关信息判断是否会有传染病爆发或流行的发生。,4,图1 传染病预测预警体系构成,传染病预测预警主要由传染病监测、传染病预测、传染病预警三大核心模块构成。,预测可视为一种工具,通过一些分析方法和模型把的数据资料转化为进行预警决策的信息,传染病监测是预警分析的基础,预警是监测的目的之一,也是预测技术在实践中的重要应用,5,一、国内外传染病预测预警现状,6,1、国内,2004年1月,传染病和突发公共卫生事件网络直报系统在全国范围内开始试运行,同年4月该系统正式启用,随后又在该平台上启动了全国艾滋病、结核病网络直报工作。其他各种疾病监测工作也逐渐构建在该平台之上,逐步实现公共卫生信息资源整合和共享。 2008年3月,全国传染病监测自动预警(时空模型)系统应用试点工作正式开始。 2007年7月,中国CDC信息中心启动了网络直报系统与医院信息系统(Hospital Information System,HIS)连接的试点工作,目的在于推进医疗和预防两大业务系统的互连互通,为更好实现传染病预测预警工作提供了强大的数据支持和信息平台。,7,图2 中国疾病预防控制信息系统,8,2、国外,2000年-2004年WHO帮助伊拉克、塞尔维亚、摩洛哥、马其顿和苏丹等国家相继建立了传染病早期预警系统。 2002年9月,伊拉克传染病控制中心用计算机处理监控数据,以促进传染病爆发的早期发现。 2002年10月,塞尔维亚公共卫生研究所建立探测疾病爆发的早期预警系统。 2003年1月,WHO与法国防疫研究所合作,支持摩洛哥的流行病和疾病控制局设计规范的计算机预警系统。 2003年5月,马其顿共和国卫生当局设计实现电子预警系统的行动计划。 2004年5月,WHO与其他联合国机构和非政府组织合作,在苏丹联邦卫生部制定了一个早期预警系统。,9,美国、加拿大、欧盟等国家和地区纷纷建立传染病预测预警相关体系和专门的机构,这其中有共同之处,也各具自身特色。 美国提出全面战略研究计划 加拿大建立全国统一的综合决策部门 欧盟采用集团型传染病监测预警系统,10,2.1 美国全面战略研究计划 美国的传染病监测预警系统非常全面,其主要特点是监测体系、实验室检测等方面技术先进且实力雄厚,并且注重合作和信息交流。 美国CDC注重与联邦政府部门和其他机构合作,共同进行疾病监测和预防控制工作。并且注重国际间的合作,与其他25个以上国家合作,提供国际性的疾病传播监管服务,实现早期预警,早期预防,从而避免急性传染病跨国流行。 美国的传染病监测预警系统的基础是有效的监测体系,是一个动态地、系统地采集、分析、解释和分发数据的体系。这个体系的主要任务是检测、调查、监视急性传染病发生和传播的特点以及评估预防和控制的效果。 1946年美国CDC成立后,建立了针对疟疾及热带传染性疾病的全国传染病监测系统。从1995年开始,CDC先后建立了各种急性传染病监测网络。2001年,CDC整合了全国100多个大大小小的各种专业监测系统,将全国疾病监视申报系统升级为“全国疾病电子监测系统”。,11,2.2 加拿大全国统一的综合决策部门 加拿大传染病监测预警系统是以监测为核心,确定国家传染病监测重点,加强系统内部合作,充分利用监测信息。 加拿大就传染病监测方面,省和联邦卫生部门通过流行病学咨询委员会传染病分会(简称ACE)达成共识,传染病监测由省级以下卫生部门执行,但整个监测行动由联邦政府统一协调和监督。 疾病监测不仅收集数据,还要编辑、整理、统计和分析数据,最后做出判断,同时参与特殊传染病的全球性监测。,12,2.3 欧盟集团型传染病监测预警系统 欧盟采用集团型传染病监测预警系统,其主要特点表现在注重集团内部多个国家的合作,为成员国对传染病防控提供交流的平台,同时注重国际间的合作。 1998年成立流行病监测和传染病控制网络,由监控系统和预警应对系统(Early warning response system,EWRS)两大支柱构成,当存在可能爆发潜在传染病并有向多国蔓延之势时,对欧盟委员会及其成员国发出警告,以便采取统一协调的应对举措。 EWRS要求报告疾病的范畴有三个方面:在某个欧盟成员国蔓延的传染性疾病;可能由病原体引起且有欧盟成员国间蔓延风险的疾病;需要欧盟及时采取协调行动遏制的死灰复燃的传染病。,13,二、传染病预测常用方法,14,1、定性预测 流行控制图法:季节性流行或周期性流行 比数图法:发病数呈正态分布的传染病 Delphi法:提供参考意见,要用进一步的调查来证实 2、定量预测 时间序列预测模型灰色模型:流行因素较稳定的疾病进行短期预测B-J模型(ARIMA):适用n50的非平稳时序列,是一种精确度较高 的短期预测模型 多因素模型: 2个或2个以上变量进行分析多元回归模型、神经网络模型 3、综合预测法,15,二、传染病预测常用方法,1、定性预测 定性预测是通过对当地传染病发生、发展规律及其有关因素的具体分析,判断该病即将流行的趋势和强度。 定性预测主要包括流行控制图法、比数图法、Delphi法等等。,16,流行控制图法: 1924年美国休哈特(W. A. Shewhart)首创,是对过程质量特性值进行测定、记录、评估,从而监察过程是否处于控制状态的一种用统计方法设计的图。 控制图法适用于各种分布的传染病,对于具有季节性流行或周期性流行规律的传染病,效果较好。流行控制图法方法简单,指标容易得到,在疾病监测中是一种较好的“预警”方法。,图3 控制图法示例,中心线 (中位线),上控制线 (上警戒线),下控制线 (下警戒线),17,应用步骤 选定研究病种和预测时间(如某月的发病率) 确定数据库:一般连续3-5年资料 确定流行标准:通常采用专家咨询法量化(如以5年资料为好,用 2s判断流行,s为标准差) 建立预警模型:以研究疾病观察月既往5年该月及前后一个月的月发病率数据为基线数据,计算出指定的百分位数作为预警界值(如P50、P80等),建立预警模型 优选合适的预警界值:绘制ROC曲线 分析软件:EXCEL,SPSS,18,图4 5年基线数据建立预警模型的原理,19,比数图法:比数图法在传染病预测中是一种可行的好方法,适用于发病数呈正态分布的传染病,比数(R)的计算公式如下R=A/ ,R的95%的可信区间:11.96s/ ,A为分析当月某病的发病数,为该病近5年同月及其前后1个月(即15个月)的发病数的月发病均数,s为标准差,一般是利用某地近5年传染病的月(或4周)发病数据来计算比数。若比数超出此上限范围,表示有流行的征兆。,20,Delphi法:即德尔菲法,也称为专家评分法或专家咨询法。是采取匿名的方式广泛征求专家的意见,经过反复多次的信息交流和反馈修正,使专家的意见逐步趋向一致,最后根据专家的综合意见,从而对评价对象作出评价的一种定量与定性相结合的预测、评价方法。 20世纪40年代由O赫尔姆和N达尔克首创,1946年,兰德公司首次用这种方法进行预测,后来该方法被迅速广泛采用。直到20 世纪70 年代中期,Delphi法才开始在医学领域中有所应用,在传染病监测系统中的应用也甚为广泛。 WHO曾经使用此方法对今后10年艾滋病流行趋势进行了预测,并根据预测的结果,制订出防治规划和干预措施。 特别注意:Delphi方法只是为传染病预防控制提供参考意见的一种方法,不能过份依靠,要用进一步的调查来证实这些意见是否正确。,21,应用步骤 成立预测专家小组 确定预测地区和预测病种 调查:提供背景资料-专家回答预测问题-汇总分析-反馈给专家-专家再次回答,反复2-4次,使预测意见趋于一致 综合整理预测结果,22,2、定量预测 定量预测是借助数学手段利用原始资料,建立恰当的数学模型,预测未来传染病的发病数和发病率,其预测精度与可靠性取决于数据的准确性和模型的科学性。 根据自变量的多少可分为时间序列模型和多因素模型。 2.1 时间序列预测模型: 时间序列预测模型假设预测对象的变化仅与时间有关,根据它的变化特征,以惯性原理推测其未来状态。时间序列模型主要包括灰色动态模型、B-J模型等。,23,灰色动态模型:灰色动态模型是我国学者邓聚龙教授于1982年创立的,后在各个领域得到了广泛的应用。它以颜色的深浅代表系统信息的完备程度,其中应用最广泛的是GM(1,1)模型。 近年来,我国的疾病监测工作者也在尝试将灰色系统理论引入到传染病的预测中,目前关于这方而的应用实例比较多。 灰色动态模型对样本容量和概率分布没有严格要求,模型简单,预测效果好,适合于对流行因素较稳定的疾病进行短期预测。,24,GM(1,1)模型应用步骤,25,BoxJenkins模型:BoxJenkins模型简称B-J模型,是时间序列预测模型中最复杂、最高级的模型,其中重要的应用广泛的预测模型是自回归滑动平均混合模型法( autoregressive integrated moving average,ARIMA)。 ARIMA将预测对象随时间变化形成的序列,看作是一个随机序列,呈现一定的规律性,用数学模型近似描述。模型识别是整个建模型阶段最为重要的一步,而对建立的预测模型的实际意义的检验则是预测应用阶段中极为重要的一步。 该模型适用n50的非平稳时序列,是一种精确度较高的短期预测模型。BJ模型的缺点是计算过于复杂,不过现有许多统计软件包已克服了应用BJ模型进行预测的计算的复杂性。,26,应用步骤:ARIMA(p,d,q) 根据时间序列的散点图、自相关函数和偏自相关函数图检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。 对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。 根据时间序列模型的识别规则,建立相应的模型。 进行参数估计,检验是否具有统计意义。 进行假设检验,诊断残差序列是否为白噪声。 利用已通过检验的模型进行预测分析。 分析软件:SPSS,27,2.2 多因素模型:多因素分析是同时对观察对象的2个或2个以上变量进行分析,从相互联系与制约的复杂关系中把握事物的本质。多元回归模型、逐步判别模型、小波模型、人工神经网络模型等均属多因素模型。 由于传染病流行特征的复杂性和多变性,模型中的变量在不同地区、不同病种、不同时段都有不同的参数,在实践中需不断进行调整,限制了多因素模型的应用和推广。 主要有多元回归模型和人工神经网络模型。,28,多元回归模型:回归模型预测传染病发病及流行趋势通常是应用直线或曲线拟合原始发病数据,用数字和等式来表达传染病的流行规律,从而找到控制疾病的有效方法。在定性分析确定现象或指标之间确实存在相关关系之后,才能利用回归预测法研究和测定相关关系的数量表现。但是回归预测不能任意外推,如果任意外推,预测远期目标,那么误差就大。 Logistic回归分析在医学研究中应用广泛,主要是用于流行病学研究中危险因索的筛选,同时具有良好的判别和预测功能,尤其是在资料类型不能满足Fisher判别和Bayes判别的条件时,更显示出Logistic回归判别的优势和效能。,29,图5 日累计发病人数实际值与预测值曲线图,Logistic回归分析应用步骤(分析软件:SPSS) 选取疫情数据 函数拟合,进行预测,建立模型,30,人工神经网络模型:是近十年来迅速发展起来的一门集神经科学、计算机科学、信息科学、工程科学为一体的边缘交叉学科,已应用于信号处理、模型识别、综合评价、预测分析等领域。 常用的神经网络模型有BP神经网络模型(误差逆向传播模型)、线性神经网络模型、Hopfield神经网络模型和Kohonen自组织模型四种。 神经网络模型用于预测的指标和被预测指标间是一种复杂的多元非线性关系,要注意数据格式的整理,其运算复杂,一般用MATLAB进行神经网络预测分析。,31,一个神经网络划分为输入层、输出层和隐含层。输入层的每个节点对应一个个的预测变量。输出层的节点对应目标变量,可有多个。在输入层和输出层之间是隐含层(对神经网络使用者来说不可见),隐含层的层数和每层节点的个数决定了神经网络的复杂度。 分析软件:MATLAB,32,3、综合预测法 综合预测又称组合预测,是现代统计预测方法发展的必然结果。单个预测模型进行预测时会存在一些缺陷,如信息源的不广泛性、对模型设定形式敏感等。自Bates和Granger首次提出组合预测方法以来,因其能有效地提高预测精度,受到国内外预测工作者的重视,一直是国内外预测界研究的热点课题。 综合预测是指应用两种或两种以上的预测模型对某种传染病进行预测,综合利用各种单个预测模型所提供的信息,以其适当的加权平均形式得出组合预测模型。它可以综合利用各种方法所提供的信息,尽可能地提高预测精度。在实际运用中最多的是把定性预测与定量预测相结合的方法,还可用不同定量预测方法结合起来。这种方法常常是将专家们评议的意见集中起来综合评价、建模和分析,克服了过去预测方法的笼统性,提高了预测结果的准确性。,33,总之,目前传染病预测的方法很多,但因为所用资料和选择的病种不同,各种方法相互之间的可比性不强。定性预测方法简单、易懂,主要对流行趋势预测,而定量预测方法复杂,预测精度高,越是精度高的方法,对资料的要求越高,计算越复杂。,34,三、传染病预测方法新进展,35,三、传染病预测方法新进展(传播机理) 对传染病的描述和预测,通常采用经验型的统计方法,通过以往的发病资料收集,用单纯的统计预测模型进行疾病发病趋势研究。 近年来随着数学和物理成果不断引入,探讨传染病传播机理的模型为传染病预测理论研究提供了许多强有力的理论基础,这类模型强调解释性和研究性,比统计预测模型复杂得多。 1、传播动力学模型(房室模型) 2、复杂网络模型 3、时空交互模型:时空扫描模型,36,1、传播动力学模型(房室模型) 假设在时刻t总人口数为N(t),易感者类、染病者类和恢复者类的数量分别为S(t),I(t),R(t)。即N(t) = S(t)+I(t)+R(t).设单位时间内人口的输入为常数r,易感者类和恢复者类的自然死亡率为d,染病者类死亡率为(包括自然死亡率和因病死亡率,显然),移出染病者类的比例为,传染者的非线性接触率为,a, b为参数,这些参数均为正常数.从而得模型。,易感者,移出者,感染者,37,2、复杂网络模型 复杂网络作为研究系统复杂性的一项重要工具,是近十几年来研究的新热点,与疾病传播密切相关的人群社会接触网络在个体的微观行为与人群的传播型态之间建立起一座桥梁。,38,近年来,研究者在刻画复杂网络拓扑结构的统计特性上提出了许多概念和方法,其中有三个基本的静态几何量:网络聚集系数、平均路径长度、度及其分布特征。 聚集系数(clustering coefficient;C),也可称为聚类系数,用来描述网络中节点的聚集情况,即网络的紧密程度。其计算方法为:假设节点i有ki条边把它与其它ki个节点相连,这ki个节点之间最多可能存在ki(ki-1)/2条边,而这ki个节点之间存在的边数Ei与总的可能的边数ki(ki-1)/2之比定义为节点i的聚集系数Ci,用算式表示就是Ci=2Ei/ki(ki-1)。网络的聚集系数就是整个网络中所有节点的聚集系数的平均。 平均路径长度(average path length;L),又称为网络的特征路径长度,是描述网络分离程度的指标。 度(degree;D)是用来描述单个节点属性的重要概念。网络中节点i的度ki为该节点连接的边的总数目,所有节点i的度ki的平均值称为网络的平均度,记作。网络中节点的度分布(degree distribution)用分布函数P(k)来描述,其含义为一个随机选定的节点恰好有k条边的概率,也等于网络中度为k的结点数占网络结点总数的比值。度分布函数对于传染病传播机理研究具有重要作用。,39,应用步骤 复杂网络理论的应用研究可以简单概括为紧密相关且逐渐深入的以下四方面内容:通过实证方法构建相应的网络模型;测定网络结构的统计性质;在已知网络结构属性及其形成规则的基础上,预测网络中的行为规范;在预测网络行为规范的基础上探讨网络控制策略。前两方面是基础,后两方面是应用。,40,利用网络模型预测网络系统行为,主要是找出关键性节点,这些节点是连接内部小团体的连通点,如果这些节点受到感染,那么疾病传播将会很迅速。从另一角度来说,这些节点感染后,又能很容易被发现,加速了就医的速度,缩短了病程,减少单个传染源传播疾病的时间,从而控制疾病的传播规模。因此,关键性节点对控制传染病在人群中传播起到重要作用。度较大的节点被感染后将会快速传播疾病,因此,防止度较大的节点成为传染源是防止疾病快速传播的第一步。另外,利用被感染节点周围的局部信息,控制被感染节点周围的部分节点,从而达到控制传染病在整个网络大范围传播的目的。,41,利用社会接触网络(SCN)理论分析疾病在人群中的传播,客观基础和前提是构建人群接触网络。人群接触网络有两种分析模式,一种是自我中心分析,一种是整体网络分析。前者只需选取一定规模的人群进行调查研究,分析人群中社会接触网络的特征,进而分析疾病在人群接触网络中的传播特征。后者需选取假定封闭的特定人群作为研究主体,通过调查该人群中的每一位成员,了解人与人之间的接触情况,构建一个完整的人群接触网络

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论