基于SIRS模型的甲型H1N1流感空间分析模型.doc_第1页
基于SIRS模型的甲型H1N1流感空间分析模型.doc_第2页
基于SIRS模型的甲型H1N1流感空间分析模型.doc_第3页
基于SIRS模型的甲型H1N1流感空间分析模型.doc_第4页
基于SIRS模型的甲型H1N1流感空间分析模型.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

甲型H1N1流感GIS空间统计分析系统1. 需求分析近年来,以重大传染病疫情为主的流行性公共卫生事件越来越受到人们的关注,也日益成为人类社会所面临的新的重大威胁。如2003年的SARS事件便是21世纪中国和世界面临的第一次公共卫生方面的重大挑战,同样,2009年爆发的甲型H1N1流感(以下简称甲流)是公共卫生领域的又一次挑战。中国的疫情始于2009年5月份归国人员造成的输入性病例,截至今年3月31日,历时11个月,全国31个省(区、市)累计报告甲流确诊病例12.7余万例,死亡病例800例。可见,此次的甲流是非常严重的。在甲流爆发后,再现甲流的传播过程与疫情聚散情况,分析影响甲流传播的可能性因素,不仅有助于人们全面的认识甲流,揭示出甲流的流行规律,而且还为人们寻求其预防和控制的最优策略,以及制定防治决策提供理论基础和数量依据。2. 解决思路对于不同的群体,在传染病发生以及蔓延之时,他们所关注的疾病信息与关注程度也会有所不同,普通大众希望了解到实时发布的疫情数据信息和蔓延趋势,如何采取自身防范措施,而对于管理部门的决策者来说,更重要的是对疫情的时空传播和扩散规律进行深层次的分析,获得疾病传播机制以及传染趋势信息,从而为制定疾病的预防和控制措施提供一定的辅助决策作用。因此,为实现上述需求,本项目将从决策者的角度出发,借助GIS空间统计学的理论与流行病传染建模的思想来建立甲流的空间统计分析系统,并选取中国大陆31个省(市、自治区)的甲流疫情数据为例,分析其发展过程和流行规律,探讨甲流与气象,交通因素等的关系,模拟甲流的传播情形,进而为预防决策提供依据。本系统中将利用空间自相关统计分析来检验甲流的疫情聚散情况,省级空间分布模式及其时空变化情况,并探测甲流爆发的冷热点区域,包括Morans I系数为度量指标的疫情聚散分析,和Getiss G*系数为度量指标的热点探测分析。研究表明,流感病毒在寒冷、干燥的气候环境里存活的时间会更长,但目前对甲流病毒来说,它的传播是否与气象条件有关系,以及气象条件对甲流的具体影响是什么还难以断定,因此在此设计空间线性回归模型来检验甲流的爆发与天气现象的关系。从理论上说,人口流动越频繁,甲流爆发及传播的机率越大,但是人口流动数据无法获取,为此我们建立引力模型来近似估计人口流动量,并通过相关性分析来检验它与甲流疫情的关系。最后,利用经典的SIRS流行病传播模型来模拟甲流的空间流行过程。3. 系统设计本系统采用传统的B/S结构设计,在Windows XP操作系统环境下,基于ArcGIS Engine 9.3组件和C#2008语言实现系统功能,所用数据采用本地Geodatabase存储,从数据组织,综合分析,最后得到甲流疫情的评价结果这整个流程可用图1来表示。 甲流疫情传播的综合评价疫情聚散分析模块疫情热点探测模块甲流GeodataBase数据管理空间数据流行病空间回归分析模块疫情数据引力模型气象数据甲流空间传播SIRS模型图1 甲流空间统计分析系统功能模块图4. 关键技术4.1 空间自相关空间自相关基于地理学第一定律,研究空间中某位置的观察值与其相邻位置的观察值是否相关以及相关程度的一种空间数据分析方法。本系统选用Morans I系数和GetisG系数作为度量指标来探测中国甲流的空间聚散情况。其中全局Morans I的计算公式为: (1)式中,为研究对象的个数,、分别为研究区域和的属性值, 为样本中所有属性值的均值,是衡量空间事物之间关系的权重矩阵。Morans I的取值在-1到1之间,正值表示研究对象的属性值在空间上正相关,负值则表示负相关,零值表示空间随机分布。I值的统计学意义通过显著性检验Z值来检验。在ArcGIS软件提供的空间自相关分析模块中,空间权重矩阵的构造方法有基于反距离,反距离平方,确定性距离阈值,多边形邻接,本项目在此基础上,加入了K最近点,Rook边界邻接,Queen边界邻接判断方法。空间权重矩阵的构造均通过算法编程实现。本项目中对于局部自相关Morans I的度量与ArcGIS的方法有所不同,分为三种:Moran散点图(Moran scatter plot),显著性地图(Significant Map),以及聚类地图(Cluster Map),从一定程度上丰富了局部自相关的表现形式。Moran散点图可以通过标绘WZ关于Z的位置和添加回归线,来突出空间自相关水平异常的区域。它的四个象限分别对应于区域单元与其邻居之间四种类型的局部空间联系形式,分别为高高,低高,低低,低高。显著性图即是根据显著性检验Z值进行渲染的地图,聚类地图则是将通过显著性检验的地区进一步分为高高,低高,低低,高低聚类显示在地图上。4.2 空间回归分析模型(线性回归,Logistic回归)本项目建立的回归模型用于分析气象因子对甲流的影响作用。有两种回归方法,一是线性回归模型,二是Logistic回归模型。以甲流的月新增确诊人数为因变量,选取平均气压(0.1hPa),平均气温(0.1),平均相对湿度(1%),日照时数(0.1小时)和降水量(0.1mm)的月值数据为解释变量,建立的线性回归模型与Logistic回归模型分别为式(3)和(4)。 (2) (3)其中,表示省的月确诊人数,和为待估参数,分别为省的平均气压,平均气温,平均相对湿度,日照时数和降水量的月值数据,为随机误差项。另外,本模型中考虑了空间邻近区域的影响作用,可以对模型进行有选择的加权处理,即把某属性值作空间加权求和作为该自变量的值。加权的方式与空间权重矩阵类似,有边界邻接(Rook,Queen两种),距离阈值(Distance threshold),反距离平方(Inverse distance squared)等。在回归分析前,为了消除自变量量纲的差异,对变量进行归一化处理,其方法为线性函数转换,表达式为:y=(x-MinValue)/(MaxValue-MinValue),其中,x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。4.3 人口迁移引力模型本系统中用引力模型来近似表达城市之间的人口流动量,并将其与甲流确诊人数进行相关性检验,即可看出人口流动对甲流疫情的影响。考虑全国交通的实际状况,针对甲流期间人口迁移情况,本文建立的人口迁移的引力模型为: (4)式中,为i省与j省之间的人口迁移量,单位为万;G为引力系数,与实际经验有关,此处暂时取;P为各省总人口,单位为万;为i省和j省质心的欧氏距离;A为可达性矩阵,可以表示为: (5) 其中,为邻接系数,相邻为1,不相邻为0.1,T为铁路的运输力,即铁路的客流量与总客流量的比例,N为同时通过i,j省的铁路的个数。由于公路的运输力数据无法获得,该模型不考虑由公路带来的人口迁移。4.4 甲流空间传播的SIRS模型SIR 模型是描述传染病迁移、扩散等基本特征的一个经典的流行病模型,一般用于预测某个地区的疾病流行过程。它将人群分为易感染者S(Susceptible),感染者I(Infective)和移除者R(Removed)三类,易感者从患病到移除的过程如图2.本系统中将其改进来模拟中国的甲流传播情况,改进后的模型如下:SIR图2 SIR模型框图用分别代表t时刻i省人群中S,I,R三类个体人数。同时假设:(1)在甲流流行期间,不考虑出生、死亡、流动等种群流动因素,人口始终保持常数Ni;(2)产生感染者的人数与易感者以及感染的人数成正比,比例系数为;(3)感染者向移除类转移的速度与感染的人数成正比,比例系数为; (6)解得: (7)在式(4)中,为t月第i个省的确诊人数,为t-1月的确诊人数,作为初始值,近似为i省总人口数,易感者人数则用下面的公式近似代替: (8)因此,对于某个具体的t,式(4)中除参数以外其余均为已知数,接下来通过某种算法对函数式进行拟合,估计模型参数即可。本系统中选用遗传算法求解流行参数。遗传算法把生物遗传中的选择、交叉、变异规律应用到求解模型中的最优化问题,对于人群研究中的参数估计效果较好。求解步骤如下:(1)产生初始种群:随机产生n个M位二进制字符串;(2)计算每个个体的适应度函数值fi:取预测残差的平方和作为适应度函数,= ;(4)交叉:以概率从种群中选出n个串,以交叉概率pc在一随机位置进行交换,产生新的个体;(5)变异:以交叉概率pm在新的种群中挑出一个个体,在一随机位置进行变异;(6)重复(3),(4),(5)步骤,直至遗传算法收敛,输出参数。5. 系统功能5.1 基本功能(1)地图漫游基本的地图浏览与操作,包括放大,缩小,平移等操作。(2)数据查询与显示基本的信息查询功能,包括地图空间数据查询,地图属性数据查询,和将疾病数据进行时间序列的曲线图展示等。图3 甲流确诊人数变化图(3)地图渲染功能将甲流疫情数据用多种形式(如分级渲染,饼图,柱状图等)的专题图显示出来,不仅可以直观的看出甲流疫情的轻重分布情况,还可通过时间上的纵向比较来粗略的找出甲流的传播路线。 (a)2009年5月 (b)2009年6月图4 甲流疫情数据分级渲染图5.2 特色功能(1)疫情聚散分析模块该模块实现对甲流疫情的聚散分析,包括全局和局部两类。全局空间自相关从统计学意义上来检验中国甲流疫情(以确诊人数为判断标准)的省际空间分布模式以及聚集情况。对甲流确诊人数进行全局Morans I分析,空间权重矩阵选取一阶多边形邻接。统计结果见表1。表1 2009年5月-2010年3月中国甲流疫情的MoranI 分析结果时间Morans I值Morans I期望值标准差Z 检验值空间格局09050.0754-0.03330.00941.1330随机09060.0783-0.03330.00861.2151随机09070.0344-0.03330.00930.7140随机09080.0909-0.03330.01011.2360随机0909-0.0446-0.03330.01140.8339随机0910-0.1845-0.03330.0079-0.7011随机0911-0.0843-0.03330.01170.3098随机09120.2715-0.03330.01062.9181聚集10010.4657-0.03330.01164.6461聚集10020.4522-0.03330.01004.8547聚集10030.2455-0.03330.00882.9765聚集局部自相关用于分析甲流疫情在各个省区的空间分布模式,判断某区域疫情高低相邻的状态,有三种表达方式:Moran散点图,Moran显著性图和Moran聚类图,在一定程度上扩展了局部自相关的表达形式。 (a)Moran聚类图 (b)Moran散点图图5 2009年12月中国甲流疫情的局部自相关结果(2)甲流疫情热点探测模块本模块选用Getiss G系数来探测中国甲流疫情(以确诊人数为判断标准)的热点省份,以及随时间的转移情况。Z(Gi*)大于1.96表示显著的甲流疫情爆发的高值集聚(热点区域),1.65-1.96表示较显著的热点区域,-1.65-1.65表示空间集聚不显著,-1.96-1.65表示较显著的低值集聚(冷点区域),小于-1.96表示显著的冷点区域。 (a) 2009年12月 (b)2010年1月图6 甲流疫情热点探测结果图(3)空间Logistic回归分析模块该模型是甲流的影响因子分析模型,用来分析甲流传播的影响因子,识别对甲流疫情影响较大的因素及满足的函数关系式。以2010年1月份为例,选取月平均气压(X1),气温(X2),湿度(X3),降水(X4),日照(X5)为自变量,甲流的确诊人数为因变量,进行Logistic回归分析,结果如下: (9)可知,只有气温与甲流确诊人数的回归系数通过显著性检验,它们之间的关系为式(1)。多数自变量不能通过显著性检验,说明Logistic回归模型不能很好地反映甲流疫情与气象因子之间的关系,该模型还在进一步改进中。(4)人口迁移引力模型引力参数估量值表示相距一定距离的两个地区人口迁移量的平方。运行该模型,可以得到甲流流行期间各省人口流动的可能数量,例如,黑龙江省与吉林省的引力参数为170.67,则表示黑龙江省与吉林省人口迁移量为F1/2 ,即13万人。将某个省与其余省的人口流动求和,即得到该省的人口流动估计值,将其与甲流确诊人数进行相关分析,即可确定人口流动对甲流疫情传播的影响。表2 引力模型分析结果省份总人口(/万)人口流动量估计值(/万)海南省80310.32广东省785951.64广西壮族自治区482228.31贵州省383740.28云南省433331.84江西省422293.49湖南省662984.01浙江省464756.22上海市162557.14重庆市310740.11将人口迁移量与甲流确诊人数进行相关分析,可以发现,二者成显著的正相关关系。(5)甲流的SIRS空间传播模拟模块该模块将空间信息与传统的疾病预测SIRS模型相结合,用来对甲流的空间传播情况进行模拟与再现,利用该模型,可以得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论