数学建模论文-脑卒中发病环境因素分析及干预模型_第1页
数学建模论文-脑卒中发病环境因素分析及干预模型_第2页
数学建模论文-脑卒中发病环境因素分析及干预模型_第3页
数学建模论文-脑卒中发病环境因素分析及干预模型_第4页
数学建模论文-脑卒中发病环境因素分析及干预模型_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

脑卒中发病环境因素分析及干预模型摘要本文主要对来源于中国某城市各家医院提供的脑卒病人基本信息以及相应期间当 地的逐日气象资料进行分析并统计,通过考虑当地环境因素气压、温度和相对湿度对该疾病发病率,建立合理的数学模型,能很好地掌握疾病发病率的规律。针对问题一,主要是运用excel,matlab等软件对题目所提供的四年期间脑卒中发病病例相关信息进行编程分析与统计并汇成三维散点图,从而分析图象得出结论:1. 年龄是影响脑卒中发病率最重要且独立的危险因素之一,且脑卒中发病率随会年龄的增加而增高。2. 男性脑卒中发病率明显高于女性脑卒中发病率。3.脑卒中发病率也受职业影响。针对问题二,根据问题一中分析结果,脑卒发病率与环境因素之间存在密切的关系。利用四年的数据进行数据拟合模型分别得到脑卒发病率与气压、温度和相对湿度之间一元关系。利用气压、温度和相对湿度已知条件下,通过建立灰色模型来预测发病率,与真实值进行比较,可知预测的结果的精确度是比较准确的。再通过对灰色模型的改进建立了多元线性回归模型,通过四年的平均发病率、气压、温度和相对湿度建立了一个多元的关系,通过对模型的检验,建立的发病率与气压、温度和相对湿度多元线性关系比较准确。针对问题三中对高危人群患病特征的分析,得出脑卒中主要是因为心血管疾病及各种不良因素长期作用于脑血管导致而成的。通过对脑卒中发病的关键指标的查找与确定,结合问题一和问题二所得结论,对脑卒中高危人群以不同性别、不同职业状况等条件以及天气状况和脑卒中的关系,得出男性发病率高于女性、各职业人群发病率区别的重要原因、严寒酷暑温差大对发病率的重要影响,从而进行预警和干预,最终向其提供合适的建议方案。关键词:脑卒中、matlab、数据拟合、灰色模型、多元线性回归、预警和干预1.问题重述1.1背景脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。1.2相关情况数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。请你们根据题目提供的数据,回答以下问题:1.3问题的提出问题一:根据病人基本信息,对发病人群进行统计描述。问题二:建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。问题三:查阅和收集文献中有关脑卒中高位人群的重要特征和关键指标结合1、2中所得结论,对高危人群提出预警和干预的建议方案。2.符号说明:代表发病率;:代表温度;:代表气压;:代表相对湿度;3.模型假设(1)假设在条件允许的情况下,题目所提供的所有数据表中存在着的一些不同的 时间格式或者错误以及部分缺失和不符合现实的数据均暂不纳入考虑的范围内。(2)假设某城市各家医院统计的数据无较大误差,不会影响预测结果。(3)假设2007-2010年这四年间中国某城市的气候条件正常。(4)假设每年每月气压、气温和相对湿度有着相似的变化。4.问题一的解答4.1问题一分析题目的附件(Appendix-C1)中给出了与性别、年龄和职业有关联的人群发病的病例信息表,根据题目要求我们应用了MATLAB绘制了2007-2010年的人群脑卒中发病病例信息图,以此来进行统计与描述首先,以X轴表示性别、Y轴表示年龄、Z轴表示职业,作出了关于这三方面的三维散点图进行观测。由于题目所提供的所有数据表中存在的一些格式上或者数据上的误差以及部分数据的缺失,故在数据受损方面我们暂不将其纳入考虑范围之内。因此,我们作出了以下的脑卒中发病病例信息图。4.2 问题一模型的建立与求解:对问题一分析后,将附件(Appendix-C1)中数据文件data1.xls-data4.xls的表格,按年份重新分类,依次为2007-2010年的,分别重命名为data5-data8,再将每年表格的性别,年龄,职业用MATLAB绘成三维图,如下所示:图1 2007年脑卒中发病病例信息图图2 2008年脑卒中发病病例信息图图3 2009年脑卒中发病病例信息图图4 2010年脑卒中发病病例信息图上述图中表明,假设X轴上面的1代表的是男性,2代表的是女性。Y轴代表的是年龄从0-100岁的各阶段人群。Z轴上的数字代表的是各职业的代号。由图可知:年龄是影响脑卒中发病率最重要且独立的危险因素之一。脑卒中发病人群大多数趋向于中老年人身上,青少年发病率则相对较少,由此可以得出结论:脑卒中发病率,随年龄的增加而越发而增高。同时从以上四张图中也可以看出,Z5(渔民)、Z6(医务人员)在这四年中的脑卒中发病率明显低于其它各职业的。这是由于Z5人群长期在海面上生存,大胆勇敢地在海上作业,对于恶劣天气的适应能力强于其它各职业人群,另外,海上渔民喜好饮酒,最主要的原因是在炎夏烈日当空时饮酒可解暑,严冬霜雪时饮酒能抗寒,因此对于脑卒中这种与天气密切相关的疾病(问题二会给出具体的分析方案)对渔民的危害明显小于其它职业人群。Z6人群则是因为长期在医院、卫生所等地工作,对于脑卒中的预防以及防止相较于其它职业人群更胜一筹,因此发病率也相对较低。Z1(农民)、Z2(工人)、Z3(退休人员)在这四年中的发病率相对于其它职业人群高出许多,这是由于Z1、Z2都是处于社会的最底层,随着社会的不断发展,来自生活各方面的压力越来越巨大,使得他们不得不面对繁琐沉重的高强度工作,日出而作日落而息,严寒酷暑劳碌奔波,这就给脑卒中疾病的发生提供了巨大的可能性。Z3人群均为退休人员,即年龄均在60岁以上,故发病率高。从表中散点图的分布看来,Z6(医务人员)、Z7(职工)、Z4(教师)这三部分职业人群在脑卒中发病率男性明显大于女性,而其他职业人群男女发病比例大致相同。由上面的四张图中我们可以大致对比出,男性脑卒中发病率明显高于女性。5.问题二的解答5.1问题二分析在问题一的基础上,从Appendix-C2中所提供的2007年到2010年这四年间的当地的逐日气象资料,可以预测到脑卒中与气温、气压和相对湿度具有相关性。绘制发病人数、平均气压、温度和相对湿度的对比图,可以很明显反映出它们之间存在着很直接关系。为了建立脑卒中发病率与气温、气压、相对湿度间的关系,利用2007年到2010年数据,通过数据拟合建模可以得出发病率与气压、发病率与温度、发病率与相对湿度的函数关系。这样当已知气压、温度和相对湿度任何一个数据可以预测近似的发病率。但由于发病率与气压、温度和相对湿度存在密切的关系。在综合考虑气压、温度和相对湿度情况下,利用灰色模型对发病率进行预测,并与实际值进行对比与残差检验。观测发病率是否可以预测。如果可以预测那么可以通过多元线性回归确定发病率与气压、温度和相对湿度之间的一个近似多元线性函数,使得在已知气压、温度和相对湿度情况下,能更加近似地得到发病率,因而更好地掌握疾病发病率的规律。5.2 问题二的模型建立与求解 5.2.1 建立数据对比图根据题目所给的Appenddix-C2以及问题一中的统计出来的每一天的发病人数做出了2007年和2008年每一天的发病人数与平均气温、气压和相对湿度的对比图。图5 2007年发病人数、平均气压、温度和相对湿度的对比图图6 2008年发病人数、平均气压、温度和相对湿度的对比图从以上两图观察可知,平均气压与发病人数仅有较为细微的关联,即在2007年和2008年中,平均气压略微成曲线的状态延伸,与发病人数在这两年中的曲线状态延伸大致一致,由此可预测,平均气压与发病人数存有较为细微的关联。平均温度与发病人数大致呈负相关关系,可以看出在寒冷的冬季发病率最高,春季气候转暖,脑卒中发病率也开始下降,夏季发病率达到最低,秋季后又开始上升。平均相对湿度与发病人数成正相关。综上所述,气温和相对湿度是影响脑卒中发病的重要因素。由于气温对脑卒的发病率有着密切的关系,从每年以月进行对发病率与气温进行对比。 (a) (b) (c) (d)图7 2007-2010年四年的温差影响发病率(以月计图)根据以上四张温差图我们可以明显的看出,入秋及早春时节也易发生脑卒中。因为此时节最易受寒流侵袭、寒流袭击、气温骤降、日内最高气温与最低气温之差太大。对于刚刚度过的炎热夏季或刚刚感受到春天融融暖意的人们,突来的气候变化会使之不适,对老年人和具备脑卒中高危因素的人来说会是一个噩梦的时季。同时根据以上四张图易得出结论:温差与脑卒中的发病率大致呈正相关,即温差变化越大,脑卒中发病率越高;温差变化越小,脑卒中发病率也随之降低。5.2.2 问题二模型的建立与分析 根据发病人数、平均气压、温度和相对湿度的数据对比图,可知它们之间存在密切的关系。为了建立脑卒中发病率与气压、气温和相对湿度间的关系模型,由于每年每月气压、温度和相对湿度变化相似,可以利用2007年到2010年四年的气压、气温和相对湿度进行数据的拟合1,拟合出近似的函数关系。将2007-2010年的数据汇总,提取出四年48个月的月平均气温的数据点,由MATLAB编程可得,脑卒中发病率与气温之间存在着密切的关系。从而通过数据拟合得出发病率与气温之间的近似函数:图8 2007-2010年每月的平均温度与发病率的关系图由图中可得,四年中每个月的平均温度在1025的时候每月的平均发病率较为稳定,大致为7%左右。当每月平均温度偏低(10)或偏高(25)的时候,每月平均发病率明显变高。同样将2007-2010年的数据汇总,提取出四年48个月的平均气压的数据点,由MATLAB编程可得,脑卒中发病率与气压之间存在着一定的关系。从而通过数据拟合得出气压与发病率之间近似函数:图9 2007-2010年每月的平均气压与发病率的关系图由图中可得,四年中每个月的平均气压与发病率呈正相关关系,即气压越低,发病率越低;反之,气压越高,脑卒中发病率就越高。整体呈平稳向上缓慢递增的趋势。同样将2007-2010年的数据汇总,提取出四年48个月的平均相对湿度的是据点,由MATLAB编程可得,脑卒中发病率与相对湿度之间存在着密切的关系,从而通过数据拟合得出发病率与相对湿度之间近似函数:图10 2007-2010年每月的平均相对湿度与发病率的关系图由图可得,四年中每个月的平均相对湿度与发病率呈负相关关系,即相对湿度越高,脑卒中发病率越低;反之,相对湿度越低,脑卒中发病率越高。其中,当四年中每月平均相对湿度小于60%的时候,脑卒中的发病率高于8%;当平均相对湿度大于60%小于75%的时候,脑卒中的发病率则大致稳定在8%;当相对湿度小于75%的时候,脑卒中发病率低于8%。5.2.3 问题二建立灰色模型2但由于发病率与气压、温度和相对湿度存在密切的关系。在综合考虑气压、温度和相对湿度情况下,利用灰色模型对发病率进行了预测。把2007年至2010年每月的发病率看成一个数列,然后建立模型:令 作, 有 可以建立下述白化形式的方程:这是一阶一个变量的微分方程模型。记参数列为,则,按最小二乘法解,求,白化形式微分方程的解为: 还原数列: 则可以通过灰色模型预测每年的发病率,利用预测与真实值进行对比与残差检验。建立GM(1,1)模型,得2007年发病率预测值: 表1 2007年每个月的模型检验结果2007年月份实际值预测值残差检验1月888888.0002月719879-0.222533月10049180.0856574月10549590.0901335月104310010.0402686月10121046-0.03367月10001092-0.0928月117511400.0297879月121011910.01570210月135612430.08333311月11981298-0.0834712月13491356-0.00519建立GM(1,1)模型,得2008年发病率预测值:表2 2008年每个月的模型检验结果2008年月份实际值预测值残差检验1月1793179302月192519240.0005193月189118180.0386044月1718171805月170716240.0486236月13871535-0.106717月13271451-0.093448月13361371-0.02629月12421296-0.0434810月140112250.12562511月128211570.09750412月10051094-0.08856建立GM(1,1)模型,得2009年发病率预测值:表3 2009年每个月的模型检验结果2009年月份实际值预测值残差检验1月86386302月828871-0.051933月793854-0.076924月8518380.0152765月8608220.0441866月774806-0.041347月8747900.096118月9057750.1436469月7747600.01808810月7487450.00401111月620731-0.1790312月679716-0.05449建立GM(1,1)模型,得2010年发病率预测值:表4 2010年每个月的模型检验结果2010年月份实际值预测值残差检验1月1424142402月12241424-0.16343月142014000.0140854月13551377-0.016245月150913550.1020546月12771333-0.043857月143513110.0864118月136712900.0563289月129812690.02234210月141012480.11489411月130412280.05828212月8401208-0.4381根据四年验差检验:1、计算原始序列标准差:2、计算绝对误差序列的标准差:3、计算方差比: 得出:计算小误差概率: 得出:。结论:通过残差分析、后验差检验,发现,模型的预测值与实际值相差不大,说明发病率在气压、温度和相对湿度已知条件下,发病率可以被预测,可以看出模型预测的结果的精确度是挺高的。5.3 问题二的改进模型多元线性回归3一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。由于发病率与气压、温度和相对湿度存在密切的关系,为了更好地掌握疾病发病率的规律,对单一变量的数据拟合进行改进,考虑多变量的下对发病率的影响。 设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为: 其中,为常数项,为回归系数,为固定时,每增加一个单位对y的效应,即对y的偏回归系数;同理为固定时,每增加一个单位对y的效应,即,对y的偏回归系数等。 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为 解此方程可求得的数值。亦可用下列矩阵法求得 即 多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。 1、多元线性回归模型的拟合程度测定 与一元线性回归中可决系数相对应,多元线性回归中也有多重可决系数,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。计算公式为: 其中, 2、多元线性回归模型的估计标准误差 估计标准误差,即因变量y的实际值与回归方程求出的估计值之间的标准误差,估计标准误差越小,回归方程拟合程度越程。 其中,k为多元线性回归方程中的自变量的个数。 3、多元线性回归模型的显著性检验 回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。能常采用F检验,F统计量的计算公式为: 根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值,若F ,则回归方程具有显著意义,回归效果显著;F,则回归方程无显著意义,回归效果不显著。 4、多元线性回归模型的显著性检验 在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。检验时先计算统计量 ;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值或,则回归系数bi与0有显著关异,反之,则与0无显著差异。统计量t的计算公式为: 其中,是多元线性回归方程中求解回归系数矩阵的逆矩阵(xx)-1的主对角线上的第j个元素。对二元线性回归而言,可用下列公式计算: 其中, 利用2007年到2010年按月进行发病率、气压、温度和相对湿度取值平均,通过多元线性回归模型进行求解。表5 2007-2010年按月平均取值月份平均气压平均温度平均相对湿度发病率11027.223.7467.838.70%21022.156.2970.728.16%31019.759.6466.788.87%41016.5314.1365.478.78%51010.0621.1164.429.01%61006.0524.2377.187.91%71004.4928.273.848.32%81006.6629.1174.898.64%91011.625.0678.188.12%101018.1819.1273.178.73%111022.612.2770.987.76%121022.527.7767.117.09%建立多元线性回归模型,利用MATLA编程运算得:得,的置信区间为,的置信区间为,的置信区间为,的置信区间为。可知发病率在气压、温度和相对湿度多环境因素下,多元线性回归模型为:对模型进行残差4,并作残差图,如图11。图11 残差分析图从残差图可以看出,除第12个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型 能较好的符合原始数据,而第12个数据可视为异常点5。6.问题三的求解6.1问题三分析本题主要的是查阅和搜集文献中的关于高危人群的相关资料。重要特征重要说的是脑卒中人群一般具有的特征现象;关键指标则是触发脑卒中的一些关键数值的限定,如引发脑卒中的重要因素之一的高血脂在什么范围内才算是高血脂6.2脑卒中高位人群的重要特征脑卒中高危人群主要由于患有心血管疾病,如高血压、高血脂、冠心病、脑供血不足、脑血管变异、高血糖、糖尿病以及吸烟、饮酒、家族遗传史、肥胖、遗传和年龄增长等多种因素长期作用于脑血管而引起的6。大多数脑卒中患者在发病前会出现一些先期的征兆如血压升高、波动、头晕、头痛、肢体麻木、短暂性脑缺血发作,嗜睡等。6.3脑卒中发病的关键指标(1)原发性高血压:是缺血性脑卒中最重要的、独立的危险因素。原发性高血压的凝血纤溶指标异常与缺血性脑卒中的发生发展关系密切,在保持血压稳定的同时维持凝血纤溶指标平衡,有可能大幅度地降低其脑卒中的发病率7。(2)心脏病:增加脑卒中(特别是缺血性)的发病率。这如同树根通过树干将营养供给树冠一样,人体从心脏泵出血液,通过血管不停息地为大脑提供氧气和营养。(3)糖尿病:糖尿病病人脑卒中是由于糖尿病血管病变引起的,发生脑卒中可能性较一般人群成倍增加。糖尿病容易形成血栓,发生脑梗死。(4)TIA: TIA者容易因为脑血管的病变而引起脑卒中的发病。(5)吸烟和酗酒:脑卒中危险性与吸烟量及持续时间相关,吸烟量越大、烟龄(吸烟时间)越长,酗酒者脑卒中的发病率是一般人群的4-5倍,特别是可增加出血性卒中的危险。(6)高脂血症:高血脂症包括高胆固醇血症、高甘油三脂血症及复合性高脂血症,总胆固醇(TC)高于5.72mmol/L(200mg/dl)异常;甘油三酯(TG)高于1.70mmol/L(150mg/dl)异常。高血脂指标异常容易引发脑卒中。(7)其他:家庭遗传史中父母双方直系亲属发生脑卒中或心脏病时60岁即为有家族史。(8)肥胖:肥胖和超重均为缺血性中风的危险因素。(9)年龄指标:男性55岁,女65岁;年龄是重要的独立的脑卒中危险因素之一。卒中发病率随年龄增加,55岁后每10年增加1倍。所有卒中大多数发生于65岁以上。卒中发生率:老年人中年人青年人。(10)另外,不同的种族或社会因素,如生活方式和环境,也可能起到一定的作用。6.4 预警和干预从日常生活中,我们每时每刻都不难得到气压,温度,相对温度等信息。可以通过看电视气象预报,听收音预报(手机收音机),或是电脑上网,手机上网知道当天温度,气压,相对湿度的相关信息。而本文建立的模型恰恰可以通过代入以上信息而知道当天发病率的高低,而人们就可以通过了解发病率的高低而做出相应的防治措施,比如:可以适当控制喝酒,老龄人可以适当控制吃肉8.根据问题一模型的建立与假设得出结论:脑卒中发病率主要受年龄,性别以及职业的影响。脑卒中发病率:年轻人中年人 plot(x,y,z,*); axis(1,2,0,100,1,8)x=data6(:1);y=data6(:2);z=data6(:3); plot(x,y,z,*); axis(1,2,0,100,1,8)x=data5(:,1);y1=data5(:,2);y2=data5(:,3);y3=data5(:,4);y4=data5(:,5); plot(x,y1,*,x,y2/10,+r,x,y3,xg,x,y4,.m);axis(1,365,1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论