脑卒中发病环境因素分析及干预模型(全国一等奖).doc_第1页
脑卒中发病环境因素分析及干预模型(全国一等奖).doc_第2页
脑卒中发病环境因素分析及干预模型(全国一等奖).doc_第3页
脑卒中发病环境因素分析及干预模型(全国一等奖).doc_第4页
脑卒中发病环境因素分析及干预模型(全国一等奖).doc_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

脑卒中发病环境因素分析及干预摘要目前,脑卒中(俗称脑中风)是威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。该病的诱发已被证实与环境因素,包括气压、气温和湿度之间存在密切的关系。本文旨在进行疾病的风险评估,对脑卒中高危人群及时采取干预措施,也让尚未得病的人了解自己得脑卒中的风险程度,做好预防。分析了脑卒中的发病环境因素;同时,通过建立数据模型,掌握该病发病率的变化规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。针对问题一,首先,根据处理附件中所给的数据统计不同性别的发病人数,绘制出发病人数的性别分布饼图,发现女性脑中风发病率低于男性;其次,将不同年龄段的发病人数统计出来,绘制出发病人数的年龄分布直方图,基本符合正态分布,表明患病人群的年龄主要集中于5090岁,为高危发病人群;再次,将8类职业的发病人数统计出来,绘制出发病人数的职业分布直方图,显示发病人群中农民的发病率明显高于其他7类职业,为高危发病人群;最后,将20072010年的各月的发病人数统计出来,绘制出了各年发病人数随月份变化的折线图,直观显现各年发病率的变化趋势。针对问题二,首先,以2007年为例,分别绘制出该年各月的发病率和该月的平均气压、平均气温以及平均相对湿度的折线图,直观上得出发病率和气压、温度以及相对湿度的关系;再次,分别建立非标准化和标准化的面板数据(Panel Data)回归模型,得到2007年发病率受气温、气压、相对湿度的影响程度依次递减;最后,利用MATLAB统计工具箱建立并比较3种多元二项式回归模型及多元线性回归模型,分别根据20072010年的数据建立剩余标准差最接近于0的多元二项式回归模型,依次为多元交叉二项式回归模型、完全二次多元二项式回归模型、完全二次多元二项式回归模型和纯二次多元二项式回归模型,显著性均比面板数据回归模型(即多元线性回归模型)好。针对问题三,我们充分运用各种资源查阅和搜集脑卒中高危人群的重要特征和关键指标,根据这些重要特征和关键指标,并结合问题一、二中所得结论,对高危人群提出了预警和干预的具体建议方案,以便预防和控制脑卒中的发生,抑制该疾病的不合理增长。关键词统计描述 正态分布 面板数据回归模型 多元二项式回归模型 MATLAB软件1 问题重述脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温、气压和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。要求根据题目提供的数据,回答下列问题:问题一:根据病人基本信息,对发病人群进行统计描述。问题二:建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。问题三:查阅和搜集文献中有关脑卒中高危人群的重要特诊和关键指标,结合问题一、二中所得结论,对高危人群提出预警和干预的建议方案。2 问题分析2.1 问题一的分析从附件Appendix-C1中的数据表,可以看出:病人信息包括性别、年龄、职业、发病时间以及诊断报告时间。通过分析,诊断报告时间意义不是很大,因此只需对病人的性别、年龄、职业和发病时间进行统计描述即可。处理附件data1.xls、data2.xls、data3.xls以及data4.xls中的数据,将不同性别的发病人数统计出来,绘制出发病人数的性别分布饼图;将年龄划分为8个年龄段,将不同年龄段的发病人数统计出来,绘制出发病人数的年龄分布直方图;将每个职业的发病人数统计出来,绘制出发病人数的职业分布直方图;将20072010年的每个月的发病人数统计出来,绘制出每一年发病人数随月份变化的折线图。观察分布图,分析统计出来的各项数据是否服从正态分布。2.2 问题二的分析问题一中,已经将20072010年每个月的发病人数统计出来了,再处理附件data5.xls中的数据,分别将20072010年的每个月的平均气压、平均气温、平均相对湿度统计出来。发病率计算方法如下:第i年第j月份的发病率=第i年第j月的发病人数第i年总的发病人数分别绘制出2007年各月的发病率和该年各月的平均气压、平均气温以及平均湿度的折线图,同理可以绘制出2008年、2009年和2010年的折线图。由此可以直观地看出发病率和气压、温度以及相对湿度的关系。建立三个模型,第一个模型:以第i年(i=20072010)的平均气压、平均气温和平均相对湿度作为自变量,第i年的发病率作为因变量,建立第i年的非标准化面板数据模型,求解模型可以得到第i年的发病率和该年的平均气压、平均温度以及平均相对湿度之间的多元线性回归关系;第二个模型:将平均气压、平均温度以及平均湿度分别进行标准化,运用上述方法得到第i年的标准化面板数据模型;第三个模型:建立上述因变量和三个自变量的多元二次二项式回归模型。根据以上建立的三个模型,可以从数值理论上分析出脑卒中发病率和三个环境因素的之间的关系,并对得到的模型进行显著性检验。2.3 问题三的分析充分运用各种资源查阅和搜集脑卒中高危人群的重要特征和关键指标,根据这些重要特征和关键指标,并结合问题一、二中所得结论,对高危人群提出预警和干预的建议方案。3 模型假设假设1: 忽略缺失数据和错误数据的影响;假设2: 这里所有时间衡量以发病时间为准,不考虑诊断报告时间;假设3: 某年某月的脑卒中发病率为该年该月的发病人数/该年全年的发病人数;假设4: 每月的平均气压、平均气温、平均相对湿度是该月每天的气压、气温、相对湿度的平均值的平均;假设5: 把发病人群分为8个年龄段:30岁以下、3140岁、4150岁、5160岁、6170岁、7180岁、8190岁和90岁以上。4 符号说明符号说明发病人群按照年龄分布的均值发病人群按照年龄分布的标准,表示某一年第j月的发病率,表示某一年第j月的平均气压,表示某一年第j月的平均气温,表示某一年第j月的平均相对湿度,表示非标准化面板模型的第i个回归系数y2007 12*1的矩阵,第i行表示2007年第i各月的发病率y2008 12*1的矩阵,第i行表示2008年第i各月的发病率2008年的发病率y2009 12*1的矩阵,第i行表示2009年第i各月的发病率2009年的发病率y2010 12*1的矩阵,第i行表示2010年第i各月的发病率2010年的发病率R2回归模型统计量中的相关系数F 回归模型统计量中的方程显著性检验 回归模型统计量中的显著性水平,本文默认值为0.05RMSE回归模型统计量中的均方误差,表示某一年第j月标准化后的发病率,表示某一年第j月标准化后的平均气压,表示某一年第j月标准化后的平均气温,表示某一年第j月标准化后的平均相对湿度,表示非标准化面板模型的第i个回归系数y数组的均值的均值,其中,i=1,2,3y数组的标准差数组的标准差,其中,i=1,2,35 模型的建立与求解5.1 问题一的求解5.1.1 按照性别对发病人群进行统计描述先用EXCEL处理附件data1.xls、data2.xls、data3.xls以及data4.xls中的数据,将发病人数按照男、女分别进行统计,得到数据见表1:表1 男性和女性的发病人数(单位:人)性别男性女性发病人数3338528526再根据统计出来的数据,运用MATLAB软件编程(源程序代码见附录1)绘制出发病人群按照性别分布的饼状图1,2,如图1所示。24图1 发病人群的性别分布饼状图图2 发病人群的职业分布直方图由此可见:脑卒中发病人群中,女性发病率低于男性。这与文献3中所给结论一致。5.1.2 按照职业对发病人群进行统计描述运用EXCEL对附件Appendix-C1中的数据进行处理,将脑卒中发病人群按照8类职业(农民、工人、退休人员、教师、渔民、医务人员、职工、离退人员)进行统计,所得数据见表2:表2 8类职业的发病人数(单位:人)职业农民(1)工人(2)退休人员(3)教师(4)发病人数2974248476644216职业渔民(5)医务人员(6)职工(7)离退人员(8)发病人数66907351751根据表2,使用MATLAB软件(源程序代码见附录1)绘制出发病人数按照上述8类职业分布的统计直方图1,2,如图2所示。图2直观地反映出,在所有发病人群中农民的发病率明显高于其他7类职业;退休人员的发病率仅次于农民,但约为农民工的1/4;工人的发病率稍低于退休人员;其他五类职业从业人员的发病率较低,从高至低依次为:离职人员-职工-教师-医务人员-渔民。农民的工作环境相对恶劣,加之发病率受环境因素(例如,空气质量)影响较大,因此农民的发病率很高。5.1.3 按照年龄段对发病人群进行统计描述将发病人群的年龄分为8个年龄段:30岁以下、3140岁、4150岁、5160岁、6170岁、7180岁、8190岁和90岁以上。再运用EXCEL处理附件Appendix-C1中的数据,将脑卒中发病人群按照8个年龄段分别进行统计,所得数据见表3:表3 8个年龄段的发病人数(单位:人)年龄段30岁以下(1)3140岁(2)4150岁(3)5160岁(4)发病人数51386130328427年龄段6170岁(5)7180岁(6)8190岁(7)90岁以上(8)发病人数142482035810295798根据表3,使用MATLAB软件(源程序代码见附录1)绘制出上述8类职业发病人数的分布直方图,如图3所示。然后使用MATLAB软件(源程序代码见附录1)将直方图的边界曲线使用四次多项式曲线拟合出来,如图4所示。观察图3和图4可以发现,第6年龄段(7180岁)的发病人数最多,其次是第4、5、7年龄段(5160岁、6170岁,8190岁),高危人群主要集中在5190岁之间。发病人数以第6年龄段为中心,逐次向两边降低,在统计学上符合正态分布。使用MATLAB软件命令mean 和std可以求解出该正态分布的均值和标准差。由于标准差很大,说明数据分布波动剧烈,每个年龄段的发病人数差距较大。图3 发病人群的年龄分布直方图图4 发病人群年龄分布的拟合曲线5.1.4 按照发病时间对发病人群进行统计描述按照病人的发病时间,使用EXCEL将20072010年每年每月的发病人数进行统计,所得数据见表4:表4 20072010年每年每月的发病人数(单位:人)年份/月份12345620079417321019106910721032200818241955191817541767148020098708478278608757922010176114881722169918821610年份/月份7891011122007101611971221137512081369200814781368127514711377132020099319348297596648072010175716801631171815651071根据上述统计出的数据,使用MATLAB软件(源程序代码见附录1)绘制出每年随着月份发病人数变化的折线图,如图5所示。由图5可以得出:(1)对于20072010年四年相比而言,2007年和2009年的折线图大致位于2008年和2010年折线图的下方,因此2007年和2009年的发病人数较少,而2008年和2010年的发病人数相对较高;(2)从每一年的折线走势可以看出,20082010年每年的发病人数随着月份呈波动下降趋势,而2007年呈波动上升趋势。图5 20072010年发病人数随着月份变化的折线图5.2 问题二的求解5.2.1 发病率分别与气压、气温以及相对湿度的关系在问题一中,已经将20072010年每个月的发病人数统计出来了,则计算发病率,方法如下:第i年第j月份的发病率=第i年第j月的发病人数第i年总的发病人数然后处理附件data5.xls中的数据,分别将20072010年的每个月的平均气压、平均气温、平均相对湿度统计出来。在这里,假设每年每月的平均气压、平均气温、平均相对湿度是该月每天的气压、气温、相对湿度的平均值的平均;所得2007年的数据见表5,20082010年的数据见附录2。表5 2007年的发病率、气压、平均气温以及相对湿度的数据月份123456发病率 7.1%5.5%7.7%8.1%8.1%7.8%平均气压1028.21020.71018.31016.51008.41006.2平均气温4.58.711.615.322.624.9平均相对湿度73.270.869.362.661.875.5月份789101112发病率7.7%9.0%9.2%10.4%9.1%10.3%平均气压10031004.91010.510191024.11023.5平均气温29.43024.319.312.67.9平均相对湿度73.36267.8根据表5,使用MATLAB软件编程(源程序代码见附录2)分别绘制出2007年各月的发病率和该年各月的平均气压、平均气温以及平均湿度的关系图,如图6所示。同理,根据20082010年的数据表,可以得到关系图,见附录2。以2007年为例,图6上的1,2,.,12表示月份。可以看出:(1)10、12月份的发病率最高,为10%左右,而在2月份,发病率最低,为5%左右;(1) 12月份之间,气压降低、温度升高、相对湿度降低,发病率降低;(2) 37月份之间,气压降低、气温升高、相对湿度升高,但发病率基本稳定;(3) 812月之间,气压回升,气温降低、相对湿度降低,发病率波动上升;(3)在1-2月份之间,随着气温的升高发病率也降低;在37月份之间,气温的降低但发病率稳定;在812月之间,气压回升,发病率波动上升;图6 2007年发病率和该年平均气压、平均气温以及平均湿度的关系图5.2.2 面板数据(Panel Data)回归模型的建立与求解1、非标准化的面板模型 模型的建立以2007年为例,选取影响该年的脑卒中发病率y的3个环境因素:该年的平均气压记作;该年的平均气温记作;该年的平均相对湿度记作。在5.2.1的表5中,已经提取了2007年的这3个主要影响因素和发病率的数据,然后建立2007年发病率的面板数据回归模型4,如下:,其中, 模型的求解运用 MATLAB软件的编程命令regress,求解出多元线性回归模型的回归系数,则2007年发病率模型(源程序代码见附录3),如下: y2007 = -3.3141+0.0033+0.0034-0.0004由此得到2007年的发病率和该年的平均气压、平均温度以及平均相对湿度之间的多元线性回归关系。图7 2007年发病率模型残差图从图7中可以看出,残差图中大多数点的残差离零点均较近,且残差的置信区间均包含零点,这说明回归得到的结果能较好的符合原始数据,而只有1个点的置信区间不包含零点(图中红线所示),这个点可视为异常点,发现关系式的线性显著。 模型的显著性检验该2007年的发病率模型中,各检验统计量如下:复相关系数R2 = 0.4828 ;方程显著性检验F = 2.4890;概率ProbF 2.4890= 0.1345,其中 = 0.05为显著性水平。均方误差RMSE = 0.0001;可见,均方误差很小,上述所建立的模型显著。 模型的推广同理,可以求得20082010年的发病率线性回归模型分别为: y2008 = -1.3229-0.0011-0.0009-0.0011y2009 = 1.1889 -0.0011-0.0006-0.0002 y2010 = -0.3926+0.0004+0.0005+0.00092、标准化的面板模型 模型的建立在上述非标准化的面板数据模型中,平均气压、平均气温和平均相对湿度三个自变量的单位都不一样,且取值范围也不一样,因此不能直接用上述非标准化回归系数的大小来解释各个自变量的影响力;而标准化回归系数无单位,可以用来衡量各自变量的影响大小,回归系数越大,则该自变量的影响力越大。因此,要衡量自变量的影响力,必须对三个变量进行标准化,建立标准化面板回归模型4,如下:其中, 模型的求解以2007年为例,用MATLAB 编程(源程序代码见附录3)求得,标准化回归系数为:结论:在2007年的发病率模型中, ,从而可知,2007年发病率的影响程度依次递减的环境因素为:气温、气压、湿度。 模型的结论同理,可以求得20082010年发病率的标准化面板模型。从2007年的标准化面板模型可以看出,气压和气温对脑卒中发病率的影响程度较大,而相对湿度影响作用较小。5.2.3多元二项式回归模型建立与求解根据表5,以2007年为例,将影响脑卒中发病率的三个环境因素看作自变量,脑卒中发病率作为因变量,运用MATLAB软件编程(源程序代码见附录4)建立如下4个多元回归模型5:(线性)(纯二次)(交叉)(完全二次).用MATLAB命令rstool产生一个如下的交互式画面,其中有3个图形,这3个图形分别给出了一个独立变量xi (另2个变量取固定值)与y拟合曲线,以及y的置信区间。可以通过键入不同的xi的值来获得相应的y值。图8 MATLAB命令rstool产生的一个交互式画面画面的左下方有两个下拉菜单,一个菜单Export用以向MATLAB工作区间传送数据,包括beta(回归系数)、rmse(剩余标准差)、residuals(残差)。另一个菜单model用于在上述四个模型中选择。分别选取这4个模型,并比较它们的剩余标准差,剩余标准差最接近于0的模型最好,我们最终选择该模型。通过操作,这4个模型对应的剩余标准差如下表6所示:表6 4个模型的剩余标准差模型类型线性多项式纯二次多项式交叉多项式完全二次多项式剩余标准差0.01160.01400.01140.0148显然,应选择比多元线性回归模型更好的多元交叉二项式回归模型 (1)在图8所示画面的左下方下拉菜单中选“Export”,则beta、rmse和residuals都传送到MATLAB命令窗口中输入命令:beta,rmse ,运行可得回归系数(beta),剩余标准差rmse=0.0114,进而求得多元交叉二项式回归模型(1)的表达式为:剩余标准差rmse=0.0114,接近于0,说明该多元二项式回归模型的显著性较好,比多元线性回归模型的显著性稍好。同理,2008年、2009年、2010年分别选择纯二次多元二项式回归模型、完全二次多元二项式回归模型、完全二次多元二项式回归模型,相应的回归模型依次为,5.3 问题三的求解1、脑卒中(又称脑中风)的定义通过查阅和搜集相关资料6-8,我们知道,脑卒中已经成为全国第二位死亡原因,它是因为脑血管病变(阻塞或出血)脑卒中是因为脑血管病变(阻塞或出血)引起的突发性脑组织损伤,导致的神经功能障碍,分为缺血性脑中风(如脑梗死、脑栓塞、脑血栓等)和出血性脑中风(如脑出血等)。2、高危人群的重要特征和关键指标 高龄; 高血压、高血糖、高血脂; 动脉粥样硬化(尤其是不稳定斑块); 心脏疾病(心律不齐、心肌梗塞、心内膜炎、风湿性心脏病); 短暂性脑缺血发作(TIA), TIA本身是缺血性中风分类的一个类型,也可以使脑梗赛的先兆或前区症状,需及时治疗 血液流变学紊乱,特别是全血粘度增加时脑血流量下降,其中红细胞水平增高和纤维蛋白原水平增高是缺血性中风的主要危险因素。 肥胖,肥胖与超重均为缺血性中风的危险因素,与出血性中风无关。 年龄和性别,年龄是动脉粥样硬化的重要危险因素,粥样硬化程度随年龄增高而增加。50岁以上随着年龄增加中风发病率亦有增加,但现在发现青中年中风发病者亦有增加,不可忽视。一般来说女性中风发病率低于男性。此外,脑中风还与心理障碍,精神紧张,情绪波动等有关。因此,有高度易怒特质的人容易发生脑卒中。3、对高危人群提出的预警和干预方案由第一问和第二问的结论知,脑卒中的发病均存在明显的季节分布特征,说明脑中风发病的季节分布是气候因素的季节差异造成的。环境因素,尤其是气候因素的剧烈波动,在脑中风发病的过程中是一个非常重要的关键因素。中风高危人群的血压和血液粘度在气候应激调节反应下耦合共创,可能是形成高发时段的本质原因。因此,我们对高危人群的提出预警和干预的建议方案如下: 环境干预:在住院期间提供良好的疗养与医疗环境,以及工作环境和家庭环境的改造等。注意气候变化,在冬季和入秋时节,容易发病,积极预防。 生物钟调整:改掉不良生活习惯,如吸烟、酗酒、熬夜等。通过药物、运动和时间控制等逐渐进行24小时生物钟调整,形成规律的作息时间。 营养调控:合理饮食,应低盐、低脂肪、低糖、低胆固醇,适量蛋白质、脂肪、丰富维生素及微量元素饮食。通过营养师进行专门的营养评价,并根据运动量等计算出每天所需的能量,结合患者的饮食习惯后制定出营养配餐。 有氧运动:根据患者的情况,选择某项或几项运动进行有氧运动训练。适当增加活动量,科学锻炼,控制体重,避免肥胖。 心理治疗:药物控制、约谈、行为疗法等与其它治疗相互结合,进行心理调整。 康复治疗:包括PT、OT、ST、物理因子治疗、水疗、中国传统医学治疗等。定期进行体格检查,着重了解血压、血糖、血脂及体重的指数。积极治疗,严格控制高血压、糖尿病、高脂血症,定期在脑血管病门诊随访。总之,脑卒中高危人群需要建立个性化的健康管理档案,通过对脑卒中高危人群长期的健康管理和阶段性康复治疗,可以有效预防脑卒中的发生,并且可以防止其他疾病的发生。6 模型的评价与改进6.1 问题一的改进和评价处理附件数据,按照性别、职业、年龄段和发病时间对发病人群进行统计时候,我们忽略了附件表格中缺失数据和错误数据的影响。相对于总的数据量来说,缺失数据和错误数据只占很小一部分,几乎不会对统计出来的信息造成影响。在分析发病率的不同年龄段的分布规律时,我们按照年龄段对发病率进行拟合。拟合出的曲线在统计学上基本符合正态分布。正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力8。实际上看,发病率按照年龄来说,确实是符合正态分布。但MATLAB 软件数据拟合时,有一个主观选择过程,势必造成一定误差,这里我们也可考虑对所拟合得到的曲线进行残差修正,以提高曲线的拟合度。6.2 问题二中模型的改进和评价所建发病率的非标准化和标准化面板数据模型便于控制个体行为差异,方便更好地研究发病率与环境因素(气压、气温和相对湿度)变化的动态性。但是,它又存在模型自由度较小,存在对个体差异的限制性假设。建立的发病率模型,是以年份为单位,并假设每年的发病率和气压、气温以及相对湿度间存在多元线性回归或者多元二次二项式回归关系,求解出的模型进行误差比较,得到了适用于不同年份的模型。但是发病率与环境因素之间也可能存在其他非线性回归关系,如:多次多项式回归关系。可以使用其他非线性回归模型,来建立发病率和环境因素之间的关系,或许会得到更好的效果。6.3 问题三的改进和评价在收集到的资料中,5090岁之间人群的脑卒中发病率很高,男性发病率略高于女性发病率,发病时间多在冬季和秋季。在问题一中,我们统计分析所得结论与之保持一致。在问题二中,由于模型本身有一定的误差,而且选取的模型具有一定的的局限性,得到的结论并不全面。加之,由于搜集到的与脑卒中发病有关的资料有限,因此根据我们搜集到的资料,并结合问题一和问题二的结论,能够实现对高危人群提出预警和干预,但是显然具有一定的误差。7 参考文献1 李德宜, 李明, 数学建模M,北京:科学出版社,2009. 2 郑阿奇,MATLAB使用教程M,北京:电子科技出版社,2004.5.3 创建者9557949,脑卒中,/view/45379.htm,2012年9月9日.4 don_lvsml, 数学建模,多元线性回归分析,/view/6eeb18c1d5bbfd0a79567335.html,2012 年9月8日.5 赵静,但琦,数学建模与数学实验(第3版)M,北京:高等教育出版社,2008.1.6 飞哥8888888888,脑卒中的高危人群如何预防疾病的发生,/view/de2bdf8e680203d8ce2f24d6.html,2012年9月9日.7 洪华,脑卒中的诊治及预防, /view/dce61c8acc22bcd126ff0c14.html,2012年9月9日.8 创建者kgdxk,正态分布百度百科 /view/45379.htm , 2012年9月9日. 9 姜启源等,数学模型(第三版),北京:高等教育出版社,2003.10 王庚,王敏生,现代数学建模方法(第一版),北京:科学出版社,2008.8 附录附录1for i=1:1:n ywork(i)=sum(biaowork(:,i);endx=1:1:n;%8个职业figure();bar(x,ywork);xlabel(职业代号(Occupation=1,2,.,8);ylabel(发病人群数);title(发病人数按照职业分布的统计直方图);%2007-2010年每一年的12个月的发病人数曲线图%已经使用excel表格讲2007-2010每一年所有月的发病人数统计出来了。%统计2007年每个月的发病人数直方图data=textread(2007-2010各月发病人数.txt);x=1:1:12; %统计12个月figure();plot(x,data(1,:),r,x,data(2,:),g,x,data(3,:),b,x,data(4,:),k);xlabel(X/月份);ylabel(Y/发病人数);title(2007-2010年12个月的发病人数曲线图);legend(2007年发病人数曲线图,2008年发病人数曲线图,2009年发病人数曲线图,2010年发病人数曲线图,2);附录22008年的发病率、气压、平均气温以及相对湿度的数据月份123456发病率9.6%10.3%10.1%9.2%9.3%7.8%平均气压1027.21027.61018.81014.61008.61005.6平均气温3.1311.115.621.423.5平均相对湿度57.557.95862.466.382.4月份789101112发病率7.8%7.2%6.7%7.7%7.3%7.0%平均气压1003.71005.81011.31018.21023.21025平均气温30.2282519.912.16.8平均相对湿度71.377.379.477.275.665.52009年的发病率、气压、平均气温以及相对湿度的数据月份123456发病率8.7%8.5%8.3%8.6%8.8%7.9%平均气压1027.71019.61019.41015.71012.11003.4平均气温32.31015.921.626平均相对湿度69.679.570.967.361.374.4月份789101112发病率9.3%9.3%8.3%7.6%6.6%8.1%平均气压1003.81005.81012.11016.81023.41024.6平均气温28.427.624.320.4115.6平均相对湿度75.181.58069.577.471.92010年的发病率、气压、平均气温以及相对湿度的数据月份123456发病率9.0%7.6%8.8%8.7%9.6%8.2%平均气压1025.81020.71020.41017.91009.81007.6平均气温12.520.723.7平均相对湿度70.974.770.869.668.476.4月份789101112发病率9.0%8.6%8.3%8.8%8.0%5.5%平均气压1005.21007.51011.51018.91021.91020.2平均气温28.630.425.518.1136.9平均相对湿度75.671.677.274.368.962.22008年发病率和该年平均气压、平均气温以及平均湿度的关系图2009年发病率和该年平均气压、平均气温以及平均湿度的关系图2010年发病率和该年平均气压、平均气温以及平均湿度的关系图%#2.1:统计2007-2010年每一年发病率分别与当年平均气压、平均温度、平均湿度的数据图clc;clear;%读取数据data1=textread(2007-2010各月发病人数.txt);data2=textread(2007-2010各月气候.txt);num2007=data1(1,:); rate2007=num2007/sum(num2007);num2008=data1(2,:); rate2008=num2008/sum(num2008);num2009=data1(3,:); rate2009=num2009/sum(num2009);num2010=data1(4,:); rate2010=num2010/sum(num2010);climate2007=data2(1:3,:);climate2008=data2(4:6,:);climate2009=data2(7:9,:);climate2010=data2(10:12,:);%#2007年发病率分别与平均气压、平均温度、平均湿度的数据图%2007年发病率和平均气压的数据图figure();subplot(1,3,1);plot(climate2007(1,:),rate2007,-r.);ylabel(发病率);xlabel(平均气压);title(2007年1-12月发病率和平均气压的数据图);for t=1:1:12 text(climate2007(1,t),rate2007(t),num2str(t);end%2007年发病率和平均温度的数据图subplot(1,3,2);plot(climate2007(2,:),rate2007,-g.);ylabel(发病率);xlabel(平均气温);title(2007年1-12月发病率和平均气温的数据图);for t=1:1:12 text(climate2007(2,t),rate2007(t),num2str(t);end%2007年发病率和平均相对湿度的数据图subplot(1,3,3);plot(climate2007(3,:),rate2007,-b.);ylabel(发病率);xlabel(平均相对湿度);title(2007年1-12月发病率和平均相对湿度的数据图);for t=1:1:12 text(climate2007(3,t),rate2007(t),num2str(t);end%#2008年发病率分别与平均气压、平均温度、平均湿度的数据图%2008年发病率和平均气压的数据图figure();subplot(1,3,1);plot(climate2008(1,:),rate2008,-r.);ylabel(发病率);xlabel(平均气压);title(2008年1-12月发病率和平均气压的数据图);for t=1:1:12 text(climate2008(1,t),rate2008(t),num2str(t);end%2008年发病率和平均温度的数据图subplot(1,3,2);plot(climate2008(2,:),rate2008,-g.);ylabel(发病率);xlabel(平均气温);title(2008年1-12月发病率和平均气温的数据图);for t=1:1:12 text(climate2008(2,t),rate2008(t),num2str(t);end%2008年发病率和平均相对湿度的数据图subplot(1,3,3);plot(climate2008(3,:),rate2008,-b.);ylabel(发病率);xlabel(平均相对湿度);title(2008年1-12月发病率和平均相对湿度的数据图);for t=1:1:12 text(climate2008(3,t),rate2008(t),num2str(t);end%#2009年发病率分别与平均气压、平均温度、平均湿度的数据图%2009年发病率和平均气压的数据图figure();subplot(1,3,1);plot(climate2009(1,:),rate2009,-r.);ylabel(发病率);xlabel(平均气压);title(2009年1-12月发病率和平均气压的数据图);for t=1:1:12 text(climate2009(1,t),rate2009(t),num2str(t);end%2009年发病率和平均温度的数据图subplot(1,3,2);plot(climate2009(2,:),rate2009,-g.);ylabel(发病率);xlabel(平均温度);title(2009年1-12月发病率和平均气温的数据图);for t=1:1:12 text(climate2009(2,t),rate2009(t),num2str(t);end%2009年发病率和平均相对湿度的数据图subplot(1,3,3);plot(climate2009(3,:),rate2009,-b.);ylabel(发病率);xlabel(平均相对湿度);title(2009年1-12月发病率和平均相对湿度的数据图);for t=1:1:12 text(climate2009(3,t),rate2009(t),num2str(t);end%#2010年发病率分别与平均气压、平均温度、平均湿度的数据图%2010年发病率和平均气压的数据图figure();subplot(1,3,1);plot(climate2010(1,:),rate2010,-r.);ylabel(发病率);xlabel(平均气压);title(2010年1-12月发病率和平均气压的数据图);for t=1:1:12 text(climate2010(1,t),rate2010(t),num2str(t);end%2010年发病率和平均温度的数据图subplot(1,3,2);plot(climate2010(2,:),rate2010,-g.);ylabel(发病率);xlabel(平均气温);title(2010年1-12月发病率和平均气温的数据图);for t=1:1:12 text(climate2010(2,t),rate2010(t),num2str(t);end%2010年发病率和平均相对湿度的数据图subplot(1,3,3);plot(climate2010(3,:),rate2010,-b.);ylabel(发病率);xlabel(平均相对湿度);title(2010年1-12月发病率和平均相对湿度的数据图);for t=1:1:12 text(climate2010(3,t),rate2010(t),num2str(t);end附录3%#2.2:建立非标准化和标准化的的面板数据模型clc;clear;%读取数据data1=textread(2007-2010各月发病人数.txt);data2=textread(2007-2010各月气候.txt);num2007=data1(1,:); rate2007=num2007/sum(num2007);num2008=data1(2,:); rate2008=num2008/sum(num2008);num2009=data1(3,:); rate2009=num2009/sum(num2009);num2010=data1(4,:); rate2010=num2010/sum(num2010);climate2007=data2(1:3,:);climate2008=data2(4:6,:);climate2009=data2(7:9,:);climate2010=data2(10:12,:);%#建立非标准化的面板回归数据模型%2007年的非标准化面板数据模型Y=rate2007;x1=climate2007(1,:); %平均气压x2=climate2007(2,:); %平均温度x3=climate2007(3,:); %平均相对湿度X=ones(12,1) x1 x2 x3;a2007,aint,r,rint,stats1=regress(Y,X,0.05)figure();format short;rcoplot(r,rint);%2008年的非标准化面板数据模型Y=rate2008;x1=climate2008(1,:); %平均气压x2=climate2008(2,:); %平均温度x3=climate2008(3,:); %平均相对湿度X=ones(12,1) x1 x2 x3;a2008,aint,r,rint,stats1=regress(Y,X)figure();format short;rcoplot(r,rint);%2009

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论