全国大学生数学建模大赛2012C题.doc_第1页
全国大学生数学建模大赛2012C题.doc_第2页
全国大学生数学建模大赛2012C题.doc_第3页
全国大学生数学建模大赛2012C题.doc_第4页
全国大学生数学建模大赛2012C题.doc_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2011高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): C 我们的参赛报名号为(如果赛区设置报名号的话): 139C05 所属学校(请填写完整的全名): 浙江工贸职业技术学院 参赛队员 (打印并签名) :1. 郑济明 2. 王庆松 3. 朱松祥 指导教师或指导教师组负责人 (打印并签名): 数模组 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2011高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号): 脑卒中发病环境因素分析及干预 摘 要 关键词:1、 问题重述 21世纪人类倡导人与自然和谐发展,环境因素成为影响健康的重要因素。脑卒中(俗称脑中风)就是与环境因素紧密相关且威胁人类生命的疾病之一。这种疾病的诱发已经被证实与环境因素有关,其中与气温和湿度存在着密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。现从中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)和 数据(见Appendix-C1)。需解决一下几个问题:问题一:根据病人基本信息,对发病人群进行统计描述。问题二:建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。问题二 :查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所得结论,对高危人群提出预警和干预的建议方案。 二、问题分析 脑卒中(俗称脑中风)作为威胁人类生命的疾病之一,并且病发的人群受环境因素的影响不断扩展。对脑卒中人群及受环境因素的影响分析来对疾病的风险评估,对脑卒中高危人群能够及时采取干预措施成为一项无疑是一项十分复杂的系统工程。 对于问题一,利用中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)和数据(见Appendix-C1)。通过excel对已知数据进行统计整理,再利用matlab程序对脑卒中病发者的性别指数、年龄指数、职业指数、月份指数进行合理的统计得出相应数据比率。对于问题二,通过题意了解到环境影响脑卒中的发病率,通过利用SPSS和MATLAB软件分析计算,得出主成份分析法和非线性回归分析的方法对多重共线性因子合并和显著因子分析辨识。对于问题三,利用问题一、二高危人群诊断、发病率的因素分析,利用三角函数模型、马尔科夫模型对未来年份气象的状况预测,来预测高危人群发病率并采取相应干预措施。 三、模型假设3.1模型假设:四、符号说明 参保年龄 模型的建立及求解5.0模型数据预处理 根据已知题意给出的中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地逐日气象资料(Appendix-C2)和数据(见Appendix-C1)的excel表格数据,我们对以下相应的数据进行合理的数据预处理: 数据处理一:由题意信息调查的对象是中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例,所以在已知的excel表格中出现的其他时间数据应当删除。 数据处理二:对于给出的信息年龄与职业不符(例如:12周岁是老师)、诊断时间不详、数据明显出错的都不应该考虑在统计范围之内,应当删掉。 数据处理三:对需要的数据格式统一化。5.1.1、性别病发者比例 1) 对发病人群的性别差异简单分析:设X1表示男性病例总数,X2表示女性比例总数,N表示总病例数,男性病发者病比例,女性病发比例 -(1)将2007-7-1至2010-12-31的资料进行统计的N=58925,X1=31832 ,X2= 27093,带入(1)得x1=0.5402 ,x2= 0.4598 。如图1和表1所示。(通过程序matlab验证,见附录1) 图1 男女病发者比例图男性 女性0.5402 0.4598 表 1 男女病发者比例表 由表1和图1我们可以清晰的看到男性在脑卒中的病发者要大于女性脑卒中病发人数。单因素方差分析:2) 逐月统计男女病例人数,考察在相同时间点上男女人群发病人数是否显著差异,结果为(见图2) ,给定显著水平,,由于所以男女有著差异(见图3和matlab程序附录2)。 图2 方差运算结果 图3方差图 5.1.2、年龄不同阶段病发者比例 利用excel预处理数据后的年龄脑卒中病发者年龄信息,将excel表格数据导入matlab并且编辑程序(见附录3)得出了年龄不同阶段脑卒中病发者的比例,见表2。 图4 年龄不同病发者比例图40岁以下40-50岁50-60岁60-70岁70-80岁80岁以上0.01750.04730.12880.23190.34060.2339 表2 年龄不同病发者比例 图 3 年龄不同病发者比例图 由图2和表2可以看出在50岁以下的人口中脑卒中病发的人数比例较小,60-80之间脑卒中的比例最为严重,80岁以上的人脑卒中较为严重,所以高龄的人是发生脑卒中的高危人群,我们应当高度关注。 图3利用histfit函数在matlab软件程序画出年龄不同病发者的比例,证明了高龄人口发病率高,提醒高龄人注意身体健康。 5.1.3、不同职业病发者比例 同样利用excel预处理数据后的职业脑卒中病发者年龄信息,将excel表格数据导入matlab并且编辑程序(见附录4)得出了不同职业的脑卒中病发者的比例(见表3)。 图5 不同职业病发者比例农民工人退休人员教师渔民医务人员职工离退人员其他职业0.48060.07280.10700.00360.00100.00140.01190.02800.2937 表3 不同职业病发者比例 由表3和图5得出农民、工人、退休人员、其他职业的人员患脑卒中的比例偏高,而其他的人患脑卒中的比例偏低。说明了职业也是患脑卒中的重要因素。5.1.4、2007年-2010年各自月份病发者指标 再次利用excel预处理数据后的脑卒中病发者的月份信息,将excel表格数据导入matlab并且编辑程序(见附录5)得出了不同月份脑卒中病发者的指标(见表4)。 图6 2007年-2010年各自月份病发者指标 1月2月3月4月5月6月0.70930.88041.01440.99181.10121.03387月8月9月10月11月12月1.11891.03461.03151.03331.00991.0409 表4 2007年-2010年各自月份病发者指标由表4和图6看出在七、八月份为脑卒中高发期,一月为脑卒中病发的可能性最小,所以告诫那些脑卒中的高危人群要注意气温变化。6.0问题二的模型建立与求解6.1.1主成分模型介绍1)主成分分析的基本原理、数学模型及基本步骤1.1基本原理主成分分析是把多个变量转化为少数几个新综合变量的一种多元统计方法,其基本思想就是在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾.其手段是将原来众多的具有一定相关性的变量重新组合成新的少数几个相互无关的综合变量(也叫抽象变量),来代替原来变量,这些新的综合变量称之为主成分.一般地说,利用主成分分析得到的主成分与原来的变量之间有如下基本关系:(1)每一个主成分都是各原始变量的线性组合.(2)主成分的数目大大少于原始变量的数目.(3)主成分保留了原始变量的绝大多数信息.(4)主成分之间互不相关.据此我们建立数学模型.1.2 数学模型在一个统计问题中,假设我们收集到个样品,每个样品观测到个变量(记为为简单起见,可以设均值为0,方差为1,),构成一个阶的样本原始资料阵: 主成分分析的目的在于利用个原始变量()构造少数几个新的综合变量,使得新变量为原始变量的线性组合,新变量互不相关,新变量包含个原始变量的绝大部分信息.这样定义为原始变量,为新的综合变量指标,每一个新综合变量指标是个原始变量的线性组合: 同时要求满足以下几个条件:1)与相互无关;2)是的一切线性组合中方差最大者;是与不相关的的所有线性组合中方差最大者;是分别都不相关的的所有线性组合中方差最大者.则新变量分别称为原变量的第一、第二、第主成分.从以上的分析可以看出,主成分分析的实质就是确定原来变量在诸主成分上的系数.从数学上可以证明,他们分别是个原始变量()相关矩阵的前个具有较大特征值所对应的特征向量,而各个新综合变量的方差恰好是相应的特征值.各主成分的方差贡献大小按特征根顺序排列,是依次递减的,即.其几何意义是:主成分分析相当于对原坐标轴做一次旋转变换,使得新坐标系的第1轴对应于数据变易的最大方向,第2轴与第1轴正交,且对应于数据变易的第二大方向,依次类推.1.3主成分分析的基本步骤.(1)确定分析变量,收集原始数据;设原始数据矩阵为其中表示第个样品(对象)在第个变量上的取值,即 (1)(2)在进行主成分分析之前,要检验该样本矩阵是否适合于主成分分析.KMO检验是检验变量之间偏相关关系的统计量,用于检验变量间的偏相关系数是否过小. KMO统计量越接近于1,说明各变量间的偏相关系数越大,KMO统计量大于0.9,效果最好;如果统计量小于0.6,则不适合于做主成分分析.Bartlett球形检验是检验相关矩阵是否是单位矩阵,即各变量是否各自独立.(3)对原始数据进行标准化,即令 (2)其中分别为第列元素的样本均值和样本标准差,即则为标准化的样本资料库.(4)由标准化后的数据矩阵求协方差矩阵,或者由原始数据矩阵求相关系数矩阵.这两种方法结果相等.本文采用直接计算原始数据的相关矩阵的方法(对于数量级差别较大或者有量纲的数据宜适用).设原始数据的相关系数矩阵为 (3)为原变量与的相关系数,其计算公式为 (4)(5)计算的特征根和特征向量;根据特征方程得的特征根为,将特征根按照从大到小的顺序排列,排列后的特征根不妨仍然表示为.同时可得对应的特征向量,将他们标准正交化,称为主轴.(6)计算所有变量的方差贡献率及累计方差贡献率;的方差贡献率为 (5)的累计方差贡献率为 (6)(7)确定主成分的数目. 方法有:一般取累计贡献率达85%95%的主成分;选用所有的主成分;累计特征值乘积大于1的主成分;画出特征值变化曲线,以转折点位置为标准判断.本文采用累计贡献率达85%95%的主成分. (8)确定主成分函数表达式模型. 设个主成分对应的特征向量分别为,其中,表示的第行的元素,则第个主成分的函数表达式为 (7)(9)提炼主成分的抽象意义.由与的相关系数的大小可以确定主要与哪几个变量显著相关,然后根据这几个变量的实际意义提炼的抽象意义.(10)检验主成分模型.根据个样本的个主成分的函数值,通过计算个主成分的相关系数就可以检验个主成分是否线性无关.如果两个主成分的相关系数为0,则说明这两个主成分线性无关,模型有效;否则线性相关,模型无效.(11)求主成分函数值将各样本标准化数据代入(7),可以求得各样本的第个主成分的函数值6.2.2模型求解 以下运行结果(见word附件1)(1)收集原始数据矩阵(见excel附件2).本文选取了地区的月平均气压的平均值、月最高气压的平均值、月最低气压的平均值、月平均气温的平均值、月最高气温的平均值、月平均气压的平均值八项指标,并分别记为. (见附录3)(2)将原始数据标准化,(SPSS内部计算见附录4).(3)求原始数据的相关系数矩阵,如表3所示. 图(一)未旋转的因子载荷矩阵 图(二)因子分析图从图(二)因子分析中,变量应该有较高的关联度,降维德效果才好,因此表格的第一行为检验变量间偏相关程度的KMO统计量,其值为在0.6之上所以数据适合做因子分析,效果显著,否则小于0.6,效果不显著不行。第三行为球形检验的结果,球形检验原假设的变量是不相关的,显然只有拒绝原假设的情况下数据才适合做因子分析。本例中KMO值为0.720,球形检验显著,两个条件都满足,变量间相关程度大,适合做因子分析。(4)计算矩阵的特征根、各因子的方差贡献率及累计方差贡献率,并确定主成分的个数.(见附件5)表4 特征值及其累计方差贡献率 从表4中可以看出,第一、第二主成分对方差的累计贡献率达到95.461%,它们分别对应着原样本数据点数据变异的最大、次大方向,是原变量系统的一个最佳整合,从而我们可以以95.461%的精度将变量的有效维数从8维降至2维.因此可以将前2个因子作为主因子.(5)确定主成分函数表达式模型,因子得分系数矩阵如表5所示. 表5 因子得分系数矩阵 设2个主成分分别为,则建立模型: (10) 其中均为原变量经过均值为0,方差为1标准化后的变量.(6)对主成分的意义进行解释。表6给出了原变量与第1、第2主成分的相关系数. 表6 因子载荷后矩阵 第一主成分,与原变量(平均气压的平均值)、(最高气压的平均值)(最低气压的平均值)、(最低气温的平均值)的相关系数的绝对值都超过了0.948,因此它是一个反映气温和气压的综合因子,我们称之为气压温度因子. 第二主成分,与原变量(月平均相对湿度的平均值)的相关系数为0.925、(月最低相对湿度的平均值)的相关系数为0.948,其余的都不超过0.266,因此它是一个反映平均相对湿度平均值、最低相对湿度平均值的因子,湿度因子.(7)计算2个主成分的函数值.将48个的经月份过标准化的数据代入模型,可以得到48个地区的主成分的函数值,然后根据函数值的大小按照从大到小的顺序排列,结果如表7所示. 表7 48个月份对应的主成分的函数值序号y1y21-1.6817 0.5485 2-0.7683 -0.2082 3-0.4507 -0.2166 40.1520 -1.5909 51.1598 -1.7758 60.9259 0.7554 71.5239 0.2097 81.5284 -0.4272 90.5675 1.0055 10-0.1318 0.1920 11-0.6524 -0.9464 12-1.1893 0.5304 13-1.5177 -0.4902 14-1.3599 -1.3556 15-0.1654 -2.0187 160.1845 -1.0300 170.9955 -1.3149 180.6764 1.8659 191.6182 -0.2525 201.1459 0.7356 210.5359 1.1416 22-0.1899 0.9149 23-0.9077 0.5766 24-1.0360 -0.9904 25-1.6009 -0.0607 26-1.1214 1.7700 27-0.6747 0.0076 280.1144 -0.9173 290.9219 -2.0976 301.3417 0.0584 311.3521 0.4715 320.9402 1.6644 330.3575 1.5115 340.2595 -0.7272 35-1.0907 1.1667 36-1.3314 0.3153 37-1.4531 0.2577 38-1.0832 0.8107 39-0.8234 0.1507 40-0.4007 -0.0756 410.7358 -0.6592 420.7824 0.7099 431.2455 0.6445 441.3537 -0.1331 450.5816 0.9467 46-0.2459 0.4312 47-0.5312 -0.6331 48-0.5928 -1.4716 6.2.3多元非线性回归模型建立与求解 假设输入变量和输出变量之间的关系是线性函数关系,建立多元线性回归模型。 (2)为了在研究两个指定变量之间的相关关系的同时,控制可能对其产生影响的其他变量,我们在研究任意两个输入变量的相互作用的判断中,运用了偏相关分析先对任意两个输入变量之间是否有交互作用进行判断。设随机变量X、Y、Z之间彼此存在着相关关系,为了研究X和Y之间的关系,就必须在假定Z不变的条件下,计算和Y的偏相关系数,记为。在考察多个变量时,(i=1,2.,p)之间的p-1阶偏相关关系可由如下的递推式定义: 计算得出输出变量的相关性检验。(3)我们建立部分多元非线性回归模型,来判断在Y与的模型中有交互作用的的形式。e+ 其中,在判断出的形式的形式后,我们建立所有与Y的多元非线性回归模型。(4) 将数据录入后,用SPSS13.0软件得出未知系数,从而得出之间的函数关系。然后再进行参数估计,统计分析,假设检验,回归系数检验,相关系数检验,如果通过检验,则得到较优模型,若未通过检验,则进行进一步调整优化。 (5)参数估计在得出函数关系后,我们要对其进行参数估计。 假设有n个独立观测的数据要确定回归系数由最小二乘法,即 求出估计值 bb=Y的估计值为: 拟合误差称为残差平方和 (6) 统计分析 首先,求残差平方和Q,并由此得的无偏估计。 然后,对Y的样本方差进行分解。 (7) 假设检验 构造F-统计量及检验的拒绝域: 拒绝域(8) 回归系数的检验 判断每个自变量对的影响是否显著。 其中,(9) 相关系数检验 复相关系数R是衡量y与相关程度的指标,R的值越接近于1,它们的相关程度越密切。问题三、模型建立与求解 1 引言马尔柯夫链预测的优势在于长期预测和对随机波动性较大数据列的预测问题,但是,马尔柯夫链预测对象要求具有平稳过程。为了提高预测精度,建立加权马尔柯夫链预测模型。2 有关模型和方法2.1 自相关系数原始序列的各阶自相关系数反映已知数据对未来数据的影响程度. 各阶自相关系数为 (13)式中, (14)对各阶自相关系数归一化得, (15)可作为各阶步长的马尔柯夫链权重,是按预测需要计算的最大阶数,一般取.根据可以确定转移步数.2.4 加权马尔柯夫模型1)状态的划分设划分的个湿度区间为其中,尽可能小,尽可能大.,如果 (23)则表明第年的相对误差处于第种状态.2)状态转移概率矩阵的构造设步转移概率为,记: (24)其中,表示状态经过步转移到状态的次数,为状态出现的次数.由于数据序列最后的状态转向不确定,故计数时要去掉数据序列中最末的个数据(也就是只考虑前面的个数据).由构成的矩阵称为步转移概率矩阵,记作 (25)已知每一步的概率转移矩阵和每一步的初始状态,则马尔柯夫链就可以确定.3)预测值的计算选取距离预测年最近的个年份,按照距离预测年由近到远,转移步数分别为,以这几年的相对误差所对应的状态为初始状态,不妨设第年所对应的初始状态分别为,其中,.例如,当时,说明距离预测年第2年的状态是第5状态.在转移步数对应的转移矩阵中,取起始状态所对应的行向量,从而组成新的概率矩阵 (26)将矩阵加权得 (27)将矩阵按列求和得 (28)找出向量的最大分量得 (29)分量所对应的状态就是预测年的状态,则该年度的预测值为3 计算1)自相关系数根据(13)、(14)、(15)式计算可得各阶的自相关系数,确定最大滞后阶数.各阶自相关系数及权重见表2.表2 我国人均(电力)生活能源消费量的自相关系数及权重120.4527 0.20420.6891 0.31092)状态划分划分的6种状态区间,见表4.表4 各个状态区间状态编号状态区间0,60)60,65)65,70)70,75)75,80)80,1003)构造转移概率矩阵如果有的状态不能从统计表中得到转移概率,则假定它未来转移到各个状态的概率都相等,即都等于.根据(24)、(25)可得5步内的转移概率矩阵1步转移概率矩阵2/31/3000001/52/51/51/501/113/112/1104/111/1101/135/134/133/130001/121/21/31/12001/31/301/32步转移概率矩阵1/31/31/30001/5001/52/51/51/101/1001/23/10003/134/133/132/131/1301/125/121/61/41/12001/302/304)组成预测年份的新转移概率矩阵选择离预测年最近的5个年份,转移步数分别为,如预测2009年的转移概率矩阵,根据(26)式得预测年的转移概率矩阵,见表5. 表5年份状态步长权重预测年的转移概率矩阵概率来源1234562009210.689101/52/51/51/502008320.31091/101/1001/23/100加权求和0.03110.16890.27560.29330.231105)确定预测年份的状态根据(27)、(28)、(29)式得,预测年的状态向量的最大分量值为0.2933,对应的状态为第4状态,即2011年湿度将处于第4状态,湿度72.5.将2009年的状态6放入序列中,重新构建马尔柯夫链,得2010年所处的状态是第6状态. 同理可得2011年-2015年所处的状态,见表7.平均绝对相对误差为1.62%,最大绝对相对误差为3.15%.2011年湿度预测月份123456789101112湿度 脑卒中发病的现状与特点脑卒中,又称中风或脑血管意外,它包括脑出血、蛛网膜下腔出血、脑梗死和短暂性脑缺血发作等急性脑血管病,是一组突然起病,以出现意识障碍和局灶性神经功能缺失为共同特征的急性脑血管病。它具有以下特征:(1)发病率高;(2)致残率高;(3)死亡率高;(4)复发率高。而且,大量的临床实践已证明,对已发生的脑卒中,无论如何完善的治疗,对其短期病死率和自然病程的影响都不很理想,因此,对脑卒中的发病更应特别强调预防为主的方针。 普遍认为气温、气压的急剧变化对脑卒中发病率具有显著的影响,气压上升、气温骤降的冷空气活动可导致发病率急剧增加。除此以外,发现北方地区云量和日降水量大。 5.2.2 模型的求解首先,计算该企业职工缴费指数的参考值。5.3 问题三的模型建立与求解企业职工养老基金缺口情况,5.3.1 模型的建立养老保险基金=社会统筹基金+个人账户基金5.3.2 模型的求解当退休年龄,5.4 问题四的模型与求解 通过matlab编程,六、模型的优化七、模型的评价7.1 模型的优缺点7.1.1 模型的优点:1)主要因素并进行了定量分析,7.1.2模型的缺点:1)当考虑定性相关因素较多时,八、参考文献1 周晓平、杨进,脑卒中发生时气节规律及其气象医学原理探讨,中医杂志,2006年6月第47卷第6期理论探讨。2 谢文龙、尚涛,SPSS统计分析与数据挖掘,北京电子工业出版社,2012.1(工程设计与分析系列)。3韩中庚,数学建模方法与应用,北京-高等教育出版社,2005.6(2006重印)。4陈在余、陶应虎,统计学原理与实务,北京-清华大学出版社,2009.3(高等学校应用型特色规划教材 经管系)九、附录附录1.统计发病人群的性别比例建立M-文件:%统计发病人群的性别比例A=xlsread(c题数据1.xls,sheet1,A2:F58926);%读入发病人群信息,58925行-6列a=size(A);B=zeros(1,2);for i=1:a(1) if A(i,1)=1 B(1,1)=B(1,1)+1;%男性病人的人数 else B(1,2)=B(1,2)+1;%女性病人的人数 endendB=B/a(1),%性别比例附录2.方差程序function y=tongji50(A,t)% A是发病人数信息矩阵, t是年份2007,2008,2009,2010a=size(A);B=zeros(2,12);for i=1:a(1) if A(i,4)=t if A(i,1)=1 if A(i,5)=1 B(1,1)=B(1,1)+1; elseif A(i,5)=2 B(1,2)=B(1,2)+1; elseif A(i,5)=3 B(1,3)=B(1,3)+1; elseif A(i,5)=4 B(1,4)=B(1,4)+1; elseif A(i,5)=5 B(1,5)=B(1,5)+1; elseif A(i,5)=6 B(1,6)=B(1,6)+1; elseif A(i,5)=7 B(1,7)=B(1,7)+1; elseif A(i,5)=8 B(1,8)=B(1,8)+1; elseif A(i,5)=9 B(1,9)=B(1,9)+1; elseif A(i,5)=10 B(1,10)=B(1,10)+1; elseif A(i,5)=11 B(1,11)=B(1,11)+1; elseif A(i,5)=12 B(1,12)=B(1,12)+1; end else if A(i,5)=1 B(2,1)=B(2,1)+1; elseif A(i,5)=2 B(2,2)=B(2,2)+1; elseif A(i,5)=3 B(2,3)=B(2,3)+1; elseif A(i,5)=4 B(2,4)=B(2,4)+1; elseif A(i,5)=5 B(2,5)=B(2,5)+1; elseif A(i,5)=6 B(2,6)=B(2,6)+1; elseif A(i,5)=7 B(2,7)=B(2,7)+1; elseif A(i,5)=8 B(2,8)=B(2,8)+1; elseif A(i,5)=9 B(2,9)=B(2,9)+1; elseif A(i,5)=10 B(2,10)=B(2,10)+1; elseif A(i,5)=11 B(2,11)=B(2,11)+1; elseif A(i,5)=12 B(2,12)=B(2,12)+1; end end endendy=B,%1年*12个月的男女发病人数 %发病人群信息A=xlsread(c题数据1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B1=tongji50(A,2007);B2=tongji50(A,2008);B3=tongji50(A,2009);B4=tongji50(A,2010);B=B1;B2;B3;B4B,%48*2矩阵,男女48个月的发病人数p = anova1(B),% 下面做单因素方差分析附录3.统计各阶段发病人群年龄比例建立M-文件:%发病人群信息A=xlsread(c题数据1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B=zeros(1,6);for i=1:a(1) if A(i,2)=40 & A(i,2)=50 & A(i,2)=60 & A(i,2)=70 & A(i,2)80 B(1,5)=B(1,5)+1;%80岁以上病发人数 else B(1,6)=B(1,6)+1; endendB=B/a(1) %年龄比率附录4、不同职业病发者比例%发病人群信息A=xlsread(c题数据1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B=zeros(1,9);for i=1:a(1) if A(i,3)=1 B(1,1)=B(1,1)+1;%农民在病发者中的人数 elseif A(i,3)=2 B(1,2)=B(1,2)+1;%工人在病发者中的人数 elseif A(i,3)=3 B(1,3)=B(1,3)+1;%退休人员在病发者的人数 elseif A(i,3)=4 B(1,4)=B(1,4)+1;%教师在病发者的人数 elseif A(i,3)=5 B(1,5)=B(1,5)+1;%渔民在病发者中的人数 elseif A(i,3)=6 B(1,6)=B(1,6)+1;%医务人员在病发者中的人数 elseif A(i,3)=7 B(1,7)=B(1,7)+1;%职工在病发者中的人数 elseif A(i,3)=8 B(1,8)=B(1,8)+1;%其他职业在病发者中的人数 else B(1,9)=B(1,9)+1; endendB=B/a(1)%不同职业人数比例附录5、 2007年-2010年各自月份病发者指标 %发病人群信息A=xlsread(c题数据1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B=zeros(4,12);for i=1:a(1) if A(i,4)=2007 if A(i,5)=1 B(1,1)=B(1,1)+1; elseif A(i,5)=2 B(1,2)=B(1,2)+1; elseif A(i,5)=3 B(1,3)=B(1,3)+1; elseif A(i,5)=4 B(1,4)=B(1,4)+1; elseif A(i,5)=5 B(1,5)=B(1,5)+1; elseif A(i,5)=6 B(1,6)=B(1,6)+1; elseif A(i,5)=7 B(1,7)=B(1,7)+1; elseif A(i,5)=8 B(1,8)=B(1,8)+1; elseif A(i,5)=9 B(1,9)=B(1,9)+1; elseif A(i,5)=10 B(1,10)=B(1,10)+1; elseif A(i,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论