西南大学A商彦英董浩赵彦荭张小飞.doc_第1页
西南大学A商彦英董浩赵彦荭张小飞.doc_第2页
西南大学A商彦英董浩赵彦荭张小飞.doc_第3页
西南大学A商彦英董浩赵彦荭张小飞.doc_第4页
西南大学A商彦英董浩赵彦荭张小飞.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2007高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 西南大学 参赛队员 (打印并签名) :1. 赵彦荭 2. 董浩 3. 张小飞 指导教师或指导教师组负责人 (打印并签名): 商彦英 日期: 2007 年 9 月 24 日赛区评阅编号(由赛区组委会评阅前进行编号):2007高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):中国人口的灰色预测模型摘要 本文利用灰色系统理论首先找到了影响全国总人口数的几项关键因素,建立短期灰色预测模型对全国短期人口数和几项关键因素做出了预测;然后将灰色预测模型和Logistic模型结合起来建立了平均法模型,将两种模型的优劣势互补综合,得到了较好的长期预测模型。本文还分析了全国人口的年龄结构特征和发展趋势,注意到了老龄化社会的到来并预测了全国人口负增长的时间点在2035年。关键词 灰色系统 灰色关联分析 灰色预测模型 Logistic模型 人口系统 一、问题重述中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。2007年初发布的国家人口发展战略研究报告还做出了进一步的分析。根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。试从中国的实际情况和人口增长的上述特点出发,参考随题目给出的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;特别要指出模型中的优点与不足之处。二、模型假设及符号说明2.1模型假设1假设从2005年2055年不会发生人口数量突变事件。2. 假设全国人口的迁进和移出保持平衡。3. 假设平均一个妇女一胎只生一个孩子。2.2符号的设定和说明-参考数列 -第i个比较序列 -比较数列对参考数列在t时刻的关联系数 -为数列对参考数列的关联度.-人口某指标i(如出生率,人口数等)的原始时间序列P(n)-2004以后第n年的全国人口数量 人口固有增长率- 人口容量三、问题分析3.1 整体分析人口系统是一个复杂的系统,对人口增长趋势的描述不仅包括人口数量的预测,还应包括对人口结构的预测。如人口年龄结构,性别结构,城、镇、乡人口分布,生育率,出生人数,出生率和死亡率等,因此我们应该从多方面描述中国人口的发展趋势。基于少量原始数据而作出较为准确的预测关键在于选取优良的模型。这个模型应当能够从少量的原始数据中以较小的误差来预测将来的人口情况。预测人口的常用模型有马尔萨斯模型、Logistic模型、多项式模型、灰色预测模型等,其中多项式模型、Logistic模型和马尔萨斯模型都要求有大量的原始数据,而灰色预测模型则很适合于原始数据较少且对系统所知信息较少的“灰色系统”情况。因此,本文选用GM(1,1)灰色预测模型作为短期预测模型,先采用灰色系统关联分析来研究哪些是影响中国人口数量的主要因素,然后对关联度较大的几个因素作灰色预测。根据人们普遍接受的人口预测短、中、长期的划分,我们以5年作为中短期预测的最长期,以50年作为长期预测的最长期。3.2对影响中国人口因素的灰色关联分析根据关联分析的方法,我们以2001年2005年人口数据作为基本数列,从中选择了12个指标做灰色关联分析,找出了影响全国人口数的主要因素,为以后对人口的各项预测做准备。3.3对全国人口的中短期预测问题的分析对全国人口数量的预测首先要对各年份的出生率和死亡率进行预测。出生率和死亡率与国民经济情况、人们的观念、习俗、社会安全状况、医疗水平等很多不确定因素密切关联,然而我们又能够根据已知数据将它计算出来,因此我们对出生率的认识是一种“部分信息已知,部分信息未知”的认识,这正是灰色系统研究的对象。根据2001年2005年的数据用GM(1,1)灰色预测法预测出未来5年内每年的出生率和死亡率并给出预测函数和误差。利用上面对未来5年出生率和死亡率的预测值和可查到的2004年我国人口总数,可以计算出未来5年的人口总数。在3.1的结论基础之上,我们对2005年起5年内的影响人口数量的主要因素作灰色预测。3.4对中国人口的长期预测问题的分析长期人口预测需要大量的原始数据作基础,然而本题中原始数据仅局限于2001年2005年5年的数据,因此灰色预测的结果可能存在较大误差。对此问题,我们认为:灰色预测模型是根据少量原始数据尽量减小误差,是一种完全根据数据值来做预测的模型,这个模型并没有考虑到人口问题的实际:自然资源、环境压力等生态学因素对人口的制约。所以,我们应当引进实际生态学方面的影响因素,来建立新的模型,这个模型能够融合GM(1,1)的数值预测优势,还能够很好的兼容实际因素。基于以上考虑,我们选取Logistic模型与GM(1,1)模型相综合,取二者在同一时间点的平均值作为预测结果。四、模型的建立与求解4.1对影响中国人口数量的因素的灰色关联分析 灰色关联度 选取参考数列 其中t表示时刻。假设有m个比较序列 则称 为比较数列对参考数列在t时刻的关联系数,其中为分辨系数,一般来说0,1.上式定义的关联系数是比较序列与参考序列在某时刻关联程度的一种指标,由于各个时刻都有一个关联系数,因此信息显得过于分散,难于比较某一具体因数对整体的关联度大小,为此我们称 为数列对参考数列的关联度.关联序 根据后面3个表格的数据和上面两个公式可以计算出各比较数列对参考数列的关联度。将各比较序列的关联度按从大到小的顺序排列,便构成了关联序。我们收集了2000年2005年的基本数据,从中选取了对人口数量影响比较大的12个指标,并参照 1把它们分为三大类:总量指标=总人口,市人口,镇人口,乡人口,男性人口,女性人口,年龄结构指标=014岁,1564岁,6590+岁,分析指标=总和生育率,死亡率,出生率,自然增长率。下面我们分别计算各个指标的灰色关联度统计2001年2005年构成总量指标、年龄结构指标的各个指标占总人口的比重,以及构成分析指标的各个指标,如下3个表:分布年份20012002200320042005市0.2420 0.2616 0.2602 0.2582 0.2772 镇0.1297 0.1255 0.1522 0.1536 0.1713 乡0.6283 0.6129 0.5876 0.5882 0.5516 男0.5103 0.5105 0.5104 0.5085 0.5054 女0.4897 0.4895 0.4896 0.4915 0.4946 2001年2005年总量指标中各个指标的所占比例 年份年龄 20012002200320042005014岁22.6609221.463520.6378819.2990719.54951564岁69.8251371.1058271.1058272.1082271.356166490+岁7.8970317.8970318.2508948.5713279.0461082001年2005年的各年龄段占总人口比例(单位%) 年份指标20012002200320042005总和生育率0.03210.03050.003010.03050.02727自然增长率0.01540.013910.013280.01390.0276出生率0.03250.03090.030.03070.0309死亡率0.01710.016990.016720.01680.0033 2001年2005年分析指标中各个指标(单位)通过MATLAB程序(附录1),计算得出各指标灰色关联分析结果如下:总量指标:市,镇,乡,男,女的关联度依次为:0.2070,0.1846,0.3228, 0.2823,0.2751.其关联序为:乡男女市镇.年龄结构指标:014岁, 1564岁, 6490+岁的关联度依次是:0.2499,0.4775, 0.2236。其关联。分析指标:总和生育率,自然增长率,出生率,死亡率的关联度依次为: 0.0136, 0.0135, 0.0137 , 0.0135。关联序是: 出生率总和生育率自然增长率死亡率。讨论 2003年因全国发生非典总和出生率降低了很多,别的分析指标没有大的变动。因此在所有与生育率有关的预测中我们把2003年看作是突变的一年。从上面的灰色关联分析可以看出,讨论的12个指标对人口数都有一定的影响。但从具体的指标出发,从总量指标分析乡人口对总人口系统的影响最大,这一点是合理的。这是因为农村人口占总人数的比重很大,而农村妇女的生育率又很大。对年龄结构指标分析,发现1564岁对总人数的影响最为显著,但另一方面65岁以上的非劳动力所占比例也比较大,说明我国是一个劳动力型占主要地位,年龄结构已完成向老龄化转变的人口大国。分析指标中死亡率对总人口数影响最小,因此在一些资料里中短期预测模型中假设死亡率不变具有一定的理论意义。4.2对中国人口状况的中短期预测的GM(1,1)模型4.2.1模型的建立设为原始数据的第一年到第n年的人口某指标i(如出生率,人口数等)原始时间序列对进行一次累加生成,即1AGO,得到生成序列其中,构造背景值序列其中,一般取建立白化方程将上式离散化,微分变差分,得到GM(1,1)灰微分方程:,为待定系数,分别称为发展系数和灰色作用系数,它们可用最小二乘法求得:其中,可得预测公式求解上式的MATLAB程序见附录3。4.2.2对全国总人口数的短期预测为预测未来5年内每年的人口数,考虑到1985年之后计划生育政策的实施情况逐渐平稳,所以应用1986到2004年之间的统计数据预测出未来5年内的人口出生率和死亡率变化。根据人口统计资料,作出1986年到2004年的原始出生率时间序列利用4.2.1建立的模型,按最小二乘法求得了出生率的,得到预测公式为得到如下灰色预测结果:出生率短期灰色预测年份200520062007200820092010出生率11.68673111.25016410.82990410.42534410.0358979.6609972注:出生率为占总人口数的千分数同理求出死亡率短期预测公式:得灰色预测结果:死亡率短期灰色预测年份200520062007200820092010死亡率6.37475416.35750056.34029366.32313336.30601946.2889518注:死亡率为占总人口数的千分数相同年分的出生率与死亡率相减即得到人口自然增长率,以资料中2004年的全国人口总数129988万为基础,得到2004以后第n年的全国人口数量预测值:全国人口数短期预测年份200520062007200820092010人口数(万人)130735.2131429.66132072.7132665.65133209.88133706.734.2.3对全国人口年龄结构的短期灰度预测按照普遍接受的方法,将人口年龄结构以劳动能力划分为三个阶段:014岁,1564岁,6590岁以上。我们绘出题目资料中给出的样本的年龄分布,先做定性分析。从图中可以明显看出中年人的比例在人口中占优势,是社会劳动力的中坚力量。同时也可以看到在一些相邻年龄之间发生了较大的跳跃,这可能与某些职业特征或生理特征有关。有理由怀疑人的生理状态在这些年龄点上发生较大改变。考虑到三个阶段人口的数量主要受各年龄段的死亡率影响(其中014岁段还受出生率影响),也就是随着时间推移,每个年龄段都有一部分年龄处于段边缘的人退出本段或进入其它段,进入本段的人数可由去年上一段的边缘人口数通过死亡率移算出来,处于段中的人可由死亡率移算出来,退出本段的人又可由去年本段边缘的人移算出,因此每年的段内人数可由是与死亡率密切相关的。鉴于前面我们用灰度预测法已经预测出各年份的死亡率,同理我们也可以对各个段的总死亡率作出灰色预测,但这样做就不如将各段的人口比例直接进行灰度预测,因此我们仍采用灰色预测来分析短期内的人口年龄结构,然后用观察法检验各年龄段的比例变化是否符合实际来。由题目所给数据计算出2001年到2005年每年各年龄段占总人口比例见附录1,根据此数据对未来每年各年龄段占人口比例作出灰度预测,得到:对年龄结构的短期灰色预测年份2006200720082009201001418.5091417.8662417.2456716.6466616.06845156471.8574772.0337372.2104272.3875572.565116590+9.4268669.85824710.3093710.7811311.27448从表中,可以清楚的看到6590以上年龄段的人口比例正在不断上升,这与我国正在朝老龄化社会过渡的事实是相符的。而1564岁年龄段的人口数变化不大,基本保持在同一个水平线上,这与事实也是相符的。4.3对中国人口状况的长期预测模型4.3.1中国人口数量的长期预测模型平均法预测模型当把4.2中建立的灰色预测模型直接运用于长期(50年)人口数预测时,发现人口数量先呈上升趋势然后急速下降,与人口学家预计的在2030到2035年间达到人口逐步负增长的结论相去甚远。这说明,灰色预测模型在远期预测的误差比较大。我们采取与其它人口模型相结合的办法来优化灰色预测模型,使其在远期预测上更精确。本文采用Logistic模型与灰色预测模型相结合,在同一长期预测时间序列上通过求各时刻两模型预测人数的平均值作为长期预测值。首先建立Logistic模型模型建立 记P(t)为t时刻国家总人口数,在指数模型中假设了人口增长率r为常数,由此容易解出 (1)但在实际人口系统中,分析发现当人口增长到一定数量后,资源,环境等会对人口的增长起着阻滞作用,并且人口总数越大,相对阻滞作用也越大。考虑到这个因数,我们对指数模型进行改进。阻滞作用主要体现在对人口固有增长率r的影响上,使得r随着x的改变而改变。于是我把增长率表示为p的函数记为r(p),显然它是一个减函数,并随着人口数的增大而减小。于是(1)写为: 既 (2)为了考虑简单,设r(p)为p的线形函数,即r(p)=r-sp (3)(这里r称为固有增长率,s=,资源和环境所能容纳的最大人口称为人口容量)带入化简2得 左端通过19952005年的人口数据算出,用MATLAB拟合参考(程序见附录2)计算r,然后带回(2)计算得出20062054年的人口总数如下单位(人):年份Logistic预测人口数2005-2009137764073813895858141400792716141129482914211257472010-2014143031897414389076681446924428145440110914613686822015-2019146785711714738952891479510921148473053514895794282020-2024149408166214982600661502136247150573061915090624242025-2029151214977415150096861517658130152011006615223794962030-2034152447950915264223301528219360152988123115314178422035-2039153283840915341514991535365080153648655115375227822040-2044153848015015393645671540181518154093608515416329772045-2049154227655715428708621543419631154392632515443941452050-205415448260521545224786154559287815459326711546246330灰色预测模型 以2000年到2004年的人口出生率和死亡率作为原始时间序列,建立长期预测模型。原始时间序列:代入4.2.1建立的模型中,解得一组解代入于是有2005年到2054年的出生率和死亡率预测结果:年份出生率2005-201011.825593811.483100411.150526310.827584310.513995310.20948842011-20169.913800759.626676799.347868529.077135128.81424278.558964192017-20228.311079078.07037327.836638677.609673587.389281857.175273122023-20286.967462536.765670556.569722886.379450266.194688326.015277462029-20345.841062715.671893585.507623935.348111875.19321965.042813332035-20404.896763134.754942854.617229974.483505544.353654044.227563312041-20464.105124423.986231613.870782193.758676413.649817453.544111262047-20523.441466543.341794633.245009423.15102733.05976712.971149982053-20552.885099392.801541012.72040265年份死亡率2005-20106.404993566.400996066.397001066.393008556.389018536.385031012011-20166.381045976.377063426.373083356.369105776.365130676.361158062017-20226.357187926.353220266.349255076.345292366.341332136.337374362023-20286.333419076.329466246.325515886.321567996.317622566.31367962029-20346.309739096.305801046.301865456.297932326.294001646.290073422035-20406.286147656.282224326.278303456.274385026.270469046.26655552041-20466.262644416.258735766.254829546.250925776.247024436.243125522047-20526.239229056.235335016.23144346.227554226.223667476.219783142053-20556.215901246.212021766.2081447以2004年总人口数为基础,由得到2005年到2054年的总人口数:年份预测人口数(人)2005-2009130756000013146477601321328937132760990813334972942010-2014133899794013441188801348867323135325062013572762502015-2019136095179413642849171367283351136995487413723072962020-2024137434844313760861441377528213137868244213795565862025-2029138015835513804953991380575305138040558513799936702030-2034137934689913784725211377377681137606941913745546672035-2039137284024013709328371368839036136656529413641179402040-2044136150317913587270841355795603135271455213494896172045-2049134612635213426301831339006405133526018313313965542050-205413274204261323336581131914967613148642431310484691将两种模型得到的结果取平均值作为长期预测模型的结果,年份取平均预测人口数(人)2005-2009134260036913521167871361060827136945236813773115212010-2014138465845713915132741397895875140382586414093224662015-2019141440445514190901031423397136142734270414309433622020-2024143421505314371731051439832230144220653014443095052025-2029144615406414477525431449116718145025782614511865832030-2034145191320414524474251452798521145297532514529862552035-2039145283932414525421681452102058145152592314508203612040-2044144999166414490458261447988561144682531914455612972045-2049144420145414427505231441213018143959325414378953502050-205414361232391434280684143237127714303984571428365510将结果绘制如下:可以发现,平均法预测结果表明人口数量在2035年开始下降,这与题目资料中给出的图象一致。4.3.2对人口年龄结构的长期预测根据题目所给资料计算出2001年到2005年各年龄段的人口比例,对它的时间序列进行灰色预测,解出可供参考的预测结果,当然,太长期的灰色预测会使结果变得很荒谬,因此,我们这里仅预测到2027年的预测结果:年份年龄段比例预测结果2006-20120-1422.6609221.3205620.5800119.8651819.1751818.5091417.8662415-6469.8251371.1567371.3312771.5062471.6816471.8574772.0337364-90+7.8970317.8820288.2427168.6199099.0143629.4268669.8582472013-20190-1417.2456716.6466616.0684515.5103214.9715814.4515613.9495915-6472.2104272.3875572.5651172.7431172.9215473.1004173.2797264-90+10.3093710.7811311.2744811.7904112.3299512.8941813.48423绘图如下:由图可以明显观察到,我国未来十几年内老年人口比例将显著上升,约到2018年超过10%,进入老龄化社会。同时也注意到,15-64岁人口比例稳定在70%左右,显示出青年、中年人口是社会劳动的中流砥柱。五、模型的分析和检验下面针对误差进行分析,对模型与实际情况的符合程度做检验。51误差的分析5.1.1误差的来源分析本模型的误差来源首先在于所给数据本身的误差;其次是样本的容量比较小;另一个来源是虽然普通GM(1,1)预测法对原始数据的值得利用比较好,但没有利用到原始数据之差的信息,这也是模型可以改进之处。5.1.2误差的影响分析由于GM(1,1)模型可以有效地减弱原始数据较少和原始数据误差所带来的模型误差,因此原始数据较少和数据本身的误差对模型准确性的影响至少在短期预测时比较小。而对原信息的利用不够充分所带来的误差是引起模型误差的主要因素,例如在对年龄结构的预测中我们发现对40年以上的预测结果会非常荒谬。5.2模型的检验5.2.1短期预测模型的检验将2001年到2004年已知的人口数代入灰色预测模型,得到的值与原始值作差并取平均值。得到的值均小于规定值0.3。这个检验可以用MATLAB程序outp1.m(见附录4)实现。5.2.2长期预测模型的检验将长期预测模型得到的50年预测曲线与题目中提供的曲线作直观比较,人口跨入14亿时间在2013年(题目中在2014年)、最大人口数量出现在2034年(题目中在2034年)、人口负增长时间在2035年(题目中在2035年),可见吻合的很好。六、模型的优缺点和改进方向6.1模型的优点短期灰色预测模型的优点在于灰色预测法能够有效减弱较少信息带来的误差,据资料介绍,GM(1,1)预测模型1到3步的预测准确率近99%,在5步的准确率近98%,10步的准确率也有80%长期平均法模型的优点在于综合考虑了GM(1,1)对误差的减弱和Logistic模型对生态因素的良好兼容,使新模型更加符合中国人口变化的实际。6.2模型的缺点短期GM(1,1)的缺点在于对原始信息间的差别考虑不全,丢掉了一些有用的信息。产生了一定误差。长期平均法模型的缺点在于对较短期部分相当于损坏了GM(1,1)模型在短期部分的准确性。6.3模型的改进方向为了减小误差,充分利用原数据的信息,可以将普通GM(1,1)模型改为增量型IGM(1,1)模型,它不用原数据的直接生成序列,而是利用原数据作累差后的序列再运用普通GM(1,1)后恢复为原来意义的序列因此充分利用到了原数据之间差别的信息,预测结果会更准确。参考文献1么焕民,数学建模(上册),哈尔滨:沙尔滨工业大学,20032姜启源,数学模型(第三版),北京:高等教育出版社,20033宋来忠,数学建模与实验,北京:科学出版社20054贾凌云,人口预测的灰色增量模型及其应用,CNKI ,2006附录1各年龄段占人口比例200120022003200420050-1422.660920521.46350120.637884219.299074219.54950415-6469.825128371.10582271.105822472.108222671.35615564-90+7.897031267.89703138.250893928.571327399.0461084附录2clear p=0.5for i=1:3 for j=1:5 a(i,j)=min(abs(x(i,j)-x(1,j); b(i,j)=max(abs(x(i,j)-x(1,j); endendminmin=min(min(a)maxmax=max(max(b) for i=1:3 for k=1:5附录3function outp=gm11(x0,k)h,w=size(x0);for i=1:h outp(i,:)=gm(x0(i,:),k);end function res=gm(x0v,k)x1=cumsum(x0v);n=length(x0v);B=zeros(1,n-1);for i=1:(n-1) B(i)=-(x1(i)+x1(i+1)/2;endB=B ones(n-1,1);Y1=x0v(2:n);au=(B*B)(-1)*(B*Y1)au21=au(2)/au(1);c1=x0v(1)-au21;c2=-au(1);for i=1:(k-1) x1pre(i)=c1*exp(c2*i)+au21;end x1pre=x0v(1) x1pre; res=x0v(1) diff(x1pre);附录4function outp2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论