论文-北京市人口预测模型研究.doc_第1页
论文-北京市人口预测模型研究.doc_第2页
论文-北京市人口预测模型研究.doc_第3页
论文-北京市人口预测模型研究.doc_第4页
论文-北京市人口预测模型研究.doc_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中央民族大学学士学位论文 bachelor thesis of central university of nationalities 2008 年 4 月 25 日 姓 名: 郭杨 学 号: 0453055 年 级: 2004 级 院 系: 理学院 专 业: 信息与计算科学 指导教师: 姚祖喜 北京市人口预测模型研究 中央民族大学本科生毕业论文(设计) i 摘 要 本文根据国家统计局发布的北京市统计公报公布的数据,利 用人口预测模型,对北京市人口在未来近三十年间的变化情况作 出预测,同时依据预测结果,提出了改进方案。 在人口预测方面,采用了马尔萨斯人口模型,二次指数平滑 模型以及 logistic 模型,将人口预测分为常住人口以及户籍人口 进行预测,同时对模型的预测误差进行检定,给出各个模型的预 测效果分析,预测结果。 前面几个模型中,马尔萨斯模型和 logistic 模型对人口的预 测结果的增长趋势是固定的,长期预测效果不佳,因此我对模型 进行了改进,使用灰色模型 gm(1,1)对数据进行预测,更加接近 真实值。本文由以下几章构成: 第一章 利用人口预测模型对常住人口和户籍人口进行预测, 对模型预测误差和效果进行分析。 第二章 针对模型的不足预测结果的增长趋势是固定的, 长期预测效果不佳提出改进模型,采用灰色模型 gm(1,1)预测提 高预测结果的准确性和真实性。 关键词: 人口预测;常住人口;户籍人口;马尔萨斯;二次指数平滑; logistic;灰色模型;excel;sas;dps abstract 中央民族大学本科生毕业论文(设计) ii according to statistics reports released by the national bureau of statistics,i applied three models of population prediction to forcast the trend of beijings next thirty years population. i also based on forecast results, an improvement program. in the population projections,i chose malthus population model, second exponential smoothing model and logistic model.i separate population projections from resident population to household population forecast. i am also on the models prediction error test, given all the final results of the forecast model. among previous models, malthus model and logistic model predict the outcome of the population growth trend is fixed, which forecast long-term projections ineffective, so i had to improve on the model, the use of grey model gm (1,1) data to predict , closer to true value. in this paper a few chapters from the following: in chapter one i use population projections for the resident population model and household population forecasts, the model prediction error and effect analysis. in chapter two i am talking model is inadequate - predict the outcome of the growth trend is fixed, whose long-term projections by poor results improved model, i use the grey model gm (1,1) results of the forecast increase forecast accuracy and authenticity. 中央民族大学本科生毕业论文(设计) iii key words: population projections; resident population; household population; malthus; second exponential smoothing; logistic; grey model;excel;sas;dps 目目 录录 中央民族大学本科生毕业论文(设计) iv 前 言4 第一章 北京市人口现状以及人口预测模型分析.5 (一)北京市人口现状分析5 (二)人口模型的建立和求解与评价6 (三) 预测结果分析15 第二章 模型改进16 1 灰色模型简介.16 2 模型的建立.17 3 数据预处理.17 4 模型的求解.18 5 灰色模型预测结果分析.19 结束语.20 参考文献.20 附 录.21 文献翻译.24 图表目录 图 1 北京市常住人口年均增长率及增长量.5 中央民族大学本科生毕业论文(设计) v 图 2 北京市常住人口构成.6 图 3 马尔萨斯人口模型常住人口与户籍人口预测值散点图.9 图 4 常住人口二次平滑指数预测值12 图 5 户籍人口预测散点图13 图 6 自然增长率散点图15 图 7 灰色预测精度检验标准18 图 8 灰色模型 gm(1,1)常住人口和户籍人口预测散点图 19 表 1 常住增长率和户籍增长率.7 表 2 20002007 年马尔萨斯人口模型预测检验 8 表 3 20082035 年马尔萨斯人口模型预测值 8 表 4 二次指数平滑模型的误差检验10 表 5 常住人口二次平滑迭代结果11 表 6 常住人口二次指数平滑无限期预测值11 表 7 常住人口二次指数平滑一期预测值12 表 8 户籍人口二次平滑指数预测值12 表 9 三点滑动平均后的序列17 表 10 灰色模型常住人口预测值.18 表 11 灰色模型户籍人口预测值.19 前前 言言 本文利用人口预测模型中常见的马尔萨斯模型,二次平滑指数模型以及 中央民族大学本科生毕业论文(设计) 1 logistic 模型对北京市人口进行预测,同时使用灰色模型加以改进。人口预 测是社会未来预测的一种。它的任务是根据客观存在的人口规律,运用现代 科学技术方法,及时预测人口的发展趋势,协助政府决策机构制定政策,选 择人口的最佳发展方案,提出改进措施,以使人口的发展更加适应物质资料 生产发展的要求。严格说来,人口预测包括对未来人口发展各个方面的测算 和预报,以及为了消除人口未来发展的不利影响而作出的措施和决策。但是, 由于后一方面的内容通常涉及到政策制订和社会管理方面的任务,因此人口 预测一般仅指前一方面的内容,仅限于对人口未来发展趋势的测算和预报。 现代人口预测往往采用几种不同的假设条件进行,这样能揭示在未来不 同社会因素作用下,人口变化的不同后果,使人们能清楚地见到未来人口变 动的大致范围。例如,我国科学工作者对我国一百年内人口数量变化趋势所 作的预测,就是采用五种不同生育率水平的假设条件进行的。联合国有关机 构在预测世界人口时,一般也采用不变式、低度变式、中度变式和高度变式 等四种假设条件进行。目前,人口预测所涉及的主要是人口数量方面的指标; 对于人口质量方面的指标,除了平均期望寿命外,一般都不进行推断。 在本文中,我首先利用国家统计局发布的 19992007 年公报数据,分 别利用三个模型进行检验和求解,然后针对三个模型的短、中、长期 10 年 为一个阶段进行预测效果比较分析,分别选取出短、中、长期最适合的模型。 由于前面三个模型的预测结果的增长趋势是固定的,我在对数据进行分 析后利用灰色模型 gm(1,1)进行改进,对数据进行了计算,得到了新的预测 结果,通过 gm(1,1)模型计算得到的预测结果更加接近真实值和现实情况。 中央民族大学本科生毕业论文(设计) 2 第一章第一章 北京市人口现状以及人口预测模型分析北京市人口现状以及人口预测模型分析 (一)北京市人口现状分析 2004 年底,北京市常住人口达到 1492.7 万人。其中:具有北京市户籍 的人口 1162.9 万人,居住半年以上的外来人口 329.8 万人,外来人口占常 住人口的 22%,也就是说,每 5 个常住人口中就有一个外来人口。在 4 个直 辖市中,北京的常住人口位于重庆和上海之后,排在第三位。 从增长情况看,常住人口增速平稳,但年均增量不断提高。常住人口年 均增长率在 20 世纪 80 年代为 2.0%,90 年代升至 2.3%,2000 -2004 年增速 没有变化,仍保持 90 年代的水平。尽管如此,由于人口基数的作用,常住 人口年均增长的绝对量在逐步提高。20 世纪 80 年代,平均每年增加 20 万人, 90 年代为 28 万人,2000-2004 年达到 32 万人。 图 1 北京市常住人口年均增长率及增长量 常住人口增长由户籍人口增长和外来人口增长构成。20 世纪 80 年代, 北京市常住人口增长以户籍人口增长为主,平均每年增加的常住人口中,户 籍人口占 75%。进入 90 年代,外来人口大量涌入,外来人口增长逐渐成为北 京市常住人口增长的主要因素,平均每年增加的常住人口中,外来人口占 73%, 户籍人口只占 27%。外来人口增长主要由三个原因造成,一是北京经济的快 速增长和城市建设的迅猛发展,为外来人口提供了大量适宜的就业岗位;二 是北京城市功能的多元化吸引了大量的外来人口;三是农村大量富余劳动力 向大城市转移、集中,寻找就业机会。20002004 年,平均每年增加的常住 人口中,外来人口比重降至 57%,户籍人口比重升至 43%。这种变化主要是 由于户籍迁移人口的大量增加造成的。20 世纪 90 年代北京市户籍人口迁移 增长每年在 6 万人左右;2001 年以来,每年达到 13 万人左右,增长了 1 倍 中央民族大学本科生毕业论文(设计) 3 多。户籍迁移人口的增长主要是由于学校扩招和部分户籍迁移政策的出台造 成的。最近几年,北京市出台了一些户籍迁移政策,如吸引高科技人才的落 户政策、吸引小城镇投资性移民的落户政策、婴儿随父落户政策、夫妻投靠 落户政策、老人投靠子女落户政策等,这些户籍迁移政策的实施使户籍人口 迁移增长大量增加。 1 图 2 北京市常住人口构成 (二)人口模型的建立和求解与评价 2.1 马尔萨斯人口模型的建立与求解 2.1.1 马尔萨斯人口模型简介 马尔萨斯(17661834,是英国经济学家和社会学家)在研究百余年的 人口统计时发现:单位时间内人口的增加量与当时人口总数是成正比的。 马尔萨斯于 1798 年提出了著名的人口指数增长模型。 2.1.2 马尔萨斯人口模型的建立 1)模型的基本假设:人口的增长率是常数。 2)模型的建立: 设时刻 的人口为,把当作连续、可微函数处理(因人口总数t)(tn)(tn 很大,可近似地这样处理,此乃离散变量连续化处理),据马尔萨斯的假设,在 到时间段内,人口的增长量为ttt ,ttrntnttn)()()( 并设时刻的人口为,于是 0 tt 0 n 中央民族大学本科生毕业论文(设计) 4 , , 00) ( d d ntn rn t n 这就是马尔萨斯人口模型,用分离变量法易求出其解为 , )( 0 0 e)( ttr ntn 此式表明人口以指数规律随时间无限增长. 2.1.3 马尔萨斯人口模型的求解 在模型的求解中,根据已有的数据,选取 1999 年()北京市人口总数 0 t 作为初始值,在选取人口增长率常数 r 的时候,由于实际增长率随年份变 0 n 化,我将每年的常住人口和户籍人口的增长率取平均值,如下 20002001200220032004200520062007 平均 值 常住 增长 率% 9.930.092.882.332.493.032.803.292.80 户籍 增长 率% 0.701.171.411.101.231.531.431.311.31 表 1 常住增长率和户籍增长率 在取平均值时,将波动较大的常住增长率的 2000、2001 年以及户籍增 长率的 2000 年剔除,得到人口增长率常数1.31r2.80 户常 ,r 根据国家统计局发布的公报数据,我将预测部分分为常住人口,户籍人 口两部分。 为了验证模型的有效性,现将 20002007 年数据的真实值与预测值进行比 对 年份/人口 (万) 常(预) 常(实) 户(预) 户(实)常(误 差) 户(误 差) 20001292.91382.01114.31107.56.45%0.61% 20011329.61383.31129.01120.53.88%0.76% 20021367.41423.21143.91136.33.92%0.67% 20031406.21456.41159.01148.83.45%0.88% 中央民族大学本科生毕业论文(设计) 5 20041446.11492.71174.21162.93.12%0.98% 20051487.21538.01189.71180.73.30%0.76% 20061529.41581.01205.41197.63.26%0.65% 20071572.81633.01221.31213.33.68%0.66% 表 2 20002007 年马尔萨斯人口模型预测检验 由上表可以看出,除 2000 年的常住人口误差较大以外,常住人口的误 差都在 4%以下,户籍人口的误差非常小,都在 1%以下,但整体误差都在可 控制的范围内,因此该模型的预测值是具有一定的可信度。 接下来利用 1999 年的数据将未来 20 年的人口数据进行预测,同样选取 ,带入,得到1.31r2.80 户常 ,r )( 0 0 e)( ttr ntn 年份 常住人 口(万) 户籍人 口(万) 20081617.51237.4 20091663.41253.7 20101710.71270.3 20111759.21287.0 20121809.21304.0 20131860.61321.2 20141913.41338.6 20151967.71356.3 20162023.61374.1 20172081.11392.3 20182140.21410.6 20192200.91429.2 20202263.41448.1 20212327.71467.2 20222393.81486.5 20232461.81506.1 20242531.71526.0 20252603.61546.1 20262677.51566.5 20272753.51587.1 20282831.71608.1 20292912.11629.3 20302994.81650.7 20313079.91672.5 20323167.31694.6 20333257.31716.9 20343349.81739.6 20353444.91762.5 表 3 20082035 年马尔萨斯人口模型预测值 散点图如下, 中央民族大学本科生毕业论文(设计) 6 0.0 500.0 1000.0 1500.0 2000.0 2500.0 3000.0 3500.0 4000.0 200820182028 常住人口预测值 户籍人口预测值 图 3 马尔萨斯人口模型常住人口与户籍人口预测值散点图 2.1.4 马尔萨斯人口模型预测结果分析 由散点图可知,常住人口与户籍人口的预测值都是逐年递增的,而且户 籍人口的增长速度明显低于常住人口的增长速度,这与奥运会期间大量人才 涌入北京,以及北京市本地严格的户籍政策是相符的。由于是指数增长的形 式,因此马尔萨斯人口模型的预测值是没有极限值的,所得的人口预测值会 逐年递增。 2.2 二次指数平滑模型的建立与求解 2.2.1 二次指数平滑模型简介 二次指数平滑法是对一次指数平滑值作再一次指数平滑的方法。它不能 单独地进行预测,必须与一次指数平滑法配合,建立预测的数学模型,然后 运用数学模型确定预测值。一次移动平均法的两个限制因素在线性二次移动 平均法中也才存在,线性二次指数,平滑法只利用三个数据和一个 值就 可进行计算;在大多数情况下,一般更喜欢用线性二次指数平滑法作为预测 方法。 2 2.2.2 二次指数平滑模型的建立 线性二次指数平滑法的公式为: )2( 1 )1()2( )1 ( ttt sss 式中:分别为 t 期和 t1 期的二次指数平滑值;a 为平滑系数。 在和已知的条件下,二次指数平滑法的预测模型为: 6 中央民族大学本科生毕业论文(设计) 7 t 为预测超前期数 2.2.3 二次指数平滑模型的求解 首先验证模型的准确性,根据迭代公式,计算出 2002 年2007 年的预测值, 与实际值做比较,结果如下 年代 实际值 (万) 预测值 (万) 误差 20021423.21394.3-2.0% 20031456.41435.5-1.4% 20041492.71466.6-1.7% 20051538.01507.8-2.0% 20061581.01569.0-0.8% 20071633.01590.1-2.6% 表 4 二次指数平滑模型的误差检验 取 1999 年的常住人口数据为初始值,带入式,再将所得的 2 . 1257 )1( 0 s 带入式,如此迭代,得到常住人口二次指数平滑迭代如下表 5 . 1369 )1( 1 s 年份t 常住人 口(万) a=0.9,初始值为 1257.2a=0.9,初始值为 1369.5 199901257.21257.2 200011382.01369.51369.5 200121383.31381.91380.7 200231423.21419.11415.2 200341456.41452.71448.9 200451492.71488.71484.7 200561538.01533.11528.2 200671581.01576.21571.4 中央民族大学本科生毕业论文(设计) 8 200781633.01627.31621.7 表 5 常住人口二次平滑迭代结果 将上表数据带入、式,可分别求出, 9 . 16322 )2( 8 )1( 88 ssa ,带入式,可以得到=1632.9+50.4t 的值, 4 . 50)( 1 )2( 8 )1( 88 ss a a b ty8 可由此预测常住人口无限期预测,如下表 年份 预测值 (万) 20081683.3 20091733.7 20101784.1 20111834.5 20121884.9 20131935.3 20141985.7 20152036.1 20162086.5 20172136.9 20182187.3 20192237.7 20202288.1 20212338.5 20222388.9 20232439.3 20242489.7 20252540.1 20262590.5 20272640.9 20282691.3 20292741.7 20302792.1 20312842.5 20322892.9 20332943.3 20342993.7 20353044.1 表 6 常住人口二次指数平滑无限期预测值 当仅做一期预测时,有 常住人口预测值见下表 年代预测值 )1( t s )2( t s 20081683.21677.61672.0 20091733.61728.01722.4 20101783.91778.31772.7 20111834.21828.61823.0 20121884.51878.91873.3 20131934.81929.21923.6 20141985.21979.61974.0 20152035.52029.92024.3 20162085.82080.22074.6 20172136.12130.52124.9 20182186.42180.82175.2 20192236.82231.22225.6 20202287.12281.52275.9 20212337.42331.82326.2 20222387.72382.12376.5 20232438.02432.42426.8 20242488.32482.82477.2 20252538.72533.12527.5 20262589.02583.42577.8 中央民族大学本科生毕业论文(设计) 9 20272639.32633.72628.1 20282689.62684.02678.4 20292739.92734.42728.8 20302790.32784.72779.1 20312840.62835.02829.4 20322890.92885.32879.7 20332941.22935.62930.0 20342991.52986.02980.4 20353041.93036.33030.7 表 7 常住人口二次指数平滑一期预测值 预测值与无限期预测值基本相同,散点图如下, 0.0 500.0 1000.0 1500.0 2000.0 2500.0 3000.0 3500.0 200820132018202320282033 图 4 常住人口二次平滑指数预测值 同样的,采用二次平滑指数预测户籍人口,结果如下 年代 预测值 (万) 20081229.3 20091245.2 20101261.1 20111277.1 20121293.0 20131308.9 20141324.9 20151340.8 20161356.8 20171372.7 20181388.6 20191404.6 20201420.5 20211436.5 20221452.4 20231468.3 20241484.3 20251500.2 20261516.2 20271532.1 20281548.0 20291564.0 20301579.9 20311595.8 20321611.8 20331627.7 20341643.7 20351659.6 表 8 户籍人口二次平滑指数预测值 中央民族大学本科生毕业论文(设计) 10 户籍人口预测的散点图如下 0.0 200.0 400.0 600.0 800.0 1000.0 1200.0 1400.0 1600.0 1800.0 200820132018202320282033 图 5 户籍人口预测散点图 2.2.4 二次平滑指数模型预测效果分析 由散点图以及预测结果可以看出,预测人口数是逐年上升的,且没有最 大值。二次平滑指数模型属于时间序列预测模型的一种,在预测结果方面, 由于对人口增长趋势进行了平滑,因此在短期预测方面稍显不足,人口预测 值同样略低于实际值,但二次平滑指数模型的趋势平滑效果一定程度上避免 了由于突然波动引起的预测偏差,使得预测结果在中期长度上具有较高的准 确性。同时由于是线性增长,在增长幅度方面要比马尔萨斯模型的结果缓慢 一些,因此虽然在无限期预测方面都是没有极限值而不准确,但是其预测的 时间有效性要比马尔萨斯模型所得到的时间要长一些。北京作为我国的首都, 尤其是在奥运会前的这几年建设的十分迅速,对人才资源需求较大,在 19992007 年间吸收了大量外来人口,人口总数膨胀较快,因此预测值往往 要比实际值要低一些。 2.3 logistic 模型的建立与求解 2.3.1 logistic 模型简介 马尔萨斯人口模型中,假设自然增长率为常数 r,而这和现实是不相符 的。随着人口的增加,自然资源环境条件等因素对人口增长的限制作用越来 越显著,如果当人口较少时,人口的自然增长率可以看作常数的话,那么当人 口增加到一定数量以后,这个增长率就要随人口的增加而减小。 1838 年,荷兰生物数学家韦尔侯斯特(verhulst)引入常数,用来表示 m n 中央民族大学本科生毕业论文(设计) 11 自然环境条件所能容许的最大人口数(一般说来,一个国家工业化程度越高, 它的生活空间就越大,食物就越多,从而就越大),并假设将增长率等于 m n ,即净增长率随着的增加而减小,当时,净增长率 m n tn r )( 1)(tn m ntn)( 趋于零,按此假定建立人口预测模型。 2.3.2 logistic 模型的建立 1)模型假设:假设增长率等于 m n tn r )( 1 2)模型的建立: 若将 r 表示为 n 的函数,则它应是减函数,考虑 到人口增量,显)(nrttt 然有ttnnrtnttn)()()()( 令满足微分方程)(0tnt得到 0 )0(,)(nnnnr dt dn 对的一个最简单的假设是,设为的线性函数,)(nr)(nrn 即 , , 表示人口的自然增长率)0, 0(srr 为了确定系数 s 的意义,引入自然资源很环境条件所能容纳的最大人口数量 ,那么当 m n 则 即: 综上可得 logisitic 模型 即 用求解微分方程的方法得 下面对参数估计,我们利用 sas 软件及附表 1 中的数据(数据由国家统sr, 计局统计公报查得)用回归分析的方法得到拟合方程: snrnr)( 0,)( , 0)( mm nrnrnn即时, ,0 m snr m n r s )1 ()( mm n n rn n r rtnr 00) ( )1 ( )( ntn n n n r dt tdn mrdt n n n dn m )1 ( )( 0 0 ) 1(1 )( ttr m m e n n n tn ,取2001 0 t 中央民族大学本科生毕业论文(设计) 12 (运行结果见附程序 1)xy 10 107 . 40058 . 0 由拟合方程可得,可知自然增长率随人口数 10 107 . 4,0058 . 0 sr)(nr n增长而变大,这与 logistic 模型所要求的自然增长率递减规律不符,其散 点图如下: -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 19992001200320052007 图 6 自然增长率散点图 观察上图可发现自然增长率呈起伏上升趋势,分析其原因,可能是由于 北京市奥运建设加速,外来人口不断涌入所致,自然增长率的变化不是稳定 下降的,因此 logistic 模型不适合北京市人口的预测。 (三) 预测结果分析 从上述数据可以看出,北京市常住人口一直保持增长的势头。2000 年以 来,常住人口平均每年增加 32 万人。根据马尔萨斯模型和二次指数平滑模 型的预测结果来看,2008 年北京市常住人口将突破 1600 万人,而且如果不 考虑奥运会后北京发展速度放缓的可能性的话,常住人口数将继续激增。同 时,由于北京市拥有非常严格的户籍政策,户籍人口一直控制的非常平稳, 增长量非常小,在马尔萨斯模型和二次指数平滑模型的预测结果中,2035 年 的户籍人口数分别是 1762.5 万和 1659.6 万,与 2007 年统计公报公布的 1213.3 万人比起来,只增加了 45.3%和 36.8%,比常住人口数的增加量明显 小很多。目前,受资源承载能力和基础设施的限制,北京市的人口规模已经 成为城市发展的制约因素,巨大的人口压力使北京市水资源和土地资源的使 用更加紧张,交通拥堵严重,环境问题日益突出。 北京市自 2001 年 7 月成功申办奥运会以来,大幅加快了城市建设速度, 公交、地铁,城市建筑,运动场馆,房屋改造,商业规划等等大型市政以及 奥运比赛设施的投入使得北京市对人才的需求暴增,大量外省人才进入北京, 为北京的建设增砖添瓦。同时由于北京严格限制户籍入京,因此这些外省来 中央民族大学本科生毕业论文(设计) 13 京人员在京工作,常驻于北京,却没有北京市户口,这就造成近几年户籍人 口与常住人口比例降低的现象。而奥运会结束后,虽然北京应该会放缓建设 步伐,但是这些迁入的外来人口并不会马上离京,因此在未来一段时间北京 市人口还将保持常住人口数明显高于户籍人口数的现象。 但是,由于马尔萨斯模型和二次指数平滑模型的预测函数都是增函数, 因此没有极限值,预测人口值随年份的增长而不断增加,这显然与现实不符, 而由于北京市作为一个国际都市,近几年奥运建设导致大量人口涌入,使得 自然增长率波动较大,不能使用 logistic 模型进行预测。在短期数据来看, 马尔萨斯模型和二次指数平滑模型的预测能力都不错,从误差检验来看,误 差都很小,而二次指数平滑模型的预测值误差较马尔萨斯模型来说更小一些, 因此,在 20082015 年这段时间来看,如果不考虑奥运会后可能出现的建 设放缓导致的人口增长放缓的情况的话,这两个模型的预测都是很准确的。 在中期时间上,也就是 20162025 年间,两个模型的人口预测值都是稳定 增加的,而二次指数平滑模型的预测值(2540.1 万)增长幅度较马尔萨斯模 型(2603.1 万)要小一些,这更符合北京市控制人口膨胀的政策走向,因此, 在中期预测上,二次指数平滑模型要较马尔萨斯模型更好一些。在长期预测 方面,由于实际人口受自然资源和其他因素的限制,不能无限增长下去,因 此两个模型在 20262035 年间的预测结果都会和实际值有较大偏差,马尔 萨斯模型和二次指数平滑模型的预测值分别为 3444.9 万和 3044.1 万,基本 是 2007 年人口的 2 倍,这是北京市所不能接受的,因此,这两个模型在长 期的预测上都不够准确。 第二章第二章 模型改进模型改进 由于 logistic 模型不适合北京市人口的预测,同时马尔萨斯模型和二次 指数平滑模型的预测值都是单调增长,对长期预测把握不够精确。因此我选 取了灰色模型 gm(1,1)来进行预测。 1 灰色模型简介 灰色理论是由我国学者邓聚龙于 20 世纪 80 年代前期提出、用于控制 和预测的新理论和新技术。与研究“随机不确定性”的概率统计和研究“认 知不确定性”的模糊数学不同, 灰色系统理论的研究对象是“部分信息已知, 部分信息未知”的“小样本” 、 “贫信息”的不确定性系统。其次, 一般统计 方法依据随机原则进行抽样调查, 以获取大量样本;而灰色理论则遵循现实 中央民族大学本科生毕业论文(设计) 14 优先的原则, 即注重对系统未来发展趋势起主导作用的现实信息。再者, 灰 色系统模型对试验观测数据及其分布并无特殊要求和限制。综上所述, 灰色 理论并不要求大量的历史数据, 甚至有 34 个数据即可建模预测 。 3 2 模型的建立 等维序列预测适合于对增长迅猛的时间序列进行数量大小的预测,为减 低原始数据随机波动影响, 先要对原始数据进行平滑处理,这里采用三点 平滑法。为了避免小数循环,采用如下公式计算。 4 ) 1()(2) 1( )( )0( )0( txtxtx tx 两个端点分别为: 4 )2() 1 (3 ) 1 ( )0()0( )0( xx x 4 )(3) 1( )( )0()0( )0( mxmx mx 对于欲建模的数列 ,可否建立精度较高的gm(1 ,1) 模型,一般用 级 )0( x )0( x 比的大小与所属区间,即其覆盖来判断。)( )0( k 4 若级比满足: () ,)( )0( k)( )0( k 1 2 1 2 , nn ee 其中, = )( )0( k )( ) 1( )0( )0( kx kx 则认为该数列 可作 gm(1 ,1) 建模。 )0( x 3 数据预处理 采用不同长度的数列建模, 所得预测结果会有不同。灰色建模的数据长度不 宜过大, 58 个数据较为适宜,我选择了6维数据进行预测,即20022007 年的数据。首先, 为了减弱数据随机波动的不利影响, 对20022007年 的 数列 采用三点滑动平均法处理, 方法见 , 三点滑动平均后的序列 )0( x 为: )0( x 年代200220032004200520062007 常住人 口(万)1431.51457.21495.01537.41583.31620.0 表 9 三点滑动平均后的序列 其次,对序列 进行级比检验,具体步骤见 。所得结果为: )0( x 中央民族大学本科生毕业论文(设计) 15 = () = (0.98,0.97,0.97,0.97,0.98) )5()4()3()2()1( , (0.75,1.33) 显然,,数列 建立 gm(1 ,1) 模型是完全满足建模条件的。 )0( x 4 模型的求解 在dps9.5 数据处理系统软件中,将20022007 年北京市常住人口数据录 入电子表格并定义成数据块,执行“其他- 灰色系统方法- gm(1 ,1) 模型”菜 单操作,在随后弹出的“输入待预测的时间长度” 、 “残差数列类型”对话框中 依次输入“28”和“1”(生成数列残差) ,得到北京市常住人口预测模型为 753230.42113653230.43526) 1( 032382 . 0 t etx 其预测结果如下 年代 预测值 (万) 20081647.6 20091679.4 20101711.7 20111744.7 20121778.3 20131812.5 20141847.4 20151883.0 20161919.3 20171956.2 20181993.9 20192032.3 20202071.4 20212111.3 20222152.0 20232193.4 20242235.6 20252278.7 20262322.6 20272367.3 20282412.9 20292459.4 20302506.7 20312555.0 20322604.2 20332654.3 20342705.4 20352757.5 表 10 灰色模型常住人口预测值 另外,模型的后验比c = 0.1569 , 小误差概率p =1.0000,由灰色预测精度检验等级标 准可知,该模型精度达到“好”标准,说明模型是可靠的 5 图 7 灰色预测精度检验标准 同样的,我将20022007年户籍人口数据带入、式进行检验,满足gm(1,1)模型 条件,因此利用该模型对户籍人口进行预测,结果如下 年代预测值 20081228.4 20091244.1 20101260.1 20111276.3 20121292.7 中央民族大学本科生毕业论文(设计) 16 20131309.3 20141326.1 20151343.1 20161360.3 20171377.8 20181395.5 20191413.4 20201431.5 20211449.9 20221468.5 20231487.3 20241506.4 20251525.8 20261545.3 20271565.2 20281585.3 20291605.6 20301626.2 20311647.1 20321668.2 20331689.6 20341711.3 20351733.3 表 11 灰色模型户籍人口预测值 模型的后验比c = 0.3013 , 小误差概率p =1.0000,模型精度达到“好”标准。 0.0 500.0 1000.0 1500.0 2000.0 2500.0 3000.0 200820132018202320282033 户籍人口 常住人口 图 8 灰色模型 gm(1,1)常住人口和户籍人口预测散点图 5 灰色模型预测结果分析 由散点图可以看出,常住人口和户籍人口的走势相对马尔萨斯模型和二次指数平滑 模型要平缓一些,而增长趋势上,常住人口依然远远高于户籍人口,这依然符合前面分 析中提到的北京市发展人才的需要和北京市严格的户籍政策问题。从数据上看,灰色模 型gm(1,1)的预测结果在长期上较马尔萨斯模型和二次指数平滑模型要低不少,常住 人口和户籍人口的预测值分别为2757.5和1733.3万,远低于以上两个模型的预测值,更接 近实际情况,因此灰色模型的长期预测效果在这几个模型中是最好的。 中央民族大学本科生毕业论文(设计) 17 结束语结束语 北京市是一个国际化的大都市,是我国的首都,从整体上讲,由于人口流动性非常 强,所以并不能把北京市作为一个封闭的系统,整个北京市的人口变化受经济、政治、 政策的影响,各个因素对人口变化都起到一定的作用,因此在对人口的精确预测需要考 虑众多因素,所建立的模型因此也需要更加复杂多变。由于能力和精力的限制,我没有 办法把众多因素都考虑到,因此预测结果不免还有不准确的地方,望以后还能有机会改 进。 参考文献参考文献 1北京市常住人口现状及特征分析, 北京统计信息网 2二次指数平滑法,mba 智库百科 3王学萌等。灰色系统分析及实用计算程序。武汉:华中科技大学出版社,2001 4邓聚龙,灰预测与灰决策.武汉:华中科技大学出版社,2002 5谭春英,谢恒星,冯雪,李青翠,gm_1_1_模型在烟台市人口预测中的应用,安徽农 业科学,2006 6闫春丽,郭杨,卜城村,我国人口预测与人口结构分析,2007 7 杨莉,人口预测中的数学模型探析,2006 年管理论丛与教育研究专刊,中国电力教 育 8 蒋辉,我国人口预测分析,科技管理研究,2005 年第 11 期 9 陈卫,中国未来人口发展趋势_2005_2050 年,人口研究,2006 年 7 月 10魏高峰、龙克柔,中国人口演化模型与中国未来人口预测研究,科技咨询导报, 2007 年第 13 期 11马小红,北京市未来 50 年户籍人口变动趋势预测,北京社科规划,2005 年 4 月 中央民族大学本科生毕业论文(设计) 18 附附 录录 附 1 北京市 19992007 年人口数据 年 常住人 口(万) 户籍人 口(万) 外来人 口(万) 外来人 口比例 出生率死亡率 自然增 长率 19991257.21099.8157.412.52%6.55.60.9 200013821107.5274.519.86%65.10.9 20011383.31120.5262.819.00%6.15.30.8 20021423.21136.3286.920.16%6.65.70.9 20031456.41148.8307.621.12%5.15.2-0.1 20041492.71162.9329.822.09%6.15.40.7 200515381180.7357.323.23%6.35.21.1 200615811197.6383.424.25%6.264.971.29 200716331213.3419.725.70%8.324.923.4 附 sas 程序 1: proc univariate data=sas 数据集 normal plot ; var sas 变量名; run; 附 sas 程序 2: 建立 sas 数据集 在 insight 窗口中打开分析所建数据集 analyzedistributions(y), xy tables location tests 在 location tests 窗口中 parameter 后输入均值 中央民族大学本科生毕业论文(设计) 19 附 dps 运行结果 模型参数 a=-0.022415 b=1347.3260 39 x(t+1)=61366.662640exp(0.022415t)- 60109.462640 no.观察值拟合值误差% x( 2)1520.4749 1466.153 1 69.2079 4.7302 x( 3)1514.7135 1486.584 1 - 41.0357 - 2.9921 x( 4)1504.3225 1593.022 3 - 32.0891 - 2.3413 x( 5)1539.4149 1568.132 9 - 33.0873 - 2.1878 x( 6)1599.1634 1637.152 1 9.2838 0.6067 x( 7)1662.5949 1640.030 4 36.9887 2.2325 x( 8)1666.3740 1615.146 1 - 10.8319 - 0.7033 x( 9)1726.0811 1700.578 0 5.9578 0.3513 对当前模型的评价 c=0.3018很好 中央民族大学本科生毕业论文(设计) 20 p=1.0000很好 致谢致谢 在去年 12 月到今年 4 月的这 5 个月中,我从最初的查阅资料到如今完成论文,我受 到了各方面的帮助,克服了许多困难,在这里我要由衷的表示感谢。 首先,感谢我的指导教师姚祖喜副教授,他在我撰写论文的全部过程中给予了全面 的指导和耐心的帮助。他不辞劳苦,非常关心我的论文撰写情况,交流写作心得和进度, 每周对我指导至少两次,对不懂的问题和论文中出现和可能出现的问题进行耐心听取和 解答。论文的完成凝结了导师大量的心血。 然后,我还要感谢我的父母及家人,他们的鼓励和对我的精神支持,是我一往直前 不竭的动力,支撑着我从来不敢放弃自己,放弃努力前进。 另外,还要深深感谢在大学四年里学院里所有曾经教育过我,帮助过我的老师们, 在学习道路上给予的悉心指导和谆谆教诲,这都将使我受益匪浅,伴随我在以后的人生 道路上成长;理学院严谨的治学态度、实事求是、不断锐意创新的科学精神、勤勉忘我 的工作作风都使我感触甚深,得益匪浅。 此外,还要感谢曾经帮助过我的同学们,他们的理解与支持给予我莫大的动力;在 此向他们表示同样由衷的谢意。 其他的老师和同学在四年中也在不同方面给了我极大的帮助,我就不一一列举了, 在此向他们表示由衷的谢意,谢谢! 最后,深深感

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论