基于聚类分析的吉林省2010年经济发展状况研究.doc_第1页
基于聚类分析的吉林省2010年经济发展状况研究.doc_第2页
基于聚类分析的吉林省2010年经济发展状况研究.doc_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于聚类分析的吉林省2010年经济发展状况研究摘要:本文以吉林省内的9个市级地区为研究对象,选取了反映经济发展水平的9个指标,应用聚类分析的方法,利用SPSS软件对这些地区2010年的发展状况进行了统计分析。结果显示长春和吉林市的发展水平比较高,其他城市发展较为缓慢。为提高吉林省全省的发展水平提供了参考的依据,为促进全省共同发展提出了具有参考价值的分析。关键词:聚类分析;吉林;经济发展引言改革开放以来,东北地区一直是我国最重要的工业基地和发达地区,也在社会主义建设中起到了中流砥柱的作用。东北经济发展在改革开放之后取得了很多值得称赞的成就,但是相比经济发展更快的沿海地区以及正在崛起的中部地区,东北地区的经济发展还是略显疲态。GDP和工业增加值也由改革开放初期的近15%和20%下降到现在的10%。而吉林作为东北地区经济发展相对较慢的地区更面临着极大的挑战。本文选择吉林省各个地区2010年经济发展的相关数据,采用聚类的方法,将各个地区分按发展状况分类,并针对于处于不同类别的地区采取不同的经济刺激方案,以求更加合理的利用资源,实现总体经济的快速增长。1.聚类分析的概念及分类聚类分析(Cluster Analysis)又称群分析,是对样品或指标进行类的一种多元统计方法。聚类分析将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化。聚类分析给人们提供了丰富多彩的分类方法,这些方法一般包括,系统聚类法,模糊聚类法,K-均值法等等。本文采用的分类方法为K-均值法。K-均值法也被称为快速聚类法,它是一种非谱系聚类法,它是把样本聚集成k个类的集合。类的个数k可以预先给定或者在聚类过程中确定。K-均值算法是常用的很经典的基于划分的聚类算法,采取距离作为相似性的评指标,即认为两个对象的距离越近,其相似性就越大。该类算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。2.聚类技术的一般步骤第一步是特征提取。它的输入是原始样本。特征提取的结果是输出一个矩阵,每一行是一个样本,每一列是一个样本矩阵。第二步是执行聚类算法,获得聚类谱系图。聚类的输入是一个样本矩阵,它把单个样本想象成为特征变量空间中的点。聚类算法的目的就是获得能够反映N维空间中这些样本点的最本质的“簇”的性质。第三步是选取合适的分类阀值。在得到了聚类谱系图后,就能够从聚类谱系图上直接看出分类方案。3.数据整理本文收集了2010年吉林省各市及自治区的主要经济指标。数据来源于吉林市各级人民政府公布的政府工作报告。对所有数据的运算,运用SPSS软件,采用欧式距离(squard Euclidean distance)(欧式距离具有简单、直观的特点)为Measure对数据进行分析。2010年吉林市各市及自治州发展状况地区地区生产总值(亿元)农林牧渔业总产值(亿元)工业增加值(亿元)规模以上工业总产值(亿元)固定资产投资(亿元)社会消费品零售总额(亿元)进出口总额(亿美元)全口径财政收入(亿元)城镇新增就业人口(万人)长春市3329474.71476.25750.83001.51286.7132.2563.410.8吉林市1800.6299.96262124.71950.1684.0284.3192.29.5白山市37062.8170255.84101171.6536.44白城市441.5155.3183.8260.9490.1162.20.814932.84辽源市41078.2180.5592.6542107.50.72528.13.5四平市81022029411006602902.51565.76松原市1102.8191495.71186.31000.02329.70.882175.15.5通化市600137262895800249.46.1761.75延边朝鲜族自治州5458621358573826115.2884.5表一从表一可以看出长春市是吉林省发展最快的地区,吉林市紧随其后,而其它地区则相对落后。由于以上指标的数量级有一定的差异,所以有必要先对数据进行标准化处理,然后再进行聚类。将所选数据用k-均值聚类方法分成四类,分类过程及结果如下:初始聚类中心聚类1234Zscore(地区生产总值(亿元))2.35575.77904-.69678.05918Zscore(农林牧渔业总产值(亿元))2.17563.84249-.96579.01195Zscore(工业增加值(亿元))2.47375.45676-.62504.14764Zscore(规模以上工业总产值(亿元))2.51455.41072-.67359-.13373Zscore(固定资产投资(亿元))2.251811.02874-.76281-.07646Zscore(社会消费品零售总额(亿元))2.37503.78318-.71447-.15267Zscore(进出口总额(亿美元))2.200771.19717-.53451-.55060Zscore(全口径财政收入(亿元))2.55187.38639-.52251-.29674Zscore(城镇新增就业人口(万人))1.929451.42375-.71576-.13226 表 二迭代历史记录a迭代聚类中心内的更改12341.000.000.353.5152.000.000.000.000(a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 1.896。) 表 三最终聚类中心聚类1234Zscore(地区生产总值(亿元))2.35575.77904-.62290-.21440Zscore(农林牧渔业总产值(亿元))2.17563.84249-.71582-.05161Zscore(工业增加值(亿元))2.47375.45676-.58512-.19667Zscore(规模以上工业总产值(亿元))2.51455.41072-.57625-.20675Zscore(固定资产投资(亿元))2.251811.02874-.60574-.28586Zscore(社会消费品零售总额(亿元))2.37503.78318-.59581-.25832Zscore(进出口总额(亿美元))2.200771.19717-.47276-.50230Zscore(全口径财政收入(亿元))2.55187.38639-.46461-.35994Zscore(城镇新增就业人口(万人))1.929451.42375-.71576-.16338 表 四ANOVA聚类误差均方df均方dfFSig.Zscore(地区生产总值(亿元))2.6153.031585.119.000Zscore(农林牧渔业总产值(亿元))2.5003.100525.039.002Zscore(工业增加值(亿元))2.6053.037569.852.000Zscore(规模以上工业总产值(亿元))2.6493.0105255.512.000Zscore(固定资产投资(亿元))2.6143.032582.617.000Zscore(社会消费品零售总额(亿元))2.6253.0255104.392.000Zscore(进出口总额(亿美元))2.6433.0145182.329.000Zscore(全口径财政收入(亿元))2.6383.0175152.416.000Zscore(城镇新增就业人口(万人))2.6263.0245108.694.000 表 五聚类成员案例号地区聚类距离1长春市 1.0002吉林市 2.0003白山市 3.3534白城市 3.4835辽源市 3.3246四平市 4.3947松原市 4.5158通化市 4.5279延边朝鲜族自治州3.54310. 表 六 聚类结果类别地区地区个数第一类长春1第二类吉林1第三类四平,松原,通化3第四类白山,白城,辽源,延边朝鲜族自治州4 表 七从分类来结果来看,第一类属于经济发展迅速的地区,第二类是经济发展较为迅速的地区,但较第一类地区还有着较为明显的差距。这两个地区是整个吉林省经济发展的重心,也是整个吉林省经济腾飞的龙头,政府要继续对这些地区给予大力支持,更好的发挥这些地区对整体经济发展的拉动作用,从而能够带动其他的临近地区经济的发展和进步。第三类地区虽然经济总量也在不断提高,但是在整体程度上还有很大不足,对于这类地区,一定的经济刺激措施是不错的选择,做好招商引资的工作,以此来带动整个地区经济的发展。考虑到一些自然灾害的影响,客观的来说,第四类地区总体的发展势头是好的,但是仍然还有很大的空间可以利用,这些地区的总体问题时发展不够均衡。政府应该鼓励其优势产业,以带动其他相关产业的发展,对于容易受自然灾害影响的地区,政府应该给予足够的关注,及时而合理的解决这些地区的实际困难,以求经济总量和质量进一步的发展。结论本文使用聚类的思想对吉林省2010年的经济发展状况进行了分类分析,并有针对的对处于不同类别的地区进行了分析,以便有的放矢的采取合理的策略,从而促进整个吉林省的经济发展。但本文也有许多不足之处,一是数据选择年分较少,对于整体的分析难免会造成误差。二是,变量的选择可以更加有代表性。如果能解决好这些问题,聚类思想在对地区经济发展状况分析过程中将会是一种很好的分析工具。参考文献:1.侯寒冰,宋永发.基于K-means聚类分析的地铁施工风险评价方法J。大连:大连理工大学,20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论