已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国主要城市经济现状的综合评价中国主要城市经济现状的综合评价 山东理工大学 罗明 袁汝鹏 宗永臻 目 录 摘要 1 1 问题描述 2 2 数据选取与处理 2 2 1 数据来源与指标选取 2 2 2 数据简单处理 2 3 模型建立 2 3 1 因子分析模型的建立 2 3 2 考察原有变量是否适合因子分析 3 3 3 因子提取 4 3 4 因子命名 4 3 5 因子得分与综合评价 5 3 6 因子分析小结 6 4 聚类分析 7 4 1 聚类分析定义 7 4 2 聚类分析的流程及数据来源 8 4 3 聚类分析结论 8 5 模型的优缺点 10 6 对我国经济发展的建议 11 7 参考文献 11 1 摘要 改革开放以来 我国取得了众多巨大的成就 然而地区 各城市之间的经 济发展不平衡问题越来越突出 基于这种现象 本文结合因子分析与聚类分析 的方法 在研究我国 27 个省会城市 4 个直辖市 北京 天津 上海 重庆 5 个计划单列市 深圳 宁波 厦门 大连 青岛 等 36 个较大城市经济现状 的基础上 对我国区域经济发展提出了合理建议 文中的数据来源为 中国统计年鉴 2010 中的 省会城市和计划单列市主 要经济指标 其中提到的 36 座城市对周边地区的经济具有经济拉动效应 是 所在经济区域中的领头羊 对周边地区的经济发展具有很好的代表作用 综上 在此选取了人均 GDP 货运量 客运量 人均储蓄 废物循环利用量等指标 经过计算综合得分 本文给出了 36 所城市的经济效应排名 广州 北京 上海 等地高居榜首 而处于西部内地的西宁 重庆 兰州则处于弱势地位 综合排 名具有较大差距的城市在某一指标因素上的排名却非常接近 基于这种现象 本文以因子得分矩阵作为数据依据 对 36 所城市进行聚类分析 得出一般结论 东部沿海城市依托优越地理因素 组成第一集团 中 西部组成二 三集团 这与实际情况基本相符 基于以上结论 本文深入挖掘数据 通过多方面比较各个城市的特点 给 出合理的建议与意见 诸如调整产业结构 加强地区间合作等 最后 本文指 出文章中在处理数据时所用方法的优缺点 关键词 因子分析 综合得分 聚类分析 2 1 问题描述 我国的经济处于怎样的发展模式 东部沿海城市与中西部城市在综合经济 发展中各处于怎样的地位 依据每所城市的产业结构特点 我国主要城市能够 分为几类 东 中 西部的城市划分方法是否还具有代表性 2 数据选取与处理 2 12 1 数据来源与数据来源与指标选取指标选取 数据选取说明 为使分析客观 全面 本文以 2010 年中国统计年鉴 中 所列 省会城市和计划单列市主要经济指标 作为评价的基础指标 选取城市 GDP 总值 亿元 第一产业值 亿元 第二产业值 亿元 第三产业值 亿 元 客运量 万人 货运量 万吨 地方财政预算内收入 万元 城乡居 民储蓄年末余额 万元 在岗职工平均工资 元 三废利用 万元 共八项 指标作为评价标准 2 22 2 数据简单处理数据简单处理 为在经济发展指标中剔除人口数量的影响 本文所涉及的变量均用人均值 来代表经济效益 人口数量则用的是 2009 年底得人口数量 在 2010 年中国 统计年鉴 中 有多项数据缺失 为了不影响以后的数据分析 将 36 个城市分 为中东部与西部两区域 然后分别以区域内的均值代替缺失值 由此 得到的数据指标为 表 2 1 定义变量 变量指标变量指标 X1人均 GDP 元 X6人均货运量 吨 X2人均一产增加值 元 X7人均财政收入 元 X3人均二产增加值 元 X8年末人均储蓄额 元 X4人均三产增加值 元 X9在岗职工平均工资 元 X5人均客运量 人 X10人均三废利用 元 3 3 模型建立模型建立 3 13 1 因子分析因子分析模型的建立模型的建立 因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计 方法 在教育领域和若其它领域的科学研究中 往往需要对反映事物 现象从 多个角度进行观测 也就设计出多观测变量 从多个变量收集大量数据以便进 行分析寻找规律 多变量大样本虽然会为我们的科学研究提供丰富的信息 但 却增加了数据采集和处理的难度 更重要的是在大多数情况下 许多变量之间 存在一定的相关关系 从而增加了问题分析的复杂性 因子分析就是将大量的彼此可能存在相关关系的变量转换成较少的 彼此 不相关的综合指标的一种多元统计方法 这样既可减轻收集信息的工作量 且 各综合指标代表的信息不重叠 便于分析 设有个测量变量 每个变量可作如下分解 p xxxx 321 3 1112121111 mmf ffx 2222221212 mmf ffx ppmpmppp fffx 2211 上式为因子模型 其中叫做公共因子 它们是在各个变量中共 m fff 21 同出现的因子 我们可以把它们看作高维空间中所张起的互相垂直的个坐标m 轴 表示影响的独特因子 做因子载荷 它是第 个变量在 2 1 pi i i x ij i 第个主因子上的负荷 或者叫做第 个变量在第个主因子上的权 它反映了jij 第 个变量在第主因子上的相对重要性 为独特因子的载荷 ij i 因子载荷矩阵的求解方法有许多种 在此可以利用 SPSS 软件统计包中的因 子分析模块解决复杂的矩阵正交分解问题 经过数据的处理 原来的维数据可以用维数据解释 从而大大减少的pm 数据处理的复杂性 3 23 2 考察原有变量是否适合因子分析考察原有变量是否适合因子分析 首先考察原有变量之间是否存在较强的线性关系 是否适合因子分析 这 里借助相关系数矩阵与巴特利特球度检验和 检验方法进行分析 表 3 1 原有变量相关系数矩阵 X1X2X3X4X5X6X7X8X9X10 X11 000 X2 0 101 1 000 X30 907 0 027 1 00 0 X40 950 0 208 0 73 4 1 00 0 X50 335 0 269 0 22 6 0 38 9 1 000 X60 493 0 079 0 50 2 0 43 1 0 180 1 000 X70 889 0 296 0 74 2 0 90 4 0 340 0 379 1 00 0 X80 854 0 322 0 63 0 0 92 9 0 387 0 446 0 88 5 1 00 0 X90 788 0 276 0 60 0 0 84 2 0 250 0 319 0 85 6 0 82 9 1 00 0 X1 00 095 0 014 0 11 0 0 07 3 0 103 0 065 0 09 5 0 08 3 0 25 6 1 00 0 4 从表 3 1 中可以看出大部分相关系数较高 个变量之间的线性关系较强 适合做因子分析 表 3 2 巴特利特球度检验和 检验 KMO and Bartlett s Test Kaiser Meyer Olkin Measure of Sampling Adequacy 0 62 Bartlett s Test of SphericityApprox Chi Square713 17 Df45 00 Sig 0 00 由表 3 2 可知巴特利特球度检验统计量为 713 17 相应概率 P 值接近 0 同时 KMO 值为 0 62 以上数据可以断定所给数据适合做因子分析 3 33 3 因子提取因子提取 表 3 3 因子解释原有变量总方差情况 初始因子解最终因子解 因子编号特征值方差贡献累计方差贡献 特征 值 方差贡 献累计方差贡献 1 000 5 603 56 029 56 029 4 988 49 880 49 880 2 000 1 224 12 240 68 269 1 149 11 490 61 370 3 000 1 099 10 991 79 261 1 112 11 122 72 493 4 000 0 718 7 182 86 443 1 041 10 410 82 902 5 000 0 679 6 793 93 236 1 033 10 334 93 236 6 000 0 372 3 721 96 958 7 000 0 157 1 566 98 524 8 000 0 093 0 928 99 452 9 000 0 055 0 548 100 000 10 000 0 000 0 000 100 000 当选取前五个因子时 累计方差贡献率达到 93 24 基本满足分析要求 故在此选取五个因子 3 43 4 因子命名因子命名 表 3 4 旋转之后的因子载荷矩阵 序号 变 量 Factor1Factor2Factor3Factor4Factor5 1 X40 9450 945 0 141 0 069 0 177 0 005 2 X10 9390 939 0 257 0 082 0 135 0 021 3 X70 9370 937 0 095 0 166 0 109 0 017 4 X80 8870 887 0 154 0 228 0 169 0 011 5 X90 8820 882 0 024 0 207 0 028 0 201 6 X30 7810 781 0 381 0 192 0 062 0 053 7 X60 290 0 9380 938 0 045 0 055 0 050 5 8 X2 0 136 0 025 0 9610 961 0 120 0 011 9 X50 220 0 056 0 127 0 9620 962 0 063 10 X100 093 0 039 0 011 0 057 0 9910 991 由表 3 4 可以看出 X4 X1 X7 X8 X9 X3 在 Factor1 中有较高的 载荷 将 Factor1 命名为资金因子 X6 在 factor2 中有较高的载荷 将 factor2 命名为货运量因子 X2 在 factor3 中有较高的载荷 将 factor3 命名为农业因子 X5 在 factor4 中有较高的载荷 将 factor4 命名为客运量因子 X10 在 factor5 中有较高的载荷 将 factor5 命名为循环利用因子 3 53 5 因子得分与综合评价因子得分与综合评价 利用 SPSS 软件容易得到每个地区的因子得分 在计算总得分时 这里采用 计算因子加权总得分的方法 权数为因子的方差贡献率 于是计算公式为 54321 1033 0 1041 0 1112 0 1149 0 4988 0 FFFFFF 表 3 5 各省市及其单列市各因子得分与总得分 资金因 子 货运量因 子 农业因 子 客运量因 子 循环利用 因子 总得 分 总排 名 广 州 1 840 1 635 0 263 0 454 0 335 1 14 8 1 上 海 2 869 0 448 1 374 1 824 0 532 1 08 5 2 北 京 2 735 2 523 1 150 1 215 0 721 0 99 8 3 杭 州 0 590 0 162 0 699 0 390 4 576 0 90 4 4 厦 门 1 238 0 972 0 267 0 412 0 202 0 76 3 5 大 连 0 721 0 773 2 878 0 210 0 453 0 70 0 6 深 圳 1 123 0 722 0 952 3 032 0 316 0 65 5 7 宁 波 0 449 1 314 1 225 0 494 0 612 0 62 6 8 天 津 0 834 0 740 0 508 0 797 0 113 0 35 0 9 南 京 0 439 0 440 0 011 0 288 0 234 0 32 2 10 呼和浩 特 0 411 0 168 1 267 0 760 0 445 0 24 0 11 青 岛 0 155 0 120 1 026 0 227 0 347 0 14 6 12 沈 0 369 0 776 0 832 0 058 0 487 0 1313 6 阳 1 长 沙 0 108 0 124 0 759 0 274 0 289 0 04 3 14 济 南 0 071 0 197 0 838 0 351 0 062 0 03 7 15 武 汉 0 141 0 696 0 341 0 477 0 093 0 06 9 16 福 州 0 344 0 548 1 309 0 085 0 445 0 14 4 17 成 都 0 699 0 293 0 094 1 483 0 009 0 14 9 18 拉 萨 0 270 1 685 0 772 0 835 3 126 0 17 8 19 合 肥 0 463 0 014 0 075 0 111 0 301 0 26 4 20 海 口 1 398 1 178 0 215 3 215 0 131 0 26 5 21 郑 州 0 352 0 329 0 501 0 109 0 479 0 33 0 22 银 川 0 953 2 075 0 460 0 498 0 063 0 33 3 23 长 春 0 419 1 108 0 716 0 446 0 347 0 33 9 24 哈 尔 滨 0 450 1 533 1 334 0 428 0 510 0 35 0 25 乌鲁木 齐 0 500 1 800 1 669 0 958 0 238 0 35 3 26 太 原 0 363 0 480 1 474 0 859 0 121 0 39 2 27 南 昌 0 483 0 879 0 126 0 499 0 411 0 42 3 28 7 昆 明 0 603 0 279 0 218 0 463 0 207 0 42 7 29 石 家 庄 0 664 0 903 0 750 0 543 0 437 0 45 3 30 西 安 0 753 0 557 0 935 0 096 0 399 0 46 7 31 南 宁 0 869 0 671 0 359 0 558 0 240 0 55 4 32 贵 阳 1 109 0 326 0 784 1 065 0 198 0 58 7 33 兰 州 0 858 0 309 1 274 0 723 0 263 0 65 3 34 重 庆 1 012 0 639 0 538 0 054 0 196 0 66 4 35 西 宁 0 891 0 953 1 108 0 353 0 419 0 75 7 36 由因子分析的结果可以看出 经济实力排名前十的城市依次是 广州 上 海 北京 杭州 厦门 大连 深圳 宁波 天津 南京 而西宁 重庆 兰 州 贵阳 南宁等地经济实力较弱 3 63 6 因子分析小结因子分析小结 为了分析各省市及单列城市之间的排名关系 现将每座城市各个因子的得 分情况排名比较 数据如下表 表 3 6 各因子排名 资金因 子 货运量因 子 农业因 子 客运量因 子 循环利用因 子 总排 名 广 州 3 3 14 7 22 1 上 海 1 12 34 36 35 2 北 京 2 36 32 4 36 3 杭 州 8 17 12 9 1 4 厦 4 6 21 8 6 5 8 门 大 连 7 7 1 18 31 6 深 圳 5 28 30 2 21 7 宁 波 9 4 5 6 3 8 天 津 6 8 25 32 11 9 南 京 10 13 18 10 5 10 呼和浩 特 11 16 4 31 29 11 青 岛 13 19 6 19 23 12 沈 阳 12 29 8 13 33 13 长 沙 15 18 9 11 19 14 济 南 14 15 7 20 10 15 武 汉 16 9 22 25 7 16 福 州 18 25 3 14 30 17 成 都 28 14 16 3 9 18 拉 萨 17 35 27 33 2 19 合 肥 23 20 17 17 20 20 海 口 36 5 19 1 13 21 郑 州 19 24 24 16 32 22 银 川 33 1 23 26 8 23 长 春 21 33 11 23 24 24 哈 尔 滨 22 34 2 22 34 25 乌鲁木 齐 25 2 36 35 17 26 太 20 11 35 34 12 27 9 原 南 昌 24 30 15 27 26 28 昆 明 26 21 20 24 16 29 石 家 庄 27 31 10 28 28 30 西 安 29 10 29 15 25 31 南 宁 31 27 13 29 18 32 贵 阳 35 23 28 5 15 33 兰 州 30 22 33 30 4 34 重 庆 34 26 26 12 14 35 西 宁 32 32 31 21 27 36 值得注意的是呼和浩特市 虽然呼和浩特地处我国内陆 但是在总排名上 其位居第十一位 这要得益于该市优越的农业发展因素 拉萨排名第十九位 但是该市的废物利用度高 在一定程度上提高了名次 从表中可以看出 排名前十的城市大都位于东部沿海地区 落后城市仍然 集中在中西部偏远地区 我国的东西部经济发展差距较大 为了提高我国整体 经济水平 各省市应该扬长避短 发挥自己的人文优势 地理优势与资源优势 如上海 总排名为第二名 农业因子排名位于第三十六位 北京依靠独特的政 治优势与地理优势 减少了对第一产业的依赖 不同省市有不同的经济依赖 如广州 资金基础雄厚 然而在废物处理的 环节不如其它省市 从而在一定程度上限制了经济的发展 如北京 上海依托 雄厚的资金优势 经济持续领跑 此外 地区之间应该加强合作 优势互补 合理经济模式布局将对我国的经济发展起到不可估计的作用 4 4 聚类分析聚类分析 从因子分析的结果可知 尽管有些地区因子总分差不多 但是在不同的 因子水平上得分却有很大差异 这说明不同的地区又不同的优势和劣势 例如 排名第二的上海 总得分 1 085 和排名第三的北京 总得分 0 998 虽然在 总得分上相差无几 但是在第四个因子上的排名上海是排在第 36 位 北京排名 是第四位 银川在因子二上的排名是第一位 在因子一上的排名是的 33 位 这 就说明地区内部 地区与地区之间有不同的经济优势 因此 为了反映各地区 的的经济状况 找出优势劣势 有必要进行聚类分析 4 14 1 聚类分析定义聚类分析定义 对一批没有标出类别的模式样本集 按照样本之间的相似程度分类 相 10 似的归为一类 不相似的归为另一类 这种分类称为聚类分析 也称为无监 督分类 从统计学的观点看 聚类分析是通过 数据建模简化数据的一种方法 传统的统计聚类分析方法包括 系统聚类法 分解法 加入法 动态聚类法 有序样品聚类 有重叠聚类和模糊聚类等 采用k 均值 k 中心点等算法 的聚类分析工具已被加入到许多著名的统计分析 软件包中 如 SPSS SAS 等 从实际应用的角度看 聚类分析是数据挖掘的主要任务之一 而且聚类 能够作为一个独立的工具获得数据的分布状况 观察每一簇数据的特征 集 中对特定的聚簇集合作进一步地分析 聚类分析还可以作为其他算法 如分 类和定性归纳算法 的预处理 步骤 4 24 2 聚类分析的流程及数据来源聚类分析的流程及数据来源 图 4 1 4 34 3 聚类分析结聚类分析结论论 在本文中 十个变量所反映的信息量可以 近似用五个因子的信息量代 替 并且 5 个因素之间相互独立 避免了原有变量之间的复共线性对聚类的 影响 因此 本文用每个城市 各个因子上的得分作为数据来源进行聚类分 析 表 4 1 各城市的因子得分表 资金因子货运量因子农业因子客运量因子循环利用因子 广 州 1 840 1 635 0 263 0 454 0 335 上 海 2 869 0 448 1 374 1 824 0 532 北 京 2 735 2 523 1 150 1 215 0 721 11 杭 州 0 590 0 162 0 699 0 390 4 576 厦 门 1 238 0 972 0 267 0 412 0 202 大 连 0 721 0 773 2 878 0 210 0 453 深 圳 1 123 0 722 0 952 3 032 0 316 宁 波 0 449 1 314 1 225 0 494 0 612 天 津 0 834 0 740 0 508 0 797 0 113 南 京 0 439 0 440 0 011 0 288 0 234 呼和浩特 0 411 0 168 1 267 0 760 0 445 青 岛 0 155 0 120 1 026 0 227 0 347 沈 阳 0 369 0 776 0 832 0 058 0 487 长 沙 0 108 0 124 0 759 0 274 0 289 济 南 0 071 0 197 0 838 0 351 0 062 武 汉 0 141 0 696 0 341 0 477 0 093 福 州 0 344 0 548 1 309 0 085 0 445 成 都 0 699 0 293 0 094 1 483 0 009 拉 萨 0 270 1 685 0 772 0 835 3 126 合 肥 0 463 0 014 0 075 0 111 0 301 海 口 1 398 1 178 0 215 3 215 0 131 郑 州 0 352 0 329 0 501 0 109 0 479 银 川 0 953 2 075 0 460 0 498 0 063 长 春 0 419 1 108 0 716 0 446 0 347 哈 尔 滨 0 450 1 533 1 334 0 428 0 510 乌鲁木齐 0 500 1 800 1 669 0 958 0 238 太 原 0 363 0 480 1 474 0 859 0 121 南 昌 0 483 0 879 0 126 0 499 0 411 昆 明 0 603 0 279 0 218 0 463 0 207 石 家 庄 0 664 0 903 0 750 0 543 0 437 西 安 0 753 0 557 0 935 0 096 0 399 南 宁 0 869 0 671 0 359 0 558 0 240 贵 阳 1 109 0 326 0 784 1 065 0 198 兰 州 0 858 0 309 1 274 0 723 0 263 重 庆 1 012 0 639 0 538 0 054 0 196 西 宁 0 891 0 953 1 108 0 353 0 419 运用 SPSS 软件中聚类分析模块中 Ward 离差平方和法 样本之间的距 离采用欧氏距离 分析结果如下表所示 表 4 2 基于聚类分析的城市分类 分类分类 5 56 67 78 8 广州 1111 上海 2222 北京 3333 杭州 4444 厦门 1111 12 大连 1555 深圳 3336 宁波 1111 天津 1111 南京 1111 呼和浩特 1111 青岛 1111 沈阳 1111 长沙 1111 济南 1111 武汉 1111 福州 1111 成都 1111 拉萨 4467 合肥 1111 海口 5678 郑州 1111 银川 1111 长春 1111 哈尔滨 1111 乌鲁木齐 1111 太原 1111 南昌 1111 昆明 1111 石家庄 1111 西安 1111 南宁 1111 贵阳 1111 兰州 1111 重庆 1111 西宁 1111 其中 第一行表示分类个数 表中的数表示属于第几类 例如当分为 五类时 海口是 一类 上海是一类 拉萨 杭州是一类 北京 深圳是一 类 其他为一类 北京和深圳有着相同的产业模式 薄弱的第一产业 优 越的资金优势 分为一类也不足为奇 上海做为国际大都市 雄厚的资金优 势使其第三产业发达 从而减少了对第一产业的依赖 海口市作为港口性质 的城市 货运量 客运量领先与全国水平 而资金水平的匮乏在一定程度 上限制了它的发展 拉萨 杭州 虽然在其它因子上得分较低 但 注重废 物回收利用 这样的发展模式 拉近了这两座城市的距离 其它城市产业发 展模式均衡 各项经济指标 大体一致 从而被分为一类 以上可以看出 城市之间的分类已经不再适合东 中 西部简单的分类 标准了 经济总量在某种程度上可以反映城市经济发展的好坏 然而并不能 13 用经济总量这种单一指标来划分城市类型 城市之间的划分更应该注重各 个城市的产业结构
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 危险货物押运员考试题库及答案解析
- 2025年人工智能工程师人工智能在智能决策领域的应用测试试卷及答案
- 建设工程施工管理模拟试题及解析
- 道路运输企业恶劣天气应急预案
- 2025全国行政执法人员执法资格考试必考题库含答案
- 2025建筑师考试历年真题及答案解析
- 2026-2031中国视频监控系统市场运行动态监测及发展前景投资预测报告
- 2025济南市国考试题及答案
- 语文版(中职)拓展模块一二 孔雀东南飞(并序) 乐府民歌教学设计
- 2026-2031中国氢燃料电池车行业市场分析与发展趋势研究报告(定制版)
- 2025年-思想道德与法治2023版第五章教学设计教案 遵守道德规范 锤炼道德品格-新版
- 2025年10月“江南十校”高三阶段检测 数学(A卷)含答案
- 2025年广西国家公务员申论考试真题及答案
- 部队炊事班年度工作总结
- 铝合金铸造企业安全培训课件
- 月嫂产褥期的心理护理
- 招商管理考试题目及答案
- 斜视教学课件
- 雨污水溯源排查方案
- 贵师大科研管理办法
- 护理中医脾胃试题及答案
评论
0/150
提交评论