第一小组35个城市的主成分分析-副本_第1页
第一小组35个城市的主成分分析-副本_第2页
第一小组35个城市的主成分分析-副本_第3页
第一小组35个城市的主成分分析-副本_第4页
第一小组35个城市的主成分分析-副本_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、对数据指标进行主成分分析20002010年全国35个主要城市的经济发展排名By选题目的选题目的日前,在网络上浏览到一篇关于2015中国城市竞争力的排行榜。又查阅了近15年来的相关数据。城市之间的竞争,跟人和企业一样,不进则退。位置年年更新,谁是崛起新秀?谁又是没落王族呢?基于对城市排名机制的好奇,我们利用所接触到计量地理学知识,从多个中选取了十个与经济紧密相关的元素,最终得到2000-2010年全国35个主要城市的经济发展排名。数据数据2000年35个主要城市和计划单列市的各项经济指标2005年35个主要城市和计划单列市的各项经济指标2010年35个主要城市和计划单列市的各项经济指标方法:主成

2、分分析工具:Excel、SPSS软件注:由于只选取了35个城市数据与主成分分析中所涉及的要素不同,结果会与网络上公布的数据有所出入。数据来源:国家统计局中国统计年鉴数据元数据元数据2000年2005年2010年2000年35个城市的主成分分析主成分的应用条件主成分分析的前提是变量之间必须有相关性。如果变量之间相互独立,则无法实现降维。SPSS提供Bartlett球形检验(卡方统计量的值、相应的自由度和显著性)。如果显著性小于0.05,则认为主成分分析是适宜的(卡方统计量的值越大,变量之间的相关性越强) 。SPSS提供KMO统计量检验(比较样本相关系数和偏相关系数,01),统计量取值越大,越适宜

3、主成分分析(一般要求大于0.5)。1. 进行样本数据的进行样本数据的标准化标准化,以消除指标变,以消除指标变量的量纲或单位的影响;量的量纲或单位的影响;2. 计算相关矩阵,并求出计算相关矩阵,并求出相关系数矩阵相关系数矩阵R的的所有所有非零特征根;非零特征根;3、由相关系数矩阵、由相关系数矩阵计算特征值计算特征值,以及各个主成分的,以及各个主成分的贡贡献率献率与与累计贡献率累计贡献率,选择主成分个数。,选择主成分个数。由左表可知,第一,第二主成分的累计贡献率已高达89.028%(大于85%),故只需要求出第一、第二主成分Z1,Z2即可。4、对于、对于特征值特征值1=7.140,2=1.763分

4、别求出其分别求出其特征向量特征向量,再计算各变量在主成再计算各变量在主成分分1,2上的上的载荷载荷。成分矩阵,表示主成分和变量之间的相关系数矩阵5、由左图可以看出,第一主成分Z1与x2,x6,x7,x8,x9,x10呈现较强正相关,即可以认为第一主成分在一定程度上代表了非农业经济结构。第二主成分Z2与x1,x3,x5呈较强正相关,与x4,x7,x8,x10呈较强负相关,即可以认为第二主成分在一定程度上代表了人口运输和农业结构。显然,用两个主成分Z1、Z2代替原来的10个变量,可以使问题更进一步简化、明了。6、为了进行综合评价,可以利用主成为了进行综合评价,可以利用主成分得分,应用下述计算公式,

5、进行加分得分,应用下述计算公式,进行加权求和,得到权求和,得到各个区域单元的总得分各个区域单元的总得分(Q指标)指标):7 7、排序、排序后的城市后的城市排名结果排名结果为:为:2005年35个城市主成分分析1. 进行样本数据的标准化,进行样本数据的标准化,以消除指标变量的量纲或以消除指标变量的量纲或单位的影响;单位的影响;主成分分析的前提是变量之间必须有主成分分析的前提是变量之间必须有相关性相关性。如果变量之间相互独立,则。如果变量之间相互独立,则无法实现降维。无法实现降维。SPSS提供提供KMO统计量检验统计量检验(比较样本(比较样本相关系数和偏相关系数,相关系数和偏相关系数,01),统计

6、),统计量量取值越大取值越大,越适宜越适宜主成分分析(一主成分分析(一般要求大于般要求大于0.5)求出求出相关系数矩阵相关系数矩阵R的所有的所有非零特征根;非零特征根;根据特征根的贡献率,第一第二主成分的累根据特征根的贡献率,第一第二主成分的累计贡献率已经高达计贡献率已经高达88.99% , 选择主成分个数选择主成分个数为为 2 ;主成分主成分1与与X2、X3、X4、X5、X6、X8、X9、X10呈现出较呈现出较强的正相关,强的正相关,而这几个变量而这几个变量则综合反映了则综合反映了经济物资总值经济物资总值状况,因此可状况,因此可认为第一主成认为第一主成分分1是经济物资是经济物资的代表。的代表

7、。主成分主成分2与与X1、X7呈现出较强呈现出较强的正相关,而的正相关,而这几个变量则这几个变量则综合反映了人综合反映了人口及其流动的口及其流动的状况,因此可状况,因此可认为第二主成认为第二主成分分2是人口总量是人口总量的代表。的代表。计算计算主成分系数主成分系数。用用主成分载荷矩阵中主成分载荷矩阵中的数据除以的数据除以相对应的相对应的特征值的平方根特征值的平方根计算计算主成分得分主成分得分为了进行综合评为了进行综合评价,可以利用主价,可以利用主成分得分,应用成分得分,应用下述计算公式,下述计算公式,进行加权求和,进行加权求和,得到得到各个区域单各个区域单元的总得分(元的总得分(Q指标)指标)

8、排序得到最终结果20102010年对省会城市年对省会城市1010项指标进行项指标进行主成分分析主成分分析对变量进行描述后的结果变量相关性的检验KMO检验:相关和偏相关系数,介于01之间,越大越适宜进行主成分分析,一般要求大于0.5Bartlett球形度检验:近似卡方检验,数值越大越适宜进行主成分分析,显著性检验数值要求小于0.05由此表可见,第一、第二主成分的累计贡献率已经高达83.922%,故只需要求出第一、第二主成分特征值和方差贡献率主成分载荷主成分Z1跟X2,X4,X7,X9, 呈现较强的正相关,说明这几个变量能够反映城市排名情况,可认为第一主成分是代表各地区生产总值。主成分Z2跟X3成

9、较强正相关,跟X10,成负相关,可认为第二主成分代表农业总产值。1.计算主成分系数:转换计算变量:用主成分载荷矩阵中的数据除以相对应的特征值的平方根2.计算主成分得分:转换计算变量,计算第一主成分得分F1,并依次计算F2、F33.加权求和:城市排名20002000年年20052005年年20102010年年昆明竟然最后!奇怪!分析分析深圳排名一直上升(上升幅度14);原因:对外贸易繁荣,外贸出口总额居全国首位,战略性新兴产业经济增长比传统产业快。厦门排名一直上升(上升幅度14);原因:旅游服务业发展迅速,人口流动加大。哈尔滨排名一直下降(下降幅度13);原因:人口流失严重,工业比重较大,且工业

10、所产生的经济利润逐渐下降。石家庄排名一直下降(下降幅度10);原因:支柱产业增长速慢,老国有工业企业,经济活力低,改革步履维艰。石家庄的产业结构不合理,过于倚重工业,服务业支撑能力不足。昆明排名一直下降(下降幅度14);原因:可能是数据缺失,难以解释。东中西部城市经济排名比较东中西部城市经济排名比较20002000年前十名年前十名东部城市中部城市西部城市20052005年前十名年前十名东部城市中部城市西部城市20102010年前十名年前十名东部城市中部城市西部城市分析分析东部城市的经济排名总体靠前,中、西部城市总体靠后在经济排名前十名中,东部城市占绝大部分比重,且比重有轻微上升;中、西部城市占比重极少,2005年、2010年中部城市甚至没能进前十。在经济排名后十名中,情况与前十名占比相反,东部城市占比逐渐减少,中、西部城市占比大且有增加。结论:东部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论