关于我国各省市经济发展的多元统计分析——课程论文_第1页
关于我国各省市经济发展的多元统计分析——课程论文_第2页
关于我国各省市经济发展的多元统计分析——课程论文_第3页
关于我国各省市经济发展的多元统计分析——课程论文_第4页
关于我国各省市经济发展的多元统计分析——课程论文_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于我国各省市经济发展的多元统计分析关于我国各省市经济发展的多元统计分析摘要:通过多元统计的主成分分析、因子分析和聚类分析方法,对我国31 个省、市、自治区的11项社会经济发展指标数据进行多元统计分析,旨在据分析结果对各地区社会经济发展状况进行分类、比较和综合评价。关键词 SAS;经济发展;主成分分析;因子分析;聚类分析Multivariate Statistical Analysis about Various Provinces and Cities Economy Development in Our CountryAbstract Through multivariate statis

2、tical principal component analysis, factor analysis and cluster analysis method, the 31 provinces, municipalities and autonomous regions in China 11 measures of social and economic development data of multivariate statistical analysis, aimed at according to the analysis results for the area classifi

3、cation, comparison and development status of social economy comprehensive evaluation.Keywords SAS; economy development; principal component analysis; factor analysis; cluster analysis0引言随着我国经济的不断发展以及改革开放的深入,研究经济的发展状况及分析经济发展的各个因素,成为决策部门的一个重要课题。影响我国各地区经济发展的因素有很多,而如何定量化地分析和揭示影响各地区社会经济发展的主要因素及潜在综合因素的影响,

4、是制定切实可行的缩小差距、促进地区经济协调发展对策的重要基础之一。为更好地推动我国各城市的全面协调发展,促进城市的现代化和国际化,我们必须对各省市经济竞争力进行正确的评估分析。测度省市经济竞争力需要建立科学的指标体系,每项指标要从不同角度反映省市的竞争力状况1-2。由于指标个数较多,并且彼此之间存在着一定的相关性,因而使所观测到的数据在一定程度上反映了信息重叠。本文运用了主成分分析法对11项指标发挥的作用进行了综合评价,再运用因子分析方法将众多指标转化为少数几个互相独立的综合指标,以避免指标间信息重叠,从而将多指标的重叠信息进行过滤,提炼出反映其本质的少数隐藏因子,为了避免分类的主观性和随意性

5、,再运用聚类分析进行客观分类,从而较为全面地反映我国各省市在2011 年的经济竞争力,有利于各城市找出自身的差距,从而实现其跨越式发展3-5。1 综合指标体系的构建根据中国统计局公布的2011 年全国31 个省、市、自治区的有关经济发展方面的数据,按照设置指标体系的内容全面、系统及可操作性的原则6-7,本文选取了11 项指标来综合评价各地的经济发展状况8-10(具体数据见表111): 反映地区经济效益的指标:x1人均GDP(亿元)、x2工业总产值(亿元);反映宏观方面财政、投资方面的指标:x3财政收入(万元)、x4财政支出(万元)、x5固定资产投资(亿元);反映居民消费方面的指标:x6居民消费

6、水平(元)、x7居民消费价格指数(上年100)、x8商品零售价格指数(上年100)、x9社会消费品零售总额(亿元);反映居民收入方面的指标:x10年度在岗职工平均工资(元)、x11年度农村居民家庭人均纯收入(元)。表1各地区11项指标数据表Table1Regional 11 indicators data table数据来源:2012年中国统计年鉴(已是最新数据)2 主成分分析2.1 主成分的基本思想主成分分析法是霍特林于1933 年首先提出来的其原理是利用降维的思想把众多变量转化为少数几个综合指标这几个综合指标为原来变量的线性组合综合指标保留了原始变量的主要信息 彼此间又不相关能使复杂的问题

7、简单化便于抓住主要矛盾进行分析12-16。2.2 主成分分析SAS 软件输出结果及分析根据主成分分析原理,由于各指标值有不同的量纲,我们将对数据进行标准化处理,在SAS中进行分析。处理结果显示主成分的特征值、贡献率、累积贡献率等的结果如表2。表2 主成分的特征值及贡献率表Table2Eigenvalues of the Correlation Matrix从表2 中我们可以看出前3 项相应的方差贡献分别为S1=65.54%,S2=19.98%,S3=10.24%,累积方差贡献达到了95.76%,且其特征值均大于1,这说明前面3个成分是主成分,因此可以用它们来代替原始的20 个指标它们能反映评价

8、指标所包含的绝大部分信息。表3 特征向量Table3Eigenvectors从表3中我们可以得到主成分分析的特征向量,据此可以得到用标准化变量表达的三个主成分表达式: Prin1=0.0313523x10.336370x20.332865x11Prin2=0.296709x10.304239x20.291478x11Prin3=0.176678x10.020089x20.158460x11对所选主成分的解释主成分分析中一般认为绝对值大于0.3 的负载就是显著的因为0.3 的平方约为10%,即0.3 负载能解释变量方差的10%。从表3 (主成分表达式)可见第一主成分在x1、x2、x3、x4、x6

9、、x9、x11即人均GDP、工业总产值、财政收入、财政支出、居民消费水平、社会消费品零售总额、农村居民收入等指标上负载较大,可以说第一主成分是经济发展水平经济效益因子。第二主成分负载最大的指标是x5、x10即固定资产投资、在岗职工平均工资,可以说第二主成分是投资、城市收入的因子。第三主成分以x7、x8即居民消费价格指数、商品零售价格指数负载最大,这个主成分可以说是居民消费的因子。3 因子分析3.1 因子分析的基本思想因子分析的基本思想是把联系较为紧密的变量归为同一个类别,而不同类别的变量之间的相关性则较低。在同一个类别内的变量,可以想象是受到了某个共同因素的影响才彼此高度相关的,这个共同因素也

10、称之为公共因子,它是潜在的并且是不可观测的。因子分析反映了一种降维的思想,通过降维将相关性高的变量聚在一起,不仅便于提取容易解释的特征,而且降低了需要分析的变量数目和问题分析的复杂性17。3.2 因子分析的SAS 软件输出结果及分析143.2.1 因子分析应用程序PROC FACTOR DATA=yz SIMPLE CORR N=3 ROTATE=V SCORE; VAR x1-x11; RUN;3.2.2 主因子的选取标准化处理后数据用SAS进行因子分析,得到11个指标的相关系数矩阵(表4)。从表4的各相关系数可以看出,各变量两两之间有较大的相关系数(90%以上大于0.3),各变量至少与1个

11、以上的其他变量有较大的相关系数,因此,适宜用因子分析法来研究变量之间的关系。表格4相关系数矩阵Table4Correlation Matrix经过方差最大化正交旋转后得到的3个主因子的特征值、方差贡献率和累计方差贡献率见表5。表5 因子特征值及贡献率表Table5Eigenvalues of the Correlation Matrix因子特征值方差贡献率累计方差贡献率16.082412140.55290.552922.797761430.25430.807330.999280890.09080.898140.452316780.04110.939350.319101810.02900.968

12、360.138071730.01260.980870.077240510.00700.987880.072313790.00660.994490.030720120.00280.9972100.019242910.00170.9990110.011537900.00101.0000我们可以看到选出的3个主因子可以解释总方差的89.81,即总体的89.81信息可以由这3 个因子来解释,方差的解释性较好,它们反映了原变量的大部分信息。并且前三个主因子的特征值均大于或接近于1。3.2.3 因子命名旋转后的因子分析模型见表6。该表格是按照设定的方差极大法(Varimax)对因子载荷矩阵进行正交旋转后的

13、结果。在经过正交旋转的载荷矩阵中,每个公共因子上的载荷分配得更加清晰了,因而比未经旋转时更容易解释各个公因子的含义。表6旋转后的因子分析模型Table6Rotated Factor Pattern从表6可以得出旋转后的因子载荷: x1=0.27757F10.87586F2x2=0.96347F10.13889F2x11=0.31978F10.89956F2表7 标准化得分系数阵Table7Standardized Scoring Coefficients因子因子1因子2因子3Zscore(x1)0.246730.89749-0.09497Zscore(x2)0.956870.16747-0.0

14、6574Zscore(x3)0.840660.48122-0.11809Zscore(x4)0.931580.16986-0.10445Zscore(x5)0.95205-0.05995-0.06548Zscore(x6)0.237180.94754-0.06122Zscore(x7)-0.27874-0.081080.88368Zscore(x8)0.13244-0.532420.64766Zscore(x9)0.952790.22063-0.04580Zscore(x10)-0.012940.89326-0.21284Zscore(x11)0.287210.91618-0.12116从表7

15、我们可以看出,第一主因子中x2、x9、x5、x4、x3 这5 项指标有较大的载荷,它们大都可以看成是关于宏观的、总体的财政、投资方面的指标,因此可以命名为总量因子;第二主因子中x6、x11、x1、x10这4 项指标有较大的负荷,这些指标大都是从居民个体的角度来反映经济发展的阶段程度,故可命名为均量因子;第三主因子中x7、x8 这两项指标有较大的负荷,可以较为明显地看它们是主要反映价格方面的指标,故可命名为价格因子。3.2.4 计算因子得分根据表7数据分析结果显示,因子得分的公式如下:F1=0.01829x10.22378x20.01106x11F2=0.25880x10.03807 x20.2

16、5627 x11F3=0.10748 x10.02397 x20.08893 x11可根据这3 个因子得分函数,计算31 个观测样本的3 个因子得分,并且,由于我们更加关心全国各地的经济发展综合实力,故可对3 个公因子的得分进行加权求和,结合表5,按照如下加权平均关系式计算得出各省市的综合得分zF。zF (F1×55.29F2×25.43F3×9.08)/89.81其中,因子得分为正值,表示该地区此因子表现高于全国平均水平;因子得分为负值,表示该地区此因子表现低于全国平均水平。之后,根据综合得分可以看出全国那些地区比较发达,在对比往年的数据可以看出那些城市发展较快

17、;根据各个主因子的得分看各省市的经济发展情况,可以看出各个城市那些方面占优势,欠缺的又是哪些方面,这样就可以具体情况具体解决,有利于我国各地区经济均衡发展。4 聚类分析4.1 聚类分析基本思想聚类分析(Clustering analysis,简称CA)将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强,目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化。聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类18-19。4.2 聚类分析的SAS 软件输出结果及分析聚类分析是数理统计的一种方法,先对原始数据进行标准化处理,然后选择运用系统聚类(又称层次聚类

18、) 方法对数据中11项指标进行分析20。聚类分析树图见图1。由图1可见,样本层次聚类分析聚成4类时,北京、辽宁、上海、浙江、山东、河南、四川属于第一类;广东、江苏属于第二类;海南、宁夏回族自治区、西藏自治区、青海属于第三类;其他省市属于第四类。聚类分析分到同一类的地区在11项指标为分析前提的情况下是有相似性的。图1层次聚类分析的树形图Figure 1 Dendrogram5 结语总而言之,本文采用以上介绍的11 项指标,结合主成分分析、因子分析与聚类分析的方法来评价我国2011年31 个省、市、自治区的经济综合发展实力,分析结果与实际情况基本一致。需要指出的是,我国东西部发展较为悬殊,经济文化

19、较为繁荣的多位于东部地区。我国中西部地区资源丰富,是个尚待开发的战略地区,也是中国潜在的大市场。只有中西部地区发展起来了,东部地区的经济发展才会有更为广阔的市场支撑。因此,我们要坚定不移地把西部大开发的战略推行下去。参考文献1 乔慧.关于我国31 个省市自治区经济发展的多元统计分析J. 科技情报开发与经济,2011,21(1):160-162.2 燕霞,梁满发.我国地区经济发展的多元统计分析M. 北京:中国学术期刊电子杂志出版社,2010.3 何晓群.现代统计分析方法与应用M.中国人民大学出版社,2012.2.4 于秀林,任雪松.多元统计分析M.北京:中国统计出版社,1999.5 理查德A约翰逊,迪安W威克恩.实用多元统计分析M.英文版.北京:清华大学出版社,2008.6 毛蒋兴,欧阳东,严志强,陈玲. 基于多元统计分析的城市职能结构特征与分类研究J.规划广角,2008,24(2):75-80. 7 陈宝薇,伍宪彬城市综合实力的协调评价J数学的实践与认识,2008,38(9):149-1508 中国统计年鉴 (2011) M北京:国家统计出版社,20129 王晓鹏,索南加,丁生喜. 青海藏区社会经济发展水平动态评价研究J. 数学的实践与认识,2012,42(6):47

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论