基于多元统计的天津市各区县经济状况评价毕业论文.docx_第1页
基于多元统计的天津市各区县经济状况评价毕业论文.docx_第2页
基于多元统计的天津市各区县经济状况评价毕业论文.docx_第3页
基于多元统计的天津市各区县经济状况评价毕业论文.docx_第4页
基于多元统计的天津市各区县经济状况评价毕业论文.docx_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业论文 论文题目(中文) 基于多元统计的天津市各区县经济状况评价 论文题目(外文) The Economic Evaluation of Districts in Tianjin Based on Multivariate Statistical Analysis 目 录摘 要4第一章 绪论71.1 研究背景及意义71.2 研究内容71.3 研究方法及创新点7第二章 原始数据10第三章 基本多元统计理论123.1主成分分析123.1.1主成分分析的基本概念123.1.2主成分分析的基本思想123.1.3主成分数量的确定123.1.4主成分的性质123.1.5主成分分析步骤133.2因子分析133.2.1因子分析的基本概念133.2.2因子分析的基本思想133.2.3因子分析的统计原理133.2.4因子载荷矩阵的求解方法143.2.5因子旋转143.2.6因子分析步骤143.3聚类分析143.3.1聚类分析的基本思想143.3.2聚类分析的注意事项153.3.3聚类分析方法153.4回归分析163.4.1确定性关系和非确定性关系163.4.2回归分析基本概念163.4.3曲线估计的基本概念173.4.5曲线估计的统计原理173.4.6分析步骤17第四章 区域经济评价指标体系184.1评价指标体系的建立原则184.2区域经济评价指标体系的建立18第五章 天津市各区县经济发展分析205.1主成分分析205.1.1特征值级和方差贡献表205.1.2主成分的碎石图225.1.3旋转前的因子载荷矩阵225.1.4主成分特征向量矩阵(主成分表达式的系数)245.1.5主成分得分和综合得分245.2因子分析255.2.1特征值和方差贡献表255.2.2旋转前的因子载荷矩阵265.2.3旋转后的因子载荷矩阵275.2.4因子转换矩阵表285.2.5因子得分和综合得分295.3多变量协和系数Kendall协同系数检验305.4聚类分析315.4.1凝聚顺序表315.4.2系统聚类的冰柱图335.4.3系统聚类的树状图345.4.4聚类结果345.5回归分析355.5.1散点图365.5.2三次曲线模型拟合效果的检验表375.5.3方差分析表385.5.4回归系数表385.5.5拟合效果图39第六章 结论综述40参考文献41摘 要区域经济发展水平的评价结果是政府评判地区目前的经济水平和制定相关政策的重要依据 陈伟.多元统计分析在区域经济评价中的运用D.武汉:武汉科技大学,2010.。多元统计分析(Multivariate statistical analysis)是目前主流的经典的区域经济评价方法,主要包括主成分分析(Principal Component Analysis,PCA)、因子分析(Factor Analysis)、聚类分析(Cluster analysis)和回归分析(Regression Analysis)。传统的区域经济评价方法一般只用某一种方法进行分析,但是由于每种方法的侧重点不同,得到的分析结果也可能不一致。因此不适合采用这种方案来制定区域经济发展政策。天津市是经济发达、治安良好、气候舒适、交通便利的一个超大城市。在2017年的最新统计数据中,天津也被评为“中国十大幸福城市”之一。但是与北上广深等特大城市相比,天津的经济发展还略逊一筹。在环境方面,也不如西藏、贵州等经济落后的省市。为了进一步创造价值,提高人民幸福感,有必要对天津市的各区县的经济状况进行深入研究,从而对政策的指定有着良好的指引作用 王江平,高文,吴达.2013年度天津市区县科技进步综合能力比较研究J.天津科技,2014,41(1): 4347.。本文利用spss19.0软件,从地区基本情况、工农业发展状况、人民生活状况、社会发展状况和经济发展趋势诸多方面选取了18项经济指标,根据全面性、前瞻性、代表性、科学性、正确性、特色性等原则,构建了反映天津市各区县综合经济实力的评价指标体系 王淑芬.多元统计方法在天津市城市居民住房消费分析中的应用J.天津工业大学学报,2007,26(1):8184.。利用主成分分析、因子分析进行初步的统计,然后采用聚类分析进行进一步的总结,最后利用回归分析对区县的经济发展进行预测,从而制定合理的政策。 关键词:区域经济评价;主成分分析;因子分析;聚类分析;回归分析AbstractEvaluation result of regional economic development level is an important basis for government to judge the present development level and make the strategies of the area. Multivariate statistical analysis is a quite popular and classical method to analysis the regional economic. Principal Component Analysis, Factor Analysis, Cluster analysis and Regression analysis are very useful. Multivariate statistical analysis usually employs only one method so the evaluation result is usually ex parte as well as different methods acquire inconsistent results. It is obviously to take a few methods at the same time to get a more objective outcome.Tianjin is an economically developed megacity behemoth. It has good order, wonderful weather and convenient transportation. It is awarded one of the ten happiest cities in China. It is slightly inferior than megalopolis in economic such as Beijing and Shanghai. And the environment is also worse than backward area such as Xizang and Guizhou. To create value and improve the happiness of people, it is essential to make an intensive study on economic of every district so that to make reasonable strategies.It employs SPSS to select factors about basic situation, the development of industry and agriculture, peoples living conditions, social development and economic trends. On the principle of comprehensiveness, scientificalness, prospect, representativeness, correctness and characteristic, it constructs the evaluation index system. It employs Principal Component Analysis and Factor Analysis to study the statistical data preliminarily. It applies hierarchical clustering method to make further analysis. After that, it uses Regression Analysis to forecast the economics of the specific district. As a result, it makes reasonable advices.Key Words: regional economy; principal component analysis; factor analysis; cluster analysis; regression analysis第一章 绪论1.1 研究背景及意义区域经济经展水平的评价结果是政府部门判断该区域现有的经济水平和制定该区域经济发展策略的重要依据;目前区域经济分析常用的数学方法有多元统计、线性规划和决策论 曹小宁,任健,罗慧媛等.“一带一路”背景下能源富集地区的经济金融选择J.西部金融,2016,(3):7074.。其中多元统计分析在区域经济评价中的具体方法有因子分析、判别分析、对应分析、聚类分析和回归分析。尽管分析方法很多,但不同的方案的侧重点不同,分析的结果也就难免有差异。本文综合利用了几种方法,着眼于尽量全面的分析问题,从而得出比较客观的分析结果。天津市是经济发达、治安良好、气候舒适、交通便利的一个超大城市。在2017年的最新统计数据中,天津也被评为“中国十大幸福城市”之一。但是与北上广深等特大城市相比,天津的经济发展还略逊一筹。在环境方面,也不如西藏、贵州等经济落后的省市。为了进一步创造价值,提高人民幸福感,有必要对天津市的各区县的经济状况进行深入研究,从而对政策的指定有着良好的指引作用。1.2 研究内容本文首先对主成分分析、因子分析、聚类分析、回归分析的基本理论进行了深入的研究,然后根据全面性、前瞻性、代表性、科学性、正确性、特色性等原则 沈晓婧,周介南.多元统计分析法对区域经济指标的研究J.科技创新导报,2009,(34):144145.,从经济增长、经济结构、经济关系、经济制度、经济协调和可持续发展等方面选取了众多经济指标,构建了天津市各区县经济发展的评价指标,利用SPSS 19.0软件首先进行了主成分分析和因子分析。然后用聚类分析对各个区县进行分类,最后利用回归分析对未来的经济发展趋势进行预测,对天津市各区县的发展提出了一些合理化的建议。1.3 研究方法及创新点目前区域经济分析的方法主要有:多元正态分布、聚类分析、判别分析、主成分分析、对应分析、因子分析、典型相关分析、定性数据的建模分析和路径分析。多元统计分析在区域经济评价中的主要方法有因子分析、聚类分析、回归分析、对应分析、判别分析。多元统计分析的一个主要研究内容就是简化数据结构,即降维问题,把高维空间的数据投影到低维空间,使问题得到简化而损失的信息又不太多1。本文用到的主要研究方法有:主成分分析法、因子分析法、聚类分析法和回归分析法。前两者用于对原始指标数据进行统计分析,并依据分析结果对各市经济发展情况进行评价和对各市综合经济实力进行排名 王友明.多元统计分析方法及其在经济研究中的应用J.安徽水利水电职业技术学院学报,2003,3(2):4244.。聚类分析是在综合前两者分析结果的基础上,依据综合结果所显示的各市综合经济实力,对天津市各区县分类,以便对各市的社会经济发展状况进行评价。回归分析用于对各区县未来的经济发展进行预测。由于不同分析方法的侧重点不同,导致不同的方法对同一数据分析结果可能不一致,从而不利于制定相关经济发展政策。本文在统计分析了天津市各区县涉及人民生活工作等多方面指标,综合了几种经典的多元统计分析方法,为制定符合当地特色的政策奠定良好的理论基础。文章的结构图如下:参考文献、致谢结论综述结束主成分分析、因子分析、聚类分析、回归分析建立区域经济评价指标体系多元统计理论原始数据绪论摘要开始 (图 1.1) 文章结构图第二章 原始数据原始数据均来自2016年天津统计年鉴。(表2. 1) 天津市16区原始数据表续表1续表2因为每个指标的单位不同,因此分析的时候需要进行无量纲化,即对数据进行标准化。第三章 基本多元统计理论3.1主成分分析3.1.1主成分分析的基本概念主成分分析就是考虑各指标之间相互关系,用“降维”的方法将众多指标转变为少数几个互不相关的指标,使进一步研究变简单的一种统计方法 谢江宏,李雪梅,王生原.多元统计分析在宏观经济分析中的应用J.信息化纵横,2009,(13):6063.。主成分分析是由HOTELLING在 1933年首先提出的,是用“降维”的思想,于损失很少信息的前提下将多个指标转化成几个综合指标,叫做主成分。每个主成分都是原始变量的线性组合,而且各个主成分之间互不相关就使得主成分比原始变量更具有某些优越的性能。3.1.2主成分分析的基本思想主成分分析(PCA)就是把相关的变量通过线性变换转变成一组按照方差递减的另外一组变量。应该注意的是,这组变量的总指标方差固定不变,同时第一指标的方差最大,叫做第一主成分。第二指标次大,和第一主成分线性无关,是第二主成分。在实际问题中,为了提高分析的效率,降低问题的复杂度,通常先将原始的变量进行线性变换,把原来的M维变量转换成综合变量L1,L2,L3.Lm这M个变量的方差依次递减,并且相互独立,一般选择前N(NM)个变量来代替原始指标 王晓鹏,曹广超,魏岭等.基于多元统计的可持续发展动态评价模型研究与应用J.数理统计与管理,2011,30(1):98106.。3.1.3主成分数量的确定(1).累积贡献率:一般来讲,主成分的累积贡献率超过80%85%就比较满意了,可以根据这一点确定需要提取几个主成分。(2). 特征值:特征值在某些程度上可以看作表示主成分影响力大小的指标,如果特征值1作为纳入标准。(3). 综合判断:实际情况表明,如果利用累积贡献率确定主成分数往往较多,然而用特征值确定又往往较少,则很多时候应当把两者结合起来,来综合确定合适的数量。3.1.4主成分的性质性质1 主成分的协方差矩阵是对角阵1。性质2 主成分的总方差等于原始变量的总方差1。性质 3 主成分 Yk与原始变量Xi的相关系数为Yk,Xi=kiitki(3.1. 1),称Yk,Xi为主成分载荷量1。性质4 i=1pp2Yk,Xiii=k,k=(1,2,p)(3.1. 2)3.1.5主成分分析步骤1. 原始数据标准化处理。2. 求解相关系数矩阵。3. 计算特征值和单位特征向量。4. 求解主成分的方差贡献率与累积方差贡献率。5. 求解主成分。 3.2因子分析3.2.1因子分析的基本概念因子分析是一种利用显在变量测评潜在变量,用具体指标测评抽象因子的分析方法,最早是心理学家Chales Spearman于 1904年提出的,其基本思想是用实测的多个指标,用少数几个的潜在指标(因子)线性组合表示 冯学军,张翠娟,盛敏.基于多元统计分析的区域经济差异研究J.统计与管理,2013,(1):3537.。3.2.2因子分析的基本思想因子分析是依据变量的相关性的大小,进行分组,同组内的变量相关性高,不同组内的变量相关性低 孟莹,谢守祥,彭潇.江苏省区域经济差异的多元统计分析J.特区经济,2010,(4):5152.。每个组分别代表一个结构,称为公共因子。原始变量涉及两个方面的信息,即无法直接观测的公共因子的线性函数和与公共因子无关的特殊因子。因子分析可以处理样本和变量。研究变量之间的相关关系的为R型因子分析,研究样品之间的相关关系的为Q型因子分析。3.2.3因子分析的统计原理x1=a11F1+a12F2+a1mFmx2=a21F1+a22F2+a2mFmxp=ap1F1+ap2F2+apmFm(3.2. 1)其中x1,x2,xp是p个原始变量,是=0,= 1的标准化变量,F1,F2,Fm是m个因子变量,m小于p,表示为矩阵形式为:X=AF+a(3.2. 2)3.2.4因子载荷矩阵的求解方法因子载荷矩阵的求解方法主要有主成分法、最小二乘法、主轴因子法、极大似然法。不同方法的侧重点不同,分析的结果也可能不完全相同。3.2.5因子旋转由原始变量的相关矩阵的特征值和特征向量直接计算出的因子载荷矩阵的各主因子不能突出一定的变量 李强,蔡根女.企业竞争力测评的多元统计分析J.企业管理,2006,(6):146148.。为了进一步突出各因子代表的具体变量,有必要进行因子旋转。因子旋转后,变量在某一个特定的公因子上载荷较大,而在其他的公因子上的载荷较小,从而对公因子进行解释。有正交旋转与斜交旋转两种因子旋转方法。3.2.6因子分析步骤1. 将原始数据标准化2. 确定待分析的原始变量是否适合因子分析3. 构造因子变量4. 利用旋转使因子变量更具有可解释性5. 计算因子变量得分。计算因子得分和的模型为:Fj=j1X1+jpXp j=1,2,m(3.2. 3) 3.3聚类分析3.3.1聚类分析的基本思想聚类分析的基本思想是找出能够度量样本或指标之间的相似程度的一些统计量,把这些统计量作为划分类型的依据,将一些相似程度较大的样本或指标聚合成一类,将另外一些彼此之间的相似程度较大的样本又聚合成一类;根据分类对象的不同,聚类分析可以分为对样本的聚类与对变量的聚类两种 田少峰,赵国杰.天津市各区县经济发展水平的多元统计分析J.天津理工大学学报,2005,21(6):2931.。3.3.2聚类分析的注意事项聚类分析的目的是确定样本中数据的特点,因此应注意所选择变量是否已经能够反应所要聚类的样本的主要特点;在聚类分析时应注意所选择变量是否存在数量级上的区别。如果一个样本包含不同数量的变量,那么应先对变量进行标准化处理,然后再进行聚类;变量间的关系度量模型和样本间相类似,只不过是一个用矩阵的行进行计算,而另一个用矩阵的列来计算 何晓群.多元统计分析M.北京:中国人民大学出版社,2008,5795.。3.3.3聚类分析方法(1).二阶聚类二阶聚类(TwoStep Cluster)(也称为两步聚类)为一个探索性的分析工具,是为揭示自然的分类或分组而设计的,是数据集内部的而不是外观上的分类;是一种新型的分层聚类算法(Hierarchical Algorithms),当前主要应用到数据挖掘(Data Mining)与多元数据统计的交叉领域(模式分类)中 邓维斌.SPSS19(中文版)统计分析实用教程M.北京:电子工业出版社,2012,3345.。二阶聚类有如下特点:1 分类变量与连续变量均可以参与二阶聚类分析;2 这个过程可以自动确定分类数;3 还可以高效率地分析大数据集;4 用户还可以自己定制用于运算的内存容量。二阶聚类的分析步骤1 预测类2 正式聚类(2).K-均值聚类1. 基本概念K-均值聚类,也称快速聚类,是由用户指定类数的大样本资料的逐步聚类分析;它先对数据进行初始的分类,然后逐步调整,得到最终的分类数;分类变量与连续变量都可以参与两步聚类分析14 。2. 统计原理如果选择了n个数值型变量来参与聚类分析,最后要求聚类数为k。可以由系统首先选择k个观测量,也可以是用户指定,作为聚类的目标,n个变量组成了n维空间。每个观测量在n维空间中为一个点。k个事先选定的观测量是k个聚类中心,也称为初始类中心。依照距离这几个类中心的距离最小的原则将观测量分配到各类中心所在的类中去;形成第一次迭代的k类 朱建平.应用多元统计分析(第二版)M.北京:科学出版社,2015,5688.。根据组成每一类的观测量来计算每个变量的均值,每一类中的n个均值在n维空间当中又形成了k个点,这就是第二次迭代的类中心。依照这种方法迭代下去,直到达到指定的迭代次数或者达到中止迭代的判据要求时,迭代就中止了,聚类过程也结束了 李庆来.多元统计分析M.上海:上海交通大学出版社,2015,103108.。3 分析步骤1指定聚类数目k;2确定k个初始类中心;3依据距离最近原则来进行分类;4重新确定k个类中心;5进行迭代计算。(3).系统聚类1基本概念系统聚类是效果最好而且经常使用的方法之一,国内外均对它进行了深入的研究,它在聚类过程中是按一定的层次进行的。具体分成两种,分别是Q型聚类与R型聚类,Q型聚类是对样本(个案)进行分类,它将有共同特点的个案聚集在一起,来对不同类的样本进行分析;R型聚类则是对变量进行的聚类,使具有共同特征的变量聚在一起,以对不同类的变量进行分析14。 1 统计原理系统聚类是依据个案或变量之间的亲疏程度,把最相似的对象聚集在一起。依据系统聚类过程的不同,又可分为凝聚法与分解法两种。凝聚法的原理是把参与聚类的每个个案或变量视为一类,依据两类之间的距离或相似性,来逐步合并直到合并成一个大类为止;分解法的原理是把所有个案或变量均视为一类,然后依据距离与相似性逐层分解,一直到参与聚类的每个个案或变量均自成一类为止。衡量样本数据和小类、小类和小类之间的亲疏程度的度量方法主要有:最短距离法、类间平均链锁法、最长距离法、类内平均链锁法、重心法、中间距离法、离差平方和法14。3.4回归分析3.4.1确定性关系和非确定性关系变量与变量之间的关系是分为确定性关系与非确定性关系,函数表达确定性关系。研究变量之间的非确定性关系,构造变量间的经验公式的数理统计方法叫做回归分析。3.4.2回归分析基本概念回归分析指的是通过提供变量间的数学表达式用来定量描述变量之间相关关系的数学过程,这一个数学表达式通常称作经验公式 燕霞,梁满发.我国地区经济发展的多元统计分析J.地方经济,2010,(5):134135.。不仅可以用概率统计知识,对这个经验公式的有效性来进行判定,而且还可以用这个经验公式,依据自变量的取值来预测因变量的取值。如果是多个因素来作为自变量的时候,还可以利用因素分析,找出哪些个自变量对因变量的影响为显著的,哪些为不显著的。1. 线性回归分析的基本概念线性回归是假设因变量和自变量之间是线性关系,利用一定的线性回归模型进行拟合因变量与自变量的数据,并且通过确定模型参数来获取回归方程。根据自变量的数量,线性回归可以有不同的划分。当自变量只有一个时,叫做一元线性回归,当自变量有多个时,叫做多元线性回归。2. 线性回归分析的统计原理一元回归方程和多元回归方程如下:Ey=0+1x(3.4. 1)Ey=0+1x1+2x2+pxp(3.4. 2)一元线性与多元线性回归分析的核心任务是估计其中的参数。3.4.3曲线估计的基本概念曲线估计也叫做曲线拟合或曲线回归,是研究两变量间的非线性关系的一种方法,选定的一种用方程表达的曲线,来使得实际数据和理论数据间的差异尽可能的小。如果曲线选择得好,那么可以来揭示因变量和自变量的内在关系,并且对因变量的预测有一定的意义14。在曲线估计中,需要解决的两个问题:一是选用哪一种理论模型,也就是用哪种方程来拟合观测值;二则是当模型确定后,如何来选择合适的参数,以使得理论数据与实际数据的差异最小。3.4.5曲线估计的统计原理在曲线估计中,有很多数学模型,选用哪种形式的回归方程才能最好地表示出来一种曲线的关系往往不是个简单的问题,可以用数学方程来表示的各种曲线的数目基本是没有限量的。在可能的方程间,以吻合度而论,也许还存在着许多的吻合得同样好的曲线方程。因此,在对曲线的形式的选择上,对于采取什么形式需要有一定理论,这些理论是被问题本质所决定的。3.4.6分析步骤(1) 在还不能明确究竟哪一种模型更接近样本数据时,可以在上述多种可选择的模型中来选择几种模型;(2) SPSS会自动完成模型参数的估计,并且输出回归方程的显著性检验的F值与概率p值、决定系R2等统计量;(3) 以判定系数为主要依据来选择其中的最优模型,并且进行预测分析等。第四章 区域经济评价指标体系4.1评价指标体系的建立原则通过对天津市“十三五”经济发展面临的新常态分析,发现天津市各区县经济发展面临着功能定位清晰、各区县协调力度有待加强,生产要素具有相对优势,资源约束压力大,产业结构不断优化,但结构调整任务较重,科技创新持续活跃,创新驱动的潜力尚未完全释放;经济增长支撑强劲,但经济发展下行压力大等的新形势;面对新形势,天津市各区县要全面认识新常态,保持战略定力,切实增强转变经济发展方式的自觉性,努力推动天津市各区县实现更高水平、更高质量、可持续发展 张骥,高翔,周晶.因子分析法在天津市主要河流水质污染程度综合评价中的应用J.安全与环境工程,2013,20(1):6568.。 对地区经济进行评价,目的在于能客观的反映地区的综合经济实力,体现一个地区的整体经济发展水平1。指标体系的构建应该秉承以下原则:1. 全面性。指标体系应该全面反映天津市的每个区县的经济状况,涵盖社会经济生活的每个方面,切实深入人民生活,从幸福感等精神方面指标到国民生产总值等经济方面进行研究,充分体现各个区县的综合经济实力和经济发展规律。2. 前瞻性。指标不应仅限于过去和当下的发展,还应该选取一些有前瞻性的适度超前的参数,这有利于深入落实可持续发展战略,对于政策制定有十分重要的意义。3. 代表性。在选取指标满足全面性的同时,更应注重代表性。毕竟反映地区综合经济实力的指标非常繁多,它们代表的含义也就难免有所重复。因此,在相关性强的指标中,只选择影响力大的能充分反映信息的指标。4. 科学性。克服随意性,避免主观意愿的干扰,选择的指标应该适合进行定量计算,并容易获取。5. 正确性。数据最好来自国家权威的统计网站比如中国统计年鉴和公布的书籍和资料,以满足权威性。6. 特色性。设计的规划指标体系应该反映天津市作为直辖市和我国北方第一个自贸区的政策优势,同时体现天津市作为吞吐量世界第四的综合性港口的交通优势,并结合天津市本身的良好的自然生态环境等诸多特色 赵彦云,陈芳,张明倩.中国30省市汽车制造业产业竞争力评价分析报告J,管理世界,2004,(10):6878.。选取的指标应该进行标准化和无量纲化。4.2区域经济评价指标体系的建立依据区域经济指标体系的建立原则,根据2016年天津市统计年鉴和统计公报,从地区基本情况、人民生活情况、工农业发展情况、经济发展趋势和社会发展情况等方面选择了反映各区县综合经济实力1的18项指标,来构建评价指标体系。1. 基础设施:普通中学校数、小学校数、卫生机构数、卫生机构床位数2. 财政金融:中资金融机构本外币存款余额、中资金融机构本外币贷款余额3. 基本情况:常住人口、城镇非私营单位从业人员4. 人民生活:社会消费品零售总额5. 经济发展水平:区县生产总值、区级一般公共预算收入、区级一般公共预算支出6. 经济发展趋势:区县生产总值增速、规模以上工业企业资产总值、规模以上工业企业工业总产值7. 对外经济:实际直接利用外资、外贸进出口总额第五章 天津市各区县经济发展分析本文根据2016年天津市统计年鉴,从地区基本情况、工农业发展状况、人民生活情况、社会发展情况和经济发展趋势等方面选取了反映各区县综合经济实力1的18项指标,记作X1,X2,X3,.X18,利用SPSS软件对数据进行分析。5.1主成分分析5.1.1特征值级和方差贡献表从下表中可以看出前3个主成分已经解释了总方差的96.367%,故可以选择前3个主成分进行分析。(表5.1.1) 解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %112.94671.92571.92512.94671.92571.92523.23817.98989.9133.23817.98989.91331.1626.45496.3671.1626.45496.3674.2541.41097.7775.1841.02598.8026.117.64899.4507.048.26799.7178.020.11199.8289.016.08999.91810.006.03399.95111.005.02699.97712.002.01399.99013.001.00599.99514.001.00499.999159.449E-5.001100.000161.494E-168.298E-16100.000171.322E-167.342E-16100.00018-1.596E-16-8.864E-16100.000提取方法:主成份分析。 由上图可知,1=12.946,2=3.238,3=1.162,1=0.71925,2=0.17989, 3=0.064545.1.2主成分的碎石图(图5.1.1)该图从另一个侧面说明了取前3个主成分为宜。5.1.3旋转前的因子载荷矩阵(表5.1.2) 成份矩阵a成份123常住人口.954.018.074城镇非私营单位从业人员.918-.166-.107区县生产总值.990-.034-.127区县生产总值增速.414.821-.138区级一般公共收入预算.989-.067-.121区级一般公共预算支出.991-.013-.120资产总值.976-.004-.205工业总产值.971.070-.209全社会固定资产投资.972.124-.189社会消费品零售总额.892-.358.197外贸进出口总额.983-.052-.145实际直接利用外资.983-.043-.162中资金融机构本外币存款余额.697-.554.347中资金融机构本外币贷款余额.919-.334.084小学校数.393.840.349普通中学校数.742.581.268卫生机构数.526.694.468卫生机构床位数.452-.659.577提取方法 :主成份。a. 已提取了 3 个成份。将上表中的数据输入SPSS数据编辑窗口中,将三个变量分别命名为V1,V2,V3。用公式 Fi=ViSQRTI , (5.1. 1)i=1,2,3 计算特征向量F1,F2,F35.1.4主成分特征向量矩阵(主成分表达式的系数)表(5.1.3) 主成分特征向量矩阵5.1.5主成分得分和综合得分将得到的特征向量与标准化后的数据相乘,得到主成分函数的表达式Zi=F11*zX1+F12*zX2+F118*zX18,i=3(5.1. 2) (其中zX为标准化后的数据)综合主成分的计算表达式为Z=1*Z1+2*Z2+3*Z3(5.1. 3)(表5.1.4) 主成分得分及综合排名5.2因子分析5.2.1特征值和方差贡献表可以看出前3个特征值大于1,同时这3个公共因子的方差贡献率占了96.367%,说明提取这3个公共因子可以解释原变量的绝大部分信息。(表5.2.1) 特征值和方差贡献表解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %112.94671.92571.92512.94671.92571.92510.60758.92958.92923.23817.98989.9133.23817.98989.9133.83321.29580.22431.1626.45496.3671.1626.45496.3672.90616.14396.3674.2541.41097.7775.1841.02598.8026.117.64899.4507.048.26799.7178.020.11199.8289.016.08999.91810.006.03399.95111.005.02699.97712.002.01399.99013.001.00599.99514.001.00499.999159.449E-5.001100.000161.494E-168.298E-16100.000171.322E-167.342E-16100.00018-1.596E-16-8.864E-16100.000提取方法:主成份分析。5.2.2旋转前的因子载荷矩阵表的底部表明使用的是主成分分析法,3个主成分被抽取出来。(表5.2.2) 成分矩阵表成份矩阵a成份123区级一般公共预算支出X5.991-.013-.120区县生产总值X3.990-.034-.127区级一般公共收入预算X4.989-.067-.121实际直接利用外资X9.983-.043-.162外贸进出口总额X10.983-.052-.145资产总值X13.976-.004-.205全社会固定资产投资X6.972.124-.189工业总产值X14.971.070-.209常住人口X1.954.018.074中资金融机构本外币贷款余额X8.919-.334.084城镇非私营单位从业人员X2.918-.166-.107社会消费品零售总额X11.892-.358.197普通中学校数X16.742.581.268中资金融机构本外币存款余额X7.697-.554.347小学校数X15.393.840.349区县生产总值增速X12.414.821-.138卫生机构数X17.526.694.468卫生机构床位数X18.452-.659.577提取方法 :主成份。a. 已提取了 3 个成份。5.2.3旋转后的因子载荷矩阵(表5.2.3) 旋转成分矩阵旋转成份矩阵成份123资产总值X13.962.223.138实际直接利用外资X9.954.215.195工业总产值X14.951.279.092外贸进出口总额X10.948.216.213区级一般公共收入预算X4.944.217.243区县生产总值X3.944.241.219区级一般公共预算支出X5.939.262.212全社会固定资产投资X6.938.333.075城镇非私营单位从业人员X2.885.120.289中资金融机构本外币贷款余额X8.821.076.532常住人口X1.819.368.331社会消费品零售总额X11.751.103.623小学校数X15.108.980-.101卫生机构数X17.191.963.113普通中学校数X16.484.847.091区县生产总值增速X12.340.736-.454卫生机构床位数X18.225-.104.954中资金融机构本外币存款余额X7.533-.049.791提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 5 次迭代后收敛。上表是按照设定的“方差极大法”对因子载荷矩阵旋转的结果。因子1在X11,X15,X17,X16,X12,X18,X7以外的其他因子上均有较大载荷,反映的是个区的基本经济发展水平;因子2在X15,X16,X17上有较大载荷,反映的是基础设施情况;因子3在X7,X8,X11,X18上有较大载荷,反映的是财政金融与人民生活水平。5.2.4因子转换矩阵表(表5.2.4) 成分转换矩阵表成份转换矩阵成份1231.894.333.2992-.109.810-.5763-.434.483.760提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 上表表明因子提取的方法是主成分分析,旋转的方法是方差极大法。5.2.5因子得分和综合得分(表5.2.5) 因子得分及综合排名F=0.58929*F1+0.21295*F2+0.16143*F3(5.2. 1)综合得分出现负值,这只表明该区的综合水平处于平均水平之下 马娟,杨益民.主成分分析与因子分析之比较及实证分析J.市场研究,2007,30(34):3034.。5.3多变量协和系数Kendall协同系数检验在SPSS中,输入主成分分析的综合得分“Z”和因子分析的综合得分“F”,对其结果进行一致性检验,得到如下分析结果:(图5.3.1) 假设检验汇总从而拒绝原假设,认为两种方法的分析结果一致。然后对两种分析方法的综合得分进行算术平均,得到各区最后的综合得分和最终排名:(表5.3.1) 综合得分及最终排名5.4聚类分析对最终的综合得分进行系统聚类,得到如下结果:5.4.1凝聚顺序表(表5.4.1) 凝聚顺序表聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 21910.001002279.002013347.0190210425.0270085114.0360086812.044007738.0800698

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论