多元统计论文_第1页
多元统计论文_第2页
多元统计论文_第3页
多元统计论文_第4页
多元统计论文_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于因子分析的我国各地区的经济差异性研究摘要:本文利用多元统计分析的方法,对2023年全国31个省、市、自治区经济开展的根本状况进行因子分析和主成分分析,并结合聚类分析的方法。选取15项经济指标,提取出3个综合因子,并给出综合排名。然后从综合得分的角度对各地区的经济实力进行聚类并作综合的评价,根据分析的结果探究造成差异的原因,同时具有针对性地提出相关建议,为我国经济的稳步开展提供参考。关键词:因子分析;聚类分析;主成分分析1引言随着社会的不断进步,经济开展的车轮将会继续滚动。近年来我国经济得到了快速开展,但开展中还是碰到了许多问题,各省市的经济水平还存在很大差异。而衡量一个省(自治区或直辖市)经济开展的根本状况,应该从多方面比方从该省(自治区或直辖市)的财政收入、财政支出、地区生产总值、居民消费水平、人民币储蓄存款等指标去考察。而由于这些指标都是对经济开展根本状况的反映,它们自身之间就存在着较强的相关性,这样在用这些指标反映经济开展状况时就造成了信息的大量重叠,这种信息的大量重叠有时甚至会抹杀经济开展状况的内在规律,所以如果能找到一组较少的但却包含着较多信息量的变量来研究这个问题,就更容易使人抓住主要矛盾,同时使问题得到简化。因子分析正是解决这样问题的有效方法。本文就是运用因子分析方法,对取影响经济开展的15项指标进行降维处理并赋予各主成分以实际意义以获取综合性指标;进而,基于因子分析结果通过聚类分析法把我国的31个地区分类。2数据及指标选择本文选自《2023年中国统计年鉴》的数据。影响经济增长的因素都是影响经济开展的因素,但由于经济开展的内涵要比经济增长的内涵宽得多,因而影响经济开展的因素也就要比影响经济增长的因素多而复杂。其中,自然因素、人口数量、科学技术、文化教育等四大因素对一国经济开展具有重要影响。本文在四大因素根底上,从众多衡量经济水平的指标中我们将采用以下指标:表1指标说明指标代号指标名称单位X1财政收入亿元X2财政支出亿元X3地区生产总值亿元X4居民消费水平元X5人民币储蓄存款亿元X6房地产完成投资亿元X7商品房销售面积万平方米X8各地区企业资产总计亿元X9建成区绿化覆盖面积万公顷X10环境污染治理投资万元X11邮政业务总量亿元X12普通高等学校在校学生数万人X13医疗机构数个X14城市液化石油气供应量万吨X15供水量亿吨3方法选择本文采用因子分析法,主要原因是它能消除主观因素的影响,排除各指标之间的相关性对后期评价造成的干扰。因子分析是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系探求观测数据中的根本结构,并用少数几个抽象的变量来表示其根本的数据结构。这几个抽象的变量被称作公因子能反映原来众多变量的主要信息从而到达降维和简化的效果。因子分析是一种用较少的综合变量来表达多个观测变量的多元统计分析方法。它的根本思想是:由相关性大小把变量分组,同组内的变量之间有较高的相关性,不同组的变量相关性较低。它的根本目的是用少数几个综合变量(也称“综合因子〞)去刻画较多变量之间的协方差关系,而各个综合变量之间是不相关的。这样,在保证数据信息丧失最少的原那么下,对高维变量空间做了降维处理,因子分析的结果经常用于综合判定。它的数学模型可表示如下:聚类分析是根据事物本身的特性研究个体的一种方法,目的在于将相似的事物归类。它的原那么是同一类中的个体有较大的相似性。系统聚类的根本思想是:先将待聚类的n个样品〔或者变量〕各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离〔或者相似系数〕,将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离〔或相似系数〕,再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品〔或者变量〕都归为一类为止。4结果分析4.1因子分析首先,运用KMO和Bartlett球形检验法对因子分析的适当性进行考察和检验,结果显示表2,KMO=0.784>0.5,Sig<0.001,说明本次研究的数据适合进行因子分析。表2KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..784Bartlett'sTestofSphericityApprox.Chi-Square841.284df105Sig..000然后,使用主成分分析进行最大方差法旋转,共获得3个特征值大于0.9的因素,其特征值分布的碎石土如图1所示。由碎石图可知提取3个公因子比拟适宜。各项指标在各公因子上的载荷见表3。第一个公因子f1在医疗机构数、环境污染治理投资、普通高等学校在校学生数、商品房销售面积、地区生产总值、财政支出、各地区企业资产总计、房地产完成投资上有较大正载荷,该因子可以称为“地区实力成就因子〞。第二个公因子f2在城市液化石油气供应量、建成区绿化覆盖面积、供水量、邮政业务总量、人民币储蓄存款上有较大正载荷,该因子可以称为“城市规模和资本充足因子〞。第三个公因子f3在居民消费水平和财政收入上有较大正载荷,该因子可以称为“经济开展水平因子〞。表3RotatedComponentMatrixaComponent123X1.451.559.683X2.672.576.386X3.668.554.472X4-.093.082.937X5.539.592.563X6.622.421.544X7.760.492.242X8.629.468.568X9.354.782.474X10.829.026.121X11.386.746.485X12.809.456.188X13.856.198-.200X14.053.841.382X15.316.747-.189以上3个因子旋转前后的特征根及解释的总方差见下表。有表4知,3个公共因子共解释了原始变量总方差的88.574%,而被放弃的其他12个因子解释的方差仅占不到12%,可见3个公因子能很好的代表经济水平的所有工程。表4TotalVarianceExplainedExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%10.51470.09370.0935.21434.7634.761.83712.24682.3394.62930.86165.6210.9356.23588.5743.44322.95488.574由于不同因子的协方差为0,所以三个因子变量之间是不相关的〔如表5所示)。表5ComponentScoreCovarianceMatrixComponent12311.000.000.0002.0001.000.0003.000.0001.000最后根据因子得分系数矩阵〔见表6〕可以计算每个公因子的得分。例如:(1)(2)〔3〕根据各公因子的解释能力得到最终竞争力F的计算公式(4)表6ComponentScoreCoefficientMatrixComponentf1f2f3X1-.006.002.201X2.093.044.011X3.095.001.071X4-.096-.235.533X5.024.037.116X6.116-.099.161X7.162.008-.048X8.103-.078.158X9-.114.256.004X10.346-.290.037X11-.089.218.022X12.197-.014-.069X13.312-.072-.214X14-.260.425-.062X15-.098.472-.378各个城市在三个公共因子上的得分和综合得分及排名汇总为表7。表7得分表地区f1f2f3综合得分排名北京-0.96766-0.606452.319010.0113天津-0.81894-1.117811.27278-0.3824河北1.57108-0.45641-0.486850.338山西0.57749-1.05066-0.12187-0.1716内蒙古0.27351-0.876320.07773-0.1817辽宁0.63672-0.271230.889310.396吉林-0.66892-0.13592-0.3046-0.3925黑龙江-0.508320.63196-0.88989-0.2118上海-1.24741-0.330612.562850.0612江苏1.401981.339591.166941.322浙江0.57032-0.146771.530650.574安徽0.305830.38893-0.524920.1210福建0.13315-0.264670.13921014江西-0.219860.32171-0.92859-0.2118山东2.71397-0.468970.6981.083河南1.65428-0.11804-0.569040.465湖北0.39010.33477-0.437850.169湖南0.63510.36002-0.992550.1210广东-0.429954.373971.26731.681广西-0.418770.55868-0.98259-0.2220海南-1.24206-0.42678-0.30541-0.7229重庆-0.40855-0.381080.12241-0.2622四川1.164980.2578-0.621490.396贵州-0.28211-0.37221-0.57172-0.3925云南-0.20396-0.16974-0.38579-0.2421西藏-1.33659-0.31423-0.8413-0.8531陕西0.58571-0.84697-0.11484-0.115甘肃-0.5251-0.29764-0.77721-0.5127青海-1.30626-0.54866-0.31959-0.7930宁夏-1.11781-0.59801-0.25191-0.7128新疆-0.911931.23175-1.61819-0.3523由结果可以看出在地区实力成就因子f1上得分最高的城市依次为山东、河南、河北、江苏、四川等城市,这些城市在医疗、环境,在校人口等水平上大于其他城市。在城市规模和资本充足因子上得分最高的城市依次为广东、江苏等,这些城市工业兴旺,而陕西、内蒙古、天津等地区在城市规模和资本充足因子上有待提高。在经济开展水平因子上得分最高的城市依次为上海、北京、天津、广东等。经济综合实力的排名可知,广东、江苏、浙江、山东、天津东部沿海省份的经济总量最高,说明经济开展水平较好;黑龙江、吉林东北老工业基地和大局部中原地区的经济总量居中,说明经济开展水平居中;江西、甘肃、贵州、西藏、新疆等西部地区经济总量最少,经济开展较落后。从这里可以看出我国东西部经济综合实力还存在着较大的差异,因此在保持东部沿海地区经济稳定开展的根底上加大对西部地区的开发,可使我国的经济总量稳定持续增加,因此从这个角度上讲实施“西部大开发〞战略是非常必要的,而且从这里就可见其局部成效,因为河南、四川经济综合实力排名和大局部中原、西部地区相比靠前,很大程度上也是西部大开发给其带来的结果。东北老工业基地在过去的历史时期曾为我国的经济开展做出了巨大奉献,但从这个排名中可以看出现在的开展不及东部沿海地区,因此近两年提出的“振兴东北老工业基地〞的政策也是非常符合实际情况的。对于湖北而言,其综合排名第九,而经济开展水平上排名相对落后,其应将提高居民消费水平和提升财政收入作为下一阶段的奋斗目标。4.2聚类分析全国各地区经济开展指标分类分布特征:以基于因子分析法得到三个公共因子上的得分对31个地区进行分类,第一类〔经济最兴旺〕、第二类〔经济较兴旺〕、第三类〔经济欠兴旺〕,结果如系统聚类分析的冰柱图和表8所示,由此可以看出我国经济开展在地域上呈现东强西弱、沿海优于内陆的渐变特征;其次层次感比拟强、包含极端现象〔如:北京、上海〕。图2冰柱图表8类别第一类北京、天津、吉林、上海、浙江、广东、海南、重庆、西藏、青海、宁夏第二类河北、黑龙江、江苏、安徽、江西、河南、湖北、湖南、广西、四川、贵州、云南、甘肃、新疆第三类山西、内蒙古、辽宁、福建、山东、陕西5总结全国各地区经济开展水平差异性分析:根据以上三类分析得知,“地区实力成就因子〞指标在衡量地区经济开展水平中处于首要决定条件,其次“城市规模和资本充足因子〞和“经济开展水平因子〞指标也在其中扮演着重要角色。对各层次地区进行交互性比拟分析可以发现:兴旺地区相较于较兴旺地区在消费水平和财政收入这两项经济指标上的优势很明显;而较兴旺地区与欠兴旺地区无论在城市规模和资本充足因子和地区实力成就因子都存在着较大差距。对此提出以下两点建议:①通过上述分析,地区经济开展的地区实力成就因子是造成各地区差距的主要原因,所以把这个要素放在开展首位是最有效的推动力,它也是有力提升地区竞争力的重要保障。所以要大力开展地区经济建设的实力水平。相应的可以采取提高医疗条件,加大教育投

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论