基于主成分分析的山东省农业发展的研究_第1页
基于主成分分析的山东省农业发展的研究_第2页
基于主成分分析的山东省农业发展的研究_第3页
基于主成分分析的山东省农业发展的研究_第4页
基于主成分分析的山东省农业发展的研究_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ABSTRACT基于主成分分析的山东省农业发展的研究摘要本论文有针对性的选取了九个农业常用指标,采用2019年山东省统计年鉴的数据,运用SPSS和Excel软件先对数据进行处理,然后对其进行主成分分析得出两个方差贡献率最高的指标,从而将九个指标降维转化成两个独立的,彼此不想关的指标。根据主成分分析的得分系数矩阵写出主成分关系式,并通过主成分分析关系式构建综合评价函数。得出山东省17个地级市农业经济发展的综合排名,并对其进行评价。将17个地级市划分为4个水平。然后结合各个地级市的实际情况提出相关的政策建议。关键词:主成分分析;降维转化;SPSS;农业发展;评价建议1引言古语有云,民以食为天,山东省作为一个农业大省,每年的粮食生产均名列国内前茅。但由于农业结构改变等各个因素,山东省的农业发展进入了瓶颈期。本文选取2019年(部分为2018年)相关数据,利用主成分分析的方法对其做简要分析,并给予一些建议,以期对山东省的农业发展提供一些帮助。2主成分分析法简介主成分分析是一种基础性的、常用的多元统计分析方法,它研究如何将多个变量转化为具有代表性和解释性的互不相关的几个综合变量。通过降维的思想把复杂问题简单化、高维问题低维化、抽象问题直观化。转化得到的几个综合指标即称为主成分,主成分不是指某个变量,而是这些变量的综合,所以不可观测。主成分分析过程中,根据方差的大小选取几个具有一定解释能力的主成分,各主成分的权重中也会在SPSS软件中自动生成,这很大程度上避免了人的主观性,也能够更加客观地反映现实问题。主成分分析的具体计算步骤如下:(1)依据数据表计算其相关系数矩阵;(2)计算特征值与特征向量;(3)计算出主成分贡献率以及累计贡献率,提取累计贡献率为85%~95%的特征值所对应的主成分;(4)计算各个主成分载荷和得分。3山东省各市农业经济水平分析3.1构建指标体系单个或少量指标并不能准确的衡量1个地区在一定时期内的发展水平。因此,需要构建1个多层次全方位的区域指标体系。根据指标选取的可比性、易操作性、全面性原则,并且根据山东省农业的实际情况,数据的可靠性和模型的需要等因素,本文选择了9个解释变量(表1),可以相对准确的对各市的农业经济水平作出综合评价。模型中所用的原始数据均来自于《2019年山东省统计年鉴》(本文中的农业除了农业总产量是指狭义的农业,其他均指的是广义农业)。表1山东省农业变量名称和表示的经济含义变量名称单位表示的经济含义X1农业机械总动力万千瓦农业生产条件X2化肥施用量万tX3农村用电量亿kWhX4耕地面积万hm^2X5农作物播种面积万hm^2X6粮食作物播种面积万hm^2X7粮食总产量万tX8农业总产值亿元农业生产情况X9农林牧渔总产值亿元3.2原始数据的相关性分析根据构建的指标体系,搜集9个指标的原始数据如表2所示。由于各个指标的量纲不同,在进行主成分分析之前,先对数据进行标准化处理,利用SPSS软件计算得到9个指标之间的相关系数矩阵,如表3所示。相关系数或相关系数的绝对值表明,其值越大,指标间相关性越强,则主成分对该变量的代表性也越大。若相关系数值较小则不宜作主成分分析。从表3可以看出,这9个指标之间存在一定程度上的农业经济信息交叉重叠。例如粮食总产量与耕地面积、农作物播种面积、粮食作物播种面积等存在非常显著的相关关系;与农业总产值、农林牧渔总产值、化肥施用量等存在较为显著的相关关系。表2山东省各市农业经济数据山东省各市农业机械总动力(万千瓦)化肥施用量(万t)农村用电量(亿kWh)耕地面积(万公顷)农作物播种面积(万公顷)粮食作物播种面积(万公顷)粮食总产量(万t)农业总产值(亿元)农、林、牧、渔总产值(亿元)济南市454.6219.9623.5935.3755.0644.43251.42318.55514.90青岛市737.8327.0537.7951.4368.3748.11310.10329.07737.00淄博市240.388.6939.8220.6925.3021.95139.24173.98269.14枣庄市300.3119.7931.1523.5539.8028.08172.00185.64298.89东营市249.7310.203.8522.9230.3025.57146.5598.12283.32烟台市767.3237.0630.2544.4545.0430.78183.27395.57957.30潍坊市1002.2047.0967.4479.01100.9569.78427.69500.94983.59济宁市923.3037.7916.8960.1598.9272.39470.48492.31926.27泰安市521.2418.3612.0836.4453.6136.65246.78313.10548.78威海市516.2410.1215.1419.3720.2712.3270.5290.18517.52日照市280.779.7410.0623.8221.9313.4785.11116.02316.16莱芜市88.483.887.607.247.923.9725.5272.91108.86临沂市764.1833.4931.9683.3899.6965.03409.23395.67689.28德州市1199.3432.7413.5864.24119.82107.23729.97308.95671.68聊城市984.3337.1816.0156.1798.4580.76520.84359.42586.10滨州市461.6519.9011.9446.3369.6260.83384.62199.80465.39菏泽市939.7506347.30947.110582.6919154.744119.145746.165328.044523.216注:数据来源于2019年山东省统计年鉴表3相关系数矩阵x1x2x3x4x5x6x7x8x9x110.8950.380.8610.8670.8510.8570.8010.808x20.89510.5970.9150.8810.8230.8050.8850.804x30.380.59710.5480.4240.3340.2990.5420.457x40.8610.9150.54810.9340.8720.8570.8180.715x50.8670.8810.4240.93410.9830.9750.7190.565x60.8510.8230.3340.8720.98310.9970.6410.492x70.8570.8050.2990.8570.9750.99710.6280.484x80.8010.8850.5420.8180.7190.6410.62810.89x90.8080.8040.4570.7150.5650.4920.4840.8913.3标准化数据的主成分分析3.3.1根据累计贡献原则提取主成分经过标准化处理的数据为表4表4标准化后的数据x1x2x3x4x5x6x7x8x9济南-0.48521-0.34321-0.053603423-0.385735-0.248782-0.151289107-0.283410.316564-0.14873青岛0.3789990.167310.7959983840.2895160.0751554-0.040182059-0.012960.3933730.723121淄博-1.13895-1.15470.917455544-1.002964-0.973076-0.830008248-0.80045-0.73898-1.11346枣庄-0.95608-0.355450.398719793-0.882714-0.620177-0.644930475-0.64946-0.65385-0.99667东营-1.11042-1.04597-1.234669597-0.909202-0.851387-0.720712728-0.76676-1.29285-1.05779烟台0.4689870.8880810.344871791-0.003962-0.492647-0.563411717-0.597520.8789071.587906潍坊1.1857161.6102912.569990891.44913190.86808290.6140814550.5290071.6482411.691107济宁0.9449550.940644-0.4544718810.65615310.8186770.6928829210.7262241.5852311.466098泰安-0.28192-0.45841-0.742259535-0.340747-0.284071-0.386183899-0.30480.276772-0.01573威海-0.29718-1.05173-0.559176329-1.058464-1.095496-1.120758485-1.11718-1.35083-0.13844日照-1.0157-1.0791-0.863118384-0.871361-1.055095-1.086037533-1.04993-1.16216-0.92888莱芜-1.60247-1.50105-1.010302922-1.568476-1.396068-1.372862792-1.32458-1.47692-1.74263临沂0.4594060.6310230.4471829941.63287090.83741720.4706688250.4439250.8796370.535797德州1.7872830.577019-0.6525128660.82811931.32733831.7447768211.9222030.2464720.466709聊城1.1311870.896721-0.5071232610.48881180.80723820.9455910710.9583310.6149660.130766滨州-0.46376-0.34753-0.7506358910.07508370.10557770.3438618680.330499-0.55046-0.34308菏泽0.9951541.6260531.3536546931.60393852.17731212.104514081.9968470.385881-0.11608由于本文指标数较多,因此特征值的选取为大于0.5的值较合适。利用SPSS软件运行得出的方差贡献率和累计方差贡献率如表5所示。根据表5可以看出,第1个成分值占总方差的77.277%,前2个成分值累计占了总方差的89.336%,这表明前2个成分值可以解释全部指标的89.336%,由于主成分的总解释以达到85%以上为宜,即基本上保留了原来指标的信息,故提取前2个主成分可以达到要求。所以,原有的9个指标可以降维转化为2个独立的、彼此不相关的指标。表5特征值和方差分析贡献组件初始特征值提取载荷平方和总计方差百分比(%)累积(%)总计方差百分比(%)累积(%)16.9577.22777.2276.9577.22777.22721.0912.10989.3361.0912.10989.33630.647.11696.45340.1431.58798.0450.0860.95598.99560.0570.63899.63370.0270.29799.9380.0050.05999.98890.0010.0121003.3.2计算主成分表达式由表6可以看出,第一主成分在所有指标上的载荷均较高,这表明第一主成分可以基本覆盖这9个指标的主要信息,所以可以将第一主成分称为农业经济综合发展水平因子。第二主成分中具有较高载荷的是农村用电量指标,因此,第二主成分可称为农村用电量因子,它可以基本涵盖农村用电量的信息。表6主成分载荷矩阵12x10.941-0.056x20.9670.126x30.5490.571x40.961-0.019x50.947-0.285x60.906-0.402x70.896-0.427x80.8770.34x90.7850.451表7主成分得分系数矩阵y1y2x10.356942-0.05364x20.3668040.120686x30.2082480.546919x40.364528-0.0182x50.359218-0.27298x60.343665-0.38505x70.339872-0.40899x80.3326650.325661x90.2977670.43198根据表7的主成分得分系数矩阵,可以列出2个主成分的线性表达式如下:其次,将2个主成分的方差贡献率各自除以2个主成分方差贡献率之和,计算得到各自权重,则山东省各市农业经济发展水平的综合评价函数如下:3.4各市的综合得分及评价表8山东省各市综合排名及得分情况山东各市Y1得分Y2得分综合得分排名潍坊3.8318692.0874533.5954241菏泽4.096084-1.291873.365782德州2.966286-1.936632.3017263济宁2.5698020.1646112.2437934临沂2.1494080.1928951.8842145聊城1.989434-0.958361.5898786烟台0.7550641.8386830.9019427青岛0.8229190.8706770.8293928济南-0.627510.243235-0.509499滨州-0.43881-1.05283-0.5220310泰安-0.79853-0.00571-0.6910711枣庄-1.889820.282293-1.5954112淄博-2.488860.632718-2.0657513威海-2.643120.290245-2.2455214日照-3.02803-0.17606-2.6414615东营-2.92775-2.15026-2.8223716莱芜-4.33843-0.4015-3.804817上述计算得出的排名可能有个别与现实情况不同,这是由主成分分析本身的缺陷所导致的。由表8可看出,山东省各市的农业经济综合实力参差不齐,区域差异较大,以全省的平均综合得分(0)为基准线,将17个市划分为以下4个水平。一、优秀:潍坊市,菏泽市,德州市,济宁市这四个市的得分均在2以上,属于农业发展优秀地区。尤其潍坊市高达3.59,第一主成分和第二主成分均达到2以上。而菏泽市地势平坦,适合发展农业。德州市地势平坦,离京津冀地区近,近年来德州市也始终把农业农村发展放在首位,通过政策引导和产业扶持,全市的农业名列全省前茅。济宁自古以来便是山东的农业大市,是重要的全国粮油,棉花产地。二、良好:临沂市,聊城市,烟台市,青岛市这四个市得分均在0以上,属于农业发展良好地区。临沂作为革命老区,近两年旅游业较发达,但农业发展也是蒸蒸日上。聊城市气候资源较为丰富,农业大多以种植业为主。烟台市位于山东半岛东部,自然资源丰富,素有“果品之乡”的美誉。烟台苹果,莱阳梨均在国内外享有较高声誉。青岛市虽然土地资源不多,但依靠其经济实力,现代农业迅速发展,且青岛市沿海渔业发达,形成了具有青岛特色的农业模式。三、一般:济南市,滨州市,泰安市,枣庄市这三个市得分在0~-2之间,属于农业发展一般地区。济南市是山东的省会,受自然条件的影响,传统农业发展比较缓慢,但是近两年也正在努力转型。滨州市地处山东省北部,黄河下游,自然条件良好,主要以种植业和设施畜牧业两大类,但是碍于经济实力较弱,所以机械化较差,从而导致农业整体发展一般。泰安市地处山东中部,以泰山而闻名,旅游业发达,然农业发展较为一般。枣庄市随着人口的增加,非农业产业迅速发展,非农业用地增加,导致农业农业用地减少,农业发展一般。四、较差:淄博市,威海市,日照市,东营市,莱芜市这五个市得分均在-2以下,属于农业发展较差地区。淄博市近两年农业资源短缺加剧,环境条件进一步恶化,优势农产品不突出,竞争力不强,导致农业发展较差。威海市由于地理条件不适合发展传统种植业,所以农业发展也较差。日照市,东营市由于本身面积较小,所以农业用地自然也小,所以农业发展都不太乐观。(莱芜市已并入济南,不再分析评价)4江苏省各市农业经济水平分析众所周知,江苏省经济发达,农业发展位居全国前列,因此采用主成分分析法对江苏省各市农业进行简要分析,以此来与山东省对比,从而借鉴江苏省农业发展的经验。使山东省农业发展更上一层楼。4.1构建指标体系同样根据指标选取的可比性、易操作性、全面性原则,并且考虑了江苏省省农业的实际情况,数据的可得性和模型的需要等因素,选择了8个解释变量(表9),可以准确对江苏省各市的农业经济水平作出综合评价。模型中所用的原始数据均来自于《2019年江苏省统计年鉴》(本文中的农业除了农业总产量是指狭义的农业,其他均指的是广义农业)。表9江苏省农业变量名称和表示的经济含义变量名称单位表示的经济含义X1农业机械总动力万千瓦农业生产条件X2化肥施用量万tX3农村用电量亿kWhX4农作物播种面积万hm^2X5粮食作物播种面积万hm^2X6粮食总产量万tX7农业总产值亿元农业生产情况X8农林牧渔总产值亿元4.2原始数据的相关性分析根据构建的指标体系,搜集8个指标的原始数据如表10所示。在进行主成分分析之前,先对数据进行标准化处理,利用SPSS软件计算得到8个指标之间的相关系数矩阵,如表所示。相关系数或相关系数的绝对值表明,其值越大,指标间相关性越强,则主成分对该变量的代表性也越大。若相关系数值较小则不宜作主成分分析。表10江苏省各市农业经济数据江苏省各市农村机械总动力(万千瓦)化肥施用量(万t)农村用电量(亿kwh)农作物播种面积(千公顷)粮食作物播种面积(千公顷)粮食总产量(万t)农业总产值(亿元)农林牧渔业总产值(亿元)南京市231.626.7132.08270.05151.38106.92277.28489.47无锡市96.334.89422.58145.3784.3456.8138.87226.19徐州市736.8556.5969.961178.48765.66484.48760.861211.96常州市143.715.54169.43181.19109.5178.15162.49293.8苏州市148.076.44599.54217.79124.4787.92177.64410.09南通市413.9321.16185.65784.63535.36336.9324.55761.23连云港市616.0232.6433.01623.95505.77364.03304.65636.65淮安市634.9234.4317.35804.08681.06482.26413.7662.58盐城市703.7948.9183.131365.78983.15704.31519.461183.89扬州市278.3118.4860.99476.54396.09287.36243.36514.02镇江市149.54.9475.92200.93153.3107.3135.64245.94泰州市284.0215.3134.58530.22385.99287.11269.9484.36宿迁市605.1836.448.92741.48598.76401.02334.65559.37相关系数矩阵如下表11表11相关系数矩阵x1x2x3x4x5x6x7x8x110.969-0.5520.9170.9410.9270.8570.855x20.9691-0.4740.9480.9460.9260.920.909x3-0.552-0.4741-0.444-0.502-0.51-0.417-0.363x40.9170.948-0.44410.9840.9690.8950.958x50.9410.946-0.5020.98410.9950.840.903x60.9270.926-0.510.9690.99510.8020.878x70.8570.92-0.4170.8950.840.80210.941x80.8550.909-0.3630.9580.9030.8780.94114.3标准化数据的主成分分析标准化后的数据如表12表12标准化后的数据江苏省各市农村机械总动力(万千瓦)化肥施用量(万t)农村用电量(亿kwh)农作物播种面积(千公顷)粮食作物播种面积(千公顷)粮食总产量(万t)农业总产值(亿元)农林牧渔业总产值(亿元)南京市-0.652195-0.88923044-0.67525-0.79034-0.93504-0.92736-0.20226-0.3236无锡市-1.216918-0.9917606161.585764-1.1098-1.16742-1.17969-0.99615-1.16494徐州市1.45672081.920772418-0.455931.5373241.1941650.9734752.5714521.985182常州市-1.019146-0.9551426960.12001-1.01802-1.08017-1.0722-0.86067-0.94888苏州市-1.000946-0.904440962.610373-0.92424-1.02832-1.02301-0.77377-0.57727南通市0.1087981-0.0751859070.2139250.5281660.3959030.230480.0688740.544834连云港市0.95235590.571542898-0.669870.1164580.2933380.367067-0.045270.146727淮安市1.03124770.672383017-0.760540.5780030.9009260.9622980.5802180.229588盐城市1.31872271.488117607-0.379672.017241.9480262.0802131.1868351.895482扬州市-0.457303-0.226164409-0.50786-0.26125-0.08683-0.01893-0.39681-0.24515镇江市-0.994977-0.988943853-0.42142-0.96744-0.92839-0.92545-1.01467-1.10182泰州市-0.433468-0.405310541-0.08177-0.12371-0.12184-0.02019-0.24459-0.33993宿迁市0.90710790.783363482-0.577750.4176040.6156590.5532940.126805-0.100234.3.1根据累计贡献原则提取主成分由于选取江苏省农业发展的指标数为8个,因此特征值的选取为大于0.5的值较合适。利用SPSS软件运行得出的方差贡献率和累计方差贡献率如表所示。表13特征值和方差分析贡献组件初始特征值提取载荷平方和总计方差百分比(%)累积(%)总计方差百分比(%)累积(%)16.77584.69184.6916.77584.69184.69120.7759.68794.37830.2643.30197.67940.1361.69799.37650.0290.3699.73660.0130.16899.90470.0070.08499.98880.0010.012100由表13可看出,第1个成分值占总方差的84.691%.即基本上保留了原来指标的信息,故提取第1个主成分可以达到要求。所以,原有的8个指标可以降维转化为1个指标。4.3.2计算主成分的表达式由表14可以看出,第一主成分在所有指标上的载荷除了农村用电量均较高,这表明第一主成分可以基本覆盖这8个指标的主要信息,因此可将第一主成分称为农业经济综合发展水平因子。表14载荷矩阵1x10.963x20.978x3-0.544x40.983x50.98x60.965x70.921x80.944表15得分系数矩阵1x10.369974x20.375737x3-0.209x40.377658x50.376506x60.370743x70.353838x80.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论