基于全国主要城市平均气温的统计分析.doc_第1页
基于全国主要城市平均气温的统计分析.doc_第2页
基于全国主要城市平均气温的统计分析.doc_第3页
基于全国主要城市平均气温的统计分析.doc_第4页
基于全国主要城市平均气温的统计分析.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于全国主要城市平均气温的统计分析摘要 本文主要采用2012年全国主要城市平均气温的统计数据,首先通过相关分析对全国主要城市的平均气温进行简单的相关分析,然后在控制平均气温的基础上对个月平均气温进行偏相关分析;其次运用聚类分析对各相似省份进行聚类分析;最后运用因子分析对各城市进行因子分析,计算出每个城市的综合得分,通过综合得分计算出每个城市平均气温的排名。关键词:相关分析;聚类分析;因子分析1、 研究背景及目的全球气温变暖为世人所瞩目,近几十年来的全球气候变暖是一个国内外都非常关注的重大问题。自从全球气温变暖的议题出现以来,关于气温的不正常变化仁者见仁,智者见智。气温的变化对农作物,人们的生活及经济的运行都有重要的影响。全世界的气温研究工作者都研究出了许多关于气温的结论,但都有一个共性即全球气温变暖。然而我国跨北纬4度到北纬53度,从东经73度到东经135度,具有比较丰富的气候和比较多变的气温,因此对我国气温的研究具有很重要的意义。在此大背景下,对我国气温的研究不仅能说明我国气温的分布和变化,同时对世界气温的研究同样具有重要作用。本文的研究目的如下:通过对我国主要城镇平均气温的研究和分析,一方面可以得出我国各市平均气温与全国平均气温差异;另一方面也可以给我们以后的就业进行指导,在适宜的季节去适宜的城市工作。2、研究方法 气温的变化不仅能促进经济的发展,同时也能阻碍经济的发展。据此我们通过全国各主要城市每个月份的平均气温对我国气温的分布情况进行分析。 本研究采用的数据是中国2012年主要城市平均气温的数据指标,数据摘自中国统计年鉴20137-7. 采用的分析方法主要有相关分析,聚类分析,因子分析等。基本思路是:首先利用线图分析各个月份平均气温的分布,然后利用条形图分析全国主要城市平均气温的对比,得出平均气温最高和最低的城市;然后利用因子分析对各个月份的平均气温进行相关分析;其次利用聚类分析对各个城市在不同气温下的类别;再次利用因子分析对构成平均气温的各各月平均气温提取公因子;最后使用一些简单的SPSS数据处理技巧依据提出的公因子对各城市进行分类及排序。3、实证分析由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS数据,我们共设置了14个变量,分别是“城市”、“1月”、“2月”、“3月”、“4月”、“5月”、“6月”、“7月”、“8月”、“9月”、“10月”、“11月”、“12月”和“年平均气温”。 样本是中国2012年全国重要城市平均气温的主要数据。数据参见附表1。3.1、画基本图形图1通过图1可以看出全国平均的月份气温最低在0度左右,最高在25度左右,说明全国平均月份气温比较温和。图2条形图反映的是各个城市的年平均气温的情况,最高的为海口,最低的为哈尔滨,比较符合现实的气温分布。3.2、相关分析对于相关分析主要有以下几部分;第一、 对每个季度的平均气温进行简单相关分析;第二、 在控制年平均气温的情况下,再分别对各季度的平均气温进行偏相关分析。3.2.1各季度平均气温的相关分析图3相关性1月2月3月1月Pearson 相关性1.989*.981*显著性(双侧).000.000N3131312月Pearson 相关性.989*1.984*显著性(双侧).000.000N3131313月Pearson 相关性.981*.984*1显著性(双侧).000.000N313131*. 在 .01 水平(双侧)上显著相关。图3显示的是1月、2月和3月的平均气温的相关性,可以看出这三个月的相关性比较明显。通过这三个月的相关分析我们容易得到其他三个季度的气温也具有比较强的相关性。3.2.2各个季度平均气温的偏相关分析图4相关性控制变量1月2月3月年平均1月相关性1.000.913.724显著性(双侧).000.000df028282月相关性.9131.000.859显著性(双侧).000.000df280283月相关性.724.8591.000显著性(双侧).000.000.df28280在控制年平均气温的情况下第一季度个月平均气温的相关性有所下降,但是没有改变它们的相关性。说明各个季度各个月份的平均气温都具有非常强的相关性。图5图5表示的是各个月份平均气温的相关图,可以看出每个月份之间的相关性都非常好。3.3聚类分析图6图7图8聚类成员案例号城 市聚类距离1北京 34.6862天津 34.2153石家庄 36.4704太原 35.9965呼和浩特 14.7726沈阳 15.2917长春 17.2958哈尔滨 110.3969上海 23.93310南京 24.35411杭州 23.89612合肥 24.86913福州 48.10614南昌 25.97715济南 37.86016郑州 28.48717武汉 24.32818长沙(望城) 24.95319广州 41.88520南宁 43.34621海口 410.97322重庆(沙坪坝)27.87023成都(温江) 25.00524贵阳 211.22325昆明 216.41926拉萨 317.50427西安(泾河) 37.07928兰州(皋兰) 18.33829西宁 113.20830银川 39.75631乌鲁木齐 17.466通过聚类分析,由图6到图8我们可以清晰的看出,在图6和图8中对各个城市的划分比较统一,而在图7中我们显然发现对于气温我们可以分成4类,分别是5、6、7、8、9月为第一类,4、10月为第二类,3、11月第三类,1、2、12月为第四类,很显然是根据气温的从高到低进行分类的,第一类温度最高,第二类次之,第三类温度稍低,第四类温度最低。3.4因子分析在上面的研究中,我们分别对温度和城市进行了分类,并且对气温进行了相关分析,得出了气温的分布情况,并且研究了气温对城市的影响,但是由于各种变量的多重共线性问题,不太利于具体问题意义解释,因此我们可以利用因子分析对各个月份的平均气温变量提取公因子,对数据进行降维处理。首先利用主菜单分析中的降维工具条进行因子分析。在对话框中,依次将“1月”、“2月”、“3月”、“4月”、“5月”、“6月”、“7月”、“8月”、“9月”、“10月”、“11月”和“12月” 添加到“变量”列表中。接着在相应的按钮中选中输出相关系数矩阵和KMO和Bartlett的球形度检验的复选框,并且设置特征根大于1为提取公因子的要求,利用最大方差法进行因子旋转,最后保存因子得分变量,并显示因子得分系数矩阵,输出结果参见图9至图15(1)KMO 和 Bartlett 的检验,如图9所示,KMO的取值为0.811,表明变量间有较强的相关性,数据很适合做因子分析。Bartlett检验的Sig.值为0.000,说明数据来自正态总体,适合进一步分析。图9KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.811Bartlett 的球形度检验近似卡方1009.087df66Sig.000(2)变量共同度,指的是按照所选标准提取相应数量主成分后,各变量中信息分别被提取的比例。如图10所示,所有变量共同度都在90%以上,所以提取这几个公因子对各变量的解释力非常好。图10公因子方差初始提取1月1.000.9842月1.000.9873月1.000.9904月1.000.9525月1.000.8906月1.000.9257月1.000.9628月1.000.9249月1.000.95210月1.000.98411月1.000.98712月1.000.986提取方法:主成份分析。(3)解释的总方差,由图11中可以看出,“初始特征值”一栏显示只有前两个特征值大于1,所以只选取了前两个公因子;“提取平方和载入”一栏显示第一公因子的方差贡献率是82.367%,前两个公因子的方差总和占所有主成分方差的96.014%,可见选取前两个因子已足够替代原来的变量。图11解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %19.88482.36782.3679.88482.36782.3676.45853.81353.81321.63813.64696.0141.63813.64696.0145.06442.20196.0143.2602.16698.1804.074.61898.7985.065.54599.3436.032.26699.6107.025.20899.8188.008.07099.8889.007.05699.94410.005.04099.98411.001.01099.99412.001.006100.000提取方法:主成份分析。(4)碎石图,是按照特征根大小排列的主成分散点图。如图12所示,我们可以看到有;两个成分的特征值超过1。图12(5)成分矩阵,如表13可见,所有的因子都聚集在第一主成分中,因此有必要进行因子旋转。我们利用最大方差法进行因子旋转得到的旋转成分矩阵如图13所示。图13成份矩阵a成份1210月.992-.0324月.975-.00211月.958-.2629月.951.2163月.931-.3501月.927-.3525月.916.22712月.906-.4072月.895-.4328月.838.4716月.821.5007月.750.632提取方法 :主成份。a. 已提取了 2 个成份。图14旋转成份矩阵a成份122月.962.24612月.955.2733月.937.3331月.936.32911月.902.41710月.779.6154月.747.6277月.166.9666月.305.9128月.337.9009月.588.7785月.554.763提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 3 次迭代后收敛。这样每个因子都很明确了,第一主成分包括1、2、3、4、10、11、12月,可以命名为较冷气温;第二主成分包括5、6、7、8、9月,可以命名为叫人气温。(6)成分得分矩阵图15成份得分系数矩阵成份121月.210-.1042月.239-.1433月.210-.1034月.076.0635月-.018.1656月-.133.2877月-.191.3448月-.121.2759月-.011.16310月.089.05011月.177-.06012月.230-.131提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。通过图15可以得出,F1=0.21*1月+0.239*2月+0.21*3月+0.076*4月-0.018*5月-0.133*6月-0.191*7月-0.121*8月-0.011*9月+0.089*10月+0.177*11月+0.23*12月,F2也可以如此得出。通过图16可见,各因子之间是正交的,即相互之间彼此独立。图16成份得分协方差矩阵成份1211.000.0002.0001.000提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 3.5因子分析后续分析当我们获得两个因子的得分之后,就可以利用因子分析进行分类和排序,我们可以利用计算变量和排序来进行各城市的平均气温得分计算和排序,具体操作步骤如下:【1】 打开数据文件,依次单击“转换”“计算变量”命令,弹出如图4所示的对话框。图17在“目标变量”一栏中输入“综合得分”,这一变量将最终代表各个城市的综合排名。综合得分= FAC1_1 * 53.813 + FAC2_1*42.201,单击“确定”,返回数据文件可以看到“综合得分”这一变量。【2】在数据文件中,在“综合得分”单元格上单击右键,在弹出的菜单中选择“降序”排列,对数据进行整理,得到综合排名,参见图18。图18观察“综合得分”一列,可以看出,海口、广州和南宁平均气温最高,因为该类城市所处纬度比较低,因此该类地区气温比较高;然而长春、哈尔滨和西宁的得分比较低,说明该类城市的平均气温比较低,因为长春和哈尔滨所处维度比较高,温度较为寒冷,西宁位于青海省,地势较高,容易受高寒气候影响,因此也较为寒冷。3.6结论研究 通过以上的研究分析,我们可以从一种宏观的视野下对我国的城市的平均气温有一个比较全面的了解,这对于我们以后对工作和生活的城市有重要的借鉴和指导意义。同时,对于我们个人来说也是工作地选择的重要参考。比如,因子分析表明,排序靠前的南方沿海城市,平均气温比较高,适合冬季到南方生活和工作。4、结论本文利用了多种统计学的方法对各地区的平均气温进行了统计分析,加入了偏相关分析,这样有利于控制其他变量的影响。同时有借住聚类分析对各个城市在不同气温下的分类;又利用因子分析对各月平均气温进行降维处理,并且利用各因子得分可以计算综合成绩,进而对各地区进行综合排名,但是,由于缺少季度数据,在分析过程中用月度数据代替了季度数据,这点事本文的不足,有望在以后的数据分析中搜集更全面的数据,并且可以利用回归分析和多重对应分析对各地区的平均气温进行更多信息的提取。参考文献1 赵辉,基于城市综合经济实力评价指标的统计分析J.spss论文2 谢龙汉,尚涛.SPSS统计分析与数据挖掘M.电子工业出版社,2012.1.附表本文数据选自2013年中国统计年鉴7-7城 市1月2月3月4月5月6月7月8月9月10月11月12月年平均北京 -3.6-1.35.916.222.825.027.426.021.114.64.3-4.212.9天津 -3.8-2.25.215.622.624.727.225.220.714.64.5-3.912.5石家庄 -2.20.57.617.923.826.628.025.820.815.65.3-2.214.0太原-5.4-2.24.814.720.922.824.522.716.710.92.1-4.710.7呼和浩特-10.8-7.70.711.518.420.623.721.614.37.2-3.7-10.07.2沈阳-14.0-8.8-0.410.518.621.624.823.017.79.4-0.4-12.97.4长春-16.1-11.9-3.58.717.220.423.522.117.07.0-4.9-16.75.2哈尔滨-18.3-12.4-3.37.816.421.323.921.816.46.4-5.2-19.44.6上海4.74.49.517.521.324.329.729.023.719.812.26.316.9南京2.93.09.017.921.925.529.428.122.318.310.03.516.0杭州4.34.3#19.021.825.130.828.723.419.712.16.017.1合肥3.13.59.618.822.726.730.628.222.718.610.03.416.5福州10.010.6#20.023.026.529.928.825.822.417.712.820.2南昌5.05.5#19.523.426.531.029.624.520.912.56.618.0济南-1.10.97.117.623.827.028.124.720.917.37.1-1.314.3郑州0.32.99.118.523.827.828.925.921.917.38.60.515.5武汉2.84.19.418.222.326.630.328.022.917.810.13.916.4长沙(望城)4.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论