2013年我国城镇居民人均消费的SPSS统计分析_第1页
2013年我国城镇居民人均消费的SPSS统计分析_第2页
2013年我国城镇居民人均消费的SPSS统计分析_第3页
2013年我国城镇居民人均消费的SPSS统计分析_第4页
2013年我国城镇居民人均消费的SPSS统计分析_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

20132013 年我国城镇居民人均消费的年我国城镇居民人均消费的 SPSSSPSS 统计分析统计分析 1 搜集到的搜集到的 20132013 年我国年我国 3131 个城市城镇居民人均消费水平的数据个城市城镇居民人均消费水平的数据 数据来源 国家统计局 2 2 对数据的基本分析对数据的基本分析 在数据文件建立好后 通常还需要对待分析的数据进行必要的预加工处理 这 是数据分析过程中不可缺少的一个关键环节 1 对数据按人均消费 expend 进行降序排列 操作步骤 1 选择 数据 排序个案 菜单项 2 将 人均消费 expend 选入 排序依据 列表框 选中 降序 3 点击 确认 按钮 生成如下降序排列的数据集 由数据的降序排列可以看出 全国只有上海 北京 广东等九个城市的城镇人 均消费在全国城镇人均消费水平以上 2 作出人均收入和人均消费的直方图 操作步骤 1 选择 图形 打开 图表构建程序 菜单项 2 从 库 中选择 直方图 将其拉入 图表预览使用数据实 例 3 将变量 地区 设置为 x 轴 将 人均收入 和 人均消费 设置为 y 轴 4 点击 确认 按钮 即生成如下直方图 通过一个复合条形图 可以很明确的发现我国城镇居民生活水平存在很大的地 区差异 地区发展很不平衡 从图中的生活消费支出和人均收入来看 北京 上海 浙江这些省市城镇居民消费水平最高 人均收入也是最高的 各省市的 城镇居民消费水平差异较大 大多数省份城镇居民人均消费集中在 15000 元左 右 3 对数据按照人均消费作出直方图 以统计我国农村人均消费的水平 1 首先对数据分组 分组数目的确定 按照 Sturges 提出的经验公式来确定组数 K K 1 计算得组数为 6 2lg lgn 2 确定组距组距 最大值 最小值 组数 28155 00 12231 90 6 2653 85 可近似取值为 3000 00 元 操作步骤 1 选择 转换 可视离散化 菜单项 将 人均消费 选 入 要离散的变量 列表框中 单击 继续 按钮进入主对话框 2 单击 生成分割点 按钮 设定分割点数量为 6 宽度为 3000 00 可见系统会自动会填充第一个分割点的位置为 12231 90 单击 应 用 返回到主对话框 3 此时可以看到下部数值标签网格里的 值 列已被自动填充 单击 生成标签 按钮 是标签列也得到自动填充 4 将离散的变量名设定为 expendNew 5 单击 确定 按钮 3 频数分析 操作步骤 1 选择 分析 描述统计 频率 打开频率对话框 2 选定 expendNew 点击 图表 选择 条形图 点击 继续 3 点击 确认 生成如下三张表 Statistics 人均消费 已离散化 Valid32N Missing0 Mean3 13 Median3 00 Std Deviation1 314 Minimum1 Maximum7 252 00 503 00 Percentiles 753 75 人均消费人均消费 已离散化已离散化 FrequencyPercentValid PercentCumulative Percent 12231 9013 13 13 1 12231 91 15231 901031 331 334 4 15231 91 18231 901340 640 675 0 18231 91 21231 9039 49 484 4 21231 91 24231 9039 49 493 8 24231 91 27231 9013 13 196 9 27231 91 13 13 1100 0 Valid Total32100 0100 0 由上图的频数分析可以看出 我国 2013 年城镇居民人均消费支出集中在第二组 和第三组 大约占到百分之七十 由于在表格中不存在缺失值 因此频数分布 表中的百分比和有效百分比相同 从此次分析中可以看出 我国城镇家庭居民 人均消费的总体水平比较集中 大约在 12000 元 18000 元之间 还有少数省 市的消费水平处在中等阶段 而有上海 北京 浙江等一些经济较发达的地区 的城镇家庭居民人均消费达到了 21000 元以上 3 对数据的回归分析对数据的回归分析 1 作出人均收入与消费支出散点图 以观察他们的线性关系如何 操作步骤 1 选择 图形 打开 图表构建程序 菜单项 2 从 库 中选择 散点图 将其拖入 图表预览使用数据实 例 3 将 人均收入 选定为 x 轴 将 人均消费 选定为 y 轴 4 点击 确认 生成如下散点图 由散点图可以看出 人均消费 Y 和人均收入 X 大概呈一元线性关系 因此可以 建立一元线性模型进行回归分析 2 假设回归模型为 Y a b X 其中 Y 表示城镇人均消费支出 为被解释变量 X 表示人均收入 为解释变量 b 为回归系数 操作步骤 1 选择 分析 回归 线性 菜单项 打开 线性回归 对话框 2 将 人均消费 选入 因变量 列表框 将 人均收入 选入 自变量 列表框 3 单击 确定 按钮 得到如下 1 2 3 4 四张表格 依次分析如下 表 1 移入 移出的变量 Variables Entered Removedb ModelVariables Entered Variables RemovedMethod 1人均收入 a Enter a All requested variables entered b Dependent Variable 人均消费 从上表可以看出 放入模型的变量只有一个即 人均收入 选择变量的方法 为强行进入法 也就是说将所有的自变量都放入模型中 模型的因变量为 人 均消费 表 2 模型汇总 Model Summary ModelRR Square Adjusted R Square Std Error of the Estimate 1 960a 922 9201106 90715 a Predictors Constant 人均收入 上表是对模型的简单汇总 其实就是对回归方程拟合情况的描述 通过这张表 可以知道相关系数 R 0 960 决定系数 0 922 调整决定系数 0 920 和 2 R 2 R 回归系数的标准误 31106 90715 由于决定系数接近于 1 说明模型的拟合程 度较好 表 3 方差分析表 ANOVAb ModelSum of SquaresdfMean SquareFSig Regression4 353E814 353E8355 256 000a Residual36757303 474301225243 449 1 Total4 720E831 a Predictors Constant 人均收入 b Dependent Variable 人均消费 F 355 256 P 0 0000 05 所以不能拒绝原假设 可以认为人均消费水平在 18000 元 同时 可知全国城镇居民 2013 年人均消费 在 95 的置信水平下的置信区间为 15809 7242 18623 4821 5 5 非参数检验非参数检验 多配比样本分参数检验多配比样本分参数检验 数据中我国城镇家庭居民人均消费包括食品 衣着 居住 家庭设备 交通及 通讯 文教娱乐 医疗保健 和其他 8 个指标 为了比较清楚的了解这 8 项指 标对我国城镇居民人均消费总体的影响 以及其大概的消费动向 可以利用多 配比样本的非参数检验 Friedman 检验对各个指标进行检验 1 操作步骤 1 选择 分析 非参数检验 旧对话框 k 个相关样本 菜单 项 打开如下对话框 2 单击 确定 按钮 得到如下两张表格 表 1 Ranks Mean Rank 食物消费8 00 衣物消费5 09 居住消费4 50 家居设备2 66 交通通讯6 38 医疗保健2 34 文教娱乐5 88 其它1 16 表 2 Test Statisticsa N32 Chi Square198 604 df7 Asymp Sig 000 a Friedman Test 2 结果分析 检验结果中的 p 值小于给定水平 0 05 故拒绝原假设 认为八个指标对我国城 镇居民人均消费的影响是有显著差异的 由表 1 知食物消费对人均消费的影 响最大 其次是交通通讯和衣物消费 而影响最小的是其它 6 因子分析因子分析 在研究我国城镇居民的消费情况时收集了食物 衣物 居住等八个影响居民消 费情况的因素 以期对问题能够有比较全面 完整的把握和认识 由于数据过 多 在实际建模时 这些变量未必能真正发挥预期的作用 会给统计分析带来 许多问题 可以表现在 计算量的问题和变量间的相关性问题 为了解决这些 问题 最简单和最直接的解决方案是削减变量个数 但这又必然会导致信息丢 失和信息不完整等问题的产生 为此 人们希望探索一种更有效的解决方法 它既能大大减少参与数据建模的变量个数 同时也不会造成信息的大量丢失 因子分析正是解决这种问题的方法 1 操作步骤 1 选择菜单 分析 降维 因子分析 出现因子分析对话框 2 把参与因子分析的样本选到变量对话框中 如下图 3 单击 确定 按钮 得到如下 11 张图 图 1 原有变量的相关系数矩阵 Correlation Matrix 食物消 费 衣物消 费 居住消 费 家居设 备 医疗保 健 交通通 讯 文教娱 乐其它 食物消 费 1 000 288 656 744 295 787 782 732 衣物消 费 2881 000 337 517 694 368 374 634 居住消 费 656 3371 000 676 505 849 750 771 家居设 备 744 517 6761 000 441 830 853 767 医疗保 健 295 694 505 4411 000 479 414 600 交通通 讯 787 368 849 830 4791 000 860 782 文教娱 乐 782 374 750 853 414 8601 000 831 Correlatio n 其它 732 634 771 767 600 782 8311 000 从上图可以看到 大部分的相关系数都较高 各变量呈较强的线性关系 能够 从中提取公共因子 适合进行因子分析 图 2 巴特利特球度检验和 KMO 检验 KMO and Bartlett s Test Kaiser Meyer Olkin Measure of Sampling Adequacy 833 Approx Chi Square233 009 df28 Bartlett s Test of Sphericity Sig 000 由上图知 巴特利特球度检验统计量的观测值为 233 009 相应的概率 p 为 0 如果给出的显著性水平为 0 05 由于概率 p 小于显著性水平 应拒绝零假设 认为相关系数矩阵与单位阵有显著地差异 同时 KMO 值为 0 833 根据 Kaiser 给出了 KMO 度量标准可知原有变量适合进行因子分析 图 3 因子分析的初始解 Communalities InitialExtraction 食物消费1 000 798 衣物消费1 000 862 居住消费1 000 750 家居设备1 000 812 医疗保健1 000 821 交通通讯1 000 897 文教娱乐1 000 885 其它1 000 872 Extraction Method Principal Component Analysis 由上图第二列可知 所有变量的共同度均较高 各个变量的信息丢失较少 因 此 本次因子提取的总体效果较理想 图 4 因子解释原有变量总方差的情况 Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Compon entTotal of Variance Cumulativ e Total of Variance Cumulativ e Total of Variance Cumulativ e 15 50468 79468 7945 50468 79468 7944 52456 54556 545 21 19214 89883 6921 19214 89883 6922 17227 14783 692 3 4735 91089 602 4 2583 22292 824 5 2372 96195 785 6 1782 22798 012 7 0911 13699 147 8 068 853100 000 Extraction Method Principal Component Analysis 上图 第一组数据项描述了初始因子解的情况 可以看到 第一个因子解的特 征根值为 5 504 解释原有八个变量总方差的 68 794 累计方差贡献率为 68 794 其余数据含义类似 在初始解中由于提取了八个因子 因此原有变 量的总方差均被解释掉 第二组数据项描述了因子解的情况 可以看到 由于指定提取两个因子 两 个因子共解释了原有变量总方差的 83 692 总体上 原有变量的信息丢失较 少 因子分析效果较理想 第三组数据项描述了最终因子解的情况 可见 因子旋转后 累计方差比没 有改变 也就是没有影响原有变量的共同度 但却重新分配了各个因子解释原 有变量的方差 改变了各因子的方差贡献 使得因子更容易解释 图 5 因子的碎石图 上图横坐标为因子数目 纵坐标为特征根 可以看到 第一个因子的特征根值 很高 对原有变量的贡献最大 第 3 个以后的因子特征根都较小 对解释原有 变量的贡献很小 已经成为可被忽略的 高山脚下的碎石 因此提取两个因 子是合适的 图 6 因子载荷矩阵 Component Matrixa Component 12 其它 929 097 交通通讯 921 222 文教娱乐 909 241 家居设备 895 103 居住消费 854 143 食物消费 822 350 衣物消费 599 710 医疗保健 635 646 a 2 components extracted 上图因子载荷矩阵是因子分析的核心内容 根据该表可以写出本案例的因子分 析模型 其它 0 929 0 097 交通通讯 0 921 0 222 1 f 2 f 1 f 2 f 文教娱乐 0 909 0 241 家居设备 0 895 0 103 1 f 2 f 1 f 2 f 居住消费 0 854 0 143 食物消费 0 822 0 350 1 f 2 f 1 f 2 f 衣物消费 0 599 0 710 医疗保健 0 635 0 646 1 f 2 f 1 f 2 f 由上表知 八个变量在第一个因子上的载荷都很高 意味着他们与第一个因子 的相关度高 第一个因子很重要 图 7 旋转后的因子载荷矩阵 Rotated Component Matrixa Component 12 交通通讯 915 244 文教娱乐 914 222 食物消费 889 084 家居设备 836 336 居住消费 819 281 其它 770 528 衣物消费 188 909 医疗保健 250 871 a Rotation converged in 3 iterations 由上图知 交通通讯 文教娱乐 食物消费 家居设备 居住消费 其它在第 一个因子上有较高的载荷 第一个因子主要解释了这几个变量 衣物消费 医 疗保健在第二个因子上的载荷较高 第二个因子主要解释了这几个变量 图 8 因子旋转中的正交矩阵 Component Transformation Matrix Component12 1 879 477 2 477 879 图 9 因子协方差矩阵 Component Score Covariance Matrix Component12 11 000 000 2 0001 000 从上表可以看出 两因子没有线性相关性 实现了因子分析的设计目标 图 10 旋转后的因子载荷图 由上图可以直观的看出 衣物消费和食物消费比较靠近两个因子坐标轴 表明 如果分别用第一个因子刻画食物消费 用第二个因子刻画衣物消费 信息丢失 较少 效果较好 图 11 因子得分系数矩阵 Component Score Coefficient Matrix Component 12 食物消费 271 187 衣物消费 188 576 居住消费 194 032 家居设备 184 001 医疗保健 157 532 交通通讯 236 084 文教娱乐 241 099 其它 110 152 根据上表可以得到以下因子得分函数 0 271 食物消费 0 188 衣物消费 0 194 居住消费 0 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论