已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东华大学管理学院管理科学与工程专业 2010 级 统计学实验报告 居民消费价格指数的统计学分析 学号 100750324 姓名 指导老师 周力 分数 2 居民消费价格指数的统计学分析居民消费价格指数的统计学分析 背景描述 背景描述 统计学在经济管理领域有着广泛的应用 本文将应用统计学对中国 1978 年至 2006 年 的居民消费者价格指数进行分析 分析的方面包括 1 历年居民消费价格指数 2 历年 城市居民消费价格指数 3 历年农村居民消费者价格指数 4 历年商品零售价格指数 5 历年工业品出厂价格指数 以及 6 2006 年居民消费价格分类指数 其中前五个指 数均以 1978 或者 1985 年为基年 最后一个指数以 2005 年为基年 本文一共应用了统计描 述 散点图 箱形图 回归 移动平均法 指数平滑法 假设检验 方差分析 定基指数 环比指数等方法进行统计学分析 其中对历年商品零售价格指数进行回归 以探究其回归方程 把握数据的变动规律 对历年商品零售价格指数进行移动平均预测和指数平滑预测 对城市居民消费价格指数和 农村居民消费价格指数做假设检验 检验两者均值是否有显著性差异 对商品零售价格指 数和工业品出厂价格指数做价格检验 检验两者均值是否有显著性差异 对居民消费价格 分类指数中的各类 共有 食品 烟酒及用品 衣着 家庭设备用品及服务 医 疗保健和个人用品 交通和通信 娱乐教育文化用品及服务 居住 八大类 进行 方差分析 检验各类消费价格指数的均值是否有显著性差异 探究此案例中分类型自变量 是否对数值型自变量有显著性影响 将定比指数换算环比指数 探究环比指数之下变动情 况并且与定比指数的情况进行对比 数据采集方式 数据采集方式 中国统计年鉴 2007 年版 第 309 页 原始数据 1 各种价格定基指数 年份 居民消费价格指数 1978 100 城市居民消 费价格指数 1978 100 农村居民消 费价格指数 1985 100 商品零售价 格指数 1978 100 工业品出厂 价格指数 1985 100 1978100100100 1980109 5109 5108 1 1985131 1134 2100128 1100 1990216 4222165 1207 7159 1991223 8233 3168 9213 7168 9 1992238 1253 4176 8225 2180 4 1993273 1294 2201254 9223 7 1994339367 8248310 2267 3 1995396 9429 6291 4356 1307 1 1996429 9467 4314 4377 8316 1997441 9481 9322 3380 8315 1998438 4479319 1370 9302 1 1999432 2472 8314 3359 8294 8 2000434476 6314354 4303 1 2001437479 9316 5351 6299 2 3 2002433 5475 1315 2347292 6 2003438 7479 4320 2346 7299 3 2004455 8495 2335 6356 4317 6 2005464503 1343359 3333 2 2006471510 6348 1362 9343 2 原始数据 2 居民消费价格分类指数 2006 年 项目全国 居民消费价格指数居民消费价格指数 食品食品 粮食 大米 104 3 面粉 99 7 淀粉 101 8 干豆类及豆制品 100 8 油脂 98 6 肉禽及其制品 97 1 蛋 96 水产品 101 2 菜 鲜菜 108 2 调味品 102 3 糖 111 2 茶及饮料 茶叶 101 2 饮料 100 9 干鲜瓜果 鲜果 121 5 糕点饼干面包 101 3 液体乳及乳制品 100 9 在外用膳食品 101 6 其他食品 101 2 烟酒及用品烟酒及用品 烟草 100 2 酒 101 2 吸烟 饮酒用品 100 7 衣着衣着 服装 99 衣着材料 100 5 鞋袜帽 100 2 衣着加工服务费 101 5 家庭设备用品及服务家庭设备用品及服务 耐用消费品 4 家具 100 2 家庭设备 101 2 室内装饰品 100 床上用品 99 6 家庭日用杂品 101 1 家庭服务及加工维修服务费 105 8 医疗保健和个人用品医疗保健和个人用品 医疗保健 医疗器具及用品 97 2 中药材及中成药 99 9 西药 98 4 保健器具及用品 100 3 医疗保健服务 103 个人用品及服务 化妆美容用品 99 7 清洁化妆用品 99 9 个人饰品 110 8 个人服务 102 5 交通和通信交通和通信 交通 交通工具 97 8 车用燃料及零配件 112 8 车辆使用及维修费 102 4 市内公共交通费 104 8 城市间交通费 105 6 通信 通信工具 82 2 通信服务 100 娱乐教育文化用品及服务娱乐教育文化用品及服务 文娱用耐用消费品及服务 94 2 教育 教材及参考书 100 3 学杂托幼费 100 文化娱乐 文化娱乐用品 99 6 书报杂志 100 7 文娱费 102 6 旅游 103 1 居住居住 建房及装修材料 103 9 租房 102 7 自有住房 103 7 水电燃料 105 9 5 针对原始数据针对原始数据 1 1 的分析 的分析 预处理 预处理 所有数据来源于 中国统计年鉴 2007 年版 确保真实 完整 有效 描述性统计 统计量统计量 Consumer Price Index 有效 20N 缺失 20 均值 345 215 均值的标准误 29 0203 中值 431 050 众数 100 0a 标准差 129 7827 方差 16843 546 偏度 858 偏度的标准误 512 峰度 839 峰度的标准误 992 全距 371 0 极小值 100 0 极大值 471 0 25227 375 50431 050 百分位数 75438 625 a 存在多个众数 显示最小值 由 SPSS19 中的描述统计中的频率可以得到上表 均值为 345 215 中值为 431 050 标准差为 129 7827 正负三个标准差的范围为 44 1331 734 5631 所 有数据均在此范围内 无异常值 偏度为 0 858 为左偏 峰度为 0 839 最大值 为 471 最小值为 100 全距为 371 现在针对 居民消费者价格指数 做回归分析 SPSS 输入页面如下 其中 AdjustedYear 为调整后的年份 6 作出散点图如下 7 回归分析表如下 8 曲线拟合曲线拟合 模型描述模型描述 模型名称 MOD 3 因变量 1Consumer Price Index 1 线性 2 对数 3 倒数 4 二次 5 三次 6 复合a 7 幂a 8Sa 9 增长a 10 指数a 方程 11Logistica 自变量调整后年份 常数包含 其值在图中标记为观测值的变量未指定 用于在方程中输入项的容差 0001 a 该模型要求所有非缺失值为正数 个案处理摘要个案处理摘要 N 个案总数 40 已排除的个案a 20 已预测的个案 0 新创建的个案 0 a 从分析中排除任何变量中带有 缺失值的个案 9 变量处理摘要变量处理摘要 变量 因变量自变量 Consumer Price Index 调整后年份 正值数 2020 零的个数 00 负值数 00 用户自定义缺失 00 缺失值数 系统缺失 2020 模型汇总和参数估计值模型汇总和参数估计值 因变量 Consumer Price Index 模型汇总参数估计值 方程R 方 Fdf1df2Sig 常数 b1b2b3 线性 892148 210118 00057 18915 611 对数 71645 348118 000 17 181133 117 倒数 38311 190118 004387 879 368 306 二次 89471 830217 00040 53918 563 095 三次 955112 643316 000132 432 23 1873 293 073 复合 898157 897118 000100 7841 063 幂 82786 271118 00067 968 560 S 50518 330118 0005 936 1 654 增长 898157 897118 0004 613 061 指数 898157 897118 000100 784 061 Logi stic 898157 897118 000 010 941 自变量为 调整后年份 10 根据R方值可以看出三次方拟合是最好的 可以得出回归方程为 132 432 23 187 3 293 2 0 073 3 此时曲线拟合图为 11 但是由明显可以看出 预测曲线在末尾是下降趋势 而实际数据在末尾确实上升趋势 所 以以 1998 年 AdjusterYaer 21 为临界点 1998 年前后各做回归分析 首先是 1918 1998 年 SPSS 曲线回归输出结果如下 12 模型汇总和参数估计值模型汇总和参数估计值 因变量 consuner 模型汇总参数估计值 方程R 方 Fdf1df2Sig 常数 b1b2b3 线性 84248 03419 00029 31617 897 对数 59813 37719 00526 225102 295 倒数 3484 81019 056309 483 258 397 二次 980194 32628 000123 610 12 6341 464 三次 983134 54037 000102 404 763 040 046 复合 953181 81619 00080 4221 085 幂 75727 99619 00074 490 493 S 4848 45319 0175 688 1 306 增长 953181 81619 0004 387 082 指数 953181 81619 00080 422 082 Logistic 953181 81619 000 012 922 自变量为 AdjustedYear 根据R方值可以看出三次方拟合是最好的 可以得出回归方程为 y 102 404 0 763x 0 04x2 0 046x3 13 此时拟合曲线为 其次是 1998 2006 年 SPSS 曲线回归输出结果如下 模型汇总和参数估计值模型汇总和参数估计值 因变量 consumer 模型汇总参数估计值 方程R 方 Fdf1df2Sig 常数 b1b2b3 线性 71317 39117 004331 9974 518 对数 67414 50017 00794 526109 050 倒数 63412 13217 010550 160 2601 821 二次 95056 43926 0001042 211 52 9111 149 三次 94854 63526 000805 653 24 269 000 015 复合 71317 40117 004346 1081 010 幂 67514 51917 007204 283 242 S 63512 15417 0106 331 5 777 增长 71317 40117 0045 847 010 指数 71317 40117 004346 108 010 Logistic 71317 40117 004 003 990 自变量为 AdjustedYear 14 根据R方值可以看出二次方拟合是最好的 可以得出回归方程为 y 1042 211 52 911x 1 149x2 此时曲线拟合图为 15 然后用移动平均值法对 居民消费价格指数 做预测 操作数据如下 由图可见三期移动平均预测的 标准误差 更小 预测的 2007 年的消费价格指数为 463 6 随后用指数平滑法进行预测 16 可见用 0 5 的指数平滑产生的标准误差最小 预测 2007 年消费价格指数为 463 014 0 5 17 0 4 0 3 然后针对 城市居民消费价格指数 和 农村居民消费价格指数 做假设检验 H0 1 2 H1 1 2 SPSS 输入如下 18 SPSS 作箱型图如下 独立样本 T 检验输出结果如下 19 组统计量组统计量 Bootstrapa 95 置信区间 分组1 Statistic 偏差标准 误差下限上限 N20 均值 373 250 93132 006303 293435 137 标准差 145 7669 4 987417 4844102 6945171 3394 1 0 均值的标准 误 32 5945 N20 均值 280 250 58716 514246 332310 801 标准差 75 1542 2 707312 177746 339093 0758 urban rural 2 0 均值的标准 误 16 8050 a Unless otherwise noted bootstrap results are based on 1000 bootstrap samples 独立样本检验独立样本检验 方差方程的 Levene 检验均值方程的 t 检验 差分的 95 置信 区间 FSig tdf Sig 双 侧 均值差 值 标准误 差值下限上限 假设方 差相等 14 547 000 2 53638 015 93 0000 36 6716 18 7622 167 2378urban rural 假设方 差不相 等 2 536 28 435 017 93 0000 36 6716 17 9333 168 0667 因 P 值 0 000 0 05 0 05 所以不拒绝原假设 两组数据均值不具有显著性差异 可见商品 零售价格指数和工业品出厂价格指数均值之间没有显著性差异 然后作居民消费价格分类指数的方差分析 H0 1 2 8 H1 i i 1 2 3 k 不全相等 SPSS 输入界面如下 22 作箱形图如下所示 SPSS 假设检验输出结果如下 23 描述描述 价格指数 均值的 95 置信区 间 N 均值标准差标准误下限上限极小值极大值 分量间方 差 118 102 5667 5 19513 1 2245099 9832105 150196 00117 90 23 100 7000 50000 2886899 4579101 9421100 20101 20 34 100 3000 1 02956 5147898 6617101 938399 00101 50 46 101 3167 2 28422 9325398 9195103 713899 60105 80 59 101 3000 3 98873 1 3295898 2340104 366097 20110 80 67 100 8000 9 49737 3 5896792 0164109 583682 20112 80 77 100 0714 2 90730 1 0988697 3826102 760294 20103 10 84 104 0500 1 34040 67020101 9171106 1829102 70105 90 总数 58 101 5759 4 74857 62352100 3273102 824482 20117 90 固定效 应 4 92579 64679100 2767102 8750 模 型 随机效 应 64679a100 0465 a 103 1053 a 2 03605 方差齐性检验方差齐性检验 价格指数 Levene 统计量 df1df2 显著性 1 983750 076 ANOVAANOVA 价格指数 平方和 df 均方 F 显著性 组间 72 114710 302 425 882 组内 1213 1735024 263 总数 1285 28657 均值图 24 因为 P 值 0 882 0 05 所以不拒绝原假设 即居民消费价格指数的各个分类的均值没 有显著性差异 可见居民在生活的各个方面的价格指数相差不显著 因此方差分析中有较多异常值 因此本文将对异常值单独关注 并在对异常值剔除后 再次进行方差分析 异常值中偏小值分别为 6 97 1 肉禽及其制品 7 96 蛋 4682 2 通信工具 4894 2 文娱用耐用消费品及服务 异常值中偏大值分别为 9108 2 鲜菜 11111 2 糖 14117 9 干鲜瓜果 31105 8 家庭服务及加工维修服务费 39110 8 个人饰品 由此看见 2006 年时 食品方面 肉禽及其制品 蛋 是相对便宜的 可以选择多 消费 鲜菜 糖 干鲜瓜果 是相对贵的 可以选择少消费 通信工具 文娱用 耐用消费品及服务 比较便宜 家庭服务及加工维修服务费 个人饰品 比较贵 可以 在消费上有侧重 25 剔除异常值后的方差分析 SPSS 输出箱形图 SPSS 方差分析输出 描述描述 26 价格指数 均值的 95 置信区 间 N 均值标准差标准误下限上限极小值极大值 分量间 方差 113 101 2154 1 31329 36424 100 4218 102 009098 60104 30 23 100 7000 50000 2886899 4579 101 9421100 20101 20 34 100 3000 1 02956 5147898 6617 101 938399 00101 50 45 100 4200 70143 3136999 5491 101 290999 60101 20 58 100 1125 1 91791 6780898 5091 101 715997 20103 00 66 103 9000 5 24557 2 1414998 3951 109 404997 80112 80 76 101 0500 1 44879 5914799 5296 102 570499 60103 10 84 104 0500 1 34040 67020 101 9171 106 1829102 70105 90 总数 49 101 3878 2 48618 35517 100 6736 102 101997 20112 80 固定效 应 2 23911 31987 100 7418 102 0338 模 型 随机效 应 55797 100 0684 102 70711 35266 方差齐性检验方差齐性检验 价格指数 Levene 统计量 df1df2 显著性 3 687741 004 ANOVAANOVA 价格指数 平方和 df 均方 F 显著性 组间 91 134713 0192 597 026 组内 205 559415 014 总数 296 69348 27 因P 值 0 0260 05 不拒绝原假设 即居民消费价格指数的各个分类的均值没 有显著性差异 单独剔除第 6 组 做箱形图和方差分析 得 30 描述描述 价格指数 均值的 95 置信区 间 N 均值标准差标准误下限上限极小值极大值 分量间 方差 113 101 2154 1 31329 36424 100 4218 102 009098 60104 30 23 100 7000 50000 2886899 4579 101 9421100 20101 20 34 100 30
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八年级数学(上)全等三角形专题精讲与深化:知识建构、思维拓展与易错辨析
- 初中八年级上学期数学(人教版)《轴对称:从对称美到几何证明》单元教学设计
- 初中八年级历史《洋务运动与边疆危机》核心知识清单
- 八年级地理基于区域认知的“秦岭-淮河”地理分界线深度探究教学设计
- 爱劳动善总结:初中道德与法治八年级知识清单
- 2026年全国房地产估价师考试(土地估价基础与实务)历年参考题库含答案
- 八年级信息技术Python函数建构教案
- 初中八年级道德与法治《走进社会生活》单元深度学习与素养提升复习课导学案
- 初三化学一轮复习:探秘构成物质的微观粒子(基础夯实教案)
- 铁路既有线封锁施工专项方案
- 2025年高校网络思政教育考试题及答案
- 2026年全国保密教育线上培训考试试题含答案【基础题】附带答案
- 康复评估工具在临床护理中的应用
- 2026年外事办韩语翻译录用考试中韩建交以来重要文件翻译练习
- 2024年贵州省黔南州公开引进高层次人才和急需紧缺人才历年高频考题难、易错点模拟试题(共500题)附带答案详解
- 回肠代膀胱术护理
- 食品风味添加剂-甜味剂(食品添加剂应用课件)
- 胰岛素的种类及应用(共26张PPT)
- 计算机网络技术试题及答案
- 中国古代史期末复习资料大一下
- 幼儿园设施设备清单表完整优秀版
评论
0/150
提交评论