北航数理统计大作业_第1页
北航数理统计大作业_第2页
北航数理统计大作业_第3页
北航数理统计大作业_第4页
北航数理统计大作业_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用数理统计 第一次课程论文 学号: SY1227217 姓名: 袁 帅 2012 年 11 月 北京航空航天大学数理统计课程论文 第 I 页 我国居民消费价格指数的多元线性回归模型 摘 要 本文首先选取了我国自 1991 年至 2010 年间的居民消费价格指数(CPI)为因 变量,并对可能影响 CPI 的七个因素进行了统计,进一步利用统计软件 SPSS 对 以上数据进行了多元逐步线性回归。并最终确定了居民消费价格指数与各因素 之间关系的“最优”回归方程。 关键词:多元线性回归,逐步回归法,居民消费价格指数,SPSS 北京航空航天大学数理统计课程论文 第 III 页 目录 摘 要 I 1. 符号说明 1 2. 引言 1 3. 数据的采集和整理 2 3.1 数据采集 2 3.2 建模 3 4. 数据分析 3 5. 结论 9 参考文献 10 致谢 10 北京航空航天大学数理统计课程论文 第 1 页 1. 符号说明 变量 符号 居民消费价格指数 y 国内生产总值 x1 总人口 x2 能源生产总量 x3 人民币汇率 x4 居民存款 x5 第一产业总产值 x6 成灾受灾面积 x7 2. 引言 CPI (Consumer Price Index 居民消费价格指数)指在反映一定时期内居民 所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格水平的 变动率在一定程度上反映了通货膨胀(或紧缩)的程度。通俗的讲,CPI 就是 市场上的货物价格增长百分比。一般市场经济国家认为 CPI 增长率在 2%3%属 于可接受范围内,当然还要看其他数据。CPI 过高始终不是好事,高速经济增 长率会拉高 CPI,但物价指数增长速度快过人民平均收入的增长速度就一定不 是好事,而一般平均工资的增长速度很难超越 3-4%。 居民消费价格指数(Consumer Price Index,简称 CPI)是度量居民生活 消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费 品和服务价格水平的变动情况。 编制居民消费价格指数的目的,是了解全国各地价格变动的基本情况,分 析研究价格变动对社会经济和居民生活的影响,满足各级政府制定政策和计划、 进行宏观调控的需要,以及为国民经济核算提供参考和依据 与就业形势报告(非农)结合在一起,消费者物价指数(CPI)就成了金融 市场上被仔细研究的另一个热门的经济指标。它获得关注的原因显而易见:通 货膨胀影响着每一个人,它决定着消费者花费多少来购买商品和服务,左右着 商业经营的成本,极大地破坏着个人或企业的投资,影响着退休人员的生活质 量。而且,对通货膨胀的展望有助于设立劳动合同和制定政府的财政政策。 基于此目的,本文从国家统计信息网上选取了 1991-2010 年这 20 年间的年 度财政收入及主要影响因素的数据,包括国内生产总值、总人口、能源生产总 量、人民币汇率、居民存款、第一产业总产值、受灾成灾面积。并进一步采用 多元逐步回归分析方法对以上因素进行了显著性分析,从而确定了关于居民消 费价格指数的最优多元线型回归方程。 3. 数据的采集和整理 数据采集 本文在进行统计时,查阅中国统计年鉴 2011中收录的 199 1 年至 2010 年连续 20 年的居民消费价格指数(CPI)为因变量,并初步选取这 20 年的国内生产总值、总人口、能源消费总量、人民币汇率、居民存款、第一产 业总产值、受灾成灾面积 7 个因素为自变量,其具体数据见表格 1. 北京航空航天大学数理统计课程论文 第 3 页 表格 1 年份 CPI 国内生 产总值 (亿元) 总人口 (万人) 能源消 费总量 (万吨 标准煤) 人民币 汇率 (100 美 元) 居民存 款(亿 元) 第一产业 总产值 (亿元) 受灾成灾 面积(千 公顷) 1991 103.4 21781.5 115823 103783 532.33 9244.9 8157.0 73291 1992 106.4 26923.5 117171 109170 551.46 11757.3 9084.7 77225 1993 114.7 35333.9 118517 115993 576.20 15203.5 10995.5 71961 1994 124.1 48197.9 119850 122737 861.87 21518.8 15750.5 86428 1995 117.1 60793.7 121121 131176 835.10 29662.3 20340.9 68092 1996 108.3 71176.6 122389 135192 831.42 38520.8 22353.7 68225 1997 102.8 78973.0 123626 135909 828.98 46279.8 23788.4 83734 1998 99.2 84402.3 124761 136184 827.91 53407.5 24541.9 75326 1999 98.6 89677.1 125786 140569 827.83 59621.8 24519.1 76713 2000 100.4 99214.6 126743 145531 827.84 64332.4 24915.8 89062 2001 100.7 109655.2 127627 150406 827.70 73762.4 26179.6 84008 2002 99.2 120332.7 128453 159431 827.70 86910.7 27390.8 74106 2003 101.2 135822.8 129227 183792 827.70 103617.7 29691.8 87022 2004 103.9 159878.3 129988 213456 827.68 119555.4 36239.0 53404 2005 101.8 184937.4 130756 235997 819.17 141051.0 39450.9 58784 2006 101.5 216314.4 131448 258676 797.18 161587.3 40810.8 65723 2007 104.8 265810.3 132129 280508 760.40 172534.2 48893.0 74056 2008 105.9 314045.4 132802 291448 694.51 217885.4 58002.2 62274 2009 99.3 340902.8 133450 306647 683.10 260771.7 60361.0 68448 2010 103.3 401202.0 134091 324939 676.95 303302.5 69319.8 55964 建模 我选取了居民消费价格指数(CPI)做为因变量 y,选取对 CPI 可能的影响因 素为自变量,其中对应关系在 1 符号说明中已经列举。这里构建模型如下: =0+7=1+ 其中 为随机误差项, 为常数项, 为待估计的参数。0 4. 数据分析 本文利用逐步回归法对该问题进行分析。该方法是从一个自变量开始,视 自变量对 y 的显著程度,从大到小地依次逐个引入回归方程,但当引入的自变 量由于后面的引入而变得不显著时,要将其剔除掉。引入一个自变量或从回归 方程中剔除一个自变量,为逐步回归的一步,对于每一步都要进行 F 值检验, 以确保每次引入新的显著性自变量前回归方程中只包含对作用显著的变量。这 个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可 引入回归方程时为止。 本文运用统计软件 SPSS 的有关功能模块根据上述原理精选出一些配合较好 和方差贡献大得自变量,组建回归方程。当 F 引 =F 剔 =0 时,则所有的变量全部 被引入,逐步回归分析结果就和一般的多元线性回归分析结果相同。当 F 取值 较大时,理论和实践都表明,在相同的 F 水平上,用逐步回归筛选出的显著变 量个数往往比先引入全部变量后再剔除的办法要少一些。为了从挑选因子中筛 选出尽可能多的因子建立模型,本系统可以自己给出 F 临界值,计算机默认的 F 引 =0.05,F 剔 =0.1,如果入选的自变量因子数目不多,可通过人为降低 F 临界 值的水平而筛选出更多的因子。如此时入选的因子太多,可人为提高 F 临界值 的水平而筛选出有代表性因子来组建模型。如最后建立的模型的复相关系数不 大,回归模型的拟合精度不太高,可根据这些入选因子来组建多元非线性模型。 现将数据输入统计软件 SPSS 中,并设定 F 引=0.25,F 剔=0.35 可得如下分析 结果: 北京航空航天大学数理统计课程论文 第 5 页 表格 2 输入移去的变量 a 模型 输入的变量 移去的变量 方法 1 总人口 . 步进(准则: F-to-enter 的概率 = .350)。 2 能源消费总量 . 步进(准则: F-to-enter 的概率 = .350)。 3 人民币汇率 . 步进(准则: F-to-enter 的概率 = .350)。 4 第一产业产值 . 步进(准则: F-to-enter 的概率 = .350)。 a. 因变量: CPI 表2显示了变量的引入和剔除,以及引入或剔除的方法与标准。系统在进行 逐步回归过程中产生了4个模型,模型1是按照F检验的标准概率值,先将与y最 密切的总人口(x2)引入模型,建立y与x2之间的一元线性回归模型,然后再将 能源消费总量(x3)引入模型,建立y与x2,x3之间的二元线性模型,最后分别 依次把人民币汇率(x4) ,第一次产业产值(x6)引入模型,分别建立了他们与 y之间的三元,四元线性模型。最后建立的是y与x2,x3,x4,x6之间的四元线性关 系。 表格 3 模型汇总 e 模型 R R 方 调整 R 方 标准 估计的误差 1 .542a .294 .255 5.76340 2 .598b .357 .282 5.65942 3 .704c .496 .401 5.16775 4 .742d .550 .430 5.04186 a. 预测变量: (常量), 总人口。 b. 预测变量: (常量), 总人口, 能源消费总量。 c. 预测变量: (常量), 总人口, 能源消费总量, 人民币汇率。 d. 预测变量: (常量), 总人口, 能源消费总量, 人民币汇率, 第 一产业产值。 e. 因变量: CPI 表格 4 模型汇总 e 模型 R R 方 调整 R 方 标准 估计的误差 1 .542a .294 .255 5.76340 2 .598b .357 .282 5.65942 3 .704c .496 .401 5.16775 4 .742d .550 .430 5.04186 a. 预测变量: (常量), 总人口。 b. 预测变量: (常量), 总人口, 能源消费总量。 c. 预测变量: (常量), 总人口, 能源消费总量, 人民币汇率。 d. 预测变量: (常量), 总人口, 能源消费总量, 人民币汇率, 第 一产业产值。 e. 因变量: CPI 北京航空航天大学数理统计课程论文 第 7 页 表格 5 系数 a 非标准化系数 标准系数 B 的 95.0% 置信区间 模型 B 标准 误差 试用版 t Sig. 下限 上限 (常量) 84.638 7.482 11.313 .000 68.920 100.3571 总人口 1.382 .504 .542 2.740 .013 .322 2.442 (常量) 63.598 17.874 3.558 .002 25.888 101.307 总人口 2.310 .873 .907 2.647 .017 .469 4.151 2 能源消费总量 4.067E-5 .000 .442 1.291 .214 .000 .000 (常量) 9.703 30.466 .318 .754 -54.883 74.289 总人口 3.784 1.063 1.485 3.560 .003 1.530 6.037 能源消费总量 8.564E-5 .000 .931 2.386 .030 .000 .000 3 人民币汇率 .032 .015 .496 2.095 .052 .000 .064 (常量) -2.191 31.012 -.071 .945 -68.291 63.909 总人口 3.856 1.038 1.513 3.713 .002 1.642 6.069 能源消费总量 2.100 .000 2.084 2.222 .042 .000 .000 人民币汇率 .039 .016 .605 2.470 .026 .005 .072 4 第一产业产值 .240 .000 -1.155 -1.345 .199 -.001 .000 a. 因变量: CPI Figure 1 Figure 2 Figure 3 北京航空航天大学数理统计课程论文 第 9 页 5. 结论 通过前面的分析与计算可以得到最优的回归方程: =2.191+3.856 2+2.13+0.394+0.246 通过以上分析可以发现,居民消费价格指数与总人口,能源消费总量,人 民币汇率以及第一产业总产值呈线型相关性显著。 这说明我国的居民消费价格指数中受到包括总人口,能源消费总量,人民 币汇率以及第一产业总产值等多方面的影响。CPI 是一个滞后性的数据,但它 往往是市场经济活动与政府货

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论