版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元统计分析课程论文 本科生课程论文本科生课程论文 课程名称:课程名称: 多元统计分析多元统计分析 题题目目:关于房价的分析研究关于房价的分析研究 专业班级:专业班级:统计统计 姓姓名:名: 李李学学号:号: 完成完成时间时间: 20142014 年年 1111 月月 2525 日日 多元统计分析课程论文 1 关于房价的分析研究关于房价的分析研究 摘要 为了进一步研究中国房价上涨的原因,我选取了房地产开发投资额、商品房销 售面积、国内生产总值、城乡居民储蓄年末余款、地方财政预算内收入、年末总人 口数以及在岗职员平均工资这七个指标对这个问题进行分析。 由于各个指标的单位 不一致,故先将各指标数据
2、进行标准化。然后就这七个指标对 35 个省份进行聚类 分析,得出各地房价的差异性。继而对这七个指标进行主成分分析,分析这七个变 量之间的相关关系,找出两个可以代表全局的主成分。最后再进行因子分析,根据 相关性的大小把原始变量分组,从而找出少数几个主要因子。以下是通过 spss 软 件分析房价问题的起因,针对 2012 年各省份关于房地产的的数据,进一步深入探 究房价出现种种问题的根源所在,了解房价上涨的内在原因。 关键词:房价上涨,spss 软件,聚类分析,主成分分析,因子分析 多元统计分析课程论文 2 1绪 论 1.1 课题研究背景及目的 2000 年以来进入本世纪,中国大陆房地产市场改革在
3、新的一波房地产投资热 潮的推动下迅速升温。2001 年房地产投资 6245 亿元,占全社会总投资 36898 亿元 的 16.9%,到 2004 年房地产投资升高到 14480.75 亿元,占社会总投资 58620.28 亿元的 24.7%(2005 年上半年房地产业投资 6193 亿元,总投资 32895 亿元,占比 18。8%)。与此同时,政府也出台多项优惠政策,以期望房地产业成为新兴的支柱 产业。使用的方法包括,退还个人所得税,降低交易契税,放宽银行贷款条件,加 大房地产业扶持力度等等。在这种背景下,房价开始迅速窜升。 针对 2012 年天价房地产的的现状,进一步深入探究房价出现种种问题
4、的根源 所在,加强对当前我国房价的认识,我就房价问题展开了深入的分析研究。 1.2 研究现状 目前国内有很多关于房价上涨的报道,其原因也多种多样。自进入 21 世纪以 来, 房价问题的社会关注度不断提高, 不断攀升的房价让越来越多的民众叫苦不迭, 买房难成了社会上的普遍问题。尽管如此,地方政府的抬价,开发商的炒作,媒体 的肆意报道,买房投资者的推波助澜,让房价泡沫日趋增大。 1.3 研究方法 利用 spss 软件,运用聚类分析、主成分分析以及因子分析的方法,对关于房 价的数据进行分析,得出结论。采用 2012 年我国 35 个主要省份的房地产开发投资 额、商品房销售面积、国内生产总值、城乡居民
5、储蓄年末余款、地方财政预算内收 入、年末总人口数以及在岗职员平均工资这七个指标,来研究影响房价的因素。 1.4 研究内容 研究35个省份的房价差异及其分组;将影响房价的七个指标降维,在损失很 小的情况下,得出几个主成分,使问题得到简化,提高分析效率;因子分析可以 提高对经济现象的分析和解释。 多元统计分析课程论文 3 2 聚类分析 通过聚类分析,得出 35 个省份按房价综合指标的分类。我首先对原始变量标 准化,采用组间的类平均法,距离计算选择平方欧氏距离,对样品进行聚类。 聚类分析输出结果: 表 2-1 聚类表聚类表 阶 群集组合 系数 首次出现阶群集 下一阶群集 1群集 2群集 1群集 2
6、13233.121003 21725.1530017 32632.1810117 4818.203006 5435.2090010 6815.246407 7830.3416011 8712.3520018 939.3690014 10416.3755012 11814.4077013 12434.42110020 13819.56211019 14320.6159022 151113.6450024 162231.6800021 171726.7252320 18721.7518024 19829.78213021 20417.923121725 21822.987191622 22381.
7、221142127 236281.3270030 247111.407181527 多元统计分析课程论文 4 25451.44820031 262231.8160032 27372.012222429 281102.1630034 293242.68827030 30363.548292331 31344.567302532 32235.570263133 332278.51832034 341214.00028330 多元统计分析课程论文 5 图 2-2 根据聚类分析的输出结果,35 个省份根据这七个指标可以分为四类。在距离 为 10 的位置往下切,得到如下的分类结果:1:北京,上海;2:重
8、庆;3:天 津,广州;其他的省份分到第 4 类。从各个省份的实际指标值看,重庆在七项指 标上都与其他省份存在显著差异, 归为一类比较合适。 北京和上海的经济比较发达, 故其可分为一类。天津和广州差异很小,故单独归为一类。由此可看出,经济越发 达的城市,房价水平越高,经济水平相近的城市,房价水平也相近。 多元统计分析课程论文 6 3 主成分分析 通过主成分分析, 在损失很少信息的前提下, 把七个指标转化为几个综合指标, 转化成的综合指标即为主成分,其中每个主成分都是原始变量的线性组合,且各个 主成分之间互不相关,这样使得主成分比原始变量具有更优越的性能。 主成分分析结果: 表 3-1 相关矩阵相
9、关矩阵 zscore (x1) zscore(x 2) zscore(x 3) zscore(x 4) zscore(x 5) zscore(x 6)zscore(x7) 相关zscore(x1)1.000.820.809.821.803.722.534 zscore(x2).8201.000.552.489.511.885.147 zscore(x3).809.5521.000.934.942.556.760 zscore(x4).821.489.9341.000.957.513.781 zscore(x5).803.511.942.9571.000.540.787 zscore(x6).7
10、22.885.556.513.5401.000.110 zscore(x7).534.147.760.781.787.1101.000 表3-2 公因子方差公因子方差 初始提取 zscore(房地产开发投资额)1.000.902 zscore(商品房销售面积)1.000.943 zscore(国内生产总值)1.000.934 zscore(城乡居民储蓄年末余款)1.000.948 zscore(地方财政预算内收入)1.000.951 zscore(年末总人口数)1.000.915 zscore(在岗职员平均工资)1.000.905 提取方法:主成份分析。 由上可得:主成分对各原始变量的信息提取
11、都很充分,达90%以上,信息损失 量较小,主成分对各原始变量的信息提取相对充分。 多元统计分析课程论文 7 表 3-3 解释的总方差解释的总方差 成份 初始特征值 a 提取平方和载入 合计 方差 的 %累积 %合计方差的 %累积 % 原始15.07372.47172.4715.07372.47172.471 21.42420.34792.8181.42420.34792.818 3.2062.94195.759 4.1442.05197.810 5.0791.12398.933 6.044.62899.561 7.031.439100.000 重 新 标 度 15.07372.47172.47
12、15.07372.47172.471 21.42420.34792.8181.42420.34792.818 3.2062.94195.759 4.1442.05197.810 5.0791.12398.933 6.044.62899.561 7.031.439100.000 提取方法:主成份分析。 a. 分析协方差矩阵时,初始特征值在整个原始解和重标刻度解中均相同。 由输出结果可得, 前两个主成分 y1、 y2 的方差和占全部方差的比例为 92.82%。 因此选取 y1 为第一主成分,y2 为第二主成分,且这两个主成分的方差和占全部方 差的 92.82%,即基本上保留了原来指标的信息,这样由
13、原来的 7 个指标转化为 2 个新指标,起到了降维的作用。 表 3-4 成份矩阵成份矩阵 a a 原始重新标度 成份成份 1212 zscore(x1).929.196.929.196 多元统计分析课程论文 8 zscore(x2).727.643.727.643 zscore(x3).946-.196.946-.196 zscore(x4).939-.257.939-.257 zscore(x5).945-.241.945-.241 zscore(x6).715.636.715.636 zscore(x7).706-.637.706-.637 提取方法 :主成份。 a. 已提取了 2 个成份
14、。 由成分矩阵表中的结果可以得到: 第一主成分对各个原始指标信息的提取量较大,第二指标较小。 0.9292+0.7272+0.9462+0.9392+0.9452+0.7152+0.7062=5.065268= 第 一 主成分的方差 0.1962+0.6432+(-0.196)2+(-0.257)2+(-0.241)2+0.6362+(-0.637)2=1.4246 76=第二主成分的方差 对 spss 的因子分析模块运行结果输出的成分矩阵的第 i 列的每个元素分别除 以第 i 个特征根的平方根,就得到主成分分析的第 i 个主成分的系数,输出结果见 表 3-5。 表 3-5 主成分 1主成分
15、2 x10.41280.1642 x20.32300.5387 x30.42030.1642 x40.41720.2153 x50.41990.2020 x60.31770.5328 x70.31370.5337 由上表得到前两个主成分 y1、y2 的线性组合为: 11234567 0.41280.32300.42030.41720.41990.31770.31 37yxxxxxxx 11234567 0.16420.53870.16420.21530.20200.53280.53 37yxxxxxxx 其中 1 x、 2 x、 3 x 、 4 x 、 5 x 、 6 x 、 7 x是对原始变
16、量标准化后的变量。 此案例中有 7 个指标,这 7 个指标有很强的依赖性,通过主成分计算后,我们 选择了 2 个主成分,这 2 个主成分具有明显的经济意义。第一个主成分中,房地产 多元统计分析课程论文 9 开发投资额、国内生产总值、城乡居民储蓄年末余款、地方财政预算内收入的系数 相当, 商品房销售面积、 年末总人口数、 在岗职员平均工资这 3 个指标的系数相当, 所以第一主成分可以看成 1 x、 2 x、 3 x 、 4 x 、 5 x 、 6 x 、 7 x的综合变量,第一主成 分所占的信息总量为 72.47%。房地产开发投资额、国内生产总值、城乡居民储蓄 年末余款和地方财政预算内收入这四个
17、指标所占的比重大体一致,商品房销售面 积、年末总人口数以及在岗职员平均工资所占的比重大体一致。 多元统计分析课程论文 10 4因子分析过程 因子分析过程是主成分分析的推广,它也是一种把多个相关变量(指标)化为 少数几个变量的统计分析方法。因子分析的目的不仅是找出公因子,更重要的是知 道每个公因子的意义。 4.1 选取原始变量 根据与房价上涨有关的因素,现选取原始变量为房地产开发投资额、商品房销 售面积、国内生产总值、城乡居民储蓄年末余款、地方财政预算内收入、年末总人 口数以及在岗职员平均工资这七个指标。 4.2 对原始变量进行标准化并求其相关阵,分析变量之间相关性 因原始变量的单位不一致, 故
18、将原始变量标准化, 并得标准化数据的相关阵为: 表 4-2-1 相关矩阵相关矩阵 zscore (房地 产开发 投资 额) zscore( 商品房 销售面 积) zscore( 国内生 产总值) zscore( 城乡居 民储蓄 年末余 款) zscore( 地方财 政预算 内收入) zscore( 年末总 人口数) zscore( 在岗职 员平均 工资) 相关zscore( 房 地 产 开发投资额) 1.000.820.809.821.803.722.534 zscore( 商 品 房 销售面积) .8201.000.552.489.511.885.147 zscore( 国 内 生 产总值)
19、 .809.5521.000.934.942.556.760 zscore( 城 乡 居 民 储 蓄 年 末 余 款) .821.489.9341.000.957.513.781 zscore( 地 方 财 政预算内收入) .803.511.942.9571.000.540.787 zscore( 年 末 总 人口数) .722.885.556.513.5401.000.110 zscore(在岗职 员平均工资) .534.147.760.781.787.1101.000 多元统计分析课程论文 11 sig. (单 侧) zscore(房地产 开发投资额) .000.000.000.000.0
20、00.000 zscore(商品房 销售面积) .000.000.001.001.000.200 zscore(国内生 产总值) .000.000.000.000.000.000 zscore(城乡居 民 储 蓄 年 末 余 款) .000.001.000.000.001.000 zscore(地方财 政预算内收入) .000.001.000.000.000.000 zscore(年末总 人口数) .000.000.000.001.000.265 zscore(在岗职 员平均工资) .000.200.000.000.000.265 因子分析的前提是指标之间具有相关性。从表 4-2-1 可以看出
21、,各指标间存在 较强大的相关性,因此我们需要对以上指标进行因子分析,把问题降维,避免指标自 相关性对结果的影响。 4.3 求解初始公共因子及因子载荷矩阵 表表4-3-14-3-1 公因子方差公因子方差 初始提取 zscore(房地产开发投资额)1.000.902 zscore(商品房销售面积)1.000.943 zscore(国内生产总值)1.000.934 zscore(城乡居民储蓄年末余款)1.000.948 zscore(地方财政预算内收入)1.000.951 zscore(年末总人口数)1.000.915 zscore(在岗职员平均工资)1.000.905 提取方法:主成份分析。 多元
22、统计分析课程论文 12 表 4-3-2 解释的总方差解释的总方差 成份 初始特征值提取平方和载入 合计方差的 %累积 %合计方差的 %累积 % 15.07372.47172.4715.07372.47172.471 21.42420.34792.8181.42420.34792.818 3.2062.94195.759 4.1442.05197.810 5.0791.12398.933 6.044.62899.561 7.031.439100.000 提取方法:主成份分析。 表 4-3-3 成份矩阵成份矩阵 a a 成份 12 zscore(国内生产总值).946-.196 zscore(地方
23、财政预算内收入).945-.241 zscore(城乡居民储蓄年末余款).939-.257 zscore(房地产开发投资额).929.196 zscore(商品房销售面积).727.643 zscore(年末总人口数).715.636 zscore(在岗职员平均工资).706-.637 提取方法 :主成份。 a. 已提取了 2 个成份。 表 4-3-4 成份得分系数矩阵成份得分系数矩阵 成份 12 zscore(房地产开发投资额).059.221 zscore(商品房销售面积)-.165.444 多元统计分析课程论文 13 zscore(国内生产总值).232.006 zscore(城乡居民储
24、蓄年末余款).257-.028 zscore(地方财政预算内收入).251-.018 zscore(年末总人口数)-.164.438 zscore(在岗职员平均工资).385-.267 提取方法 :主成份。 旋转法 :具有 kaiser 标准化的正交旋转法。 构成得分。 由成分得分系数矩阵可得,房地产开发投资额的得分较高,说明其对房价的影 响较大,供求关系大大影响着房价。 表 4-3-5 因子载荷是公共因子与指标变量之间的相关系数, 载荷越大, 说明公共因子 与指标变量 之间的关系越密切。在确定公共因子个数时,先选择与原变量数目相 等的因子个数,计算因子总方差结果见表 4-3-1。取初始特征值
25、大于 1 的因子为公 共因子。由表 4-3-2 可知,符合条件的特征值有 2 个,累积方差贡献率达 92.818%, 涵盖了大部分变量信息。因此,选取前两个因子作为公共因子。 由各变量所占比重的碎石图,可知第一主成分的贡献率最大,而前两个成分的 累计贡献率已经足够代表所有的变量,其可以解释总体的 92.818%的信息量。 多元统计分析课程论文 14 4.4 因子旋转 表 4-4-1 旋转成份矩阵旋转成份矩阵 a a 成份 12 zscore(在岗职员平均工资).949-.067 zscore(城乡居民储蓄年末余款).898.376 zscore(地方财政预算内收入).893.392 zscor
26、e(国内生产总值).867.428 zscore(商品房销售面积).177.955 zscore(年末总人口数).172.941 zscore(房地产开发投资额).611.727 提取方法 :主成份。 旋转法 :具有 kaiser 标准化的正交旋转法。 a. 旋转在 3 次迭代后收敛。 表 4-4-2 成份转换矩阵成份转换矩阵 成份12 1.788.616 2-.616.788 提取方法 :主成份。 旋转法 :具有 kaiser 标准化的正交旋转法。 表 4-4-3 成份得分系数矩阵成份得分系数矩阵 成份 12 zscore(房地产开发投资额).059.221 zscore(商品房销售面积)-
27、.165.444 zscore(国内生产总值).232.006 zscore(城乡居民储蓄年末余款).257-.028 多元统计分析课程论文 15 zscore(地方财政预算内收入).251-.018 zscore(年末总人口数)-.164.438 zscore(在岗职员平均工资).385-.267 提取方法 :主成份。 旋转法 :具有 kaiser 标准化的正交旋转法。 由上表可知:对因子进行旋转后每个变量在一个公共因子上有较大的载荷,效 果很好,所以因子有旋转的必要。从旋转成分矩阵可得,房地产开发投资额在两个 公共因子上都有较大的载荷,可以单独归为一类;商品房销售面积和年末总人口数 在第二
28、个公共因子上有较大的载荷,可以归为一类;国内生产总值、城乡居民储蓄 年末余款、 地方财政预算内收入和在岗职员平均工资在第一个公共因子上有较大的 载荷,可以归为一类。房地产开发投资额、商品房销售面积和年末总人口数是反映 城市房地产的供求指标,国内生产总值、城乡居民储蓄年末余款、地方财政预算内 收入和在岗职员平均工资属于房地产的经济因素指标。 图 4-4-4 由旋转空间的成分图可看出:旋转后各变量更集中了,从图中也可以形象看出 各指标变量间的关系。 4.5 因子得分 fac1_1fac2_1 3.36430.55242 1.10779.18967 -.78833.32158 -.34117-.81
29、731 .17972-1.22357 多元统计分析课程论文 16 -.253651.03184 .20747-.08845 -.49457-.06072 -.74500.43615 3.22335.52164 .50485-.45869 .42401.01485 .28611-.54646 -.41510.06016 -.36320-.11137 -.18266-.84407 -.66388-.38561 -.28825-.35564 -.10091-.00934 -.68152.74660 -.05518.55134 -.24662.19667 1.37567-.14300 1.24975-
30、.95641 -.72426-.26023 -.82272-.83990 -.760554.39367 -.270751.58381 -.76570-.11458 -.54265-.03364 -.44817.47358 -.61700-.84844 -.69844-.95139 -.32645-1.05490 -.32630-.97022 多元统计分析课程论文 17 由因子得分可得出,北京的综合因子得分较高,天津、上海和杭州的总和因子 得分次之。 其他地区的综合得分有为负的, 说明这些省份就的因子得分低于平均分。 多元统计分析课程论文 18 结语 通过以上聚类分析、主成分分析和因子分析三种多
31、元统计方法,对 2012 年我 国 35 个省份的影响房价水平的七项水平进行了深入分析,由此我们可以得出以下 结论: (1)我国 35 个省份的房价水平分为 35 个省份根据这七个指标可以分为四类。 1:北京,上海;2:重庆;3:天津,广州;其他的省份分到第 4 类。从各 个省份的实际指标值看,重庆在七项指标上都与其他省份存在显著差异,归为一类 比较合适。北京和上海的经济比较发达,故其可分为一类。天津和广州差异很小, 故单独归为一类。由此可看出,经济发展情况相近的房价水平相近。 (2)通过主成分分析,我们可以知道,房地产开发投资额、商品房销售面积、 国内生产总值、城乡居民储蓄年末余款、地方财政
32、预算内收入、年末总人口数以及 在岗职员平均工资这七个与房价有关的指标可以降维为两个主成分, 大大减小了对 房价分析的工作量。 (3)由因子分析可得出,与各地房价关系最密切的是房地产开发投资额、国 内生产总值、城乡居民储蓄年末余款和地方财政预算内收入这四个指标,商品房销 售面积、年末总人口数以及在岗职员平均工资所占的比重次之。说明房地产的供求 因素对房价的影响很大,经济因素的影响次之。 多元统计分析课程论文 19 参考文献 1 何晓群 多元统计分析(第三版) 中国人民大学出版社 2 中华人民共和国国家统计局统计数据 附录 x1:房地产开发投资额(亿元) x2:商品房销售面积(万平方米) x3:
33、国内生产总值(亿元) x4:城乡居民储蓄年末余款(亿元) x5:地方 财政预算内收入(亿元) x6:年末总人口数(万人) x7:在岗职员平 均工资(元) 3535 个地区关于房价的数据(个地区关于房价的数据(20122012 年)年) 地区x1x2x3x4x5x6x7 北京 3,153.44 1,943.7417,879.40 21,404.55 3,314.93 1,297.4685,306 天津 1,260.00 1,661.6912,893.887,055.38 1,760.02993.265,398 石家庄833.21768.73 4,500.203,735.50272.28 1,00
34、5.3338,426 太原359.24324.81 2,311.403,021.50215.67365.8448,905 呼和浩特447.99478.18 2,475.601,243.27178.64230.3265,637 沈阳 1,942.96 2,469.65 6,602.604,318.84715.04724.7949,898 大连 1,396.52 1,076.36 7,002.804,160.47750.11590.3154,821 长春649.65908 4,456.602,767.38340.8756.946,673 哈尔滨789.04 1,195.28 4,550.203,320.67354.72993.5341,773 上海 2,381.36 1,898.4620,181.72 19,506.70 3,743.71 1,426.9380,191 南京971.96950.87 7,201.604,465.37733.02638.4863,152 杭州 1,597.36 1,089.62 7,802.006,022.08859.99700.5256,418 宁波884.35590.22 6,582.204,175.96725.5577.7156,255
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年化验员题库及答案详解(必刷)
- 2024-2025学年度执业药师题库【典优】附答案详解
- 2024-2025学年度“安全生产事故隐患排查”知识竞赛经典例题【轻巧夺冠】附答案详解
- 2024-2025学年度注册核安全工程师题库试题(网校专用)附答案详解
- 就合作伙伴合作关系续签的商洽函7篇范本
- 行政文件归档分类模板提升文件管理效率
- 2024-2025学年度护士资格证模考模拟试题及参考答案详解【培优B卷】
- 2024-2025学年度法律硕士考试彩蛋押题及参考答案详解【轻巧夺冠】
- 2024-2025学年公务员(国考)复习提分资料带答案详解(B卷)
- 2024-2025学年反射疗法师3级测试卷【预热题】附答案详解
- 医院反恐防暴演练方案
- 煤矿电力巡线报告范文
- 储能站施工组织设计施工技术方案(技术标)
- 复核申请书格式
- 混凝土搅拌工高级试题库(含答案)
- 软件开发质量保障措施
- 中国古代戏曲
- 口腔颌面部损伤(口腔颌面外科学课件)
- 第3章-WPS电子表格的应用
- DL∕T 5789-2019 绝缘管型母线施工工艺导则
- 二手房买卖意向合同协议
评论
0/150
提交评论