版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、- -基于R语言的上海房价预测模型摘要:利用R语言优秀的统计计算和统计制图特点,对多元统计模型进行分析。本文建立的模型主要是讨论上海商品房房价问题。考虑到商品房经济始于1998年,且可供查找的数据截止到2011年,故本文的数据来源于1998-2011年的上海统计年鉴和国家统计局。在本文中主要讨论影响上海商品房房价的因素及各个因素对于房价的影响作用,考虑到房地产不同于一般的消费品,它不仅提供居住的功能,带来收租收益,发生价值增值,而且对人的行为有重要的影响,因此,在进行预测自由贸易下的房价时,本文主要从人均生产总值、人均可支配收入、商品零售价格指数、常住人口、住房竣工面积、住宅投资总额、居民居住
2、消费价格指数7个方面来考虑对于商品房房价的影响。本文在建模型时,先通过R软件拟合商品房房价与时间的非线性回归模型,再利用7个自变量与因变量商品房价多元线性关系,并进行逐步回归,得到最优回归模型。最后将时间的非线性回归模型与影响因素的多元线性模型预测值进行比较,给出2012、2013、2014年的房屋价格,其中2012年与2013年可与实际进行对比,进而评价模型的好坏。关键词:R语言非线性回归多元线性回归价格预测模型显著性检验第一章分析软件R语言简介R语言是属于GNG系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和统计制图的优秀工具。主要用于统计分析、绘图的语言和操作环境。R本来是由
3、来自新西兰奥克兰大学的RossIhaka和RobertGentleman开发(也因此称为R),现在由“R开发核心团队”负责开发。R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。R的语法是来自Scheme。R的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同时有人开发了几种图形用户界面。R的功能能够通过由用户撰写的套件增强。增加的功能有特殊的统计技术、绘图功能,以及编程介面和数据输出/输入功能。这
4、些软件包是由R语言、LaTeX、Java及最常用C语言和Fortran撰写。下载的执行档版本会连同一批核心功能的软件包,而根据CRAN纪录有过千种不同的软件包。其中有几款较为常用,例如用于经济计量、财经分析、人文科学研究以及人工智能。第二章商品房房价与时间的非线性模型数据准备本文从研究影响房地产价格的因素入手,鉴于国家在1998年出台停止福利分房,进而促进了的商品房的自由贸易,故数据始于1998年,且上海统计年鉴可查的到2011年年鉴,故通过综合国家统计局及上海市年鉴1998年2011年的房地产相关数据,最后筛选出如下可能影响未来房地产价格走势的变量,本文取定七个因素:x:人均生产总值;x:人
5、均可支配收入;x:商品零售价格指数;x:常1234住人口;x:住房竣工面积;x:住宅投资总额;x:居民居住消费价格指数;567y:上海商品房房产均价m数据如下:tyx1x2x3x4x5x6x71998302125206877341521527.001963.51404.96113.619993176270711093240401567.001731.55378.82105.920003326300471171838951608.601724.02443.90103.320013659317991288338401668.331743.9466.71102.3200240073395813250
6、37901712.971880.5584.51100.020034989384861486737541765.842280.79694.30101.120046385448391668337881834.983270.43922.61101.620056698496481864537671890.262819.35936.36102.920068237548582066837741964.112746.8854.15102.9200710292620402362338652063.582843.62853.13104.5200813411669322667540712140.651899.48
7、71.52102.5200915800691652883840482210.281522.07922.8196.6201019276760743183841172302.661415.441232.96103.5201124595825603623042842347.461581.031403.13105.42.2建立非线性模型首先对y画出关于时间t的散点图,对应的R语言程序为:X=read.csv(E:2.csv)attach(X)plot(t,y)得到图一:1998200020022004200620082010t由散点图可知,初步认为y与t成指数关系,利用R语言进行拟合检验。m- - -
8、对指数函数y=aebt两边取自然对数得:lny=Ina+bt,令y=lny,a=Ina则mm1m1可将其化为一元线性函数y二a+bt对y取对数并进行一元线性回归的R语言11m程序为:yl=log(ym)al=log(a)reg=lm(y1t)summary(reg)得到结果如下:腌RConsoleI=|回Call:lM(fo22niulaL=ylt4ResidaslB:MinIQMedian3QMax-1.395e-13-1.057e-146.60Se-152.419e-145.532e-14Coefficients:EBtiir.dteStd.Errort-vslae(Intexcept)一
9、3603e-l:365E+13t1.6Ble-013.296e-155.099e+132e-16Signif.codes:00.0010.010.05J0.11R亡sidaalstandarderror972e-lon12d亡qh亡亡日of:E工亡亡dono.MultipleR-sqjiared:1,AdjustedR-sq口atireid.:1F-statistic:2.6e47on1and1DFfp-vdlae:Residuals:37-3u3HinIQedzan-5237-23212DE百匚口eftieiant3:Em匚Imaze3匸d.Error匸valuePr(匸|)rnrercep
10、n)XlxZx3x7-4.725e0-3-今.2e-011259=-0J5g7c0(J9312=001-630e-013758=H-0CI曹.222E-+011.975e+042239e-01S.204?-012104+00l05=十Cd丘.739=-Dl17B8=十DOZIOIe+DI-2.3930.053B4-01DA653,923000773*2,92O.0311G&0.S570.421130.220Slt|IIntercept卜-3a135e+043a-659e-bO3-ea5692-65e-05Xl2829e-ai7-241S-02-39070004502A-frx2:L220C+Q
11、O937e-Ql6.1090000227曲E881e-k0a1832e+00312E001411E*4-133e+00l-131e-FaO500000807-6A-fr3-856e+016-llle-bai06310545618Signifcodes:Q,毙足!ft*0.0-310.011I0057ResidualSLandaLXClerrcr:383on8degreesfreedamMultipleR-squared:CL998fAdjustedR-squared:05967F-statistic:on5andSDF,p-value:1438e-10继续剔除x,7Reg4=lm(ymx1+x
12、2+x3+x6)summary(reg4)得到如下结果:11:Im(fcizml3L=*Xl4x24-x3Rrsiduals-HinTIQ-632.02-7E.96.E4205.2S3SD.33Coefficicnts:EsLima匸eSLdErrorcvaluePrOlEl)(Intercept-3.136e+O3,535e+03-8.073勺.59e-0Kl53B=-O15-3356-02-4.705D001213126=十QCI1237e-017501D7e-0SxS6916=+00苦.SSfe-Ol7.77427Se-05KBr535e-l-O05,5716-01今.73EDOOlOf
13、iSignifcdes:05D011*J30百13.J111Residualscaxidarderxcx:3757OH9degree3工needomMultipleR.-squared:Q.勺?79尸AdjustedR-squared:-statistic:10S1ar.4and殳DFpvalues5072e-12盘RConsoler对结果整理得:B0B1B2B3B6估计值标准差T值P值-3.136e+043.535e+03-8.8739.59e-06*-2.538e-015.395e-02-4.7050.00111*1.126e+001.287e-018.7501.07e-05*6.916e
14、+008.896e-017.7742.78e-05*4.538e+009.577e-014.7380.00106*对系数进行显著性检验,由结果可知,P,P,P,P,P在=0.05条件下,01236、II丨均拒绝原假设,认为具有很好的效果。对方程进行检验,残差的标准差为375.7而相关系数R2=0.9969,P值小于0.05,效果明显,故拒绝原假设,即认为y与各个变量之间存在多元线性回归关m系。3.3模型的总结通过三次逐步回归,则最终得到最优的多元线性模型为:y=31360-0.2538*x+1.126*x+6.916*x+4.538*xTOC o 1-5 h zm1236从该模型分析可知,在所
15、选的因素中,x:人均生产总值;x:人均可支配12收入;x:商品零售价格指数;x:住宅投资总额等因素被保留了下来,而x:364常住人口;x:住房竣工面积;x:居民居住消费价格指数被剔除,特别是x574- -和x本应该对房价产生直接影响,通过分析可知,上海市住房竣工面积并不是逐5年增加或减少等的规律性变化,呈现无规律性,这导致它在作为影响因素发挥的作用大大减小,而x为何也被剔除,在我的能力范围内,分析认为可能是因为其4随时间变化缓慢造成的。第四章房价预测及模型的对比评价指数方程预测房价故本文共得到两个预测模型及其预测值为:y关于t的指数方程为:m亍=(3.220924e-143)*exp(0.16
16、81*t)m对ym进行预测的R语言程序为:tt=2012:2014yy=a*exp(b*tt)yy三年的预测值为:20122013201424765.3329298.7534662.03多元线性回归预测房价y关于影响因素的多元线性回归模型:my=-313600.2538*x+1.126*x+6.916*x+4.538*xm1236在国家不出台政策的条件下,我们假设7个自变量按照符合实际的增长率增长,依次求出未来三年的各项数据。自变量增长率2012年2013年2014年人均生产总值10%9081699897.6109887.4人均可支配收入10%3985343838.348222.1商品零售价格
17、指数2%4369.74457.14546.2住宅投资总额7%1501.351606.441718,89带入回归方程,则可得多元线性方程预测的三年房价的值为:20122013201427499.3530763.2434245.12预测模型的对比评价通过收集实际数据,与两个预测模型进行对比,可对预测的结果进行评价得到结果如下:两个模型预测房价与实际房价的对比201220132014实际房价2569129537(截止到5月)无时间指数模型预测值24765.3329298.7534662.03与实际的偏差比例3.6%6.6%无多因素回归模型预测值27499.3530763.2434245.12与实际的
18、偏差比例6.5%4.2%无则可知,指数模型和多因素线性回归模型均得到较好的预测值,预测偏差均非常小。根据房价时间模型,房价将随着时间呈指数增长之势,因此必须出台相关政策,有效抑制房价增长。根据多元线性模型,房价与各个自变量的正负相关性就是各个变量前系数的正负。要抑制房价的增长,可以通过使系数为正的自变量增长率减少,系数为负的自变量增长率增加来达到目的。比如可以通过中央人民银行对于贷款利率的增加,减少投资者的过度投机行为,使土地拍卖价格降低,直接降低房屋成本,同时贷款利率的增加减少了房地产商的贷款,使房地产商资金面收紧,迫使其降价卖出现有房屋,已达到回笼资金偿还原来贷款的目的。总结学习的心得是:学习一个软件,并将其应用于实践,可以快速提高软件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全员电气安全培训课件
- 全员安全生产培训计划课件
- 问心剧中的医患关系
- 安全与员工幸福讲解
- 职业发展规划决定未来
- 人工智能高效学习方法
- 社工面试技巧应用场景
- 光电技术教学课件
- 当前就业前景分析
- 2025-2026学年广东省深圳市高三(上)期中语文试卷
- 《上帝掷骰子吗:量子物理史话》【超星尔雅学习通】章节答案
- YS/T 254.5-2011铍精矿、绿柱石化学分析方法第5部分:氟量的测定离子选择电极法
- GB/T 4457.2-2003技术制图图样画法指引线和基准线的基本规定
- GB/T 39433-2020气弹簧设计计算
- GB/T 28756-2012缆索起重机
- GB/T 20659-2017石油天然气工业铝合金钻杆
- 爱学习-爱劳动-爱祖国- 课件 主题班会
- 华师大版九年级下册数学全册优秀教学课件
- 科技论文写作-课件
- 罗马尼亚工业园一览表
- 能源科学概论
评论
0/150
提交评论