




免费预览已结束,剩余15页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2015年“高信杯”青岛科技大学大学生数学建模竞赛题 目 基于多元线性回归的青岛市房价预测模型 摘 要随着我国住房制度的商品化改革,我国住宅产业蓬勃发展,逐渐成为影响国计民生的重要产业之一。本文针对青岛市住宅房地产的价格问题,首先对影响房价的各个因素进行统计分析,然后对各个影响因素进行相关性分析,再建立合适的房价模型并检验,最后对房价进行灰色预测。针对问题一,本文对青岛市2006-2013年的商品房平均销售面积、房地产开发投资额、地方财政一般预算收入、GDP、市区人口、人均消费性支出、居民可支配收入、人均住房面积、恩格尔系数、竣工房屋面积的相关数据与商品房平均销售价格进行相关性分析,得出数据间的Person系数和显著性水平,进一步去除内在相关性强的数据指标,最终得到四个比较独立的影响指标:人口、GDP、人均住房面积、竣工房屋面积。针对问题二,把与商品住宅价格有强联系的四个影响指标作为自变量,把商品住宅价格作为因变量,建立多元线性回归模型,通过spss软件得到非标准化系数,得到模型方程,以及他们对价格影响的大小。进一步分析回归结果与实际房价的误差,检验模型,最终证明模型合理可行,结果精良。针对问题三,本文通过灰色预测模型对四个影响指标分别进行未来5年预测分析,把预测结果代入房价模型中,得到2006-2018年的房价数据, 2006-2013年数据与实际数据吻合很好,未来房价仍保持上升趋势。关键词:青岛市住宅价格;相关性分析;多元线性回归;灰色预测一、问题重述随着青岛市城市化进程的推进,城市住宅投资规模不断扩大,住宅销售面积 逐年增加,住宅价格下一步如何增长?这一问题对政府、企业和广大市民具有普 遍的现实意义。 在此背景下,请借助网络搜集青岛市近年来经济发展和房地产销售的相关数据,以青岛市住宅房地产的价格为研究对象,探讨住宅价格的走势及主要影响因素通过实证的方法来检验分析的结果。同时,建立起科学合理的房价模型,为政府调控、企业经营和购房者投资提供帮助,保障我市住宅产业健康、持续的发展。根据题意,本文需要解决的问题有:1、搜集影响房价的因素,通过相关性分析确定青岛市房价的主要影响因素。2、分析主要影响因素的特征,建立科学合理的房价模型。3、预测住宅价格走势。二、模型假设假设1:假设本文只研究住宅体系中的商品住宅,不考虑占比例很少的经济适用房和廉租房。假设2:假设没有严重自然灾害、经济危机等不可抗因素的影响。假设3:假设在讨论房价受相关因素影响时,不考虑消费者的心理因素 。 假设4:假设在讨论房价受相关因素影响时,不考虑非正常需求而引起房价上涨的因素 ,如炒房行为、政府政策等。 三、符号说明变量含义人口人均住房面积(平方米/人)GDP(亿元)竣工房屋面积(万平方米)商品房平均销售价格(元/平方米)四、问题分析通过分析本文将问题分成下列三个问题:1、分析查找影响青岛市住宅销售价格的可能因素,遴选出主要影响因素。2、以主要影响因素为自变量建立科学合理的房价模型。影响房价指标分析相关性分析选取主要影响因素预测住宅价格走势模型检验多元线性回归建立房价模型3、通过房价模型预测住宅价格走势。分析流程图z首先影响房价的因素涉及生活,生产,政府政策的方方面面,本文打算从GDP、房地产投资总额、地方一般性财政预算收入、居民可支配收入、商品住宅销售价格、居民消费性支出、恩格尔系数、市区人口、城市人均居住面积、竣工房屋面积、房屋平均销售面积这十一个因素分为需求和供给两个方面分析影响房价的主要因素。通过相关性分析或者主成分分析方法得到与房价相关性高的因素,进一步剔除内在相关的因素,最终得到主要的相互比较独立的影响因素。在主要影响因素的基础上,考察尽可能多的数据,建立多元线性回归模型,得到房价模型,并通过各种检验方法检验模型的合理可行性。 最后预测住宅价格走势,本文选择未来5年2014-2018年的数据增长情况,首先需要预测各个主要影响因素,针对不同的影响因素的规律特征,有灰色系统预测、时间序列、回归拟合等不同的预测方法,比较各种预测方法的优缺点,选取对应合适的预测方法。将最终预测结果带入房价模型中,即可得到未来5年的房价结果,并检验模型的准确性。五、影响因素分析影响房价的因素是多种多样的,我们就供给和需求两个方面分析一下影响青岛市房价的主要因素。需求因素人口GDP人均住房面积恩格尔系数人均消费性支出居民可支配收入竣工房屋面积房地产开发投资额地方财政一般预算收入商品房平均销售面积供给因素5.1在需求方面的主要因素包括:1.城市人口数量:城市人口的数量会直接影响到城市住房的需求量,它会通过供给关系的市场规律而影响房价。2.国内生产总值:即GDP,是衡量国民经济发展的总体标准,是商品住宅活动的主要影响因素,GDP值增长速率快说明社会经济发展水平高,对住宅的需求高,也就是说GDP与住宅需求呈正相关。3.人均居住面积:人均居住面积是很多不可量化因素的综合体,比如国家的各种政策法规,经济发展水平,人们的购房换房欲望等。在人们具备购买的前提下会对人均住房面积产生影响,决定人们对住房的需求。4.恩格尔系数:恩格尔系数即食品消费支出与居民消费支出总额的比值。恩格尔系数越小,就说明这个地区经济发展越发达,居民对住宅的购买能力就越强,对房屋的需求就越大。5. 居民可支配收入:居民可支配收入的高低直观的反映了人民的平均收入水平,从而决定了商品住宅市场的需求大小。可支配收入与住宅需求呈正相关。6. 居民消费性支出:居民消费性支出包括食品消费性支出,居住消费性支出等,居民的年人均可支配收入与其消费性支出占其年的可支配收入的比例越小,其具备购买商品住宅的能力越大。表格 1 需求影响因素数据年份商品房平均销售价格(元/平方米)人口(万人)GDP(亿元)人均住房面积(平方米/人)恩格尔系数人均消费性支(元)居民可支配收入(元)20064,249.06749.383183.1823.7336.4119451532820075,200.55757.993750.1623.7237133761785620085,094.00761.564401.5626.8337.4149992046420095,576.00762.924853.8726.7138.5160802236720106,576.00763.645666.1927.4237.7175312499820117,495.44766.366615.627.6737.5192972856720128,056.09769.567302.1127.8636.5203913214520138,435.00773.678006.629.136.52206035227图一 需求因素走势图5.2在供给方面的主要因素包括:1.商品房平均销售面积:住宅的实际销售面积直接反映了我国城镇居民对住房的需求,当经济发展迅速,人均可支配收入水平增加的时候,消费者购买能力就增强,消费者对住房的需求就增加,那么实际销售面积也会增加。 2.地方财政一般预算收入:房地产与地方财政具有同向的变动关系,房地产业的繁荣带动了相关税收的增长,财政收入也随即增加。3. 房屋的竣工面积:在完全竞争的房地产市场中,房屋的竣工面积直接影响到住房的供求关系。如果当年的住房竣工面积量大,房屋的供应量大,在需求不变的情况下,住房的价格会上升。4. 房地产开发投资额:房地产开发投资额可以直接影响房地产的供给,如果年度开发投资额多,房地产供应量就会增加。往往投资额增加会导致房价下降。表格 2 供给因素数据表2006-2013年年份商品房平均销售价格(元/平方米)地方财政一般预算收入(亿元)竣工房屋面积(万平方米)房地产开发投资额(万元)商品房平均销售面积(万平方米)20064249.06 225.77 654.22 2683631.00 718.41 20075200.55 292.58 640.70 3223547.00 833.29 20085094.00 342.44 671.49 3805652.00 770.30 20095576.00 376.99 814.24 4594829.00 1261.86 20106576.00 452.61 1020.51 6024387.00 1360.69 20117495.44 566.00 924.76 7827193.00 1029.91 20128056.09 670.18 1211.57 9301099.00 950.92 20138435.00 788.72 957.34 10485299.00 1160.16 *数据来自青岛市统计年鉴图二 供给因素走势图5.3影响因素的相关性分析相关性分析是一种讨论变量之间相关程度的统计分析方法。在相关性分析中,所有变量是被同等看待的,也就是说自变量与因变量是不予以区分、不考虑因果关系的,并且所有变量都假定为随机变量。本文运用SPSS软件对搜集的数据进行相关性分析,在商品房平均销售价格、商品房平均销售面积、GDP、人均住房面积、人均消费性支出、居民可支配收入、恩格尔系数地方财政一般预算收入、竣工房屋面积、房地产开发投资额这十一个因素与因变量(即商品住宅销售价格)的相关程度从高到低依次排列,排列顺序为:GDP、房地产开发投资额、居民可支配收入、人均消费性支出、地方财政预算收入、市区人口、竣工房屋面积、人均住房面积、销售面积、恩格尔系数。运行处理之后得到的数据整理结果见表格4。表格 3相关性分析结果销售价格人口销售面积GDP人均住房面积恩格尔系数.928*0.489.990*.852*-0.197销售价格地方财政预算收入人均消费性支出居民可支配收入竣工房屋面积房地产开发投资额.981*.983*.986*.853*.988*. 在 .01 水平(双侧)上显著相关。*. 在 0.05 水平(双侧)上显著相关。将这十一个影响因素进行两两因素之间的相关性分析,找出与商品住宅销售价格相关程度较高的自变量,并排除掉与这几个自变量相关程度较高的其余次要的变量。其中,销售面积、恩格尔系数与商品住宅销售价格的关系不明显,不相关的可能性超过了5%,所以最先排除掉房屋销售面积、恩格尔系数这两个因素;地方性财政预算收入、房地产开发投资额与住宅销售价格的相关程度高,而且房地产开发投资额与商品住宅销售价格的相关性大于地方性财政预算收入这个因素与商品住宅销售面积的相关性,所以排除地方性财政预算收入这两个因素;同理,居民可支配收入GDP相比也是应该被排除的因素。由于人均消费支出、房地产开发投资额与GDP的相关程度高,而GDP与商品住宅的销售价格的相关性高于人均消费支出、房地产开发投资额与住宅价格的相关性,所以排除人均消费支出、房地产开发投资额这两个因素。相关数据见表格4。表格 4两两因素相关性分析GDP人口销售面积GDP人均住房面积恩格尔系数.947*0.5061.908*-0.165GDP地方财政预算收入人均消费性支出居民可支配收入竣工房屋面积房地产开发投资额.991*.997*.999*.842*.993*所以,通过上面的数据分析可以得出影响青岛市商品住宅销售价格关键因素是:GDP、市区人口、人均住房面积、竣工房屋面积。六、房价回归模型的建立与求解假定在分析某一因素对房屋价格的影响时,其他影响因素对房价的影响基本不变。从住宅需求角度分析了GDP、居民可支配收入、居民消费性支出、恩格尔系数市区人口、人均居住面积六个方面;从住宅供给角度分析了商品房平均销售面积、地方财政一般预算收入、房屋竣工面积、房地产开发投资额四个方面。根据网络搜集的数据得到近几年的一些数据指标,并采用多元线性回归模型来考察影响房价变化的一些主要因素。6.1模型准备多元线性回归模型回归分析中最简单的形式是,均为标量,为回归系数,称一元线性回归。它的一个自然推广是为多元变量,形如 (1),或者更一般地 (2)其中,是已知函数。这里对回归系数是线性的,称为多元线性回归。不难看出,对自变量作变量代换,可将(2)化为(1)的形式,所以下面以(1)为多元线性回归的标准型。在回归分析中自变量是影响因变量的主要因素,是人们能控制或能观察的,而还受到随机因素的干扰,可以合理地假设这种干扰服从零均值的正态分布,于是模型记作 (3)其中未知。现得到个独立观测数据,由(3)得 (4)记, (5),(4)表为 (6)6.2建立多元线性回归模型与求解通过对青岛市商品住宅市场需求量影响因素的相关性分析,得出对青岛市商品住宅需求量因变量影响程度较大的四个自变量,分别为竣工房屋面积,人口,人均住房面积,GDP。将销售面积定义为因变量Y,将人口、人均住房面积、GDP、竣工房屋面积四个变量分别定义为X1、X2、 X 3、 X 4。建立模型通过数据拟合来计算系数、,求解模型,见表格5表格5系数计算模型非标准化系数标准系数TSig.B标准 误差试用版1(常量)-14922.07825126.680-.594.594人口28.86935.008.139.825.470人均住房面积-243.55197.863-.307-2.489.089GDP.958.1671.0765.733.011竣工房屋面积.542.672.072.807.479a. 因变量: 商品房平均销售价格得出房价模型表达式为:运用建立的模型预测房价使用建立的多元线性回归模型计算出的价格并与实际价格比对,数据见表格6。表格 6 多元线性回归模型结果年份人口(万人)人均住房面积(平方米/人)GDP(亿元)竣工房屋面积(万平方米)住宅销售价格预测价格误差%2006749.38 23.73 3183.18 654.22 4249.06 4336.38 -2.01 2007757.99 23.72 3750.16 640.70 5200.55 5123.22 1.51 2008761.56 26.83 4401.56 671.49 5094.00 5109.57 -0.30 2009762.92 26.71 4853.87 814.24 5576.00 5688.74 -1.98 2010763.64 27.42 5666.19 1020.51 6576.00 6426.60 2.32 2011766.36 27.67 6615.60 924.76 7495.44 7301.88 2.65 2012769.56 27.86 7302.11 1211.57 8056.09 8161.11 -1.29 2013773.67 29.10 8006.60 957.34 8435.00 8514.87 -0.94 6.3多元回归模型的检验6.3.1回归方程的显著性检验对回归方程的显著性检验就是要看自变量X1、X2、XP从整体上对随机变量Y是否有明显的影响,显著性检验有两种方法:一是回归方程显著性的F检验,二是回归系数显著性的t检验。这里仅对F检验进行论述,t检验原理相同。F检验原假设H0假定自变量系数1=2=P=0当所构造F检验统计量FF(n-p-1)时拒绝原假设,认为回归方程显著;或P=PFFn-p-1时,拒绝原假设,回归方程显著。选定显著性水平,利用SPSS软件计算出的方差分析表如表3所示。表格7方差分析表模型平方和df均方FSig.1回归16427437.63444106859.409118.811.001a残差103699.061334566.354总计16531136.6957a. 预测变量: (常量), 竣工房屋面积, 人口, 人均住房面积, GDP。b. 因变量: 商品房平均销售价格从表3可知,显著性P值(即表中Sig值)小于0.05,因此拒接原假设,回归方程线性回归效果显著。6.3.2拟合度的检验拟合度用于检验回归方程对样本观测值的拟合程度,其值越大说明随机误差所占的比重越小,回归的效果越显著。可决系数也称拟合优度定义为:通产定义r为相关系数:它描述了指标变量与解释变量之间的线性相关程度。与值越接近1,说明回归方程对样本观测值拟合得很好,表8所示为模型相关系数值。表格8模型相关系数表模型RR 方调整 R 方标准 估计的误差1.997a.994.985185.92029a. 预测变量: (常量), 竣工房屋面积, 人口, 人均住房面积,GDP。由表8可知,模型相关系数,修正后的可决系数,说明回归方程对样本观测值的拟合程度很高。6.4结果分析由以上多元回归模型建立过程可知,对影响指标变量青岛市商品住宅价格Y的各个因素进行了样本线性相关筛选与逐步回归F检验筛选,最终确定影响青岛市商品住宅价格的四个主要因素:人口X1,人均居住面积X2,GDP值X3,竣工房屋面积X4。得到回归方程:其中,相关性系数。模型估计结果说明,在其他变量不变的情况下,人口每增加X1,商品住宅销售价格就增加28.869X1;在其他变量不变的情况下,人均住房面积每增加X2,商品住宅销售价格就减少243.551X2;在其他变量不变的情况下,GDP每增加X3,商品住宅销售价格就减少0.985X3;在其他变量不变的情况下,竣工房屋面积每增加X4,商品住宅销售价格就会增加0.542X4。模型经检验,符合理论上的有效性,可以尝试使用该回归模型预测青岛市将来商品住宅的价格,为制定相关政策方案提供一定的参考。七、房价灰度模型的建立与求解在上述的由多元线性回归建立的房价模型中,考虑了四个主要影响因素:人口,人均住房面积,GDP,竣工房屋面积。通过对四个因素分别进行预测带入模型中的到房价预测结果。由于数据的不完全的原因,数据量少,针对这一特点,本文采用灰色预测模型进行预测。7.1模型准备-灰色预测模型记原始数据序列为非负序列其中,为了得到一组新生成的数据,能弱化原始数据的随机性,使原来的数据明显接近指数关系规律,需用1AGO生成一阶累加生成序列,其相应的生成数据序列为其中为的紧邻均值生成序列其中,称为GM(1,1)模型,其中,b是需要通过建模求解的参数,若为参数列,且则求微分方程的最小二乘估计系数列,满足 称为灰微分方程,的白化方程,也叫影子方程。其中称为发展灰数;称为内生控制灰数。7.2建立模型与求解对新的参考数列进行一次累加,得到。构造数据矩阵B及数据向量Y。计算 ,得到四个主要影响因素的a,b值,见表格1。表格 9 四个主要影响因素的a,b值人口人均住房面积GDP竣工房屋面积a值243640.3993.629162.68384.7b值-242890.3-970.3-26097.5-7809.6建立模型,分别得到四个影响因素的灰色预测模型,见表格2。表格 10 四个影响因素的灰色预测模型影响因素灰色预测模型人口人均住房面积GDP竣工房屋面积四个主要影响因素数据预测结果:年份人口(万人)人均住房面积(平方米/人)GDP(亿元)竣工房屋面积(万平方米)2006749.3823.733183.18654.222007758.4624.753763.92626.452008760.1625.804398.73764.932009762.5326.454984.27829.302010764.9027.125647.75899.082011767.2827.816399.55974.742012769.6628.517251.421056.762013772.0629.238216.701145.682014774.4629.979310.461242.092015776.8730.7310549.821346.612016779.2931.5111954.161459.932017781.7132.3113545.441582.782018784.1433.1315348.551715.967.3灰色预测模型的检验 适用范围 当时,可用于中长期预测;当时,可用于短期预测,中长期慎用;当时,短期预测十分慎用;当时,应采用残差修正;当时,不宜采用灰色系统预测模型。由表一数据可知,四个主要影响因素的a值分别为243640.3、993.6、 29162.6、 8384.7,均满足,因此可用于中长期预测。 后验查检验 设残差序列和分别是残差的均值和方差,和分别为的均值和方差。则后验差比值,小误差概率,其中C越小越好,p越大越好。表格 11 精度检验等级参考表指标评价Cp一级好0.350.95二级合格0.500.80三级勉强0.650.70四级不合格0.800.60得到最终四个影响因素的后验差比值和小误差概率以及对应的精度检验评价,见表格4。表格 12 四个影响因素的精度检验评价影响因素人口人均住房面积GDP竣工房屋面积C值0.13850.3230.07280.5418p值1110.75精度检验好好好合格 残差检验按预测模型计算 并将累减生成然后计算原始序列与的绝对误差序列及相对误差序列。, , 在建立模型后,还必须对模型进行精度检验,其检验标准见表5。表格 13精度检验等级参照表精度等级相对误差 一级(优)0.01二级(良)0.05三级(合格)0.1四级(不适用)0.2表格 14 四个影响因素预测值与实际值对比表年份实际人口(万人)预测人口(万人)实际人均住房面积(平方米/人)预测人均住房面积(平方米/人)实际GDP(亿元)预测GDP(亿元)实际竣工房屋面积(万平方米)预测竣工房屋面积(万平方米)2006749.4749.423.723.73183.23183.2654.2654.22007758.0758.523.724.83750.23763.9640.7626.42008761.6760.226.825.84401.64398.7671.5764.92009762.9762.526.726.54853.94984.3814.2829.32010763.6764.927.427.15666.25647.71020.5899.12011766.4767.327.727.86615.66399.5924.8974.72012769.6769.727.928.57302.17251.41211.61056.82013773.7772.129.129.28006.68216.7957.31145.7表格 1 四个影响因素的相对误差表(%)年份20062007200820092010201120122013人口0.000.06-0.18-0.050.160.120.01-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 探索Photoshop设计的无限可能性试题及答案
- 计算机WPS理解与应用试题及答案
- 现代软件测试的挑战与策略试题及答案
- 备考必读 税法试题及答案
- WPS操作能力试题及答案回顾
- 汉语知识综合运用试题及答案
- 汉语考试冲刺阶段的准备试题及答案
- 理解2025年逻辑考试的趋势试题及答案
- 现代汉语表达中的逻辑问题试题及答案
- 学会Photoshop中设计海报的布局技巧试题及答案
- 环境保护和水土保持保证体系框图
- 【审计工作底稿模板】FH应付利息
- 眼部健康检测与分析课件
- 专业硕士学位论文修改报告(二)
- 苏州市建设工程造价计价解释
- 煤矿机电设备春季预防性检修计划
- 2017年山东、临沂爆炸事故案例分析
- 工贸企业安全管理台账资料
- 三方协议书(消防)
- S771(一) 水力循环澄清池
- 高密度电法探测及数据处理解释--答辩
评论
0/150
提交评论