多元线性回归在影响房地产销售因素分析中的应用_第1页
多元线性回归在影响房地产销售因素分析中的应用_第2页
多元线性回归在影响房地产销售因素分析中的应用_第3页
多元线性回归在影响房地产销售因素分析中的应用_第4页
多元线性回归在影响房地产销售因素分析中的应用_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析课程设计 课程论文标题:多元线性回归在影响房地产销售因素分析中的应用学号113010201021130102012711301020131姓名吴美琳袁铭雪张欣贡献成绩 指导教师陈彩霞日期2016.1.5【摘 要】:依据凯恩斯理论和房地产泡沫理论, 选取当年年人均收入、新增住房面积及上一年商品房价格等三个因素,利用相关分析和多元线性回归分析测度其对商品房价格的影响, 找出了引起房地产价格波动的主要因素当年年人均收入,根据实证结论提出了控制房价的建议。【关键词】:多元线性回归分析;商品房价格,相关分析,多元线性回归,影响因素,F检验,T检验,多重共性线引言 改革开放以来,我国的经济突飞

2、猛进对城市商品房的价格产生了巨大影响,特别是进入21世纪后,伴随着商品房价格日益增长,出现了房地产投资过热。在这种房价居高不下的形势下,国内外诸多专家学者认为我国的房地产市场已经出现价格泡沫,在房地产业对我国国民经济发展起着积极作用的大环境下,这种价格泡沫势必会对我国的经济发展造成重大影响。为了解决这个问题,我国政府逐渐出台相关政策对房地产市场进行宏观调控,整体上看房地产的发展趋势,房地产企业的经营方式将呈现更加规模化、专业化、多样化。根据产品的细分市场、企业的自有资源、外部的政策环境等,各个企业会选择自己合适的经营方式。1.从区域布局上来看,一线品牌房企加速进军二级城市。随着交通枢纽、产业规

3、划的全新布局,中国二级城市将迎来新一轮发展计划,在这样的背景下,二级城市消费力将得到提升。2.从品牌规模来看:过去十年,万科、保利等房地产企业把握住了市场机遇实现了高速发展,企业规模迅速扩大,成为行业巨头。随着调控政策的继续和行业增速的放缓以及土地成本的飙高,这些大型企业的领先优势会更加明显,市场份额逐步上升,一些中小规模的企业受到政策和市场的冲击影响会较大,会逐渐边缘化。3.从开发模式上来看:现在中国房企发展的最大瓶颈依然是金融,资金链成为房企开发项目的最大风险所在。过去10多年来,房地产业为中国的宏观经济发展做出了巨大贡献,这是有目共睹的。尽管出现了房地产过热,出现了经济对房地产的过度依赖

4、,但房地产去经济支柱化之路是不可能一蹴而就的,宏观经济的结构转型也不可能短期就能见到显著成效。国内关于房地产价格的影响因素研究很多,姚先国 等人对地价对房地产价格的影响进行研究,认为地价与房价有联系,但并不成线性关系,居民需求是推动房价上涨的主要原因。y与x的关系图1因变量与自变量的关系图如下,姚大全 认为影响放低产价格的另一因素是土地储备,一方面土地价格影响开发成本,另一方面土地供应机制影响房屋开发总量。黎文江 认为房价与GDP及人均收入挂钩具有合理性,两者是相互影响的关系。需要注意的是,以上都是对单一因素进行了分析。房地产的健康持续发展是市场正常运作的需要,也是经济持续发展的需要,运用统计

5、学等理论方法对影响房价的相关因素进行实证研究是非常必要的,能够为居民消费、投资,政府调控提供依据,对维护广大人民群众利益有至关重要的作用。影响房地产价格的因素有很多,根据影响程度找出主要因素对实行房地产价格的宏观调控有关键意义。本文以中国统计年鉴20002012年相关数据作为分析样本(附表),使用相关分析和多元线性回归分析方法,对选取的当年国民年人均收入、新增住房面积及上一年商品房价格等三个影响因素进行了研究。一、相关因素的选取凯恩斯理论将供给和需求作为决定市场价格的因素,需求分为刚性需求和投机需求,但前提条件是人们有购房的资金,因此将年人均收入作为影响当年房地产价格Y的一个因素X1。而供给方

6、面, 当年新增住房面积X2代表了当前房地产市场的供应量。其次,今年来部分地方政府、开发商对房价进行炒作, 出于投机而买房的现象也大量出现,买房子会在一定程度上依据去年商品房价格X3来预测当前或未来房价的水平,据此来进行商品房交易,影响当前交易量。文章没有考虑购房贷款利率的影响,一方面是因为我国国情,银行贷款利率固定,难以衡量频繁变动的房地产价格。另一方面,当房价上涨带来的即得利益远远高于利率水平的时候,人们可能对利率的变动不甚敏感。因此,本文对年人均收入、当年新增住房面积、前一期商品房价格这些影响因素进行分析,不考虑房地产贷款利率的影响。二、SPSS相关分析(1)散点图检验y因变量分别与xl、

7、x 2、x 3自变量间统计关系的散点图如图1所示。由图可知,y与x1呈强正相关关系(如图1 a),y与X 2呈强正相关关系(如图1 b),y与x 3呈强正相关关系(如图1C)。图1:因变量与自变量的关系图(a) y与x1的关系(b)y与x2的关系 (c)y与x3的关系(2)相关系数检验a、表1对参与相关分析的各变量基本统计信息进行了汇总。由表l可知,商品房均价的均值是2429.5654,标准差是879.18833, 共有13个样本数据参与;人均可支配收入的均值是10986.0769,商品房竣工面积的均值是929.3192。上一年商品房的价格的均值为2216.5385。表1:相关变量汇总表描述统

8、计量N极小值极大值均值标准差x1131756.0022968.0010986.07697342.76598x213266.161603.76929.3192436.68744x3131098.233680.762216.5385836.17618y131248.083867.582429.5654879.18833有效的 N (列表状态)13b、表2对参与相关分析的各变量相关分析结果记性了汇总。有上表可知,商品房均价y与人均可支配收入x1的简单相关系数为0995,与商品房竣工面积x2的简单相关系数为O990。与上一年商品房价格x3的简单相关系数为0999。它们的相关系数检验的概率P值都近似为0

9、。因此,当显著性水平 为005时,都应拒绝相关系数检验的零假设,认为两总体存在线性关系。表2:相关性表相关性x1x2x3yx1Pearson 相关性1.986*.992*.995*显著性(双侧).000.000.000平方与叉积的和6.470E837931318.88173107613.71277068961.495协方差53916212.2443160943.2406092301.1436422413.458N13131313x2Pearson 相关性.986*1.987*.990*显著性(双侧).000.000.000平方与叉积的和37931318.8812288351.048432537

10、6.8864559613.129协方差3160943.240190695.921360448.074379967.761N13131313x3Pearson 相关性.992*.987*1.999*显著性(双侧).000.000.000平方与叉积的和73107613.7124325376.8868390287.1668808656.549协方差6092301.143360448.074699190.597734054.712N13131313yPearson 相关性.995*.990*.999*1显著性(双侧).000.000.000平方与叉积的和77068961.4954559613.1298

11、808656.5499275665.403协方差6422413.458379967.761734054.712772972.117N13131313*. 在 .01 水平(双侧)上显著相关。(3)偏相关分析偏相关分析的目的主要是辨别变量间的虚假相关,剔除其他相关因素影响条件下计算变量间的关系。由下表3可知, 在X 2、X 3作为控制变量的条件下,Y和X 1间的偏相关(如表3a)为0.880,呈正相关关系,说明人均可支配收入X1对当年商品房的平均价格Y有线性影响(如表3b); Y和X3间的偏相关为0.539,呈弱正相关关系,说明上一年商品房价格X3对当年商品房的平均价格Y有弱线性影响(如表3c)

12、; 商品房竣工面积X2对当年商品房均价的偏相关为0.356,呈极弱的负相关关系,该结论与相关分析的结论(简单相关系数为0952)差距甚远,说明当控制了变量XI、X3后,X2就不再对Y有显著线性作用了。表3:相关性控制变量yx1x3x2-无-ay相关性1.000.995.999.990显著性(双侧).000.000.000df0111111x1相关性.9951.000.992.986显著性(双侧).000.000.000df1101111x3相关性.999.9921.000.987显著性(双侧).000.000.000df1111011x2相关性.990.986.9871.000显著性(双侧).

13、000.000.000.df1111110x3 & x2y相关性1.000.539显著性(双侧).087df09x1相关性.5391.000显著性(双侧).087.df90a. 单元格包含零阶 (Pearson) 相关相关性控制变量yx3x2x1-无-ay相关性1.000.999.990.995显著性(双侧).000.000.000df0111111x3相关性.9991.000.987.992显著性(双侧).000.000.000df1101111x2相关性.990.9871.000.986显著性(双侧).000.000.000df1111011x1相关性.995.992.9861.0

14、00显著性(双侧).000.000.000.df1111110x2 & x1y相关性1.000.880显著性(双侧).000df09x3相关性.8801.000显著性(双侧).000.df90a. 单元格包含零阶 (Pearson) 相关。三、回归分析1、多元线性回归分析简述:在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。 多元线性回归的基本原理和基本计算过程与一元线性回归相同,但由于自变量

15、个数多,计算相当麻烦,一般在实际中应用时都要借助统计软件。这里只介绍多元线性回归的一些基本问题。但由于各个自变量的单位可能不一样,比如说一个消费水平的关系式中,工资水平、受教育程度、职业、地区、家庭负担等等因素都会影响到消费水平,而这些影响因素(自变量)的单位显然是不同的,因此自变量前系数的大小并不能说明该因素的重要程度,更简单地来说,同样工资收入,如果用元为单位就比用百元为单位所得的回归系数要小,但是工资水平对消费的影响程度并没有变,所以得想办法将各个自变量化到统一的单位上来。前面学到的标准分就有这个功能,具体到这里来说,就是将所有变量包括因变量都先转化为标准分,再进行线性回归,此时得到的回

16、归系数就能反映对应自变量的重要程度。这时的回归方程称为标准回归方程,回归系数称为标准回归系数,表示如下:Zy= 1Z*1 + 2Z*2 + + kZ*k,估计方法:普通最小二乘法(Ordinary Least Square, OLS)普通最小二乘法通过最小化误差的平方和寻找最佳函数。通过矩阵运算求解系数矩阵;广义最小二乘法(Generalized Least Square)广义最小二乘法是普通最小二乘法的拓展,它允许在误差项存在异方差或自相关,或二者皆有时获得有效的系数估计值。其中,是残差项的协方差矩阵。优点:回归分析法在分析多因素模型时,更加简单和方便;运用回归模型,只要采用的模型和数据相同

17、,通过标准的统计方法可以计算出唯一的结果,但在图和表的形式中,数据之间关系的解释往往因人而异,不同分析者画出的拟合曲线很可能也是不一样的;回归分析可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果;在回归分析法时,由于实际一个变量仅受单个因素的影响的情况极少,要注意模式的适合范围,所以一元回归分析法适用确实存在一个对因变量影响作用明显高于其他因素的变量是使用。多元回归分析法比较适用于实际经济问题,受多因素综合影响时使用。缺点:有时候在回归分析中,选用何种因子和该因子采用何种表达 式只是一种推测,这影响了用电因子的多样性和某些因子的不可测性,使得回归分析在某些 情况下

18、受到限制。做回归预测时需要分析的数据往往是多变量的,那么我们在做多元回归时就需要特别注意了解我们的数据是否能够满足做多元线性回归分析的前提条件。应用多重线性回归进行统计分析时要求满足哪些条件呢?总结起来可用四个词来描述:线性、独立、正态、齐性。自变量与因变量之间存在线性关系,这可以通过绘制”散点图矩阵”进行考察因变量随各自变量值的变化情况。如果因变量Yi 与某个自变量X i 之间呈现出曲线趋势,可尝试通过变量变换予以修正,常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。各观测间相互独立任意两个观测残差的协方差为0 ,也就是要求自变量间不存在多重共线性问题。对于如何处理多

19、重共线性问题,请参考多元线性回归模型中多重共线性问题处理方法残差e 服从正态分布N(0,2) 。其方差2 = var (ei) 反映了回归模型的精度, 越小,用所得到回归模型预测y的精确度愈高。e 的大小不随所有变量取值水平的改变而改变,即方差齐性。 2、建立回归模型通过以上分析,建立多元线性回归模型:Y=X1+X2+X3+。其中,Y表示商品房平均价格,X1 表示人均可支配收入,X2 表示商品房竣工面积,X3表示上一年商品房价格。3、回归方程的拟合优度检验由表4,调整的判定系数为0995,接近1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。表4:模型汇总b模型

20、RR 方调整 R 方标准 估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改1.999a.998.99841.54026.9981788.78339.0001.785a. 预测变量: (常量), x3, x2, x1。b. 因变量: y4、 回归方程的显著性检验依据表5可进行回归方程的显著性检验,显著性水平:为005, 由于概率P值小于,认为各回归系数不能同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。表5:Anovab模型平方和df均方FSig.1回归9260135.06233086711.6871788.783.000a残差

21、15530.34191725.593总计9275665.40312a. 预测变量: (常量), x3, x2, x1。b. 因变量: y5、回归系数的显著性检验由表6可知,变量X1,X2 的回归系数显著性t检验的概率P值大于显著性水平,因此,不应拒绝零假设,认为回归系数与零无显著差异,被解释变量Y与解释变量x 的线性关系不显著。表6:系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)368.332114.6113.214.011x1.027.014.2221.920.087.01472.092x2.207.181.1031.141.283.02343.4

22、87x3.711.128.6775.562.000.01379.518a. 因变量: y6、共线性检验从表7来看,第4个特征根既能解释人均可支配收入的99,也可解释上一年商品房价格的99 ,因此有理由认为这些变量间存在多重共线性:第3、4个条件指数大于1O,说明变量间的确存在多重共线性。表7:共线性诊断a模型维数特征值条件索引方差比例(常量)x1x2x3113.8261.000.00.00.00.002.1704.745.04.01.00.003.00335.997.10.39.88.014.00160.058.86.60.12.99a. 因变量: y7模型的修正通过以上分析可知,回归方程存在

23、一些问题,应重新建立回归方程,采用向后筛选策略完成解释变量的筛选。表8中说明每个模型中各解释变量的偏回归系数显著性检验的情况。显著性水平为O05,前两个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。第三个模型是最终的方程,P小于,因此表4 回归分析结果(强制进入策略)人均可支配收入与被解释变量间的线性关系显著,模型是合理的。最终的回归模型y=654.797+0.231xl。表8:8残差检验由图2可知,标准化残差分布不存在线性关系,可以认为残差满足了线性模型的前提要求。有表9中数据可知,库克距离绝对值小于3,标准化残差绝对值小于3,不存在强影响点。分析结果表明,人均可支配收入对

24、商品房价格产生主要影响,年人均收入可支配收入每增加一个单位就会使商品房价格增加0231个单位。表9:残差统计量a极小值极大值均值标准 偏差N预测值1251.27933929.51122429.5654878.4520013残差-61.9312448.89600.0000035.9749213标准 预测值-1.3411.707.0001.00013标准 残差-1.4911.177.000.86613a. 因变量: y图2:四、结语本文分析结果显示:居民年可支配收入是影响房地产价格的一个关键因素,年收入过高会导致富余的资金流向房地产市场,推动房价上涨,导致一部分人收入过高的直接原因就是收入分配不均问题。另外,收入分配不均的问题下,低收入人群的购房需求多为刚性需求,而高收入人群的投

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论