数学建模-sample.doc_第1页
数学建模-sample.doc_第2页
数学建模-sample.doc_第3页
数学建模-sample.doc_第4页
数学建模-sample.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于特征价格理论的二手房估价模型摘要本文针对由区域因素、个体因素、市场因素等特征因素对上海二手房价产生的影响,根据题目表格所给数据进行处理与统计分析,以住宅特征价格理论、虚拟变量替代多分类变量、多元回归分析、时间序列等方法为基础,(1)建立了二手房价格评估的对数线性形式的特征价格模型(HPM),并依此为基础,(2)估计了“估价”表中案例的合理价格,(3)通过四级检验分析了该模型的评估精度,(4)对模型的局限性作出理性分析。针对问题(1),首先引入虚拟变量代替表格所给数据中的各特征变量(多分类变量),然后通过研究住宅特征价格理论,建立了特征价格模型,在遵循边际效用递减规律的前提下,改进为对数线性形式的特征价格模型,再通过spss的逐步回归分析与matlab线性回归拟合曲线,得到如下对数线性形式特征价格模型对数?的关系式:其中,P表示房价,xi ( i=1,2,19 )为各影响因素对应的虚拟变量。针对问题(2),将“估价”表中的特征变量化为对应虚拟变量,再代入(1)中所得公式,估计出这些案例的合理价格。针对问题(3),根据(1)中求解出的方程、相应的matlab及spss结果,通过经济意义检验、统计检验(R2检验,F检验,t-检验)、模型预测检验,并分析相对误差与方差,得到了该特征价格模型“通过以上四级检验,可用于经济结构分析、经济预测”的结论。针对问题(4),主要考虑政策、季节等时间序列因素对(1)中所得模型的影响有特色,将三年的房价转化为共12个季度的平均价格,再通过各时间序列因子对房价的影响,分析价格波动的原因。关键词 特征价格理论(HPM) 虚拟变量 多元回归分析 时间序列1、 问题重述 根据住房参与流通的时序结构,住房市场可以分为一级市场和二级市场。二手房的价格评估,涉及的不确定因素众多。评估的准确性与评估所采用的方法以及评估人的经验和资料丰富程度密切相关。“估价难”一直是交易过程中存在的一个突出问题,因此确定科学合理的价格评估模式,对二手房的价格进行客观科学准确地综合评估,不仅能提高签约成功率,还有助于减少商业纠纷。影响二手房价格的因素主要有区域因素、个体因素、市场因素以及消费者的心理因素等。其中不仅包括客观因素,如行政区、房型、楼层、朝向、面积、房龄、装修等,还包括与房屋所在小区相关的主观因素。我们随机抽取了上海市20112013年的491个有效二手房交易案例,并聘请了5位经验丰富的专家对房产所在小区进行了评分,计划根据交易系统记录的主要数据、区域评分和实际交易价格来构建一个电子化的二手房价格评估系统。现需研究以下4个问题:(1) 建立评估上海二手房价的数学模型;(2) 利用模型给出附件Excel文件“估价”工作表中的案例的合理价格;(3) 对该模型的评估精度作出分析;(4) 对该模型的局限性作出分析。二、 模型假设2.1、所有家庭的偏好类似,买卖双方的主观偏好不影响房屋价格;2.2、假设20112013年的房价不受通货膨胀和房市变化的影响;与后面不符2.3、假设楼房总楼层对房屋价格无影响与后面矛盾了;2.4、假设经验丰富的专家评分客观公正。3、 符号说明1、客观变量(分类变量) x1, x2, x3:行政区。 内环:x1=x2=x3=0; 中内环: x1=x2=0, x3=1;中外环: x1=x3=0; x2=1; 外环以外: x1=1,x3=x2=0 x4, x5, x6,x7:楼层。低层:x4= x5= x6=x7=0;多层:x4= x5= x6=0,x7=1;中高层:x4= x5= x7=0,x6=1;高层:x4= x6= x7=0,x5=1;超高层:x4= 1,x5=x6= x7=0 x8, x9, x10:装修。 毛坯:x8=x9= x10=0; 普通装修: x8=x9=0, x10=1;精装修: x8=x10=0; x9=1; 豪华装修: x8=1,x9=x10=02、主观变量 x11:出行便利; x12:生活配套; x13:学区评分; x14:升值潜力; x15:医疗评分; x16:环境评分; x17:房龄; x18:面积; x19:朝向; P: 房价。四、数据预处理1、 对于附件Excel文件中数据异常或缺失的数据,编号196、275和448为面积列数据异常,编号219为面积项数列缺失,编号438为装修列数据缺失,由于这5个数据占总体数据的比例很少,可使用个案剔除法进行处理,直接去掉这5个数据。加分2、 根据上海内环中环外环图1,将18个行政区分为4类,行政区4-虹口、5-黄浦、8-静安、9-卢湾为内环,行政区2-长宁、13-普陀、16-徐汇、17-杨浦、18-闸北为中内环间,行政区1-宝山、10-闵行、11-南汇、12-浦东为中外环间,行政区3-奉贤、6-嘉定、7-金山、14-青浦、15-松江为外环以外,分别赋值为1、2、3、4。3、 根据民用建筑设计通则2,楼层分为5等级,低层为13层,多层为46层,中高层为79层,高层为1029层,超高层为30层及以上,分别赋值为1、2、3、4、5。4、 由于朝向为南北和朝南的房子采光、通风俱佳,所以将通风采光性能好的朝向6-南北、7-南的分为一类。而附件Excel文件中数据朝向为15类的数据较少(仅为15例),无需再分类,故将其余通风采光性能差的5类朝向1-北、2-东北、3-东、4-西南、5-东南分为另一类,分别赋值1、0。5、 对于一般情况下,处理如面积、房龄、专家评分等量纲不同的变量时,需要现将其标准化,消除量纲,再进行分析。但从后文分析可以看出对面积、房龄、专家评分进行标准化对matlab检验数R2的影响不大,故对其不进行标准化。5、 模型建立与求解(1) 评估上海二手房价的数学模型1.1、问题分析本题所要求解的是评估上海二手房价的数学模型,通过分析附件Excel文件“数据”工作表数据,可以得出其中自变量很多,所以首先对行政区、楼层、朝向、装修进行分类处理,分类标准可以参见表1.1,附录中表1.2为分类处理后的数据。表1.1 变量选取及其量化用表格很清楚序号变量变量的量化量化方式1行政区分为4等级,行政区4-虹口、5-黄浦、8-静安、9-卢湾为内环,行政区2-长宁、13-普陀、16-徐汇、17-杨浦、18-闸北为中内环间,行政区1-宝山、10-闵行、11-南汇、12-浦东为中外环间,行政区3-奉贤、6-嘉定、7-金山、14-青浦、15-松江为外环以外,分别赋值1、2、3、4分等级赋值2楼层分为5等级,低层为13层,多层为46层,中高层为79层,高层为1029层,超高层为30层及以上,分别赋值为1、2、3、4、5。分等级赋值3朝向6-南北、7-南为1,1-北、2-东北、3-东、4-西南、5-东南为0虚拟量化4装修分为4档:毛坯、普通装修、精装修、豪华装修,分别赋值1、2、3、4分等级赋值1.2、模型建立1.2.1、住宅特征模型的函数形式3参考文献标注规范在竞争性市场的均衡条件下,住宅购买者所支付的价格应当补偿其各种属性所能带来的舒适度。已假设所有家庭的偏好和收入水平类似,那么这个市场所有住宅的价格就应当是这些属性的一个函数,这就是住宅的特征价格模型(hedonic price model,简称HPM)。我们采用对数线性形式(log-linear) (1-1) 式中,P为研究对象的价格;a0表示除特征变量所引起价格变化外,所有其他影响价格的常量之和;ai为住宅特征变量;bi表示特征变量的特征价格似乎有误;表示误差项。自变量采用线性形式,因变量采用对数形式,则回归系数对应着特征价格与产品总价格之比。1.2.2、多元线性回归模型4一般的,影响实验指标的因素有多个,假设它们之间有如下线性关系式:y= b1x1+ b2x2+ bpxp+ (1-2)其中N(0,2).令=(b1,b2,bp)T ,x=(x0,x1,xp),表示为 y=x+.现获得y和x0,x1,xp的n组观测值,要求的估计值。设Y和X分别为相应n组观测值的n1和nk矩阵,即Y=(yi)n1,X=(xij)np (1-3)则的估计值为 (1-4)1.2.3虚拟变量模型5虚拟的通常使用方法是,对一些通常表明“品质”或“属性”是否存在的属性变量,将其量化,给其赋值为“1”或“0”来表示虚拟变量出现某种属性和未出现某种属性。为了区分两个类别,只引入一个虚拟变量Di。一般规则是:如果一个定性变量有m个属性值,则仅引入m-1个虚拟变量。设某个回归模型含有p个数量变量和一个品质变量,该品质变量可以有k+1个(k1)水平,据此,可建立以下回归模型: (1-5)其中xi,p+1 ,xi,p+k为k个引入的虚拟变量,并且需要拟合的回归方程为 (1-6)通常情况下,该方程能较好地通过线性性检验,弥补仅用数量变量拟合的不足。1.2.4、模型求解由于数据中定性自变量可以取多类值,我们初步设想引入多个0-1自变量,使用虚拟变量(0-1变量)代替分类变量好的,对于一般情况,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量。数据预处理的行政区、楼层、装修用虚拟变量(0-1变量)来代替,变量及其虚拟变量可见表1.3,附录中表1.4为虚拟变量处理后的数据。表1.3 变量及其虚拟变量序号变量虚拟变量虚拟变量间相互关系1行政区x1, x2, x3内环:x1=x2=x3=0; 中内环: x1=x2=0, x3=1;中外环: x1=x3=0; x2=1; 外环以外:x1=1,x3=x2=02楼层x4, x5, x6,x7低层:x4=x5=x6=x7=0;多层:x4= x5= x6=0,x7=1;中高层:x4= x5= x7=0,x6=1;高层:x4= x6= x7=0,x5=1;超高层:x4= 1,x5=x6= x7=03装修x8, x9, x10毛坯:x8=x9= x10=0; 普通装修: x8=x9=0, x10=1;精装修: x8=x10=0; x9=1; 豪华装修: x8=1,x9=x10=0使用matlab运用逐步回归判断模型中众多变量哪些对整体影响不显著,但由于有19个变量因素,使用matlab做逐步回归时所得结果表太长,不利于分析,所以改用spss做逐步回归,根据运行结果,由表1.5可以看出变量x4, x6, x7,x10,x13对整体影响不显著,故在模型中忽略这5个变量缺少解释。表1.5 已排除变量模型Beta IntSig偏相关共线性统计量容差x4.004n.259.796.012.865x6.012n.802.423.037.865x7-.006n-.398.691-.018.798x10.024n1.030.304.047.385x13.020n.911.363.042.429使用matlab对剩余的14个变量做回归拟合(程序见附件),最后得到拟合方程没有用到Hedonic: (1-7)(二)利用模型给出附件Excel文件“估价”工作表中的案例的合理价格2.1、问题分析本小题中的附件Excel文件“估价”工作表给定了30组待估价的案例,要求给出其案例的合理价格,即为第一小题关于上海二手房价的数学模型应用的一种情况。由题目给定的数据,在确定房屋各个评价因素的情况下,估计二手房屋的合理价格,因此利用第一小题构建的数学模型,由题目给定的数据确定房屋价格的具体数值。2.2、问题求解对于“估价”工作表中出现的“室”和“厅”列,由于题目所给案例数据表中没有相应列,无法进行数据检验,考虑进入以后模型的精确性进行分析,故暂且忽略这两列数据。将附件Excel文件“估价”工作表中给定的30组待估价的案例分别代入第一问构建的数学模型: 可以得到对应的二手房价格(程序见附件),估计价格如表2.1所示。表2.1 30组案例的估计价格编号估计价格编号估计价格编号估计价格编号估计价格(万元)11689434175082514425001012618116262043390111251957227362427412294201812822753951332921151293526450142482248130263786155552315983061632424254对30组案例中编号前三个估价进行实际分析,来初步检验模型的精度最好是用已知价格的案例检验。对于编号1,行政区在中外环间,装修为精装修,面积较小,房龄较长,各项专家评分均属于中等,故符合价格较低的结果。对于编号2,行政区在内环,装修为精装修,面积较大,房龄中等,各项专家评分均属于较高,故符合价格较高的结果。对于编号3,行政区在中内环间,装修为精装修,面积较大,房龄中等,各项专家评分除学区评分较低外其余均属于中等,故符合价格中等的结果。上述对编号1、2、3的初步分析可以看出估计价格符合实际情况,对30个案例估价的合理性和评估精确详细分析见第三小题-对该模型的评估精度作出分析。(三)对该模型的评估精度作出分析3.1问题分析对于第一小题相应的matlab及spss结果和建立的数学模型,及第二小题得到的估计价格,我们针对模型的评估精度分析和检验,可以对模型的适用性和应用前景有更好的认识,也可以验证第二小题给出的估价是否符合实际情况。3.2分析方法3.2.1经济意义检验主要检验模型参数估计量在经济意义上的合理性,其表现为检验求得的参数估计值的符号与大小是否合理,是否与根据人们的经验和经济理论所拟定的期望值相符合。如果不符,则要查找原因和采取必要的修正措施,重新建立模型。只有当模型中的参数估计量通过所有经济意义的检验,方可进行下一步检验。模型参数估计量的经济意义检验是一项最基本的检验,经济意义不合理,不管其他方面的质量多么高,模型也是没有实际价值的。 在本线性回归模型中,其中,x1,x2,x3,x17对应系数符号均为负号。其中x1,x2,x3表示行政区,在以内环为标准的时候,距市中心越远,价格降低程度越大。(类似的可解释x5,x8,x9,x19对应系数符号为正)。x17表示房龄,在不考虑拆迁的情况下,显然房龄越大,价值越低。房屋竣工后即进入折旧期,按照理论折旧率,混合一等结构房屋折旧期限为50年,每年的折旧率为2,与本模型求出的2.49%基本一致。 x11,x12,x14,x15,x16均为评分,显然分数越高,价格越高,故x11,x12,x14,x15,x16对应系数符号为正。x18表示面积,显然面积越大,价格越高;x19表示朝向,朝南以及南北朝向采光效果较好,为购房者首选,故x18, x19对应系数符号为正。解释得很有道理!3.2.2统计检验6统计检验是由统计理论决定的,目的在于检验模型的统计学性质。它是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验。主要包括拟合优度检验、方程显著性检验、变量显著性检验等。(1)拟合优度检验 ( R2检验)拟合优度检验是检验回归方程对样本观测值的拟合程度,即检验所有解释变量与被解释变量之间的相关程度。检验的方法是构造一个可以表征拟合程度的指标,这个指标是通过对总变差(总离差)的分解而得到。误差平方和分解: SST=SSE+SSR总误差平方和SST: 代表直接用y的均值来估计y时的误差(即bi=0时)残差平方和SSE: 代表用回归模型不能解释的那部分误差回归平方和SSR: 代表用回归模型可以解释的那部分误差好的模型就是要使得SSE尽可能小,SSR尽可能大。R2统计量:R2=SSR/SST表明模型能解释的信息比例. R2越接近1, 说明模型越显著。由 matlab 模拟得到R2= 0.9021,y的90.21%可由模型确定 。结果:通过拟合优度检验。(2)方程显著性检验 ( F检验)方程显著性检验就是对模型中解释变量与被解释变量之间的线性关系在总体上是否显著成立作出推断。即检验被解释变量Y与所有解释变量x1, x2,,xk之间的线性关系是否显著,方程显著性检验所应用的方法是数理统计学中假设检验。检验的原假设H0与对立假设H1分别为:H1:只少有一个不为零。应用数理统计理论可以证明:S回与S残相互独立,且当为真时,S回与S残分别服从自由度为k、n-k-1的分布,故有: (3-1)即F统计量服从以(k,n-k-1)为自由度的F分布。本题中,k=14,n=19,a=0.05,查表可得:F=309.9470 F0.05(14,6) =5.87结果:通过方程显著性检验。(3)变量显著性检验 ( t-检验)检验和F检验都是将所有的解释变量作为一个整体来检验它们与被解释变量Y的相关程度以及回归效果,但对于多元回归模型,方程的总体显著性并不意味每个解释变量对被解释变量Y的影响都是显著的。如果某个解释变量并不显著,则应该从方程中把它剔除,重新建立更为简单的方程。所以必须对每个解释变量进行显著性检验。等价于对每个解释变量检验假设其中j=0,1,2,k。应用数理统计理论可以证明:当为真时,统计量服从自由度为(n-k-1)的t分布,即: (3-2)其中j=0,1,2,k。 在给定的显著性水平下:若,则拒绝H0,说明解释变量xj对被解释变量y有显著影响,即xj是影响y的主要因素;反之,接受H0,说明解释变量xj对被解释变量y无显著影响,则应删除该因素。此部分已经通过spss的逐步回归给出。 结果:通过变量显著性检验。(4)相对误差与方差 相对误差见“精度”一表,409个数据结果相对误差0.05,最大不超过0.15,模型可靠。由 matlab 模拟得到误差方差= 0.0393,很小。3.2.3模型预测检验 预测检验主要检验模型参数估计量的稳定性以及相对样本容量变化时的灵 敏度,确定所建立的模型是否可以用于样本观测值以外的范围,即模型的所谓超样本特性。具体检验方法为: 利用扩大了的样本重新估计模型参数,将新的估计值与原来的估计值进行比较,并检验二者之间差距的显著性说了,但没有做。 将所建立的模型用于样本以外某一时期的实际预测,并将该预测值与实 际观测值进行比较,并检验二者之间差距的显著性。由于本题估计表中未给出实际价格,故仅作定性分析。以标号为7,15,28为例。7号:行政区在外环之外,装修为毛坯,面积较小,各项评分除环境因素外,其余均较低。故符合价格较低的结果。15号:行政区在内环,装修精美,面积较大,朝向极佳,各项评分均较高。故符合价格较高的结果。28号:各项评价指标都处于中间水平,装修、朝向较好,但面积较小。故符合价格适中的结果。(四)对该模型的局限性作出分析4.1、问题分析由于在模型假设中假设20112013年的房价不受通货膨胀和房市变化的影响,第一小题建立的上海二手房价的数学模型中,没有考虑政策、交易时间、房市冷热、买卖双方心理对二手房交易价格的影响,我们现在单独考虑交易时间对价格影响的大小,可以对模型的局限性有更好的认识。4.2、分析方法我们将附件Excel文件“数据”工作表的上海市20112013年的房价通过计算转化为12个季度的平均价格,可以得到表4.1。表4.1 交易季度价格季度交易均价(万元)季度交易均价(万元)2011 1st3.182012 3rd3.142011 2nd3.172012 4th2.882011 3rd2.722013 1st3.312011 4th2.972013 2nd3.482012 1st3.062013 3rd3.502012 2nd3.102013 4th3.60由表4.1可以看出交易时间对交易价格有一定的影响,20112012年房价呈波动状态,2013年房价持续提升,通过查阅房地产最新“国五条”和“沪四条”7等资料可以分析出价格波动受政策、交易时间、房市冷热的影响,而我们在模型中没有考虑,这是模型的一个局限性。能注意这点,还是要鼓励的六、模型的评价与改进(一) 模型的优点:1、该模型是在遵循边际效用递减规律的前提下,将线性的特征价格模型改进为对数线性形式的特征价格模型,提高了模型的精确度。2、模型中引入虚拟变量代替多分类变量,提升了模型的合理性。3、用四级检验评估模型,极好的验证了模型的连贯性、相关性和类推性。(二)模型的不足 本论文若能够在以下方面做进一步的深入研究,则将会有更大的现实推广意义:1、卧室与客厅的数量会对房价产生影响。但由于题目所给数据表中没有给出室、厅的数量,因此无法提升“估计”表中案例价格的精确度;2、未能将时间因素考虑在内。我们考虑将时间因素加入模型来提高精度。由于时间和篇幅原因,就不在这里详细讨论。七、参考文献1 未知作者 上海内环中环外环图 /topicsh/wedding201105/images/360280.jpg 2014.05.182 中国建筑标准设计研究所,建设部标准定额司 民用建筑设计通则 /view/9e858e4d767f5acfa1c7cd92.html 2014.5.143 鲁海燕 州市住宅二级市场及其特征价格研究 /view/b278010d52ea551810a6876c.html 2014.5.164胡良剑,孙晓君 MATLAB数学实验 高等教育出版社 20095 未知作者虚拟变量在金融和经济中的作用/link?url=4pgjECVhv5bDeUSt_X4RH9esIf-ql_qHFMv2AIRqAcJnAwZIzluw7SnTjM2oJPTM6LvJh8y1W30eZDH0Duh3-YXn7H5_ffsrSFhRtS-PIRW 2014.5.186 刘京娟 多元线性回归模型检验方法 /view/1dd6c08271fe910ef12df8ba.html 2014.5.187 未知作者 房地产最新“国五条”和“沪四条”/link?url=vCorLbWYnFHFN5ibctbYDOUR_NY8V8N5ueU18cZHVr-xPHrHKzqxPLoJQkyLoCc9405CSnmDcat9-n54OhH122N9jT-WxrBb-bR-sDvb_Di 2014.5.18八、附录表1.2 分类处理后的数据(由于案例数据很多,只选择前50个案例,全部数据见附件)编号成交日期行政区楼层朝向面积房龄装修出行便利生活配套学区评分升值潜力医疗评分环境评分成交价格12011-5-162111167392646947457541722011-6-172417314264798582754416132012-6-92311087360764198678439442013-10-12221445281466570434410552012-10-213217610116132227217413562011-9-1625110611491758884784431272011-9-31217011387818992969132582013-10-223401135356385261624429792013-12-1241012731162424276044104102013-4-1041014643161310272144114112013-1-524112153656660577785480122013-8-2141012054162630272185139132013-6-21410993216242427604478142011-8-53409453323856276186225152012-8-14409431571310792199139162012-8-2223193113858575996477273172013-6-2314111463747386278682530182011-4-221163162284871664944117192013-10-244109214451326822144217202011-6-2644013921162410902182130212013-6-734110063443331492144249222012-9-2531086103585763934179220232012-5-21241138113918580278493437242012-12-2024199103375229587197260252011-5-192213823490858563594494262013-10-142209563787537516644230272013-5-221191132576367276485233282013-3-2314190103699041958299364292013-5-2934112173476294277184393302013-5-32119694738198628944305312012-9-262419862775819505997294322012-4-163419641411327932199174332011-8-511110153918899969081394342012-12-233209131447684528744148352

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论