已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
二手房估价问题摘要写得好本文根据问题的条件和要求,在合理的假设之下,对二手房估价问题进行预测并评估,不断优化模型,得出最理想的预估结果。对于分析影响上海二手房价的特征因素问题,运用逐步回归分析方法,对影响房价因素进行筛选。在分析数据后,删除5组偏差较大或不全的数据,通过合理的假设剔除时间、厅室分配这两个可以忽略的因素,简化了模型。数据处理时,通过查阅资料,对18个行政区按照经济发展状况进行排名,并用其作为行政区的量化标准,同时对其余的楼层、朝向、面积、年龄、装修、出行便利、生活配套、学区评分、升值潜力、医疗评分、环境评分这11个因素进行统一量化。数据处理后,利用SPSS求解逐步回归模型,筛选出主要影响因素,剔除出行便利这一因素。得出影响上海二手房价的特征因素为:行政区、楼层、朝向、面积、年龄、装修、生活配套、学区评分、升值潜力、医疗评分、环境评分。对于建立评估上海二手房价的数学模型并估价问题,由于影响二手房价格的因素众多,且因素之间存在复杂的非线性关系,决定使用神经网络模型有特色。根据问题一得出的特征因素建立RBF神经网络模型。对特征影响因素数据进行归一化处理后,随机挑选其中的45组作为神经网络的评测数据检验模型的精确度,剩余的441组数据作为神经网络的训练数据模型验证清楚。调整隐层神经元数、扩展速度、期望误差等参数,让其不断的自我学习训练,得到一个最小最优的网络结构netRBF.mat,该网络结构包含了输入层到输出层的最优映射关系。利用45组评测数据检测该网络结构得到拟合度R2=95.05%,拟合程度高,精确度高,说明模型可靠。并用此模型对题目要求待估数据进行预测,对结果反归一化后得到预估价格。对于模型的评估精度和局限性问题,建立了一套评估体系好的。从两个方面对模型进行评价:一方面是对模型总体回归进行预测,通过四个参数拟合优度检验(R2 )平均平方根误差、平均相对误差、平均绝对误差进行分析;另一方面是对单个样本的偏差进行检验,利用两个参数匹配度(X/Y)、相对误差进行分析。计算得到结果:0.95050.00960.00280.0462由以上数据分析可知,本模型拟合度高,偏差小,整体效果较为满意,具有一定的可靠性,因此可用来评估上海二手房价格。关键字 :逐步回归 SPSS RBF神经网络 归一化处理 MATLAB 拟合检测一、问题重述二手房的价格评估,涉及的不确定因素众多。评估的准确性与评估所采用的方法以及评估人的经验和资料丰富程度密切相关。“估价难”一直是交易过程中存在的一个突出问题。二手房交易时,由于买卖双方的角度和心态各异,结果往往是买卖双方提出的价格相差悬殊,无法成交。因此,确定科学合理的价格评估模式,对二手房的价格进行客观科学准确地综合评估,不仅能提高签约成功率,还有助于减少商业纠纷。影响二手房价格的因素主要有区域因素、个体因素、市场因素以及消费者的心理因素等。其中不仅包括客观因素,如行政区、房型、楼层、朝向、面积、房龄、装修等,还包括与房屋所在小区相关的主观因素。 我们随机抽取了上海市20112013年的500个二手房交易案例,并聘请了5位经验丰富的专家对房产所在小区进行了评分(其中8个案例因地址不详没有评分)计划根据交易系统记录的主要数据、区域评分和实际交易价格来构建一个电子化的二手房价格评估系统。由题目内容需要解决的问题分为三个部分:问题一:根据这些数据分析影响上海二手房价的特征因素。问题二:建立评估上海二手房价的数学模型,利用模型给出附件Excel文件“估价”工作表中的案例的合理价格。问题三:对问题二中的模型的评估精度和局限性作出分析。二、模型的假设1、假设上海近几年里经济发展平稳,政策稳定,即时间对房价影响可以忽略不合理2、假设题目附录给出的数据真实可靠3、假设上海市每幢楼均配备电梯什么意思?4、假设厅室与面积存在很大的关联性,厅室对房价的影响可以通过面积体现三、符号及文字说明(i=112)依次表示行政区、楼层、朝向、面积、年龄、装修、出行便利、生活配套、学区评分、升值潜力、医疗评分、环境评分二手房成交价格随机误差项(i=112)回归系数归一化后的数值待归一化的数值 依次为待归一化的某一列数值的最大值和最小值预测值实测值隐层神经元个数扩展速度期望误差拟合优度检验平均平方根误差平均相对误差平均相对误差匹配度四、问题分析4.1.1问题一的分析从题目可知,影响二手房价格的因素是复杂与多样的。影响二手房价格的因素主要有区域因素、个体因素、市场因素以及消费者的心理因素等。其中不仅包括客观因素,如行政区、房型、楼层、朝向、面积、房龄、装修等,还包括与房屋所在小区相关的主观因素。仅凭定性分析,难以确定哪些特征因素对上海市二手房成交价具有决定性的影响,也很难判定选取哪些影响因素作为自变量建立评估模型。在自变量很多时,其中有对因素可能对应变量的影响不是很大,而且各因素之间可能不完全独立,可能有种种相互作用关系。在这种情况下可用逐步回归分析,进行因素的筛选,挑选出对二手房价格产生决定性影响的主要因素,利用这些因素建立的模型预测效果会更好。 2利用逐步回归分析可以寻找对目标影响低于一定显著度的因素,并剔除这些因素,不断循环,直至所有因素对目标都具有一定的影响度,进一步简化评估模型,使预估价格与目标的拟合度更高,评估结果更精确。利用SPSS软件求解逐步回归模型得出影响上海二手房价的特征因素。4.1.2问题一的模型建立与求解 数据分析处理通过数据分析得出可能的影响因素有时间、行政区、楼层、朝向、面积、年龄、装修、厅室分配、出行便利、生活配套、学区评分、升值潜力、医疗评分、环境评分14个。在相对稳定的政治、经济时期,外部条件一般变化不大,即宏观因素对房地产价格的影响不予考虑,可忽略时间因素的影响。厅室分配与面积的关联性很大,其对二手房成交价的影响可以通过面积来表现,所以在合理的假设下可以忽略厅室因素。通过观察发现附录编号为196、448、275、219对应的面积太大或缺失,以及438号对应的装修数据缺失,这些认为是粗数据,予以剔除清楚。剩余的12个因素里面有定量指标和定性指标,为使各指标在模型体系中具有可比性,需将定性指标量化。在本模型中,定性指标有行政区、朝向和装修,其余的为定量指标。对于定性指标朝向和装修,直接利用题目列表中所分等级排序作为其定量指标,代表其优劣程度排序。而行政区主要是通过经济发展状况不同来影响房价,为了使行政区和目标之间建立一种线性关系,我们通过分析每个区域的房价特点和查找相关资料得出上海市各个区域近几年经济发展状况排名,打分方式与排名成正比直接用排名代替,可以排名如下:排名123456789101112131415161718行政区859162417131210181156314117对于定量指标:1楼层:通过对于数据的观察,我们合理假设房屋都配备电梯,楼层对于成交价的影响是与楼层的大小成正比,其他因素相同的情况下楼层越高价格越高。2面积:其他因素相同的情况下,面积越大成交价越高。3房龄:房龄对于成交价的影响也是线性的,其他因素相同的情况下,房龄越大价格越低。4专家评分标准:出行便利、生活配套、学区评分、升值潜力、医疗评分和环境评分对于成交价的影响与评分标准成正比。将上述12个影响因素数据进行量化,量化后数据见附录1,再建立逐步回归模型,筛选出12个影响因素中的主要因素, 建立逐步回归模型逐步回归分析有模型优化,首先建立因变量y与自变量x之间的回归方程: 5(其中y是二手房成交价格,是随机误差项,(i=112)为回归系数)对方程及每一个变量自变量进行假设检验。当总方程不显著时,表明该多元回归不成立;而当某一个自变量x对y影响不显著,应该把它去除,重新建立不包含该因子的多元回归方程。筛选出有显著影响的因子作为自变量,并建立“最优”回归方程。 求解模型将量化后的数据导入SPSS建立逐步回归模型进行求解,根据原始数据由LINEST函数得出多元线性回归结果,计算各自变量的F检测,设置F分布值进入值大于剔除值,若变量的F值大于所设置的进入值,将此变量选入回归方程 ;当回归方程中变量的F值小于设置的剔除值,则该变量将从回归方程中被剔除。 数据导入SPSS后得出部分结果如下:通过分析以上结果可得,SPSS自动拟合了11次后,剔除出行便利因素。将剔除出行便利的数据和原数据通过matlab中regress函数返回最小二乘的拟合度进行比较,发现两者相差仅0.001,几乎不变,证明剔除此因素的正确性。1最终结果:剔除了(出行便利评分)。根据这些数据分析影响上海二手房价的特征因素为行政区、楼层、朝向、面积、年龄、装修、生活配套、学区评分、升值潜力、医疗评分、环境评分11个。4.2.1问题二的分析利用问题一建立的逐步回归模型得出的结论,剔除出行便利因素,利用行政区、楼层、朝向、面积、年龄、装修、生活配套、学区评分、升值潜力、医疗评分、环境评分这11个主要特征因素建立评估模型。由于影响二手房价格的因素众多,且因素之间存在复杂的非线性关系,某一因素的变动一般都会引起价格波动,这就对估价人员经验丰富程度、数据处理能力提出了较高的要求。估价人员依靠经验,对数据、资料进行处理,测算出评估结果。这种专家大脑思维方式与神经网络的工作方法恰好吻合,因为神经网络有超强的自组织能力、自适应能力和自学习能力,特别擅长从事那些需要同时考虑诸多因素和条件、不精确和模糊的信息处理问题。其基本思想是通过对二手房样本中的影响因素按一定方法进行量化处理得到量化值作为神经网络的输入数据,样本价格作为网络的期望输出,通过样本学习获得有用的知识,从而确定网络的扩扑结构和有关参数,网络结构确定了,则房地产的价格与其影响因素之间的非线性关系就建立起来了。因此,我们可以建立RBF神经网络模型来预测二手房价格。4.2.2问题二的模型建立与求解 基于神经网络模型的二手房估价过程应包括选取训练样本、设计并训练网络模型、预测待估二手房价格等几部分,神经网络进行房地产估价流程如下图自己画的吗?否则一定要标记参考文献:1、训练样本的选择与处理根据问题一中得出的结论,将附录1中数据剔除出行便利这一无关因素,且为了方便RBF神经网络的自我学习,利用归一化公式: 3将剔除无关因素后的数据进行归一化后得到附录2.从附录2中随进抽取45组样本数据作为测试数据,剩余的441组作为训练RBF神经网络的数据。2、网络模型的设计神经网络结构包括三层:输入层、输出层、隐层(即径向基层),如下图所示:4隐节点数(隐层神经元数目)在选取时,通常情况下,应该设计满足精度要求的最小结构的神经网络,以保证神经网络的泛化能力。传统设计方法通常采用OLS算法,但在神经网络规模很大时,该法设计的RBF网络可能会影响其泛化能力。因此,实际上也是通过大量反复实验确定,求解时,编写程序RBF1.m通过枚举法确定隐节点数mn=40。径向基函数扩展常数(扩展速度)在选取时,与隐层神经元数目是有关系的。通常扩展常数越大,需要利用的隐层神经元就越多,训练时间也就越长,这样会造成神经元的冗余,即无法建立最小结构的神经网络,不利用网络训练,而扩展常数的选取,理论上没有明确的规定,只能通过不断的实验找到一个相对较好的扩展速度。求解时,别写程序RBF2.m通过枚举法确定扩展速度sp=1。期望误差在选取时应当通过对比训练确定一个合适的值,所谓合适,是针对所需的隐节点数和训练时间来确定。较小的期望误差要通过增加隐节点以及延长训练时间来获得,通常情况下,可同时对两个具有不同期望误差的网络进行训练,通过对比分析最终确定一个合理的期望误差。本文根据实际训练请款选取训练误差goal=0.0025.3、网络的训练与测试 在所有参数确定后,调用程序RBF.m利用MATLAB神经网络工具箱对训练数据组进行反复学习,最终生成一个网络结构netRBF.mat,即输入层到输出层的映射关系,下图为RBF网络训练过程误差曲线: 1 将测试数据输入此网络结构并反归一后即可得出预估价格,与目标价格对比结果如下图所示:由上图可见,预估价格与实际价格拟合度很高,说明基于RBF神经网络的二手房价格评估是可行的,结果也是相对可靠的。4:待预测二手房估价 由上可知,已建立的神经网络模型精确度很高,因此,可用训练生成的网络结构netRBF.mat对待测二手房的价格进行预估,将待测数据量化和归一化后作为输入层变量进行预测,将结果反归一化后即为预估价格,见下表:编号行政区室厅楼层朝向面积房龄装修出行便利生活配套学区评分升值潜力医疗评分环境评分预测价格110214780123574232504644185.06 282216711763797782948644489.71 3132224710963775819505997344.60 453016793192998688649544287.52 552237104101939393939393409.30 623267137113917588847844450.68 71511117545116132552219957.74 812224610864494279965474345.21 98221779153729181697991463.33 10112157734116131027214480.66 111021366314276275682464466.83 1212221778453646341877078292.01 13922156101152929386279378285.70 14121219573104737398657475176.91 158326613493848478939578522.65 16173226118103545726724387305.02 1722226711853918070588578485.99 18121676813255133495214455.46 1922218712384909396279895538.70 201224687103344642272196133.19 21622678723163610952199208.38 228222879663788779999597542.19 235215751192967348698444195.98 24122247100103816339814344276.83 2510211770103363531274444162.71 2613215770133637381715844184.45 2713228712191698498756381373.88 281721977773574360724086221.53 292227710463626649966375385.08 302221686102777141996495257.71 4.3.1问题三的分析问题三要求我们对问题二中的模型的评估精度和局限性作出分析。就是建立一个衡量模型好坏标准的模型,通过定量分析模型的优缺点。在衡量也测结果的好坏,评价不同方法之间的预测拟合效果时,主要从两个方面考虑:1、 对于预测样本总体,实际预测值序列与实际成交值序列要有较好的相关性。这反映了该方法通过训练后对总体规律的掌握程度。2、 对于单个预测样本,不希望出现太大的评估预测误差,绝对误差和相对误差控制在一定范围内,才能保证方法的实际推广。模型总体回归预测效果检验的标准利用四个参数来说明:拟合优度检验(检验)、平均平方根误差、平均相对误差、平均绝对误差。单个样本的偏差检验标准利用两个参数来说明:匹配度、相对误差。4.3.2问题三的模型的建立与求解鉴于以上分析,本模型选择一下评价指标对神经网络模型进行评价:一、 模型总体回归回归模型还是神经网络模型?预测效果检验1、 拟合优度检验(检验) 拟合优度检验是检验回归方程对样本观测值的拟合度,即检验所有解释变量与被解释变量之间的相关程度。是各个观察值与样本均值之差的平方和,反映了全部数据之前的差异。如果越接近1,则说明回归方程的拟合优度越高,解释能力越强。等于1此时回归方程完全拟合了样本观测值。2、 平均平方根误差该指标是数值预测中用的最普遍的指标。它反映了预测值与实际值之前的差距,反映了预测值与实际输出值之间的离散情况。该值越小,预测结果越好。3、 平均相对误差该指标反映了预测值与实际输出值之间的平均值。这一指标具有较强的直观性,平均相对误差越小,回归预测效果的实用性越好。4、 平均绝对误差该指标反映了预测值与实际输出值之前差值的平均值。这一指标具有较强的实际选用价值,平均绝对误差过大,回归预测效果的应用受到质疑。计算结果:0.95050.00960.00280.0462二、单个样本的偏差检验1、引入匹配度反映预测值和实际值之前的匹配度,匹配度愈接近1,对于单个样本的也测效果越好。2、相对误差体现样本偏差,即,该性能指标反映了绝对误差与实际输入值之间的实际误差情况,用以修正匹配度指标对绝对数值上的体现不足。这一数值过大,拟合效果不佳。计算结果:目标价格预测价格匹配度相对误差101.00 105.32 1.04 0.04 401.00 363.98 0.91 0.09 186.00 169.91 0.91 0.09 426.00 438.39 1.03 0.03 480.00 517.00 1.08 0.08 404.00 426.64 1.06 0.06 508.00 457.63 0.90 0.10 238.00 218.78 0.92 0.08 315.00 287.25 0.91 0.09 312.00 298.48 0.96 0.04 641.00 620.20 0.97 0.03 225.00 226.57 1.01 0.01 466.00 456.73 0.98 0.02 612.00 556.28 0.91 0.09 124.00 116.76 0.94 0.06 777.00 713.30 0.92 0.08 276.00 266.92 0.97 0.03 552.00 510.96 0.93
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多功能包装膜热封机创新创业项目商业计划书
- 《调车长局》试题以及答案
- 复用电动备皮器刀头清洗消毒知识考试试题
- 统编版(2024)二年级上册道德与法治第一单元 过好节假日(第1~4课)教案(表格式)
- 2024年佳木斯市富锦市高校招聘教师真题
- 2025年火星移民计划的工程技术与资源需求
- 排球俱乐部球员转会审核工作方案
- 2025年福建辅警协警招聘考试真题(含答案详解)
- 2025年郴州辅警协警招聘考试备考题库附答案详解(培优)
- 2025年辽阳辅警招聘考试真题附答案详解(轻巧夺冠)
- 财政直接支付管理制度
- 2025至2030年中国电力智能巡检机器人行业市场现状调查及发展前景研判报告
- 2024年广东省清远市事业单位招聘考试《公共基础知识》真题库及答案
- D级压力容器质量管理体系内审资料符合TSG07-2019附录M
- 大数据与会计专业职业生涯规划书3400字数
- 大米加工安全管理制度
- 教师通识考试试题及答案
- DB3502T 141-2024城市道路开口设置指引
- 山东春季高考ps试题及答案
- 舟山市社区工作者招聘真题2024
- 2025下半年中学教师资格证《数学学科知识与教学能力》试卷真题
评论
0/150
提交评论