




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于多维多规则云模型的上海市普通住宅基于多维多规则云模型的上海市普通住宅 定价及实证研究定价及实证研究 鲁东大学 樊思维 王文杰 梁绍倩 目 录 1 1 问题的提出问题的提出 1 1 2 2 研究思路研究思路 2 2 3 3 数据分析数据分析 3 3 3 13 1 定价体系的选取及假设定价体系的选取及假设 3 3 3 1 1 定价体系的选取 3 3 1 2 若干假设 4 3 1 3 符号的约定 4 3 23 2 基于双对数回归模型的剔除性最小二乘法分析基于双对数回归模型的剔除性最小二乘法分析 5 5 3 2 1 剔除性最小二乘法模型的引入 5 1 双对数回归模型的构建 5 2 剔除性最小二乘法的引入 6 3 2 2 剔除性最小二乘法模型的定义及变量假设 6 3 2 3 剔除性最小二乘法模型的构造及本案例中的应用 7 1 模型的构造 7 2 在本案例中的应用及分析 9 3 33 3 双对数回归模型双对数回归模型 1111 3 43 4 多维多规则的云预测模型多维多规则的云预测模型 1414 3 4 1 云模型引入及概述 14 1 云模型引入 14 2 云模型概述 14 3 4 2 多维云的定义及分类 14 1 多维云概述 14 2 多维云的分类 16 3 4 3 多维云模型在本案例中的应用 17 1 定量到定性的转化 17 2 五维多规则逆向云发生器的实现 19 3 五维多规则生成器的实现 19 3 53 5 模型对比分析模型对比分析 2222 3 5 1 模型的对比 22 3 5 2 模型的优点及不足 22 3 5 3 模型的改进及建议 23 4 4 结论与建议结论与建议 2323 附录附录 2424 参考文献参考文献 3232 摘 要 针对于上海房地产定价体系的问题 根据上海房地产的实际现状 我们从 供求原理的角度来选取定价指标 在建立预测模型时 考虑到在进行多元回归 分析 选取的变量可能具有多重相关性 且变量过多时系统可能会自动排除掉 一些具有重要解释意义的量 于是 我们引入了剔除相关性最小二乘法 在排 除了多重相关性后 剔除出相关性较大的自变量 进行相关分析 从定量的角度考虑 我们应用了简单的双对数多元回归分析 应用基于剔 除相关性最小二乘法选取出的相关性较大的一些自变量 建立双对数模型进行 分析 从定性的角度考虑 根据定量与定性相互转化的方法 我们认为房价的产 生是随机的 而房价高低的概念是模糊的 依据这些考虑 我们融随机性与模 糊性为一体 在运用剔除相关性最小二乘法选取变量的条件下 引入一个多维 多规则云模型 使之在定性和定量相结合的基础上 解决房价的预测 并与双 对数回归分析结果进行比较 得出更为准确的房价预测模型 模型在构建的过程中 我们运用了 SPSS19 0 及 Matlab2009 来实现有关上 海房地产定价的实证研究 本文的创新之处有三点 1 在定价指标选取的方面 我们不是根据经验直接选取 首先从供求原 理的角度来选取 再根据这些指标的数据特点并结合实际进行筛选 2 在数据分析方面 针对于传统模型筛选变量的不足 引入了剔除性最 小二乘法 实证表明基于剔除性最小二乘法的回归模型要优于传统多 元回归模型 3 在数据预测方面 基于剔除性最小二乘法的分析 引入了多维多规则 云模型进行预测 从定量与定性相互转化的角度 解决预测数据的模 糊性与随机性问题 使研究更具有科学性 关键词关键词 多维多规则云模型 剔除相关性的最小二乘法 房地产 定价体系 1 1 问题的提出 房地产市场的健康发展与否关系到国家经济发展 同时与老百姓的生活更 是息息相关的 房价成为人们越来越关注的焦点 就上海而言 经过二十多年 的改革及发展 上海房地产也走出了多年的调整期 呈现持续繁荣的状态 显 然房价过高已成了不争的事实 国家也已经开始着手于房价的调控 那么房价 的高低到底是有什么决定的呢 虽然房地产业已经得到了足够的重视 但是对 于房地产定价模型和方法的研究却没有像房地产市场那样得到应有发展 早期文献选取的宏观经济变量指标比较单一 一般认为从长期看房价与宏 观经济步调保持一致 房价是由宏观经济因素决定的 较为经典的有 Clapp 和 Giaccotto 1994 利用简单回归分析 认为宏观经济的变化对于房价有很好的 预测能力 Quigley 1999 采用了平衡确定价格的模型 认为宏观经济基本面 的相关指标可以解释房价的变化 宏观经济因素对于房地产市场短期的影响不 大 但是长期的影响显著 Miki Seko 2003 通过利用计量模型分析出日本各 地区的住宅价格和经济基本面有着比较强的相关性 可以预测房地产市场的发 展 Dipasquale 和 Wheaton 2002 采用存量流量模型来分析房地产业发展对国 民经济增长具有明显的拉动效应 而且 大多相关研究采用了简单线性回归模型和 VAR 模型 还有 DSGE 模型 简单线性回归模型无法避免因素之间的多重相关性 变量太多时可能会 剔除重要变量 会使模型在整体上不够精确 VAR 模型不依赖具体的经济理论 直接对数据的动力性质进行分析 结构参数的估计是不稳定的 DSGE 模型则 建立在坚实的经济理论基础之上 从而避免了卢卡斯判断 但是以实际数据不 完全匹配 由这些我们发现这些研究均存在着不足的地方 需要进行进一步的讨论 于是我们引入了双对数模型以及云预测模型 特别是云预测模型几乎没有在房 地产价格方面应用 本文通过对比双对数模型以及云模型与实际房价的拟合度 尝试拓展云模型的应用范围以及为房价预测提供新的思路 2 2 研究思路 基本概念及房地产文献研究 前人研究的不足 之处 构建定价 指标体系 结论与建议 剔除性最小二乘法分析 双对数模型 多维多规则 云模型 3 3 数据分析 3 1 定价体系的选取及假设 3 1 1 定价体系的选取 在选取指标时 我们从供求原理出发 从影响供给和需求两个方面来刻画 房价 从供给的角度出发 影响供给方的主要因素是成本和对房价的预期 以及 宏观因素中的物价指数 因此我们在选用描述供给指标的时候 我们从这些方 面入手 土地成本投入是房地产商成本投入的一大部分 因此 我们选用土地 交易价格指数来刻画成本的一个方面 投资额的增加也意味着成本的增加 在 上海 随着国际化的日益加深 越来越多的外资涉足上海房地产市场 并且其 在投资总额中所占的比重越来越大 所以汇率和对房价的预期也是对成本的一 个重要影响因素 对于国内的房地产商而言 企业的贷款利率会在一定程度上 影响着其贷款额 所以 企业贷款利率也是不得不考虑的因素 为了用来描述 投资商或供给商对于房价的预期这一因素 我们选取了房地产景气指数和新建 住宅价格指数来从宏观和微观共同刻画 从需求 1 的角度来看 需求由投机需求 投资需求和正常需求构成 影响 房屋的正常需求的因素有房价 收入效应 替代效应 以及购房方式 由于房 屋的不可替代性 所以我们只考虑收入效应和房价对正常需求的影响 因此我 们呢选取了新建住宅价格指数 房价比收入 个人存款利率和贷款利率来刻画 正常需求 而投资需求主要体现在出租房市场上 因此出租房价格指数可以用 来描述投资需求 投机需求一般受到房价和对房价的预期的影响 因此我们在 选取影响投机需求的指标时 可以从这两方面入手 因此 我们选用房地产景 气指数和新建住宅价格指数来从宏观和微观共同刻画投机需求 基于以上分析我们选取出下列指标 房地产景气指数 土地交易价格指数 这两个影响房屋投资及成本的因素 并以上一年的数据 作为房地产商对当年房地产业的预期 4 消费者价格指数 CPI 房价收入比 新建住宅价格指数及房屋租凭价格 指数衡量 同时也均选用上一年的数据 作为影响人们或房地产商对当期价格 预期的因素 从而影响需求 从宏观经济态势方面来看 选取了人民币汇率 GDP 利率 通货膨胀率 来考察 选取企业贷款年利率 即中长期贷款利率一至三年 个人定期存款利 率 即定期存款整存整取 一年 个人住房商业贷款年利率 一至三年 来 衡量利率 3 1 2 若干假设 本文从房地产商的角度出发 模拟房地产商的定价模型 从供求原理出发 提出以下假设 1 房地产商是理性的 对于房地产商来说 利润是其定价的出发点 但 从长远看 房地产商是理性的 即在定价时 在考虑利润的基础上 充分考虑 需求 2 房屋的地理位置对于房价以及购房人的购买意愿没有影响 3 假设二手房交易市场对普通住房价格没有影响 4 房地产市场是非理性的 非均衡的 即炒房投机对需求有很大影响 3 1 3 符号的约定 普通住宅房价 房地产景气指数 1 人民币汇率 年平均汇率 2 居民消费价格指数 3 土地交易价格指数 4 企业贷款年利率 即中长期贷款利率一至三年 5 个人定期存款利率 即定期存款整存整取 一年 6 5 个人住房商业贷款年利率 一至三年 7 房价收入比 8 新建住宅价格指数 9 房屋租凭价格指数 10 3 2 基于双对数回归模型的剔除性最小二乘法分析 3 2 1 剔除性最小二乘法模型的引入 1 双对数回归模型 2 的构建 在处理多变量的问题时 一般采用多元线性回归模型进行分析 在这里考 虑使用非线性模型中的双对数模型 多元双对数模型函数 0 1 ln ln n ii i yxu 其中 在本案例中 是多元线性回归方程的未知参数 0 1 2 10 由于参数估计的工作是基于样本数据的 由此得到的参数只有参数真值 0 的估计值 记为 于是有 1 2 10 0 1 2 10 ln 0 1 1 ln 2 2 ln 10 10 ln 称为估计的多元线性回归方程 运用 SPSS 软件 3 对与 进行双对数模型分析时 1 2 10 自动剔除出了 等变量后 得出了与 5 9 1 2 3 4 八个变量之间的双对数回归方程 即简单模型 6 7 8 10 104 085 12 509 20 661 26 431 3 964 7 984ln 1 ln 2 ln 3 ln 4 ln 6 155 5 419 3 943 6 ln 7 ln 8 ln 10 ln 6 应用在 SPSS 对双对数模型进行拟合优度的检验 结果如下 表表 1 1 双对数模型拟合优度表双对数模型拟合优度表 模型 R 2 R 双对数回归模型 1 0001 000 由表 1 可知 双对数模型回归方程的拟合优度 说明其回归自变 2 1R 量与因变量具有较强的相关性 但是在用双对数模型分析 或者说使用回归方 程时 变量的多少对的影响很大 即自变量的个数与评价回归方程拟合效果 2 R 的一个重要指标复测定系数有很大的关系 自变量的个数越多 复测定系数的 值就越大 而且由于影响房价的各个因素之间互相影响 存在着多重线性相关 又会使一些重要的变量被排除 因此我们无法明确的从此模型得出房价与各个 变量之间是否存在着回归关系 而这两个问题是多元回归分析是难以回避的 所以许多统计学家都主张在回归建模时 应采用尽可能少的自变量 2 剔除性最小二乘法 4 的引入 在大量的社会 经济 工程问题中 对于因变量 Y 的全面解释往往需要 多个自变量的共同作用 在变量的选取中 为了不漏掉重要信息 总希望能考 察到的指标尽量考察到 这样会导致变量过多 增加分析难度 且往往会扩大 估计的方差 降低模型的精度 在既兼顾到不遗漏重要的解释变量 由遵循参 数节省原则 使自变量的个数尽可能的少 在这里我们引入剔除相关性的最小 二乘法 剔除变量间的复相关性 有效地对变量进行筛选 3 2 2 剔除性最小二乘法模型的定义及变量假设 设多元线性回归模型为 其中为因变量 为变量 i n 1 i i 0 i 为回归系数 为随机误差 0 i 2 定义定义 1 1 设 是维随机向量 随机向量期望 21 i 随机变量和的协方差 随机变量和 i ij i i j j 7 的相关系数为 若 0 则称与不相关 若 ij ij ii jj ij i j 1 则称与相关很大 ij i j 定义定义 2 2 复测定系数 为估计值 为观测值 为的均值 则复测 i y i yy i y 定系数为 2 11 2 2 R n i i n i i yyyy 定义定义 3 3 偏 F 检验 设有个自变量和因变量 满足多元线性k 12 k x xxy 回归模型 若采用其中个自变量拟合 即 记其复测定p 01 1pp yx 系数为 从这个自变量中找出一个自变量 异于 这是用 2 p Rk j x 12 p x xx 个自变量拟合 即 记其复测定系数为1p 01 11pppj yxxx 2 1p R 记 若几乎为零 则说明增加对的解释能力没明显 22 1pp RRR R j xy 提高 否则 若不显著为零 则就可以为回归模型提供显著的解释信息 R j x 假设 01 0 0 HRH 统计检验量为 pnF pnR R F p i 1 1 1 2 1 在假设成立的条件下 服从分布 第一自由度为 1 第二个自由 0 H i FF 度为 有检验水平 得到拒绝与的临界值 若 拒绝 说明np F i FF 0 H 显著不为零 则说明增加对的解释能力有明显的提高 若 接R j xy i FF 受 说明显著不为零 则说明增加对的解释能力没明显提高 0 HR j xy 上述检验称为偏检验 它是变量筛选的统计依据 F 8 3 2 3 剔除性最小二乘法模型的构造及本案例中的应用 1 模型的构造 1 数据对数化处理 用 SPSS 软件将自变量与因变量集 对数化 1 2 10 处理 以保证得到可控的平滑聚合函数 故可得到新的自变量与因变量集 1 Y 2 10 2 计算相关矩阵 用 SPSS 软件计算出标准化的自变量与因变量集 Y 的 1 2 10 相关矩阵 记与的相关系数为 i j ij 3 找出自变量与因变量的性关系数的绝对值最大的自变量 4 相关性剔除 令 ji j 1 2 10 由于与不相关 这 1 j j ij i jj ii 1 j 1 i 样就剔除对其他变量的影响 在此处由于为自变量与因变量的性关系数 i 9 的绝对值最大的自变量 故令 i 10 用 MATLAB 编程 5 见附录 B 即可算出 j 1 2 13 如表 2 所示 1 j 表表 2 2 新变量相关矩阵表新变量相关矩阵表 1 1 X 1 2 X 1 3 X 1 4 X 1 5 X 1 6 X 1 7 X 1 8 X 1 10 X Y Y 0 2131 0 0928 0 2752 0 2599 0 6718 0 509 0 5844 0 1291 0 3172 8 16702 7 0 0576 0 0688 0 2069 0 1138 0 0795 0 0198 0 1183 0 4674 0 5159 8 24589 0 0727 0 0277 0 042 0 0962 0 3957 0 3066 0 3867 0 1788 0 218 8 48078 5 0 8002 8 69166 9 0 0126 0 2512 0 5723 0 1951 0 7582 0 6714 0 65880 31872 0 604 0 4275 0 578 0 0993 0 6864 0 565 0 5372 1 4746 0 6792 8 75248 1 0 4999 2 436 0 6761 0 0829 0 0977 0 4604 0 0518 0 9205 0 585 8 72339 1 0 5306 0 5405 0 2955 0 0331 1 0591 0 8581 1 1338 0 7565 0 172 8 90826 1 6272 0 6378 0 277 0 0462 1 3115 1 572 1 3736 0 0719 0 5025 8 91910 6 1 9059 0 713 1 3207 0 0496 1 025 0 9159 1 4427 1 5917 0 8357 9 26752 1 5 用与因变量 Y 做最小二乘回归分析 及其复测定系数为 1 i 2 1 R 6 对进行标准化处理后仍记为 目的是把剔除后的变量与 1 j 1 j 1 i 同等对待 计算与因变量 Y 的相关系数矩阵 依次重复第 3 4 步的工 1 i 1 j 作 及第 k 次找出的基变量为 由第 3 4 步知 不相关 k i 1 i 2 i k i 用 与因变量 Y 做最小二乘回归分析 记其复测定系数为 1 i 2 i k i 2 k R 由定义 3 如果偏 F 检验通过 则停止计算 否则 重复 3 4 5 的计算 2 在本案例中的应用及分析 由标准化的自变量与因变量集 Y 的相关系数矩阵可以 1 2 10 看出与因变量 Y 存在严重的相关性 所以把当做基变量 记 作 9 9 1 9 9 相关性剔除 ji j 1 2 10 并标准化处理 得到 1 9999 jjjjj 剔除的影响后的相关系数矩阵 从相关系数矩阵可看出与 Y 的相关系数 1 9 1 3 最大 所以把作为第二基变量 记 用以为因变量经最小二乘法 1 3 21 33 1 9 计算后得到如下结果 0 857 偏 F 检验不存在 2 RF 然后以同样的方法继续剔除相关变量 剔除及相关检验结果如表 3 10 表表 3 3 剔除的自变量剔除的自变量与因变量与因变量的拟合度及偏的拟合度及偏 F F 检验值表检验值表 i j XY 自变量自变量 i j X 2 RF 1 1 Fni 1 9 0 857 不存在不存在 1 9 2 3 0 9278 5973 36 1 9 2 3 3 2 0 9524 2973 46 1 9 2 3 3 2 4 1 X0 9767 0613 59 1 9 2 3 3 2 4 1 X 5 4 0 9919 9123 78 1 9 2 3 3 2 4 1 X 5 4 6 10 0 9920 4254 06 注 注 的值对应的显著性水平的值对应的显著性水平 0 10 0 10 1 1 Fni 由表 3 可知 以 为因变量最小二乘计 1 9 2 3 3 2 4 1 X 5 4 6 10 算后得到如下结果 0 992 偏 F 检验 0 425 则通过检验 2 RF F F 也就是说及其他的变量对因变量的影响可以忽略 所以用 6 10 1 9 2 3 3 2 为因变量做回归分析 是非常好的 4 1 X 5 4 在应用剔除性最小二乘法分析时 剔除了企业贷款年利率 即中长期贷款 利率一至三年 个人定期存款利率 即定期存款整存整取 一年 个人住房 商业贷款年利率 一至三年 房价收入比 房屋租凭价格指数这些指标 选取 出影响房价最主要的因素是新建住宅价格指数 居民消费价格指数 CPI 人 民币汇率 年平均汇率 房地产景气指数 土地交易价格指数 从实际的角度 来看 CPI是央行决定利息变化的主要指标 即间接影响利率的大小 因此剔除 有关利率的三个因素是可行的 根据图2 可以观察到2000年至2009年上海市房 价收入比一直在0 2 0 3之间波动 其波动幅度不大 再者 房价收入比的大小 是受房价与收入的影响 国家在调控收入时主要参照了CPI的变化 且CPI会影 响房价 因此剔除了房价收入对房价的影响 11 2000至2009年上海市房价收入比 0 0 1 0 2 0 3 0 4 时间 房价收入比 房价收入比 房价收入比 0 23 0 23 0 23 0 26 0 28 0 27 0 23 0 25 0 22 0 29 200 200 200200 200 200 200 200200 200 图图 1 1 20002000 年至年至 20092009 年上海市房价收入比年上海市房价收入比 从需求的构成中可以看出 投机需求和直接需求所占的比重最大 而投资 需求却比较少 因此用来描述投资需求的指标出租房租赁指数可以排除 从下 图中可以看出上海市普通房价与需求整体来说是正相关的 需求上升 房价上 升 房价上升 需求上升 2001到2009年上海市普通住宅销售量与销售价格的关系图 0 5000 10000 15000 销售量 销售价格 销售价格 销售价格 3523 3812 4821 5952 6327 6145 7393 7475 10587 1594 1664 2007 2892 2396 2117 2776 1706 2478 图图2 2 上海市普通住宅销售量与销售价的关系图上海市普通住宅销售量与销售价的关系图 注 上表中价格单位为元每平方米 注 上表中价格单位为元每平方米 从传统的需求曲线来看 房价与需求应该是负相关的 而在投机需求中 投资者投机资金以赚取差价为根本目的 无论是需求者还是供给者 他们对期 望价格是不断上涨的 购买者获得了商品增值带来的利润 供给者则获得了更 高的销售利润 这样就使的价格与需求实现暂时性的一致与房价却是正相关的 当投机需求占总需求的比重过大时 就会出现房价与总需求正相关的情况 而 由上图可以知道 上海市正是出于这种情况 因此 相比其他指标 最终剔除 12 房价比收入这个影响正常需求的量是可行的 可见 使用剔除性最小二乘法分析得到的结果具有很高的可行性 3 3 双对数回归模型 在应用了剔除相关性的最小二乘法后 我们只保留了被选的基变量中与 因变量无关的噪声 即 而 1 9 2 3 3 2 4 1 X 5 4 1 9 2 3 3 2 4 1 X 所对应的是 这些原始变量 因此对它们进行 5 4 9 3 2 1 4 多元线性回归分析 则可得到新变量标准化后的方程式 12345 93214 0 9260 2640 160 1540 121p 通过新变量与原变量之间的对应关系及对数转换可以得到有关原变量的 双对数回归方程式 12349 ln54 464 1 603ln2 871ln9 928ln1 581ln2 330lnpXXXXX 在运用 SPSS 进行回归分析时 可以得出该模型的拟合优度检验结果表和 残差图 如下 表表 4 4 剔除变量后双对数模型拟合优度表剔除变量后双对数模型拟合优度表 模型模型R 2 R 新变量回归模型 0 9960 991 原变量回归模型 0 9770 955 13 图图 3 3 残差图残差图 由上表可知新变量 0 991 原变量 0 955 模型拟合度都很高 有 2 R 2 R 残差图 图 3 可知标准化预测值与 Student 化残差所构成的点均落在 2 2 的水平带状区间中 且不带任何系统趋势 完全随机的分布在该带状之 中 说明采用的回归方程对样本数据的拟合是良好的 故两者都表明该模型是 合理的 根据观察新变量系数 可以发现影响房价最主要的因素是新建住宅价格指 数 居民消费价格指数 CPI 人民币汇率 年平均汇率 房地产景气指数 土地交易价格指数对房价的影响是逐渐减弱的 但这是建立在剔除了所选因素 的相互影响的情况下 实际上这些因素是存在着相关关系的 因此 我们需要 将新变量还原进行分析 由新方程各变量的系数可以发现居民消费价格指数 人民币汇率 年平均汇率 新建住宅价格指数 房地产景气指数 土地交易价 格指数对房价的影响逐渐减弱 实际上我们知道 CPI 是央行决定利息变化的 14 主要指标 而利息则是决定房价的最为重要的因素 可见其对房价有着决定性 的作用 只不过是通过间接的方式在传导 而根据此模型我们可以直观的观察 出其影响的程度 同时这也说明了 通过该模型我们能观测各个原变量对房价 影响大小 以及原变量对房价是抑制还是促进 即相关系数能表示的是新变量 与房价的关系 影响大小 促进还是抑制 双对数模型预测结果如下 表表 5 5 上海市上海市 20002000 年至年至 20092009 年预测值与实际值的比较年预测值与实际值的比较 时间时间普通住宅实际价格普通住宅实际价格普通住宅预测价格普通住宅预测价格 20013522 853482 76 20023811 934207 9 20034821 234587 04 20045953 075403 20056326 376435 47 20066144 986860 46 20077392 796777 95 20087473 417743 27 200910588 4710414 98 注 上表中价格单位为元每平方米注 上表中价格单位为元每平方米 3 4 多维多规则的云预测模型 3 4 1 云模型引入及概述 1 云模型 6 引入 以上使用的双对数回归模型 是从定量的角度来研究有关房价的研究 而 我们一般情况下还会采用 时间序列预测模型 灰色模型 GM 模糊数学 神 经网络等 这些将定量与定性相互转化的方法 而我们采用了同样是定量与定 15 性相互转化 却鲜有在房价分析方面进行拓展和应用的云预测模型 在此 本 文试图进行这个方面的尝试与研究 2 云模型概述 云是用语言值描述的某个定性概念与其数值表示之间的不确定性转换模型 或 者简单地说云模型是定性定量间转换的不确定性模型 云的数字特征用期望 Ex 熵 超熵三个数值表征 它把模糊性和随机性完全集成到一起 构成定EnH 性和定量相互间的映射 其中是云的重心位置 标定了相应的定性概念的中Ex 心值 是概念不确定的度量 它的大小反应了在论域中可被定性概念接受的En 元素数 即亦此亦彼性的裕度 是熵的不确定的度量 即熵的熵 它反映了H 云的离散程度 云的数学定义式如下 在 0 1 中取值 云是从论域U 到区间 0 1 的映射 x 0 1 U xU xx 构成一个云滴 x u x 3 4 2 多维云的定义及分类 1 多维云概述 对于大自然的不确定的信息 需要一种形式化的符号系统去刻画 当我们 在描述这些量的时候 很多情况下并不是靠着精确计算某种数值来把握 而是 通过感知概念和事物的整体特征来描述的 比如房价的高低 汇率的高低 此 处的高低并没有一个明确的划分标准 因此说语言固有的不确定性与客观世界 普片存在的亦此亦彼性有着很好的对应关系 而以云模型为工具来描述语言原 子 则正好能体现这一关系 对于简单的定性规则 7 我们可以这样描述 IF A THEN B 同理对于 复杂的定性规则我们可以这样表述 IF A and B and C THEN E 也就是说 我们可以根据多维空间的云对象来表示这一复杂的定性规则 通过构造高维云 发生器来解决复杂的不确定性的推理问题 所以我们在一维云的基础上 可以 引出多维云的概念 16 定义定义 设是一个普通集合 称为论域 关于论域 XX 12 n Xx xx 中的模糊集合 是指对于任意元素都存在一个有稳定倾向的随机A 12 n x xx 数 叫做对的隶属度 如果论域中的元素是简单有A 12 n x xx 12 n x xxA 序的 则可以看作是基础变量 如果论域中的元素不是简单有序的 而根据X 某个法则 可将映射到另一个有序的论域中 中的一个且只有一个fX X X 和对应 则为基础变量 隶属度在基础变量上的 12 n xxx 12 n x xx X 分布称为云 多维云的数字特征 期望值 熵 超熵 12 n Ex ExEx 12 n En EnEn 它们的含义如下 12 n H HH 期望值 多维云覆盖范围下的某一平面上投影面积的形心 12 n Ex ExEx 它反映了相应的由两个定性概念原子组合成的 1122 nn G xEx xExxEx 定性概念的信息中心值 熵 多维云在各个平面上投影后的边缘曲线 期望曲 12 n En EnEn 线的熵 它反映了定性概念在坐标轴方向上的亦此亦彼性的裕度 由 nn Ex En 的数字特征值 分别确定了各平面上的具有正态分布形式的云期望1 2 n 曲线方程 2 2 2 nn n xEx En n Ye 超熵 间接反映了多维云在某一平面上投 12 n H HH n H1 2 n 影一维云的厚度 即其离散程度 2 多维云的分类 1 多维正向云 基本云 通过两个方向给定多维云的三组数字特征 12 n Ex ExEx 和 产生满足多维正态云分布规律的点 12 n En EnEn 12 n H HH 17 称为云滴 其云发生器 PGG Planar Clouds Generator 的 12 n drop x xxy 如图 4 111 Ex En H 222 Ex En H nnn Ex En H PCG 为产生云滴的时间间隔dt N dt 为个数 N 121 1 2 iii drop xxy i 图图 4 4 多维云发生器多维云发生器 条件云 通过两个方向给定云的三组数字特征 X 12 n Ex ExEx 和特定的值 12 n En EnEn 12 n H HH 12 n x xx 11 xu 产生满足上述条件的云滴 也可以 22 xu nn xu 12 ni drop u uuy 只给定一个 值组 即某平面上的点 j x1 2 jn 0i xu 12101 iijijinii drop xxxuxxy 条件云通过两个方向给定云的三组数字特征 Y 12 n Ex ExEx 和产生满足上述条件的云滴组 即 12 n En EnEn 12 n H HH 1 Yv 某横截面上的点 也可以再给定 产生满足上述条件 121 iini drop xxxv 0i xu 的云滴 121011 iijijini drop xxxuxxv 2 多维逆向云 给定符合某一正多维云分布规律的一组云滴作为样本 产生描述二维云所 对应的定性概念的三组数字特征 和 12 n Ex ExEx 12 n En EnEn 即两个方向上的期望值 熵和超熵其云发生器如图 5 12 n H HH 18 1 PCG 121 1 2 iii drop xxy i 111 Ex En H 222 Ex En H nnn Ex En H 图图 5 5 多维逆向云发生器多维逆向云发生器 3 4 3 多维云模型在本案例中的应用 1 定量到定性的转化 基于剔除性最小二乘法 我们选取出了与房价相关性较强且相互影响较小 的五个指标 由于选取的这些指标全部是定量的 因此 首先必须将定量的指 标转化为定性的量 我们采用 SPSS 对选取的五个指标进行聚类分析 得到了 4 类 由于数据的个数问题 导致 09 自成一类 因此我们在利用基于信息的X 多维云逆向发生器 由于 2001 年至 2003 年人民币汇率值相同导致熵和超熵不 能求出 故对这些数值做细微改动 只能得到三个规则 如表 6 注 多维云 逆向发生器的 Matlab 编程见附录 C 表表 6 6 多规则划分表多规则划分表 规则规则 一一 房地产景气房地产景气 指数指数 人民币汇人民币汇 率率 居民消费价格居民消费价格 指数指数 土地交易价格土地交易价格 指数指数 新建住宅价格新建住宅价格 指数指数 普通住宅销售普通住宅销售 价格价格 20011008 2791001001000 352285 2002100 778 27710092 2102 10 381193 2003101 178 275100 5102 31110 482123 Ex100 64678 277100 166798 1667104 36670 4052 En0 54030 00170 27854 98545 54240 0604 Hn0 24840 00110 07591 78021 83980 0227 规则规则 二二 房地产景气房地产景气 指数指数 人民币汇人民币汇 率率 居民消费价格居民消费价格 指数指数 土地交易价格土地交易价格 指数指数 新建住宅价格新建住宅价格 指数指数 普通住宅销售普通住宅销售 价格价格 19 2004102 51008 2768100 6125 1000134 70000 595307 2005106 05008 1917102 8161 8000156 00000 632637 2006101 74007 9718103 7170 6000170 40000 614498 Ex103 43338 1468102 3667152 5000153 70000 6141 En2 18630 14621 476122 893915 87530 0157 Hn0 70950 05830 60367 63558 40030 0100 规则规则 三三 房地产景气房地产景气 指数指数 人民币汇人民币汇 率率 居民消费价格居民消费价格 指数指数 土地交易价格土地交易价格 指数指数 新建住宅价格新建住宅价格 指数指数 普通住宅销售普通住宅销售 价格价格 2007106 05007 604105169 7000165 00000 739279 2008111 25006 9451108 3177 2000170 60000 747341 Ex108 65007 2745106 65173 4500167 80000 7433 En4 60840 58392 92456 64674 96290 0071 Hn2 77800 3521 76294 00672 99170 0043 注 上表中人民币汇率单位为注 上表中人民币汇率单位为 价格单位为万元每平方米 价格单位为万元每平方米 根据上表可以得出以下三个规则 使用 IF A THEN B 语句 a If 房地产景气指数低 人民币汇率高 居民消费价格指数低 土地交 易价格指数低 新建住宅价格指数低 then 普通住宅销售价格低 b If 房地产景气指数中等 人民币汇率中等 居民消费价格指数中等 土地交易价格指数高 新建住宅价格指数中等 then 普通住宅销售价 格中等 c If 房地产景气指数高 人民币汇率低 居民消费价格指数高 土地交 易价格指数高 新建住宅价格指数中等 then 普通住宅销售价格高 2 五维多规则逆向云发生器的实现 在本案例中 由上述多维逆向云发生器的实现可以得到五维三规则逆向云 发生器 如图 6 所示 1 PCG 20 1 PCG 1221 1 2 iiin drop xxxy in 111 Ex En H 222 Ex En H nnn Ex En H 图图 6 6 逆向云发生器逆向云发生器 1 PCG 3 五维多规则生成器的实现 1 理论依据 二维单规则生成器的算法 用二维条件云发生器和一维条件云发生器可以构造一条复杂的定性规则生XY 成器 比如规则 IF A and B THEN F 的云发生器示意图如图 7 所示 111 Ex En H 222 Ex En H nnn Ex En H 1 PCG PCG 为产生云滴的时间间隔dt N dt 为个数 N 121 1 2 iii drop xxy i 111 Ex En H 222 Ex En H nnn Ex En H 图图 7 7 云发生器示意图云发生器示意图 将单个二维单规则生成器组合起来作用是 就构成了二维多规则生成器 如 图 8 所示 5 n 21 1 AB PCG 111 BBB ExEnH 1 iii drop y 2 C CG 222 BBB ExEnH 2 AB PCG n AB PCG 1 C CG n C CG 2 iii drop y iini drop y 1 A Ex 1 A En 1 A H 1 C Ex 1 C En 1 C H 2 A Ex 2 A En 2 A H 2 C Ex 2 C En 2 C H nnn BBB ExEnH n A Ex n A En n A H n C Ex n C En n C H 1i 2i ni B x A x 1 C CG C E 图图 8 8 二维多规则生成器的实现二维多规则生成器的实现 注 注 就是就是 的预测值的预测值 C E A x B x 2 理论拓展 由二维多规则生成器的理论知 由 3 个五维单规则生成器组合起来作用时 就构成了五维多规则生成器 在本例中 它反映如表 6 分析得出的三条定性规 则 3 五维多规则生成器的应用 1 参数整理 将表 6 重新整理可得到运处理后的数字特征和特征参数如表 7 所示 22 表表 7 三规则参数表三规则参数表 房地产景气指数房地产景气指数人民币汇率人民币汇率居民消费价格指数居民消费价格指数 ExEnHnExEnHnExEnHn 规则一规则一100 64670 54030 24848 2770 00170 0011 100 1667 0 2785 0 0759 规则二规则二103 43332 18630 70958 14680 14620 0583 102 3667 1 4761 0 6036 规则三规则三108 654 60842 7787 27450 58390 352106 652 9245 1 7629 土地交易价格指数土地交易价格指数新建住宅价格指数新建住宅价格指数普通住宅销售价格普通住宅销售价格 ExEnHnExEnHnExEnHn 规则一规则一98 16674 98541 7802 104 36675 54241 83980 40520 0604 0 0227 规则二规则二152 522 8939 7 6355153 715 8753 8 40030 61410 0157 0 0100 规则三规则三173 456 64674 0067167 84 96292 99170 74330 0071 0 0043 2 五维多规则正向云发生器的实现 基于上表所示的定性规则集 由上述五维多规则生成器图 我们可以推 广出本案例中的五维正向云发生器 PGG 构造方法 由表 规则表 所示的定性 规则集 由于多维规则发生器中 有很多量是随机产生的 因此 当我们每次 输出的云滴也许会有很大不同 所以我们在选云滴时 仔细衡量 最终观察每 次所选云滴构成的正态曲线的期望围绕哪个值左右波动 确定最终的预测房价 预测结果如表 8 注 五维正向云发生器 PGG 实现的具体 MATLAB 程序见附 录 C 表表 8 基于云模型的房地产价格预测表基于云模型的房地产价格预测表 年份年份实际房价 万实际房价 万 平方米 平方米 预测房价 万预测房价 万 平方米 平方米 20010 3522850 3625 20020 3811930 367 20030 4821230 5012 20040 5953070 60055 23 年份年份实际房价 万实际房价 万 平方米 平方米 预测房价 万预测房价 万 平方米 平方米 20050 6326370 6325 20060 6144980 6079 20070 7392790 7433 20080 7473410 7433 注 上表中价格单位为元每平方米注 上表中价格单位为元每平方米 3 5 模型对比分析 3 5 1 模型的对比 预测房价与实际房价的对比 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 20012002200320042005200620072008 时间 房价 实际房价 预测1 预测2 图图 9 9 上海普通住宅预测价格与实际价格的对比图上海普通住宅预测价格与实际价格的对比图 由于数据的限制 09 年与三个规则的隶属度都趋近于 0 也就是说几乎不 属于给出的三个规则 所以我们无法给出 09 年的预测数据 但是由上表可以看 出 对于可以确定规则的年份 2001 到 2008 年 云预测模型拟合的效果比双 对数多元线性回归要好很多 3 5 2 模型的优点及不足 通过剔除性最小二乘法分析 剔除出相关性大的变量 重新组合运用到以 24 下两个模型中 首先从定量的角度考虑 我们选用了双对数多元回归模型 根 据新变量及原变量的系数 可以明确得出所选取的变量分别在剔除其他量带的 影响前后对房价的影响程度 根据这些来为政府调控房价提出建议 但是此模 型只是从定量的角度来分析的 缺乏对房价的定性考虑 因此引入了云模型 从定量与定性相互转换的方面来进行研究 研究证实 云模型预测的精度要高于双对数模型 但是云预测模型必须要 求能够将定量的指标转化为定性指标 如果不能 比如本文这个例子 就会出 现无法预测的情况 并且 云预测模型的过程较为复杂 由于多为规则发生器 中 我们有时为了得到更为准确的期望 我们不得不进行利用多规则发生器进 行多次重复的计算 由于我们没有预测所选指标的未来趋势 所以我们无法用双对数模型与云 模型对房价进行长期的预测 只能根据所选指标预测下一年房价 这也正是这 两个模型的缺陷与不足 3 5 3 模型的改进及建议 基于以上分析 可以知道本模型无法对房价进行长期的预测 结合时间序 列的长期预测的优点 我们建议在数据足够多的情况下 可以将时间序列模型 与云模型结合起来即基于时间序列的云预测模型 从而可以预测出房价的长期 走向 4 结论与建议 房价是房地产市场的调控的杠杆 基于以上实证分析 我们建议政府从以 下几个方面进行调控 1 通过升高存款利率来缓解通货膨胀 降低消费者价格指数 2 在拆迁征用土地时 不能过度竞标土地 使土地价格增大 应该适当 的控制或者降低土地价格 从而减少开发商的开发成本 3 竭力保证汇率的稳定性 做好金融监管 严格控制国际炒房基金的投 入 25 4 出台限购令 限制炒房 囤房 附录附录 附录附录 A A 处理前的原始数据 由于数据量大 原始数据暂不附于此处 数据出处 国家统计局 网址 上海统计局 网址 http www stats 凤凰网 网址 附录附录 B B 处理后所选取的定价体系的原始数据 表表 9 9 20002000 年至年至 20092009 年人民币汇率及各种年利率年人民币汇率及各种年利率 时间时间 人民币汇人民币汇 率率 企业贷款年利企业贷款年利 率 率 个人定期存款年个人定期存款年 利率 利率 个人住房商业贷款个人住房商业贷款 年利率 年利率 20008 27845 942 255 346 20018 2775 942 255 346 20028 2775 55412 01854 9987 20038 2775 491 984 941 20048 27685 53662 02664 9829 20058 19175 762 255 184 20067 97186 21442 41825 593 20077 6046 89133 20426 2022 20086 94517 11223 8376 3939 20096 8315 762 254 86 注 其中企业贷款年利率及个人住房商业贷款年利率均为一至五年期 个人定期存款利率注 其中企业贷款年利率及个人住房商业贷款年利率均为一至五年期 个人定期存款利率 为一年期为一年期 表表 1010 上海市上海市 20002000 年至年至 20092009 年各类价格指数年各类价格指数 以 以 20002000 年为年为 100100 26 时间时间 居民消费价格居民消费价格 指数指数 土地交易价格土地交易价格 指数指数 新建住宅价格新建住宅价格 指数指数 房屋租凭价格房屋租凭价格 指数指数 2000100100100100 2001100 092 2102 1107 4 2002100 5102 3111107 4 2003100 6125 1134 7108 7 2004102 8161 8156110 1 2005103 7170 6170 4113 7 2006105 0169 7165116 4 2007108 3177 2170 6123
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省阜阳市颍州区2025届数学三年级第一学期期末质量跟踪监视模拟试题含解析
- 2025届西藏山南地区扎囊县数学三年级第一学期期末模拟试题含解析
- 行政管理的公共关系学备考试题及答案
- 2022 年中级会计师考试《中级经济法》真题及解析(9月5日)
- 剧组协调员助理场记聘用合同
- 长期公寓租赁合同
- 中级经济师考试对行业发展的影响与试题及答案
- 农民信息技术应用服务合同
- 知识产权转让与保密协议细节展开说明文档
- 心理学应用知识练习题
- 2025届北京市东城区高三二模 政治试题(含答案)
- 公共组织绩效评估-形考任务一(占10%)-国开(ZJ)-参考资料
- 《慢性阻塞性肺疾病》课件
- 家校共育 静待花开 课件高二下学期学考动员家长会
- 2025陕西氢能产业发展有限公司所属单位招聘(101人)笔试参考题库附带答案详解
- 2025安全生产月安全生产知识竞赛题库及答案(共1418题)
- 2024年内蒙古师范大学招聘事业编制人员考试真题
- 切割钢丝企业数字化转型与智慧升级战略研究报告
- 企业融资的多样选择试题及答案
- 邮轮概论考试题及答案
- 2024年春八年级生物下册 25.1 发酵技术教学设计 (新版)北师大版
评论
0/150
提交评论