集对分析聚类预测法在城市生活需水量预测中的应用.docx_第1页
集对分析聚类预测法在城市生活需水量预测中的应用.docx_第2页
集对分析聚类预测法在城市生活需水量预测中的应用.docx_第3页
集对分析聚类预测法在城市生活需水量预测中的应用.docx_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集对分析聚类预测法在城市生活需水量预测中的应用和蕊 ,原晨阳 ,杨思波 ,吕明捷(合肥工业大学 土木与水利工程学院 ,合肥 230009 )摘 要 集对分析聚类预测法结合了集对分析中的同异反模式识别的“择近原则 ”和聚类分析的基本思想进行分类预测 。基于该方法给出了城市生活需水量的详细方法预测 ,在分析过 程中考虑了城市生活需水量与其影响因素之间的关系 ,利用城市生活用水总量和影响因素的历史数据 ,建立了城市生活需水量聚类预测的模型 ,并利用我国北京市的实际数据进行了分析 计算 。结果表明 ,该预测方法应用于城市生活需水量预测思路清晰 ,计算简单且精度较高 ,该 预测方法具有较高的实用价值 。关键词 集对分析 ;联系度 ;聚类预测 ;生活需水量预测中图分类号 TV213文献标识码 A文章编号 1006 - 7175 ( 2010 ) 12 - 1324 - 04Se t Pa ir Ana ly s is - C lu ster Pred ica t ion M e thod in UrbanD om e st ic W a ter D em an d Foreca st in gH E R u i, YUAN Chen - yang, YAN G Si - bo, LU M ing - jie( Schoo l of C ivil Enginee ring, H efe i U n ive rsity of Techno logy, H efe i 230009 , Ch ina)A b stra c t: Se t p a ir ana lysis ( SPA ) - C lu ste r p red ica tion m e thod com b ine s the C lo se F irst P rinc ip lew ith the c lu ste r ana lysis p h ilo sop hy, ba se on wh ich th is p ap e r show s the de ta iled u rban dom e stic wa2 te r dem and fo reca st1 W ith con side ra tion of the re la tion sh ip be tween the u rban dom e stic wa te r dem and and the fa to rs tha t can m ake influence on it, a C lu ste r Fo reca stMode l of u rban dom e stic wa te r dem and is bu ilt in th is p ap e r ba sed p e r the reco rd s of h isto ry1 SPA is found and ve rified a s a p rac tica l and ef2 fic ien t m e thod of fo reca sting the c ity life wa te r dem and th rough the ana lysis of the ac tua l da ta reco rd sof B e ijing c ity1Key word s: se t p a ir ana lysis; connec ting degree;ca stingc lu ste r p red ica tion; dom e stic wa te r dem and fo re2问题 。近年来随 着科学技术的不断发展 , 预 测 方 法 和 技术有了很 大 进 步 。很 多 学 者 提 出 了 城 市 需 水 量 预 测 方 法 ,如利用 B P神经网络和模糊神经网络预测 方法 , 回归 预测法 ,灰色预测法等 1 - 6 。集对分析方法 ( se t p a ir ana l2 ysis m e thod , SPA )是研究确定不确定系统的一种方法 7 。 集对分析聚类预测方法 7 将预测对象与其影响因素联系 起来考虑 ,但并不是建立预测对象与其影响因素之间关0 引言随着中国城市化进程的不断推 进 , 城 市 对 水 资 源 的需求日益提高 ,对城市需水量进行科学的分析和预测是 满足城市需求 、保证给水系统正常运行和水资源可持续 利用的重要课题 。科学的供水规划源于对未来需水量的 科学分析与准确预测 ,需水量的长期预测即着眼于这一收稿日期 基金项目 作者简介 2010 - 09 - 27水利部公益性行业科研专项经费项目 ( 201001043) ;国家自然科学基金项目 ( 51079037 )和 蕊 ( 1982 - ) ,女 ,河南周口人 ,硕士研究生 ; 原晨阳 ( 1988 - ) ,男 ,河南焦作人 ,硕士研究 生 ; 杨思波( 1985 - ) ,男 ,安徽阜阳人 ,硕士研究生 ;吕明捷 ( 1988 - ) ,男 ,安徽肥西人 ,硕士研究生 1 1324 和蕊 , 等 :集对分析聚类预测法在城市生活需水量预测中的应用第 12期系的数学表达式 , 而是将预测对象与其影响因素作为一个整体进行数据处理 。鉴于此 , 本文把集对 分 析 聚 类 预 测法引入城市生活需水量预测中 ,即首先应用聚类分析的基本思想对生活需水量和影响因素的历史数据进行分 类 ,然后建立集对的同异反联系度 。当给定 未 来 影 响 因素的状态时 ,建立待预测的样本与参照系统之间的联系 度 ,从而判断出生活需水量变化的类型 ,进而预测出未来生活需水量 。最后 通过对北京市生活需水 量 预 测 , 以 进 一步验证集对分析聚类预测方法的有效性和实用性 。子的数目 。k = ak + bk i + ck j表示第 k个分类集合 A k 与参照系统 组成集对后所得的同异反联系度 , 也可记成 联系向量 k= ( ak , bk , ck ) ( k = 1, 2, , n) 。各分类集合 A k 与 m 个因素有关 , 记第 k 个分类集合 A k 与参照系统组成集对 后 关 于 第 t个 因 素 ( t = 1, 2, , m )的同异反联系度为 k t , 相应有 m 个联系度 k1 ,k2 , , km 。k t ( t = 1, 2, , m )可按下式计算 :k t = ak t + bk t i + ck t j( 2 )式中 ak t、bk t和 ck t分别为影响因子年增长率 xk j与 x0 j的同一1 集对分析基本概念集对分析 ( se t p a ir ana lysis m e thod, SPA ) 是赵克勤在1989年的全国系统理论会议上提出的一种用联系数处理 确定不确定性系统的分析方法 。集对分析的实质是一种新的不确定性理论 , 其核心思想是将确定不确定性作为一个确定不确定系统 ,并且认为确定性和不确定性相互 联系 、相互影响 、相互制约 ,并在一定条件下相互转化 。联系度能够充分体现上述思想 ,用联系度统一地描述模糊 、 随机 、中介和信息不完全所致的各种不确定性 ,通过联系 度把不确定性利用一个具体的数学模型表达出来 7 。集对分 析 的 基 本 概 念 是 集 对 及 其 联 系 度 。所 谓 集 对 ,就是具有一定联系的两个集合 所组成 的 对 子 。按 照集对的某一特性展开分析 ,对集对在某一问题背景下的 联系度表达式为 :度 、差异度和对立度 , 其中同一度一般可以取 9 : a = x /k tk j2, 对立度采用倒数型对立度 : c = 012 x 。k tk j若影响城市生活需水量的各个因子对分类的重要性不同 , 则可以用权系数来表示各 个因子的 重 要 程 度 。权 系数的大小对于联系度具有重要的作用 , 不同的权系数 会得出不同的结论 。为确保预测的精度应尽量合理的确m定权系数 。权系数记为 w = (w1 , w2 , , wm ) , 满足 w i =i = 11。此时 , 联系度 = a + b i + c j可视为这 m 个联系度kkkk的加权平均联系度 , 其中 ak , bk , ck 分别为各个同一度 、差异度 、对立度的加权平均值 9 :mmmak =w i ak i , bk =w i bk i , ck =w i ck i( 3 )iiim = a + bi + cj( 1 )k = w1k1 + w2k2 + w3k3 + wmkm = w i( 4 )k ii = 1式中 a表示两个集合的同一程度 , 称为同一度 ; b表示两个集合的差异不确定程度 , 称为差异度 ; c 表示两个集合 的对立程度 , 称为对立度 ; i为差异标记符号或相应系数 ,取值于 - 1, 1 ; j为对立标记符号或相应系数 , 规定取值 为 - 1。根据定 义 , a, b, c 满足归一化条件 a + b + c = 1。 其中 a, c是相对确定的 , 而 b是相对不确定的 , 当 i取 - 1和 1时表示 b是确定性的 , 而随着接近于 0, b的不确定性 也随之增强 ; 因而式 ( 1 ) 是一种确定不确定结构 函数 , 它 体现了确定不确定系统的对立统一关系 。2 基于联系度的集对分析聚类预测 模型的建立将 SPA 理论与城市需水的专业知识相结合 , 根据城 市生活需 水 量 年 增 长 率 的 规 律 识 别 待 预 测 事 物 所 属 类别 , 从而达到预测的目的 。具体建模步骤如下 :假定待预测的城市生活需水量为 N , 相应的待预测系 统为 B 。( 1 )根据城市生活需水量及其影响因子的年增值率(这里的年增长率定义为该年的值与上年的值之比 ) , 确 定城市生活需水量 N 的分类模式 ; 尽量做到各分类中的 样本数量 相 等 。城 市 生 活 需 水 量 N 的 分 类 集 合 为 A = A1 , A2 , , A n 。其中 n为分类的数目 。( 2 )建立城市生活需水量 N 的各分类集合的影响因( 3 )建立待预测系统 B 的影响因子年增长率集合 XB= xbj | j = 1m 与参照样本的年增长率集合 X o = x0 j | j= 1m 的同异反联系度 B = a + bi + cj, 同步骤 ( 2) 。( 4 )计算各分类的同异反距离 。设 k ( k = 1, 2, , n ) 8 - 9 为联系度 k 与 的同异反距离:222kn)=( ak - a ) + ( bk - c) + ( ck - c) , ( k = 1, 2, 3( 5 )( 5 )确定待预测样本 B 所属的类别及生活需水量的年增长率 x。比较各个同异反距离 ( k = 1, 2, , n ) 的大小 , 根据k 9 同异反 模 式 识 别 的 择 近 原 则, 若 k0 = m in (1 , 2 ,n ) , 则认为待预测系统 B 与分类模式系统 A k0最接近 , 因0而可以把 B 归入模式 A k0 。记 xk 为各个分类系统的中心 , 9 则 B 的预测值可由下式计算:0xk 1/n nx = ( 6 )k = 1 k k = 1 k3 应用实例311 资料整理以北京市生活需水量预测为例 , 说 明 集 对 分 析 聚 类 预测方法在城市生活需水量预测方面的应用 。城市生活 用水系统复杂 、影响因素多种多样 , 其主要影响因素包括城市非农业 人 口 、第 三 产 业 状 况 、建 筑 面 积 和 生 活 水 平 等 。根据综合考 虑 , 最终确 定城市生活需水 量 的 预 测 主 要选择了非农业人口 、人均居住面积 2个影响因素 10 。 1325 子年增长率集合 X k = xk j | j = 1m 与参照样本的年增长率集合 X0 = x0 j = 1 | j = 1 m 的同异反联系度 。其中 X k为第 k个分类集合的影响因子年增长率集合 , m 为影响因水利科技与经济W a ter C onservancy S cience and Technology and Econom yV ol116 N o112D ec1, 2010第 16卷第 12 期2010 年 12 月11 = 01509 754 5 + 01196 172 9 j;12 = 01520 605 5 +01192 084 0 j21 = 01520 838 + 01191 998 3 j; 22 = 01516 387 +观察北京市的生活用水量及其影响因素的历史数据(表 1 ) , 对其进行处理 , 得到生活用水总量及影响因素的 年增值率见表 2。表 1 北京市生活用水量 、非农业人口 、人均居住面积 10 01193 653 2 j( 7 )31 = 01507 990 5 + 01196 854 1 j;32 = 01517 017 5 +01193 417 2 j根据式 ( 4 ) 、式 ( 7 )并对两个影响因素分配等权重 , 计 算可得分类样本 A k 与参照系统组成集对后的同异反联系 度为 :非农业人口X 1 /万人人均居住面积X 2 /m2 人 - 1生活用水量/ 104 m3年份1986198719881989199019911992199319941995199619971998199946 4741945 7441150 9041451 4281752 8521856 6191558 3761662 5711967 2951270 5401569 8601575 5731578 7311582 715156216376506646736836927077258158298268388546146618271177145717281018131815181738187911791499187101431 = 01515 180 + 01290 692 i + 01194 128 j2 = 01518 613 + 01288 561 i + 01192 826 j3 = 01512 504 + 01292 360 i + 01195 136 j313 计算待测样本 B 与参照样本的联系度( 8 )为了分 析 集 对 分 析 聚 类 预 测 方 法 的 预 测 精 度 , 以1999年 的 非 农 业 人 口 、人 均 居 住 面 积 年 增 长 率 之 值 ( 11019 093, 11056 738) 为待测样本 B 的观测 值 , 预测该 年的生活需水量年增 长率之值 , 并与实际 值 比 较 。根 据 观测值 ( 11019 093, 11056 738) , 确定待测样本 B 与参照 系统组成集对后关于第 t个因素 ( t = 1, 2 ) 的同异反联系 度为 :B 1 = 01509 546 5 + 01196 252 9 j根据上述 19871998 年的历史资料为分类样本 , 该城市生活需水总量的年增长率在 01980 11113 之间 。将 样本按需水总量的年增长率分为 3 类 (即 n = 3 ) , 尽量满 足各类中样本数量相等 。表 3 给出各类样本的增长率范 围和 2个因子 (即 m = 2 )的平均值 。表 2 北京市生活 用水量年增长率 、非农业人口 年 增 长 率 、人均居住面积年增长率B 2 = 01528 369 + 01189 262 j( )9从而可得待测样本 B 与参照系统组成集对后的同异反联系度为 :B = 01518 95 + 01288 29 i + 01192 76 j( )10314 计算同异反距离根据式 ( 5 ) 、式 ( 8 ) 、式 ( 10 ) 计算待测样本 B 与各类 别样本的同 异 反 距 离 , 见 表 4。根 据 同 异 反 模 式 识 别 的 “择近原则 ”, 预测 1999年北京市生活需水总量年增长率 属于 A2 类 。生活用水量增长率非农业人口增长率人均居住面积增长率年份19871988198919901991199219931994199519961997199801984 27511112 80811010 30011027 69111071 26811031 03411071 86611075 48611048 22501990 36011081 77711041 78711025 76511020 40811020 40811020 40811014 85911014 85911014 85911025 46011124 13811017 17801996 38111014 52811055 72811051 32011039 05211036 24211037 56511037 45311024 0611025 8511016 03711033 82211034 89611040 042表 4同异反距离及分类结果123判定类别A201004 67501000 43801007 985315 结果分析表 4给出该地区 1999年的生活用水量年增值率的预 测结果属于 A2 类 , 即年增长率在 11028 0 11071 3之间 。 根据表 4及式 ( 6 ) 计算可得 , 该城市 1999 年的生活用水 总量年增长率为 11047 955, 与当年实际增长率 11050 6比 较 , 相对误差为 01251 8 % , 预测精度较高 。上述分析计算中 , 影响因素是等权重考虑的 , 若结合 生活用水的实际情况分配更合理的权重 , 可进一步提高预测的精度 。316 方法比较为了对集对分析聚数预测方法 进 行 比 较 分 析 , 本 文 应用多元线性回归分析方法 10 和灰色 GM ( 1, 1 ) 预测模型 , 根据北京市生活需水量历史数据建立相应的预测模 型 。灰色 GM ( 1, 1)预测模型方程为 : 1999 11050 602 11019 093 11056 738 表 3北京市生活用水量年增长率的分类样本数据各类样本数因子均值类别增长率取值范围x1x2A 1A 2 01980 0, 11028 0 ) 11028 0, 11071 3 )4411019 50911041 67611041 21111032 774 A 3 11071 3, 11113 0 ) 4 11015 981 11034 034312 建立各类样本与参照系统的联系度记第 k个分类样本 A k ( k = 1, 2, 3 ) 与参照样本 (参照样本的年增长率集合 X o = x0 j = 1 | j = 1m )组成集对后 关于第 t个因素 ( t = 1, 2) 的同异反联系度为 k t = ak t + ck t j。根据表 3数据可得如下联系度 : 1326 01047 217k( 1)Q ( k + 1) = 9721352 214e- 9261608 114( 0) ( 1) ( 1)Q ( k + 1) = Q ( k + 1 ) - Q ( k )( 10 )和蕊 , 等 :集对分析聚类预测法在城市生活需水量预测中的应用第 12期测模型的研 究 J 1 给 水 排 水 , 2004, 30 ( 6 ) : 102 -1051 5 章征宝 ,陈朝东 ,张一刚 1人工神经网络在城市用水 量预测中 的 应 用 进 展 J 1 给 水 排 水 , 2007, ( 33 ) :110 - 1141 6 R EN Yong - chang, X IN G Tao, CH EN X iao - ji, e t a l1B a sed on P roce ss N eu ra l N e two rk L ea rn ing A lgo rithm fo r P red ic tion of U rban W a te r Con sump tion A 1 2010 In2 te rna tiona l Confe rence on Comp u ting, Con tro l and In2 du stria l Enginee ring C 12010, 34 - 371 7 赵克勤 1集对分析及其初步应用 M 1杭州 :浙江科学技术出版社 , 20001 8 吴开亚 ,金菊良 , 王玲杰 , 等 1 集对分析聚类预测方 法在区域生态足迹趋势预测中的应用 J 1武汉大学 学报 (信息科学版 ) , 2008, 33 ( 9) : 973 - 9771 9 高洁 , 盛 昭 翰 1 集 对 分 析 聚 类 预 测 法 及 其 应 用 J 1系统工程学报 , 2002, 17 ( 5) : 458 - 4621 10 张雅君 ,刘全胜 ,冯萃敏 1 多元线性回归分析在北 京城市生活需水量预测中的 应用 J 1 给 水 排 水 ,2003 , 29 ( 4 ) : 26 - 291式中 k为年的序号 , k = 1表示 1989年 , 以此类推 。应用多元线性回归分析预测模型和灰色 GM ( 1, 1 )预 测模型 ,得到的北京城市 1999年生活需水量见表 5。表 5几种预测方法的预测结果比较集对分析聚类预测多元线性回 灰色 GM ( 1 , 1 )预测方法归分析预测预测预测结果 /104 m3相对误差 / %82 5071030125282 5471760120382 849124- 01377从表 5中的结果可以看出 ,集对分析聚类预测方法预测精度较高 ,方法直观 ,可应用到城市生活需水量预测 。4 结语城市生活 需 水 总 量 的 预 测 是 一 项 复 杂 而 重 要 的 工作 ,由于未来城市生活用水量变化要受到诸多因素的影 响 ,而这种影响往往又不能准确 、定量地加以描述 。这体 现了其不确定性 ,在处理不确定性信息方法中 ,集对分析 方法和传统方法相比更具有优越性 。传统的预测方法一 般不考虑或简化考虑这些影响 。本文根据我国北京市的生活用水量年增长率的历史数据 ,用集对分析聚数预测 方法预测生活需水总量 。集对分析聚数预测方法充分利 用了历史样本中的相似信息 ,本文实例验证了该方法的 适用性和有效性 。另一方面 , 由于联系度和 同 异 反 距 离 的计算比较 简 单 , 用 于 预 测 十 分 简 便 , 具 有 很 强 的 实 用 性 。上述结果表明了集对分析聚类预测法在城市生活需 水量预测中应用的可行性和实用性 。 11 L I X iang - m e i, ZHOU J ing - xuan, SHAO X iao -gang, e t a l1 D ynam ic sim u la tion of Eco logica l Foo t2 p rin t in R e spon se to Soc io - econo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论