运用支持向量机方法对数值模拟结果的初步释用.pdf_第1页
运用支持向量机方法对数值模拟结果的初步释用.pdf_第2页
运用支持向量机方法对数值模拟结果的初步释用.pdf_第3页
运用支持向量机方法对数值模拟结果的初步释用.pdf_第4页
运用支持向量机方法对数值模拟结果的初步释用.pdf_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3 2 卷第2 期 2 0 1 5 年4 月 海洋预报 M A R n 呵EF O R E C A S T S V 6 1 3 2 N O 2 A p r 2 0 15 D O I :1 0 1 1 7 3 7 j is s n 1 0 0 3 0 2 3 9 2 0 1 5 ,0 2 0 0 3 运用支持向量机方法对数值模拟结果的初步释用 邓小花,魏立新,黄焕卿,张润宇 ( 国家海洋环境预报中心,北京1 0 0 0 8 1 ) 摘要:基于获得的海水浴场逐日两次观测资料及同期N C E P 数值模拟结果( 提取各种相关变 量) ,通过求取两者之间的相互关系,并采用最优子集方法确定了对各预报要素具有重要意义的影 响因子。针对海水浴场的气温、降水及能见度等要素的预报,应用支持向量机方法建立了相应的 预测模型,最终获得不同海水浴场在不同预报时效、不同预报要素的数值产品释用结果。经过对 比分析,各预报要素释用后的结果较释用前在预报准确率方面有较大的提高。 关键词:支持向量机方法;N C E P 数值模拟结果;释用;气温;降水;能见度 中图分类号:P 7 3 2 文献标识码:A文章编号:1 0 0 3 0 2 3 9 ( 2 0 1 5 ) 0 2 0 0 1 4 1 0 支持向量机( S u p p o r tV e ct o rM a ch in e s 简称 S V M ) 是V a p n ik V N 等人提出的基于统计学习理论 的小样本学习方法”2 1 。该方法的基本思想是把低 维样本空间的难于线性划分解决的样本集通过非 线性映射到高维特征空间中,在高维特征空间寻求 最优划分超平面,从而实现样本空间的非线性分 类。在短期的气候预测业务或短期天气预报中,由 于大气环流变化的复杂性和非线性性,决定了大部 分的预报对象及其对应的预报因子之间为非线性 相关关系。目前,国际上应用较为广泛的支持向量 机方法则是一种较为新颖的处理非线性分类和回 归的有效方法口卅。 滕卫平,俞善贤等”1 应用S V M 回归方法在汛期 旱涝预测中进行了应用研究,通过相关分析从前期 大气环流场、海温场中选取了相关性较高的预测因 子,建立了浙江省汛期旱涝短期气候预测模型,效 果较传统的逐步回归方法有明显的提高。杨淑群, 芮景析等陋,也利用多年的7 4 项环流特征量、海温指 数、相关区域海平面气压等指数,建立了四川盆地5 片区域降水特多或特少的S V M 预测模型,并进行了 降水分类预测试验;结果显示所建的S V M 模型的 T S 评分较高。李智才,马文瑞等p 1 利用N in o 区海温、 南方涛动指数、副高面积指数等预报因子,建立了 阳泉地区夏季降水正、负距平的S V M 非线性分类模 型;预报试验表明,预报能力良好。熊秋芬,胡江林 等隅1 还专门就支持向量机和人工神经网络两种方 法,分别建立了云量预报模型;所开展的交叉验证 和实例预报的结果显示:两者方法相比而言,S V M 的预报能力高于人工神经网络方法,且在计算速度 上有后者无法比拟的优势。吴爱敏,郭江勇等一,应 用S V M 方法,对甘肃陇东地区冰雹天气的主要环流 形势进行了分析,对冰雹分类预报进行了探讨;经 检验,主要降雹季节各月有无冰雹分类的正确率大于 8 0 ,效果较好。另外,黄玉霞,许东蓓,蒲肃等”叫还 应用该方法,建立了甘肃省林区森林火险分类推理 模型;结果表明该模型具有良好的预报能力,预报 效果明显优于传统的逐步回归方法。众多试验和 研究结果表明,不管是针对短期的气象预报还是 短期气候预测,运用该方法均能取得较为满意的 预报结果。因此,在本文中,针对日最高气温、降 水及能见度要素的预报,采用该方法来建模是可 行的。 收稿日期:2 0 1 4 0 3 2 7 基金项目:国家海洋局海洋公益性行业科研专项( 2 0 1 0 0 5 0 3 6 ) 作者简介:邓小花( 1 9 8 2 一) ,女,工程师,硕士研究生,主要从事海洋气象预报工作。E - m a il:d e n g x h n m e f cg o v cn 2 期 邓小花等:运用支持向量机方法对数值模拟结果的初步释用 2 支持向量机分类方法简介及释用 模型流程图 支持向量机( S u p p o r tV e ct o rM a ch in e ,简称为 S V M ) 是一种处理非线性分类和回归的有效方法。 该方法中,“机”代表机器学习领域中的一些算法, “支持向量”则是指训练集中的某些训练点的输入 系数;该方法也是一种有督促( 有导师) 学习方法, 即已知训练点的类别,求训练点和类别之间的对应 关系,以便将训练集按照类别分开,或者是预测新 的训练点所对应的类别。 用线性回归函数他) = w 什务拟合数据协,y 1 ) ,f - 1 ,2 , ,l,z ,R d , Y ,R 的问题,根据S V M 理论,若 采用线性不敏感损失函数 if ( x ) 刊。= 黼一Y I 主巍 并引入松弛因子亭j 0 和占o ,则问题为在 约束条件 1 w y 妒- w x b - 一y 篙_ 1 J 2 棚( 1 )1 w 呵f +f s + 占, ” ”7 下,最小化目标函数 中,寡,孝专撕+ c2 ( e i+ ) , ( 2 ) 常数C O 控制对超过误差E 的样本的惩罚程度。采 用优化方法可以得到其对偶问题,即在约束条件 j 孙I 西) - 0 础,( 3 ) 、=f l, ,I ) , 【O a :c, 下,对L a g r a n g e 因子啦,d :最大化目标函数 ( 仅;) 一s ( + 仅弘苁( 旷a :) 号 。 。 ( 4 ) ( “i a :) ( 吁一町) ( z ? ) 从而获得回归模型: 厂( 功= ( 埘 功+ 6 = ( d 。一d :) 。 力+ 6 + ( 5 ) 式中,仅,O l:均不为0 ,对应的样本则是支持向 量。如果用核函数K ( x 。 戈i) 替代公式( 4 ) ,( 5 ) 中的 内积运算,则可确定非线性拟和函数厂中的6 + , 取在边界上的一点,即可确定。有关非线性核函数 的种类较多,常用的有多项式核函数、经向基核函 的非f 二类划分 薹薹柔三:离 低维l 空间 的非 线性几 募萎l多类划分 分类I 。 图1 支持向量机分类方法基本思路 历史数值预报格点数据 历史实况数据 ( P 、T 、H 、F 、d d 、V )( 再分析资料、站点资料) 最优子集方法、 主成分分析方法 、r 筛选各预报因子的影响因子 ( 不同模型可选择不同的影响因子) , 最新的数值模拟结果 支持向量机方法或神经网络技术 ( 格点数据) ( 构建网络模型,并建立因子库) + 输出释用对象的释用结果 图2 释用模型建立流程图 数、柯西核函数等,本文采用经向基核函数。图1 则 为支持向量机分类方法的基本思路。 图2 为本文中所建立的各预报要素的释用模型 建立流程图,其预报对象包括日最高气温、降水及 能见度。 3 数据准备及初步处理 本文选取了青岛、厦门2 个海水浴场作为南北 海水浴场的示范区,所收集到的观测资料为2 0 1 1 年 和2 0 1 2 年海水浴场开放期间所测得。其中,青岛海 水浴场观测资料时间段为2 0 1 1 年7 月1E t 一9 月3 0 E l和2 0 1 2 年7 月1 日一9 月3 0E t ,厦门海水浴场观 i贝0 资料时间段为2 0 1 1 年5 月1 0 日一6 月1 2 日、2 0 1 1 年9 月1 日一1 0 月3 1 日及2 0 1 2 年5 月1 日一1 0 月2 0 日;观测要素则包括:风向、风速、总云量、过去2 4h 降水量、过去6h 降水量、气温、视程等。 另外,模式预报场资料为美国N C E P 逐6h 一次 输出、预报时效为1 2 0h 的模式结果,模式的空间分 辨率为0 5 0 O 5 。受观测资料时间序列限制,针对 1 6海洋预报 3 2 卷 不同的海水浴场建模,模式所选用的时间段与观i贝4 资料时间段一致。所提取的模式变量主要包括:各 等压面上的位势高度、温度、风要素、相对湿度、土 壤湿度、云水混合比、可降水量等;提取区域为青 岛、厦门两个海水浴场及其周边地区模式预报数 据。表1 列举了释用工作中所用到的主要变量及其 具体含义。 由于支持向量机分类方法在预报对象为等级 预报时具有一定的优越性,因此,在本部分工作中, 日最高气温的预报表现为订正等级预报,即按照表 2 将模式日最高气温结果与实测日最高气温结果之 间的差值进行相应的分类。而所建模型的预报结 果一2 、一1 、0 、1 或2 ,则代表了不同的订正类别。例如 预报结果为正时,则代表将在模式气温预报的基础 上,进行相应的“降温”调整;而当预报结果为负时, 则将进行相应的“升温”调整。随后的能见度预报 表现为能见度的等级预报,降水预报表现为降水量 的等级预报,具体划分标准分别见表3 、表4 。 4气温、降水的订正及能见度预报 4 1 气温预报的订正 针对海水浴场的气温要素预报,较为关注的为 日最高气温预报,本文以厦门海水浴场为例,因其 日最高气温较纬度偏北的青岛海水浴场更为明 显。将海水浴场逐日最高气温实测资料( 受观测资 料限制,取其1 4 时资料代表日最高气温) 与对应时 表2 预报对象的划分标准( 日最高气温预报模型) 表3 预报对象的划分标准( 能见度预报模型) 表4 预报对象的划分标准( 降水预报模型) 刻的模式输出气温结果进行对比后发现:针对预报 时效为2 4h 内的模式结果,5 7 3 的样本其实测气 温值与模拟气温值差值在2 以内;3 2 9 的样本 两者之间的差值在2 x 4 或一4 x 4o C 的样本也较释 用前明显减少。 4 2 降水预报订正 针对降水预报,本文主要关注降水量等级的预 报,下面的预报模型以预报时效为4 8 7 2h 的青岛 海水浴场为例。通过求取降水量与模式各变量之 间的相关性,其相关系数达到0 2 6 以上的因子数为 1 1 个,主要包括对流性降水量、云水、整层可降水 量、相对湿度等变量,具体情况见表6 。通过众多预 报模型的预报效果的对比,最终筛选出4 个模型用 于最终的降水预报模型的集成,预报效果见图4 。 图4 中,其横坐标为样本数,纵坐标为2 4h 降水 量等级。r e a l代表的是实测降水量等级( 按照表3 进 行划分) ,其中,3 3 个检验样本中有9 个样本为降水 样本,在建立的各预报模型中,均能较好的对降水 样本给出较为准确的晴雨预报,由于夏季降水具有 阵性的特征,所以对降水量的等级较难把握。 为了更好地对各降水预报模型进行检验,本文 还特地将N C E P 模式预报的相关降水变量进行了提 取和进一步处理,将其预报效果与所建立的模型预 报效果进行了对比。总得来说,青岛海水浴场降水 量的预报经过数值产品释用之后,降水预报的提升 效果较为明显,可见图5 。图中,绿色柱状为降水释 用模型预报结果,蓝色柱状为观测结果,紫色柱状 为N C E P 模式对流性降水量,而红色柱状为累积过 的逐6h 降水量预报结果。需要说明的是,紫色柱 2 期邓小花等:运用支持向量机方法对数值模拟结果的初步释用 1 9 02 04 0 ; 灭; ; j V V V V 丫V V I i 。 I丫V V V V V 丫丫V 丫T V 丫V V V V V V V 丫丫丫V 1 嬲V A V I y 尺 i r V V V T V V VT V 丫V V V V V V V 丫丫V V 。 j ? VV 厂弋 一 - VV 1r V V V V V V V V T V 丫V 丫V V V V V 丫V V V 一 - ! i ? ! i : VV 弋 厂弋I i 一 - VVt V V V V V V V V Y V V V V V V V V V 丫丫V V 一 - i _ : 丫丫式厂 : 。 I V丫丫V V V 丫V V V V Y V V V V V V V V V 丫V V V 一 2 0 时间,日数 图4 青岛海水浴场各降水预报模型预报效果检验( m o d e ll m o d le 4 降水等级预报) 及实测降水分析( 降水实况等级分析:r e a l) 状和红色柱状所体现的降水可以直接转换为降水 量预报;譬如红色柱状第2 个样本的3 7k g m 2 则相 当于3 7r a in 降水量。 根据降水观测资料,在3 3 个检验样本中共有9 个降水样本,N C E P 模式预报A C P C P ( 对流性降水) 变量对降水样本的预报准确次数为3 次,空报0 次, 漏报6 次;而A P C P 0 6 ( 6h 累积降水量) 对降水样本 的预报准确次数也为3 次,空报0 次,漏报6 次;经过 数值产品的释用后,模型对降水样本的预报准确次 数为8 次,空报0 次,漏报1 次。与N C E P 模式预报 相比,释用后的降水模型预报准确率大幅提高;其 效果不仅体现在晴雨预报方面,在降水等级方面, 释用后的降水模型预报也更加贴近观测实况。从 图5 还可以看出,检验样本中的第8 、第9 - 样本,观 测实况显示为中雨和大雨降水过程,N C E P 模式预 报的相关变量对这两次降水过程均出现了漏报,而 释用后的降水模型则不仅对这两次降水过程进行 了有效预报,在降水等级上也有较好的体现,预报 的降水等级均为中雨。经过对各预报时效的降水 预报模型准确率的统计,结果表明:针对青岛海水 浴场,O 一2 4h 、2 4 4 8h 、4 8 7 2h 各预报时效其预 报模型综合准确率( 晴雨预报T s 评分) 分别为: 8 8 、8 9 及8 4 。关于该浴场降水其它预报时效 所建立的预报模型所选用的变量表及对应的预报 效果图略。 4 3 能见度预报 针对厦门海水浴场能见度预报模型的建立,首 先对收集到的厦门及其周边地区的能见度实况数 据进行统计后发现:大、小梅沙、汕尾、厦门、平潭、 东山及南澳一带,在每年的5 1 0 月容易出现辐射 雾,如图6 所示。该图横坐标为日数,纵坐标为能见 度值,灰色柱状为0 8 时能见度,蓝色柱状为1 4 时能 见度;而其中的箭头所示为辐射雾影响时间段;即 天气晴朗少云的清晨容易出现1 0k m 以下的能见 度,而至下午时间段,能见度转好,可达1 5k m 以 上。由于辐射雾的形成条件主要包括:( 1 ) 冷却条 件:地面散热迅速,即晴朗少云的夜间或清晨;( 2 ) 水汽条件:近低层水汽充沛,湿度越大、湿层越厚, 越有利于形成雾;尤其是空气被雨和潮湿的地面增 湿厚,对此类雾形成特别有利;可对应模式中的土 壤湿度项;( 3 ) 层结条件:有逆温层存在;( 4 ) 风力不 3 2 1 0 3 2 O 3 2 ,O 3 2 l 0 3 2 ,O 熙淋寸副鼙 n 副辎 剥辎 _ 副鼙 海洋预报 3 2 卷 图5 青岛海水浴场降水释用模型( 预报时效为4 8 7 2h ) 检验效果图 I I , jI 川【城 图6 厦门海水浴场能见度实况图( 2 0 1 2 9 4 N2 6 日一5 月3 1 日期间逐日两次观测) 大:微风。因此,后续所开展的工作即从模式中提 取了相关的因子以备建模使用。 根据辐射雾的形成条件,从模式中提取了相关 的因子,譬如8 5 0h P a 温度与9 2 5h P a 温度之间的温 度差、9 2 5h P a 与2m 高度的温度差、风力、风向、中 低层的相对湿度、土壤湿度及土壤湿度的2 4h 变化 情况等等。其中,土壤湿度及土壤湿度的2 4h 变化 情况是一个较好的指标;在土壤湿度已经达到一定 2 期 邓小花等:运用支持向量机方法对数值模拟结果的初步释用 2 1 的阈值的前提下,由于清晨时间段土壤的温度高于 近地面的气温,致使土壤中的水分不断蒸发并遇冷 凝结,导致辐射雾的形成。 在具体的建模过程中,通过求取备选因子与能 见度之间的相关,将相关性超过一定阈值的因子提 取出来,并进行因子的最优因子组合,进而构建了 预测模型。 在卜2 4h 预报时效的能见度预报模型的建立 中,所设置的相关系数阈值为0 3 4 ,达到阈值的因子 个数为9 个。通过众多预报模型的预报效果的对 比,最终筛选出4 个模型用于最终的能见度预报模 型的集成。图7 中,横坐标为检验样本数,纵坐标为 能见度等级,蓝色虚线是能见度为1 5k m 的分界线 ( 虚线以左的样本能见度小于1 5k m ,以右的样本大 于1 5k m ) 。图中的r e a l代表了检验样本中各能见 度等级的实况,譬如等级3 表明样本能见度小于 1 0k m ;等级2 表明样本能见度在1 卜1 5k m 之间; 而等级1 代表样本能见度在1 5k m 以上。从 表7 厦门浴场能见度预报各模型所选用的变量( 各预报时效) 变量O一24h 预报模型 2 4 4 8h 预报模型4 8 7 2h 预报模型 L F T X S F C P W A T E A T M R H 一7 0 0 S O I L W D e lt aT M P ( 与东边站点之差) D e lt aT M P ( 与两边站点之差) D e lt aU G R D8 5 0 ( 与东边站点之差) D e lt aV G R D8 5 0 ( 与南边站点之差) D e lt aV G R D8 5 0 ( 与北边站点之差) DS O I L W ( 土壤湿度2 4h 变化) + 表中以D e lt a _ 开头的变量,代表本站与周同站点之间的变量差 03 06 0 j1 1i 一_ _ 一 : l : Il 一 I_I - I _ - ,_ 一 一_一-一 f 一 f0 V 一一一 一_ 一_ 一 j W j 一 - 产_一 一 一- _ 一 j W j 一一 图7 厦门海水浴场各能见度预报模型预报效果( m o d e ll_ m o d l“能见度等级预报) 及能见度实况分析 ( 能见度实况等级分析:r e a l) 3 2 3 2 3 2 3 2 3 2 霹戗 妻、晕 墨交+ 金,晕 善犁 海洋预报 3 2 卷 m o d e ll- - m o d e m 的预报效果来看,各预报模型对 能见度小于1 0k m 的样本把握较为准确,而对 1 0 1 5k m 的能见度预报较难把握;另外,各预报 模型对能见度的预报具有总体“偏差”的趋势,即 针对一些能见度在1 5k m 以上的样本,预报模型仍 然给出了1 0k m 以下的预报结论。 表7 为厦门海水浴场能见度各预报模型在不同 预报时效情况下所用到的具体变量。总体来说, O 一2 4h 预报时效能见度预报模型中所用到的变量 包括:整层大气可降水量、土壤湿度( 含2 4 h 土壤湿 度变化情况) 、8 5 0h P a 经向风速切变等;而2 卜4 8h 预报时效能见度预报模型中所用到的变量则包括: 整层大气可降水量、土壤湿度( 含2 4h 土壤湿度变 化情况) 、气温、8 5 0h P a 纬向风速切变等;4 8 7 2h 预报时效能见度预报模型中所用到的变量包括:地 表抬升指数、整层大气可降水量、土壤湿度、气温、 8 5 0h P a 风速切变等。从各不同预报时效能见度预 报模型所选用的影响因子来看,较大一部分是较为 一致的,这表明各预报模型总体上可信度较高,并 且预报效果比较稳定。关于厦门浴场2 4 _ 4 8h 、 4 8 7 2h 能见度预报模型效果图略。 5 结论及展望 利用收集到的2 0 1 1 年、2 0 1 2 年青岛、厦门海水 浴场开放期间所收集的观测资料及对应时间段内 的N C E P 模式预报资料,应用S V M 方法,分别构建 了2 个海水浴场不同预报时效内的气温、降水及能 见度预报模型。将释用结果与实测资料或者模式 输出结果进行比对,主要可以得出以下结论: ( 1 ) 应用S V M 方法,分别构建的各预报模型, 无论是历史样本拟和的精度上( 图略) 还是模型的 实际预测能力,均比较满意; ( 2 ) 与模式结果相比,各预报要素释用后的结 果较释用前在预报准确率方面有较大的提高。如 经过气温、降水模型的进一步释用订正,预报结论 与实测结果更为接近; ( 3 ) 经过对能见度要素( 模式未能进行直接输 出的变量) 的诊断,其结果总体上较为满意,即各能 见度预报模型能够较为准确地把握住能见度低于 1 0k m 的情况;但其预报能力仍具有很大的潜力及 提升空间。 参考文献: 1 】V a p n ikV N T h eN a t u r eo fS t a t is t ica l L e a r n in gT h e o r y 【M N e w Y o r k :S p r in g e r - V e r la g ,2 0 0 0 2 V a p n ikV N S t a t is t ica l L e a r n in gT h e o r y 【M 】N e wY o r k :J o h n w ile y & S o n s , I n c。1 9 9 8 :3 7 5 5 7 0 【3 陈永义,俞小鼎,高学浩,等处理非线性分类和回归问题的一种 新方法( I ) 支持向量机方法简介( J 】应用气象学报,2 0 0 4 ,1 5 ( 3 ) :3 4 5 3 5 4 4 冯汉中,陈永义处理非线性分类和回归问题的一种新方法 ( ) 支持向量机方法在天气预报中的应用【J 应用气象学 报,2 0 0 4 ,15 ( 3 ) :3 5 5 - 5 6 5 【5 滕卫平,俞善贤,胡波,等S V M 回归法在汛期旱涝预测中的应用 研究 J 浙江大学学报( 理学版) ,2 0 0 8 ,3 5 ( 3 ) :3 4 3 - 3 4 7 ,3 5 4 【6 杨淑群,芮景析,冯汉中支持向量机( S V M ) 方法在降水分类预测 中的应用【J 西南农业大学学报( 自然科学版) ,2 0 0 6 ,2 8 ( 2 ) : 2 5 2 2 5 7 7 李智才,马文瑞,李素敏,等支持向量机在短期气候预测中的应 用【J 气象,2 0 0 6 ,3 2 ( 5 ) :5 7 - 6 1 【8 】熊秋芬,胡江林,陈永义天空云量预报及支持向量机和神经网 络方法比较研究【J 热带气象学报,2 0 0 7 ,2 3 ( 3 ) :2 5 5 2 6 0 【9 9 吴爱敏,郭江勇,张洪芬,等支持向量机方法在冰雹预报中的应 用 J 】干旱气象,2 0 0 5 ,2 3 ( 4 ) :4 1 4 5 1 0 】黄玉霞,许东蓓,蒲肃S V M 方法在森林

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论