形势场相似计算方案的比较研究_第1页
形势场相似计算方案的比较研究_第2页
形势场相似计算方案的比较研究_第3页
形势场相似计算方案的比较研究_第4页
形势场相似计算方案的比较研究_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、形势场相似计算方案的比较研究董良淼1),李宇中2)1)(广西自治区气象台,广西 南宁 530022)2)(广西气象局,广西 南宁 530022)摘 要结合天气分析方法,对常用的形势场相似算法效果进行了对比分析,结果表明: “相关系数”是较好的“形”相似判据;对经向和纬向分别计算相似度可以发掘出更多有预报参考价值的信息;另外,对相似计算方案的边界条件及执行效率等问题也作了探讨。关键词:形势场 相似判据 相似算法 天气分析Comparison of Several Analogue Arithmetic for Situation FieldDong Liang-miao1),Li Yuzhong

2、2)1) (Guangxi Meteorological Observatory, Nanning,Guangxi, 530022, China)2) (Guangxi Meteorological Bureau, Nanning,Guangxi, 530022, China)Abstract: Combine synoptic analysis method, several analogue arithmetic frequently used are tested and discussedResult indicated that correlation coefficient is

3、better shape similarity criterion; calculate longitude and latitude similarity separatly can dig out more informations that have the forecast reference value.Keywords: Situation Field, Similarity Criterion, Analogue Arithmetic, Synoptic Analysis引言 相似预报方法是一种在台站天气预报业务中得到广泛使用的统计预报方法,由于它能够综合考虑天气发展过程的三维结

4、构特征,并且兼顾大气本身的线性和非线性变化规律1,因而在各种动力、数值预报方法迅速推广普及的今天,仍有其生命力和独特的实用价值。相似预报效果的好坏,关键在于相似性判据的选择及其计算方案的实现。一般来说,衡量两个样本属性相似程度的判据可分为两大类:“值”相似判据和“形”相似判据。具体到对天气形势场这类研究对象而言,前者主要刻画了样本间的振幅(能量)差异,后者则侧重于样本间的流型(位相)差异。常用的“值”相似判据有“绝对距离”(海明距离)、“欧氏距离”等,“形”相似则多采用“相关系数”、“相似系数”等来衡量,文献1对这几种判据作了介绍和比较。显然,对两个天气形势场之间的相似性判别,需要综合考虑“值

5、”和“形”的差异,并在二者之间做出合理的权衡。李开乐2较早地提出以综合考虑了“值”“形”相似的“相似离度”统计量作为相似预报的相似性判据,此后得到普遍推广,目前在广西气象台的一些天气预报业务系统中仍有使用3,4;阎惠芳1等经分析比较后认为,使用相似系数和相对欧式距离系数分别作为“形”、“值”相似的判据,进行综合分析效果较好。与上述两种方案不同,毛卫星5等提出用“相关系数”作为“形”相似的判别标准,并采用了一种将“形”、“值”系数相乘的非线性综合方案。此外,钟元6等还提出了一种将形势场的经向相似和纬向相似分别计算、最后再综合的相似系数求解思路。上述几种现代常用相似分析方法的实际业务效果如何?本文

6、将从天气分析的角度出发,对它们及一些相关的边界问题进行比较研究,以期归纳出最适合实际预报业务使用的形势场相似求解方案。1 资料和方法以ECWMF 24小时500hpa格点预报场作为“实况”天气形势场;历史个例样本资料库选用ECWMF19702001年北半球逐日格点分析场资料。进行对比分析的形势场相似系数计算方案有四种,分别是“常规相似离度法”(即李开乐法,简称方法1)、“综合相似系数法”(即阎惠芳法,简称方法2)、“非线性相似离度法”(即毛卫星法,简称方法3)和“经纬向复合离度相似法”(简称方法4)。编制上述四种方法的计算程序,在初始条件(实况场)一致的情况下分别对历史资料库进行检索;遍历19

7、702001年同期天气形势场,计算出每个历史形势场与当前实况场的相似系数值,然后排序输出该方案判定的前10个最相似个例日期;最后用MICAPS系统分别调出这10个最相似个例的形势场分析图,与实况场进行人工比对,根据预报员的天气分析经验来判定每种方法检索结果的优劣。2 相似计算方案的比较分析2.1 几种相似计算方案的算法比较由于方法1、2、3对“形”和“值”相似的判据选择各不相同,直接导致这3种相似系数算法有明显的区别:其中,方法1使用了原创性的“形”相似判据,其特点是计算简便、且两个相似系数具有相同的数量级,可简单地进行线性加权综合。方法2使用“相似系数”作为“形”相似的判据、“值”相似也采用

8、了其它两种方案都不推荐的“欧氏距离”判据;由于二者直接计算结果的数量级不同,该方法对欧氏距离作了标准化处理改进。方法3使用“相关系数”作为“形”相似的判据,尽管计算愈发复杂,但其理论依据却更为充分;为克服“形”“值”两种相似系数数量级不同的缺陷,该方法以“形”、“值”系数相乘的方式来进行非线性综合,其总体计算复杂度反而较方法2有了明显简化。以上三种计算方案的区别具体列表如下:表1 三种相似计算方案的比较常规相似离度法(方法1)综合相似系数法(方法2)非线性综合相似离度法(方法3)“形”相似判据平均因子差值离散度相似系数相关系数“值”相似判据海明距离相对欧氏距离海明距离“形”“值”相似综合方案线

9、性综合(相加)线性综合(相加)非线性综合(相乘)算法特点以加、减法运算为主,算法简便。求解相似系数时乘、除、乘方、开方运算多,且还需计算相对距离,运算最为繁琐。求解相关系数时乘、除、乘方、开方运算多,运算较复杂;但综合方案简便。 方法4比较特殊,它的新颖之处是对经向、纬向相似的分别处理。本文着重验证该创新思路对相似预报结果产生的影响。2.2 相似计算效果比较相似方案实际应用效果的好坏与“形”、“值” 相似判据的优劣,以及两判据综合方式的合理程度这三个方面有直接关系,以下对这几个方面分别进行分析比较。2.2.1 “形”相似计算效果比较表2 三种“形”相似判据计算结果比较最相似个例排序常规相似离度

10、法(方法1)综合相似系数法(方法2)非线性综合相似离度法(方法3)日期“形”系数值日期“形”系数值日期“形”系数值11995.12.2918.661995.12.290.000009991993.1.270.011321978.2.2819.691993.1.270.000012311995.12.290.016731993.1.2721.111978.2.280.000012631982.1.180.017641981.1.1522.901996.2.90.000014051970.1.150.019051972.3.323.101972.3.30.000014271977.3.40.019

11、961996.12.2224.121981.1.150.000014571987.1.120.020371996.2.924.141996.12.220.000015291972.3.20.020482001.3.1124.661981.1.160.000015621976.1.50.020491999.12.2425.302001.3.110.000015711996.2.90.0205101979.2.1725.311979.2.170.000016371978.2.280.0208备注平均因子差值离散度相似系数相关系数表2为分别采用三种不同的“形”判据方案对2007年2月1日20时500

12、hpa实况场(即ECWMF 的2007年1月31日20时500hpa 24小时预报场,以下同)进行检索,得出的19702001历史同期(历年2月1日的前后45天)前10个最为“形”相似的个例结果。其中为统一起见,方法2、3的“形”系数值(Sij)都作了“1-Sij”的处理,以便能从小到大地排序表示最相似的程度。从表中可以看出,尽管“相似系数”和“相关系数”这两种方案的计算公式极为相近(区别在于后者使用距平值来进行运算),但得出的结果却大相径庭,最相似个例的排序也有明显区别。而方法1、2的计算方案虽有差异,但得出的最相似个例结果却非常接近,只是次序稍有不同而已。例如,1982.1.18这一天是方

13、法3选出的第三“形”相似个例,而方法1、2均未将其列入前十名之列;1978.2.28在前两个方法中均有较高的排名,而方法3只将它列在靠后的位置。调出实况场和上述个例的历史形势场,可以直观地分析判断三种方案计算结果的优劣(扇形框内为进行相似检索计算的格点范围):图1、典型个例形势场的“形”相似度比较 单位:位势米/ dgpm实况场(图1a)的典型特征是:青藏高原东侧有一个明显的低槽,云贵高原到华南西部一带则受高压脊控制;这两个特征在1993.1.27(图1b)、1982.1.18(图1c)的分析图中都有不同程度的反映;相比之下,1978.2.28(图1d)分析图的青藏高原东侧已经是弱高压脊控制、

14、云贵高原上空也是一个浅槽区,流型的相位有明显差异。这说明,方法3的排序结果更为合理。“相关系数”一直以来是描述两个序列波动位相异同程度的首选,有充分的理论依据;大量类似的对比分析表明,使之作为“形”相似的判据,较之其它两种方案有更好的效果。文献1也曾指出,“相似系数”并非完全反映“形”相似的特征,其中还掺杂有“值”相似的成分;鉴于方案1、2的输出结果近似,有理由认为,文献2提出的“形”相似判据也可能或多或少地包含有“值”相似的信息,因此,当它们与“值”相似系数进行1:1线性综合时,实际上是突出了“值”相似的特征、而将“形”相似弱化了。2.2.2 值相似计算效果比较表2为两种不同“值”判据方案对

15、2007年2月1日20时500hpa实况场32年历史同期最相似个例检索结果。比较发现,这两种方案的排序结果基本相同。可以认为,使用绝对距离和欧氏距离来表征两个序列的“值”差异程度,其效果是等同的。表3、两种“值”相似判据计算结果的比较最相似个例排序绝对(海明)距离法(方法1、3)相对欧氏距离法(方法2)日期“值”系数日期“值”系数11995.12.2918.851995.12.290.064921996.2.924.551996.2.90.076031972.3.324.671972.3.30.076841996.12.2224.791981.1.150.081051981.1.1525.27

16、1996.12.220.083261999.12.2425.491999.12.240.084271979.2.1726.201979.2.170.084681972.3.1226.271981.1.160.088391981.1.1626.521978.2.280.0888102001.3.1126.711995.2.50.0907备注平均因子差值离散度相似系数 值得指出的是,计算海明距离只需进行简单的加减和符号判断运算,而计算欧氏距离则需使用复杂的乘方和开方运算;从计算效率上看,前者显然优于后者。2.2.3 综合相似结果比较除了与判据的选择有关外,综合相似结果的优劣还取决于“形”“值”两个

17、判据综合方式的合理程度。从表2、表3的对比分析可以看出,方法1“形”“值”两个相似系数的量级相同,相近个例之间系数差值的量级也基本相同,采用线性综合方案是合理的;方法2尽管可以保证“形”“值”两个相似系数的取值在01之间,但二者之间仍有34个数量级的差距,采用线性综合方案仍无法做到“形”“值”均等兼顾。方案3的设计者显然注意到了两种判据物理意义上的本质区别并不能简单用标准化方法来彻底消除,进而采用了将两系数相乘的非线性综合方案,从而相对合理地解决了这个问题。表4是三种计算方案的综合输出结果排序,其中,为均衡起见,我们对方法2的“形”系数作了三个量级的放大,使之与“值”系数具有相同的量级。表4

18、三种综合相似计算结果的比较最相似个例排序常规相似离度法(方法1)综合相似系数法(方法2)非线性综合相似离度法(方法3)日期“形”系数“值”系数综合系数日期“形”系数“值”系数综合系数日期“形”系数“值”系数综合系数11995.12.2918.6618.8518.761995.12.290.0100.0650.0371995.12.290.01718.850.3221972.3.323.1024.6723.881996.2.90.0140.0760.0451993.1.270.01232.990.3931981.1.1522.9025.2724.091972.3.30.0140.0770.046

19、1996.2.90.02024.550.5041996.2.924.1424.5524.351981.1.150.0150.0810.0481972.3.30.02324.670.5751996.12.2224.1224.7924.451996.12.220.0150.0830.0491970.1.150.01930.700.5861978.2.2819.7030.5225.111979.2.170.0160.0850.0511981.1.150.02425.270.607(10)1996.12.220.02524.790.62(13)1993.1.2721.1132.9927.05(15)1

20、993.1.270.0120.1020.057备注1:1线性平均综合1:1线性平均综合相乘综合从表中可以看出,尽管作了量级方面的改进,方法2的输出结果仍与单独考虑“值”相似的计算结果基本相同;前面分析已指出,尽管方法1的 “形”“值”综合方案比较合理,但由于其“形”系数可能包含有“值”相似的信息,最后的个例输出与方法2吻合度较高也就不难理解了。相比之下,方法3的输出结果有明显的不同:其中1993年1月27日位居最相似个例的第二位,而该日在方法1、2的结果排序中分别位于第13、15位。图2、三种相似计算方案第二最相似个例形势场的相似度比较 单位:位势米/ dgpm图2是三种方案第二相似个例的对比

21、图。可以看出,1993.1.27(图2b)形势场与实况场(图2a)的关键天气系统(槽脊)特征基本相同,只是在青藏高原到华南西部一带地区上空的位势梯度有较大差异(实况场的等高线较为稀疏、相似场则较稠密);相比之下,1972.3.3形势场(图2c)中的云贵高原上空没有高压脊存在、而1996.2.9形势场(图2d)中的青藏高原一带完全处于高压脊控制,流型有了明显的改变。在区域天气预报实践中,槽脊的位置往往对天气现象的发生起关键作用。从这个角度看,方法3排序结果的预报参考价值更高。2.3 经、纬向分别处理对计算结果的影响方法13在处理不同经纬度的格点信息时,都是按一定顺序以一维序列的处理方式进行的。方

22、法4则采用了文献4首先提出的先分别计算经向相似和纬向相似系数、最后再综合的思路:使用与方法3相同的、以“相关系数”为“形”判据、“海明距离”为“值”判据的序列相似计算方案;在扫描区域网格内,对每一条经线计算南北向序列相似系数、对每一条纬线计算东西向序列相似系数;以所有经向序列相似系数的平均值作为经向相似度、所有纬向序列相似系数的平均值作为纬向相似度;最后将经、纬向相似度的线性和作为整个形势场的综合相似离度。将最后输出与方法3作一比较,结果是“戏剧性”的(见表5):表5 经纬向相似分别计算后的输出结果比较最相似个例排序经纬向复合离度相似法(方法4)非线性综合相似离度法(方法3)日期经向系数纬向系

23、数经纬向综合日期“形”系数“值”系数综合系数11995.12.294.2460.7224.9681995.12.290.01718.8540.31521970.1.153.7202.0025.7221993.1.270.01232.9890.38631978.2.284.4571.4005.8571996.2.90.02024.5470.50241994.3.43.2132.9196.1321972.3.30.02324.6680.57151970.2.114.8001.7546.5541970.1.150.01930.6970.58261995.1.54.9821.6796.6611981.

24、1.150.02425.2680.60171972.3.124.1032.7186.8211977.3.40.02030.4540.60881979.2.145.5561.3766.9321972.3.120.02326.2750.616对比后可以看出,将经、纬不同方向的相似度差异分别加以考虑后,输出的相似个例结果有了非常明显的改变,而且这些新个例往往是前3种计算方案都不曾考虑到的。图3 方法3和方法4典型相似个例形势场的相似度比较 单位:位势米/ dgpm图3d是综合考虑经、纬向不同相似度后的第二最相似个例输出结果,从中可以分析出该方案与方法3的细微差别:图中广西区域上空处于脊前,这与实况场

25、(图3a)中的特征相吻合,而在方法3第二最相似个例场(图3c)中广西区域则处在脊后槽前;另外,图3d青藏高原东部一带的高空槽结构也比图3c中的更加完整。单从天气分析的角度考虑,图3d所描述的天气形势较之图3c更接近实况。另一方面,更重要的是,类似图3d这样的、预报员认为更有分析参考价值的形势场,采用前3种计算方案却无法发掘出来,这充分表明:对经向和纬向的差异性应区别考虑,这在相似预报方案设计中有其独特的重要性。2.4 边界条件对计算结果的影响相似计算方案主要有时间和空间两个边界条件:即“历史同期”过程的时间检索范围、以及对每个形势场的扫描(对比)区域范围。“历史同期”时间段的选取决定了进行相似

26、检索计算的样本量,它对输出结果有直接影响。分别按每一年起报日的前后30天、前后45天、前后60天和前后90天这四个时间范围进行相似过程检索,结果表明,起报日前后30天范围一般可涵盖70% 以上的最相似个例(前十个统计,以下同),但不太稳定(最少时候只能达到50% );若将检索范围增加到起报日前后45天,则可稳定集中90%以上的最相似个例;而继续增加样本范围到历史同日的前后60天、乃至前后90天,已几乎不会对输出结果(特别是前五名个例的排序)产生影响。在空间扫描范围方面,大量的对比分析表明,程序实际扫描区域比预报关注的中心区域扩大510个经纬距为宜;向海洋、高原等测站稀疏区域外延时幅度可适当缩小

27、。过大或太小的扫描区域都会显著改变相似计算结果及其预报可参考性可能使相似个例在预报中心区的关键系统特征被弱化、或者在大范围的流场特征上不尽人意(图略)。2.5 计算效率的比较在检索时段设置为历史同日前后45天、扫描区域设定为90°E130°E、10°N40°N,在同一台P4 2.9GHz计算机运行条件下,对上述4种方案的计算耗时进行了比较,依次为137.578(方法1)、139.375(方法2)、138.78(方法3)和139.515(方法4)(每次测试均采用重新开机启动、第一次进入窗口界面后再执行程序的方法,以杜绝系统高速缓存对程序运行带来的影响),差

28、距微乎其微。由此可以看出,尽管方法4的计算过程最为繁琐,但现今IT技术发展水平已使得普通电脑的CPU运算能力已不再是进行类似运算的瓶颈;进一步的对比发现,程序在存取资料方面的耗时最多(历史格点分析资料都存储在硬盘上):例如,将检索时间段设置为起报日前后30天(总存取样本量减少了1/3),各种方法的运算时间缩短为约1分半钟;而改变格点扫描范围则几乎对运算时间没有影响。系统高速缓存对程序运行时间的影响非常明显重复运行相似程序或执行检索操作,其结果输出时间可比程序首次运行输出时间要缩短2/31/2左右,这说明数据被缓存到内存缓冲区后,再次访问耗时就显著减少。3 小结和讨论(1)采用“相关系数”作为“形”相似的判据更为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论