版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分类号:P457.9 U D C:D10621-408-(2014)0541-0密 级:公 开 编 号:2010024057成都信息工程学院学位论文决策树法在贵州雷电潜势预报中的应用论文作者姓名:王加敏申请学位专业:雷电防护科学与技术申请学位类别:工学学士指导教师姓名(职称):孙凌论文提交日期:2014年05月16日独 创 性 声 明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得成都信息工程学院或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究
2、所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名: 日期: 2014年 5月22日关于论文使用授权的说明本学位论文作者完全了解成都信息工程学院有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权成都信息工程学院可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名: 日期: 2014年 5月22日决策树法在贵州雷电潜势预报中的应用摘 要贵州省位于我国西南部地区,是雷暴活动频繁、雷电灾害最为严重的省份之一。为了更多的了解贵州地区的雷
3、暴灾害,本文利用MICAPS软件,对2013年贵州地区75个地面观测站的资料,进行雷暴发生时间、站点和天气形式的统计。结果显示,贵州地区所发生的雷暴主要是在天气系统的影响下产生的,其中受高空槽影响产生的雷暴数最多,占总数的31%;其次是受副热带高压移动所产生的雷暴占总数的22%;受西南低涡影响所产生的雷暴占总数的10%,受高空急流影响所产生的雷暴占总数的7%,受切变线影响造成的雷暴占总数的6%,受东风波影响所产生的雷暴次数占3%,受冷锋系统影响造成的雷暴占2%。由其他因素影响产生的雷暴占总数的19%。贵州地区雷暴的时空分布表现出如下特征:从月变化上看雷暴主要集中在6-8月份,从日变化上看雷暴数
4、白天少于夜间,从地区上看,南部多于北部,而且主要分布在西南部,东南部,西北部。通过贵阳和威宁两个高空探测站所记录的925 hPa、850 hPa、800hPa、700 hPa、500 hPa、250hPa等探测资料,对雷暴发生的不稳定参量进行相关性统计分析,得出与雷暴发生情况相关性较好的不稳定指标为,对流有效位能,850hPa假相当位温,气团指标K,沙氏指数S ,850hPa与500hPa假相当位温差,全总指数。根据以上指标,运用决策树方法生成贵州省未来12小时雷暴潜势预报的决策树,并通2014年3月份的资料对决策树进行验证和修正,得到当概率预报达到70%以上时,对未来12小时雷电潜势预报准确
5、率较高,达到了预期效果。 关键词:贵州,雷暴,MICAPS,天气系统,决策树Application of Decision Tree in Guizhou Potential Prediction of ThunderANSTRACTGuizhou Province is located in the southwest of China, which is one of the most serious lightning disaster regions in China. In order to studing the thunderstorm disasters in Guizhou,
6、 the paper uses MICAPS software analyses the recording of ground sites to draw a statistical report on the occurrence time of thunderstorms and the weather patterns of Guizhou. The report shows that plenty of thunderstorm disasters in Guizhou are caused by weather systems, such as 31% of the disaste
7、rs caused by the high shafts, 22% caused by the movement of subtropical high pressure, 10% caused by the the southwest vortex, 7% caused by the high-altitude jet, 6% caused by the shear line, 3% caused by the easterly wave, 2% caused by the cold front system, and 19% caused by the other factors. The
8、 characteristics of Guizhou thunderstorms distribution are as follows. In the aspect of monthly changing, the thunderstorms mainly change from June to August. In the aspect of dayly changing, the thunderstorms mainly happenned in the night. In the aspect of regional distribution, the south thunderst
9、orms are more than the north thunderstorms. By means of analysing the recording of souding site in 925 hPa, 850 hPa, 800hPa, 700 hPa, 500 hPa, and 250hPa, we figure out the most valuable instability indexs, which are CAPE, the pseudo-equivalent temperature in 850hPa, the index K of air mass, Showalt
10、er index S, the difference of pseudo-equivalent temperature between 850hPa and 500hPa, and the total surface temperature. Basing on these characteristics, we use Decision Tree method to get the next 12 hours details of the forecasting of thunderstorms in Guizhou,and the forcasting product can be cor
11、rected by the data in March 2014. When the right rate of forecasting reachs 75% or more, we can ensure that the thunderstorm forecasting product can satisfy the social request.Keywords: Guizhou,thunderstorm,MICAPS,weather systems,Decision Tree目 录第一章 绪论11.1 雷电灾害概况11.2 国内外研究现状11.3 研究的内容、目的和意义2第二章 资料来源
12、和处理工具32.1 资料来源32.2 MICAPS软件介绍42.2.1 MICAPS系统概述42.2.2 MICAPS在气象业务系统中的位置52.2.3 系统主界面说明52.2.4 MICAPS系统功能6第三章 贵州地区的雷暴特征73.1 雷暴天气系统类型73.2 雷暴的时空分布特征8第四章 天气形式和不稳定参数分析104.1 天气形式分析104.1.1 副热带高压104.1.2 高空槽114.1.3 西南低涡124.1.4 台风槽134.1.5 高空急流134.1.6 冷锋144.1.7 东风波154.2 不稳定参数的初步选择与相关性分析164.2.1 不稳定参数的初步选择164.2.2 不
13、稳定参数相关性分析16第五章 研究方法175.1 决策树法175.1.1 决策树的定义175.1.2 决策树的建立和修剪185.1.3 决策树的分支准则18第六章 雷电潜势预报决策树206.1 雷电潜势预报决策树206.2 雷电潜势预报决策树的检验21第七章 结论22参考文献23致 谢24第一章 绪论1.1 雷电灾害概况雷电灾害是当今世界面临的最严重的十种自然灾害之一,它是自然大气中的瞬间放电现象,并同时伴有声光电的出现。雷击的峰值电流可达到几万甚至几十万安培,对地面人员及物体会造成很大的威胁。根据多年的雷电灾害统计表明,我国每年都有上千人遭雷击伤亡,以广东省、云南省和贵州省损失最为惨重。雷击
14、灾害事故在我过呈现出明显的两极分布特征:在农村,雷电灾害主要表现为人员伤亡,因为农村地区村民居住分散,文化教育程度低,对雷电等自然灾害缺乏认识,防雷意识薄弱,又因为没有经济基础,对雷电几乎没有任何相应的防雷设施,然而家用电器也相对较少,所以受灾形式以人员伤亡为主。而在城市,雷电灾害主要表现为微电子电器设备受损。因为城市中居民人口集中,电脑,电话等电子设备通信设施普及且广泛使用。现代设备对雷电电磁辐射的防护还没有跟上电子设备的发展进度,然而建筑物防直击雷工程相对较完善,所以在城市中受灾形式以电子,电气设备损坏为主。因为雷电灾害给国民经济和人民生命财产安全造成了严重的威胁和巨大的损失,所以经常引起
15、社会的震动和关注。贵州省境内天气复杂多变,据相关统计分析,贵州省年平均雷暴日达到51.6天,地闪平均密度达到10.4次每平方千米。从进入2013年以来,截至到6月20日,在贵州地区就发生31起雷击事故,造成5人死亡,4人受伤,导致直接经济损失248.3万元。然而这些数据与常年同期相比还有所下降。由于雷暴在时间上具有很强的瞬时性,在空间分布上又有显著的广泛性,分散性和局地性等特点。导致雷电灾害相比其他自然灾害更加难以预报。 1.2 国内外研究现状关于雷电灾害的预报,一直以来都是气象预报业务中的一个难点。Sutapa Chaudhuri Anirban Middey 2012年在对不同地区雷暴和闪
16、电活动的特征性差异的研究中,发现闪电辐射随对流有效位能的增加而线性增加,这两种数据的高度相关也表明闪电辐射强度可以通过对流有效位能的值来进行检测。Goodman在2010建议将闪电跳算法作为一种有用的强雷暴潜势的判断方法2。Lal and Pawar 2009验证了夏季风前,印度中部的对流性降水和雷暴活动之间存在一定的相关性3,Ramesh Kumar and Kamra在2010年对闪电活动的研究中,得出上升气流的加强会导致暴雨、闪电比率的提高4。在国内,刘贵萍等从层结不稳定、低层湿层和垂直运动出发,再配合雷达回波来探讨雷暴发生的成因,得出龙洞堡机场初夏雷暴多发生于低空急流最北端、高空急流的
17、左前方和右后方辐散区域、中层槽前、副热带高压西部的外围地区、地面的锋面气旋中4。丁旻等对雷暴活动规律和雷电灾害特征进行了相关性分析,说明了雷暴活动的强弱直接决定了雷电灾害发生的概率5。通过对贵州省雷暴地面观测资料、贵州省闪电定位监测资料、雷电灾害统计资料整理,统计分析了贵州省雷电灾害的时空分布特征与雷暴活动规律,并利用最小二乘法将二者作相关性分析,发现二者具有很高的相关性6。赵琳提出在西南地区的雷暴天气预报中,较深的高空冷槽的移动和台风槽的移动应该引起注意,容易产生较大面积雷暴,高空冷槽移动可结合地面图看地面高压是否到达盆地地区,而台风槽引起的雷暴则要看台风边缘风带,边缘风带所覆盖的区域都是易
18、产生对流的区域。数值预报产品(T213)能较好的预报出系统的上升运动的强弱,卫星云图也能反映出对流云系的运动和发展,这对雷暴的预报有一定的指导意义7。我国的雷电潜势预报技术相对国外还有很大的差距,主要表现在,方法研究不足。自动化,开放式的预警预报系统还未普及。1.3 研究的内容、目的和意义本文使用2012年10月到2013年10月贵州全省85个站台的地面填图资料和两个高空探测站资料,运用MICAPS以及EXCEL软件,对数据进行分析,统计出贵州地区雷暴发生的时空分布特征、以及与雷暴活动有关的主要天气形式和不稳定指标,并通过对不稳定指标进行相关性分析,筛选出能够预报贵州地区发生雷暴的预报因子,运
19、用决策树这一数学方法,来生成贵州地区未来12小时的雷电潜势预报决策树,这对贵州省的雷电预警预报有一定的意义。第二章 资料来源和处理工具122.1 资料来源本文所使用资料来源于2012年10月到2013年10月贵州全省85个站台的地面填图资料和两个高空观测资料,以三个或者三个以上的站点有雷暴活动发生,记为一次,然后从中随机选取55个有闪电活动和53个没有闪电活动的个体为样本进行研究。 贵州省85个站台的分布情况如图2-1所示,其中各站点名称与站号之间的对应关系如表2-1所示。图2-1 贵州省气象站点分布图为了目前对不稳定参量的研究,从贵州在以上85个站中选择贵阳(57816)、威宁(56691)
20、作为研究对象,因为他们是贵州地区唯一有高空资料的两个地点。表2-1 贵州省气象站号与站名对照表站号站名站号站名站号站名57609赤水57808普定57913龙里57634务川57813清镇57921平塘57708大方57814平坝57923三都57719开阳57821福泉57713遵义57723凤冈57824贵定56691威宁57728瓮安57828麻江57606桐梓57732印江57834台江57816贵阳57736江口57900晴隆57832三穗57738镇远57903关岭57902兴仁57739玉屏57905贞丰56793盘县57800纳雍57908安龙57614习水57707毕节579
21、09册亨57647松桃57722湄潭57911白云57710仁怀57731思南57907兴义57712汇川57741铜仁57926荔波57718息烽57803黔西57623道真57729余庆57806安顺57734石阡56792普安57825凯里57932榕江57625正安57906望谟56693水城57922独山57916罗甸2.2 MICAPS软件介绍2.2.1 MICAPS系统概述MICAPS是气象信息综合分析处理系统(Meteorological Information Comprehensive Analysis And Process System)的简称,是与“9210”工程通信
22、、数据库系统配套的支持天气预报制作的人机交互系统。其主要功能是通过检索各类气象数据,显示气象数据的图形和图象,对各类气象图形进行编辑加工,为气象预报人员提供一个中期、短期、短时天气预报的工作平台。系中国气象部门气象卫星、天气雷达和数值预报等产品的综合应用最强有力业务技术支撑平台。2.2.2 MICAPS在气象业务系统中的位置图2-2 MICAPS在气象业务系统中的位置2.2.3 系统主界面说明系统启动后主界面如图2-1 所示,包括标题栏、菜单条、工具条、资料检索窗口(综合图目录、综合图文件窗口)或工具箱、图层选择窗口、属性窗口、显示设置窗口、图形显示区域和状态栏等几个部分。图2-3 MICAP
23、S主界面2.2.4 MICAPS系统功能1. 业务预报员通过该系统能够检索和用字符或图形图像方式显示数据库中所有与业务预报有关的数据,并能通过该系统提供的图形编辑功能对显示的图形进行必要的编辑修改。2. 该系统提供足够的图表和图形编辑功能及其他工具,帮助业务预报员制作预报并自动生成最终预报产品。3. 业务预报员通过该系统界面可随时查询本地现代化业务系统中与预报业务有关的各子系统运行状态。4. 该系统能自动产生与预报业务管理有关的各种数据,并对它们进行管理和输出。5. 该系统应提供一个二次开发环境,以便各地根据本地情况对该系统的各分量进行调整,或在该系统提供的基本功能之上开发新的功能。第三章 贵
24、州地区的雷暴特征本文使用2012年10月到2013年10月贵州全省85个站台的地面填图资料和高空探测资料,运用MICAPS和EXCEL软件查找和记录贵州省雷暴天气发生的具体时间、站点和不稳定参数,以及雷暴发生时的各高度层参数,为了方便研究,以3站以上有雷暴发生,记为一次,整理得出以下结论:33.1 雷暴天气系统类型通过对雷暴发生的站点,时间进行统计,并对925hPa,850 hPa,700 hPa,500 hPa,250 hPa的环流形式进行分析,可以观察到贵州地区由环流背景产生的雷暴占主要部分:受高空槽影响产生的雷暴数最多,次数达47次,占总数的31%;其次是受副热带高压移动所产生的雷暴,次
25、数达到34次,占总数的22%;受西南低涡影响所产生的雷暴,次数为15次,占总数的10%,受高空急流影响所产生的雷暴,次数为11次,占总数的7%,受切变线影响造成的雷暴有10次,占总数的6%,受东风波影响造成的雷暴次数为5,占3%,受冷锋系统影响造成的雷暴4次,占2%。由其他因素影响产生的雷暴有18次,占总数的19%。由各天气形式影响产生的雷暴所占比例如图3-1所示。由此可见,尽管贵州地区的地势比较复杂,天气多变,但是总的来说,贵州地区发生雷暴的主要是因为还是受到系统性天气影响为主。图3-1天气系统所占比例图3.2 雷暴的时空分布特征由2012年10月到2013年10月一年的数据观察得出,贵州地
26、区的雷暴活动表现出显著的特征,从雷暴活动发生的日变化上看,主峰出现在一年的8月份,次峰出现在一年的3月份。从雷暴活动发生的日变化上看,主峰出现在15时到一天之中的20时这一时段,且主要集中在17时左右。次峰则出现在23时到凌晨02时这一时段,且最大值是在24时左右。图3-2,3-3显示贵州地区雷暴活动在一年之中时间上的变化特征。图3-2 贵州雷暴月变化统计图图3-3 贵州雷暴天气日变化统计图第四章 天气形式和不稳定参数分析44.1 天气形式分析4.1.1 副热带高压副热带高压是指在副热带地区产生的一种暖性高压系统,它对各纬度地区的水汽、热量、能量的输送和平衡起着至关重要的作用。西太平洋副热带高
27、压一般在1040之间活动,其位置随着季节的变化而变化。贵州地区一年中大部分时间处于副热带高压所控制的地区,它对贵州地区的气候产生了重要的影响。当副热带高压带北移到亚洲大陆地区时,由于海陆分布的影响,在部分地区断裂成许多个的高压单体。在受到副热带高压控制的西部外围地区空气相对暖湿。经常会出现大气层结构不稳定的情况。只要有足够的热力和冲击力,就会很容易形成雷暴活动。当副热带高压西伸或东退时,处于副高西侧的西南暖湿气流控制下的地区,水汽将逐渐增多,往往容易产生雷暴。图4-1 2013年8月02日20时500hPa天气图如图4-1所示,2013年8月2日20时贵州地区大面积的雷暴活动就是在副热带高压引
28、起的,从图中可以看出,副热带高压588线受地形的影响,被切断成两个单体,其中一个出现在我国的东南部沿海地区,一个位于我过西部四川,西藏一带。在东南部的一支将海上暖湿气流输送到我国中部地区,与位于西部地区的一支输送北方干冷空气相遇,结果引起我国贵州在内的大部分地区产生雷暴活动。4.1.2 高空槽高空槽是从低压中心延伸出来,中间的气压比两边低的狭长型区域。高空槽的形成与来自西北方的冷空气有关。高空槽为雷暴活动的形成和发展供给了很好的触发条件(垂直运动)和良好的水汽条件。在大气不稳定程度达到一定阈值的时侯,高空槽的深度越深,气流的辐合越强,相应的上升运动亦强,因而越有利于雷暴的产生。然而,高空槽是否
29、真的能够造成雷暴活动,还需要观察其它的两个情况,即槽线前后的气流分布和它们的冷暖性质。所谓槽线前后的气流分布情况,主要以槽线两侧的风向交角及风速的大小来表征。一般来说,风向交角愈接近或小于99度及槽后风速较大,槽线上的辐合上升运动也较强,这样的槽就有利于产生雷暴天气。除以上所述的情况外,高空槽的温度场结构也跟雷暴活动的形成有着相当大的关系。冷性的高空槽和暖性高空槽相比,冷性高空槽的槽线前后暖舌和冷槽相对明显,冷暖平流较强。因此更有利于雷暴活动的形成。而暖性的高空槽则不同,由于其槽线前后都为暖空气所占据,垂直运动得不到发展,因此对雷暴形成不利。图4-2 2013年3月12日20时500hPa天气
30、图如图4-2所示,13年3月12日20时贵州地区大面积的雷暴活动就是在高空槽作用下产生。4.1.3 西南低涡西南低涡又称西南冷涡,顾名思义它是出现在我国西南地区中纬度中层大气中的一种低强度,小范围的冷性低压系统。它在700百帕天气图上比较容易观察出来。西南低涡的范围较小,一般水平尺度只有几百千米。在它存和发展的时候,可引导地面上的低压或锋面气旋发展加强。在西南低涡控制的区域,会有强盛的空气辐合上升,从而可能导致云雨天气的产生。尤其是在西南低涡的东部地区和东南部地区,气流的上升运动最为强盛,对流性天气也随之更为严重。西南低涡一般在一年四季都可出现,是影响贵州地区雷暴发生的重要天气系统之一,在它所
31、控制的区域,特别是边缘地区,会有强烈的对流运动产生,在下垫面扰动等条件下,雷暴活动就很容易形成7。如图4-3所示,在我国的四川地区产生了一个范围较小的低压系统(西南低涡),而贵州正处于它的东南部边缘地带,气流辐合运动非常强烈,从而导致了2013年4月4日贵州地区雷暴活动的产生。D图4-3 13年4月4日700hPa高度场4.1.4 台风槽台风槽即在台风来临或者离开时所留下的低压槽,当其达到一定强度时,则会带来暴雨、雷暴、大风等强烈天气,由于台风本身具有大风、高温和高湿的特点,当台风中心出现在我国东南的偏南地区时,台风就会将海洋上的暖湿气流向我国的西南地区输送,处于台风边缘的辐合气流控制下的地区
32、,由于辐合抬升的作用便可产生雷暴。如图4-4所示,13年8月2日台风飞燕在我国的海南省登陆,将海洋上大量的暖湿空气吹向我国的内陆地区,在不同性质的气流的交汇处,造成了中国南部大部分地区出现雷暴和强降水。飞燕图4-4 2013年8月2日500hPa流场图4.1.5 高空急流高空急流是所有急流中的一种。急流是指大气中一股强而窄的气流带。急流的水平长度达到几万千米,宽度达到几百千米,厚度达到几千米。如图4-5中急流中间的长横轴称为急流轴,它近于水平分布。急流中心风速的最大值在对流层的上部必须在30米每秒以上,风的垂直切变速度为5-10米每秒之间,水平切变速度为每百公里5米每秒。西南地区雷暴的产生6月
33、份以前主要受副热带西风急流和极锋急流的影响,6月至10月,极锋急流消失,副热带西风急流处于较偏北的纬度,西南地区处于这支西风急流南侧,在高空急流轴左前方和右后方是辐散区域,有利于上升运动的发展和维持。如图4-5所示,2013年3月19日贵州地区的雷暴天气就主要是由高空急流影响产生的。图4-5 2013年3月19日250hPa流场图4.1.6 冷锋冷锋是由两个大的冷暖气团移动时,在冷气团和暖气团相遇的的界面(锋面)上发展起来的。由于冷空气的密度相对较大,所以冷空气总是处在暖空气的下面,排挤着暖湿的空气,并把它抬升起来,于是处在锋面地区的天气就急剧地发生变化。因为冷空气往往来势非常猛烈,是雷雨形成
34、因素中最为强烈的一种,常常在很短的时间内产生特大暴雨,所以其危害最为严重。引起雷暴出现的时间主要取决于冷锋锋面的移动速度。冷锋雷暴一般情况下会产生于冷锋过境前后的两三个小时之内。当高空表现为前倾槽的时候,则在冷锋过境之前出现雷雨天气,相反,当高空表现为后倾槽的时候,雷暴就会冷锋过境之后出现7。雷暴产生的区域一般就在锋面附近。如图4-6所示,13年6月10日贵州省大面积的雷暴天气就是在北方冷气团南下,冷锋过境所引起的。图4-6 2013年6月10日20时250hPa天气图4.1.7 东风波在北半球的夏季,随着西太平洋副热带高压588线西伸脊线北抬到30以北,并逐渐形成稳定的带状,此时在我国的长江
35、流域及其以南地区,就处于副高南侧的由海洋吹向陆地的东风暖湿气流中,常常会出现一些天气尺度的波动向西移动,即东风波7。波长一般在10001500公里,强的东风波波长可达40005000公里,弱的仅300公里。在波带曲率较大的地方附近,在动力和热力的作用下,容易产生雷暴天气。由图4-7所示,在副热带高压北移至30度以北时,长江以南地区处于由海洋吹向陆地的东风暖湿气流中。在曲率较大的广西,贵州地区产生了范围较大的雷暴天气。图4-7 2013年7月26日500hPa天气图4.2 不稳定参数的初步选择与相关性分析4.2.1 不稳定参数的初步选择根据雷暴发生的基本条件,结合天气学知识,选取了对流有效位能,
36、K指数,地面总温度,对流抑制能来反映大气的聚集能量,选取选取200hPa的散度,500hPa的涡度来反应触发雷暴的动力条件,选取沙氏指数S作为大气不稳定指标,选取850hPa、700hPa、500hPa温度露点差之和作为雷暴发生的水汽条件,最后为了更全面的反应雷暴发生的条件,还选择了850hPa假相当位温,850hPa与500hPa假相当位温差等综合指标作为本文研究的样本。4.2.2 不稳定参数相关性分析以上资料是根据雷电发生的天气学条件,选取在理论上有关的指标,但是由于各地区有其特殊性,所以,这些参数能否作为贵州地区发生雷暴活动的预报因子,还需要对其做一个相关性分析。由于受到资料限制,本文引
37、用杨秀庄基于闪电定位仪资料研究雷电潜势预报的方法,以经纬度网格内发生雷暴的频率与前一天20时起报的18小时预报产品和当天08时起报的18小时预报产品6。二者建立相关性统计关系。其关系式如下:rxy=i=1Nxi-xyi-yi=1Nxi-x2i=1Nyi-y2(4-1)公式中x表示闪电强度,y表示18小时预报产品。通过计算得出选取的十个物理量与雷暴活动的相关系数如表所示。表4-1 物理量与雷暴活动的相关系数表不稳定指数相关系数对流有效位能0.3288K指数0.3798对流抑制能(CIN)-0.0281沙氏指数(SI)0.2837地面总温度0.1577850hPa与300 hPa温度差0.0217
38、850 hPa涡度0.0492300 hPa散度0.0469850hPa、700hPa、500hPa温度露点差之和-0.1577850hPa与500hPa假相当位温差0.2388由上表可知各物理量与雷暴强度之间的相关系数,在显著水平=0.05的情况下,相关系数的临界值为0.1384。所以,以上物理量相关系数大于0.1384的则与雷电活动有显著的相关性。第五章 研究方法55.1 决策树法5.1.1 决策树的定义决策树是一种与流程图相似的树形结构,树中的每个节点表示一个测试(查询),该节点的每个分支表示一次测试(查询)的结果,树中的每一个叶子节点表示一个类别。它是一种直观运用概率来进行分析的图解法
39、。5.1.2 决策树的建立和修剪决策树的生成是一个自上而下递归的过程。设有数据样本集S,首先根据某种策略选择一个属性对样本集S进行划分,得到n个子样本集,记为Si。再对每一个Si迭代执行上一步骤。经过n 次递归后, 最终生成决策树。从根节点到叶结点的路径就对应着一条具体的规则, 整棵决策树有多少个叶节点就对应着多少组规则。在树构成步骤中, 关键是要找出节点的属性和如何对节点的属性值进行划分。在对属性值进行划分的时候,当出现以下三种情况时,划分终止1.节点处所有样本均属于同一个类别。2.没有变量可以用来分类。3.该节点下没有样本。当决策树生成之后所面临的问题是树的过分细化,尤其是存在噪声数据或不
40、规范属性时表现得更为突出,决策树的修剪实际上就是对过度细化的模型进行重新调整。修剪算法分为先剪枝算法和后剪枝算法两种。前剪枝算法是在树的生长过程完成前就进行剪枝。先剪枝法的优点是在树生长的同时就进行了剪枝,所以效率高,但是它可能造成某些有用但还没来得及生成的节点被剪去。后剪枝算法是在决策树生长完成后再对其进行剪枝。它分为两种情况,即需要单独剪枝集和不需要单独剪枝集。后剪枝有它的一些优点,例如,当单独的两个属性似乎没有什么用处,但是,当它们结合在一起的时候却有非常强的预测能力,即一种结合效果。5.1.3 决策树的分支准则在将样本区分后,需要确定分支准则,使得后继节点的数据尽可能的“纯”,本文将采
41、用信息衡量标准,即各分支节点的熵不纯度,来进行决策树的分支。熵不纯度计算公式:p1,K,pJ=-J=1JpJlog2pJ(5-2)不纯度必须满足一下条件:定义在pJ0,且满足J=1JpJ=1。不纯度必须大于等于零,且只有在1j,K,1j时有最大值,在1,0,0,0,0,1,0,0,0,0,0,1时有最小值0。p1,K,pJ中任何变量对调,不影响函数值。对任何节点t不纯度的计算,有如下公式:it=p1t,p2t,pJt(5-3)pit表示节点t中,属于类别i的概率。假设有一分支s将节点t的样本分为t1和t2,其所占比例分别为p1和p2,则分支之后不纯度的减少为:is,t=it-p1it1-p2i
42、t2(5-4)选择不纯度减少量最大的一个分支继续往下进行。即:is,t=maxSiSisi,t(5-5)s=S1,S2,(5-6)根据以上所述,终止分支在实际应用中,可以给定一个较小的临界值,即is,t=maxSiSisi,t时终止分支工作。因为的值不恒等于零,所以,最终节点仍然有一定的不纯度,为了利于知识的获得,还可以用门槛值法和错分成本法等进行归类。在节点t分类所需的信息:Int=p1,K,pJ=-J=1JpJlog2pJ(5-7)nt表示属于节点t的样本总个数。如果以属性A作为分支标准,A=A1,A2, ,AV,则其期望值为:EA=i=1vnintIni(5-8)Ini=-j=1jpjl
43、og2pj(5-9)ni表示节点t中属性值为Ai的个数。Pj表示属性值为Ai,而且属于类别J的比例。如果以该属性作为分支的依据,那么不纯度减少量为:gainA=Int-EA(5-10)分支标准的原则是找出信息量最大属性,作为节点t的分支标准,即选择maxAgain(A)(5-11)本文将根据这一规则建立贵州雷电潜势预报二叉决策树。第六章 雷电潜势预报决策树66.1 雷电潜势预报决策树贵州省雷电潜势预报决策树是由以上相关性分析得出相关性大于0.1384的因子组成,有对流有效位能,K指数,沙氏指数,850hPa与500hPa假相当位温差。经计算属性值,和不纯度减少量后进行分支,修剪后生成一棵二叉决
44、策树。雷电潜势天气概率预报是雷电活动发生可能性的概率预报,概率越大说明在贵州未来12小时发生雷电活动的可能性就越大,相反,概率越小说明发生雷暴活动的可能性就越小。贵州省雷电潜势预报决策树如下图6-1所示。对流有效位能se(850hPa)se(850hPa与500hPa差)无雷电天气无雷电天气K指数无雷电天气沙氏指数全总指数度无雷电天气无雷电天气无雷电天气有雷电天气70j/kg70j/kg50500015151.81.84242图6-1 贵州省雷电潜势预报决策树6.2 雷电潜势预报决策树的检验贵州雷电潜势预报决策树是在贵州省一年的资料为样本,经过训练后建立起来的,本文利用决策树建立过程中未用到的
45、2013年部分资料,分成3至8月份和9至2月份两部分对雷电潜势预报决策树进行初步检验,检验原则是,把概率预报当作确定性预报,当该站点通过决策树预报有雷电产生,而在未来12小时该站点果然有雷电活动产生,则判断为预报正确。如果预报有雷暴发生却在12小时内没有雷暴发生则判断为空报,如果没有预报却在未来12小时内有雷暴发生,则判断为漏报。检验结果显示,在预报概率值大于80%时具有较好的指导意义。检验结果如表6-1,6-2所示。表6-1 3至8月份雷电潜势预报验证表预报概率60657075808590正确概率66.57%70.33%76.44%80.19%85.88%89.31%91.27%漏报概率2.13%2.28%2.34%2.56%2.67%2.88%3.01%空报概率31.30%27.39%21.22%17.25%11.45%7.81%5.72%表6-2 9至2月份雷电潜势预报验证表预报概率60657075808590正确概率60.18%63.87%70.56%78.77%83.48%87.33%90.08%漏报概率2.81%2.99%3.23%3.37%3.81
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学大一(计算机应用技术)数据库开发技术实务阶段测试题
- 2025年高职(野生动植物资源保护与利用)珍稀动物保护试题及答案
- 2026年面包制作(全麦面包烘焙)试题及答案
- 2025年中职灌溉与排水技术(灌溉排水操作)试题及答案
- 2025年中职旅游服务(导游实训实操)试题及答案
- 2025年高职汽车电子技术(汽车电器维修)试题及答案
- 2026年环境工程(污水处理技术)试题及答案
- 2025年大学医学信息学(医学信息)试题及答案
- 2025年高职哲学(西方哲学概论)试题及答案
- 2025年高职(烹饪工艺与营养)烹饪原料学阶段测试题及答案
- DB11∕T 637-2024 房屋结构综合安全性鉴定标准
- 2025年新疆中考数学真题试卷及答案
- 2025届新疆乌鲁木齐市高三下学期三模英语试题(解析版)
- DB3210T1036-2019 补充耕地快速培肥技术规程
- 混动能量管理与电池热管理的协同优化-洞察阐释
- T-CPI 11029-2024 核桃壳滤料标准规范
- 统编版语文三年级下册整本书阅读《中国古代寓言》推进课公开课一等奖创新教学设计
- 《顾客感知价值对绿色酒店消费意愿的影响实证研究-以三亚S酒店为例(附问卷)15000字(论文)》
- 劳动仲裁申请书电子版模板
- 赵然尊:胸痛中心时钟统一、时间节点定义与时间管理
- 家用燃气灶结构、工作原理、配件介绍、常见故障处理
评论
0/150
提交评论