




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于GIS的海量气象数据预处理技术研究论文 摘要:由于气象观测数据种类多,文件存储数目大,一般难以对海量气象数据进行深入的处理,挖掘和分析。该文通过对气象数据类型,文件种类等进行研究,通过建立气象数据库并连接GIS软件进行数据分析,较好的解决了海量数据分析和处理问题。该方法利用编程软件,数据库软件和GIS技术对海量气象数据进行预处理,为海量气象数据分析提供高效、精准的数据存储和管理。并最终将数据库直接连接入强大的分析处理软件ArcGis。经过测试表明,该方法可靠性和可操作性很强,成功实现了对海量气象数据的预处理。 Abstract:Becausemeteorologicalobservationdatahasmorekindsandlargenumberfilestostore.Generally,Massmeteorologicaldataisdifficulttoprocess,mineandanalyzeforfurther.ThispaperintroducesamethodofdataanalysisthroughtheestablishmentofmeteorologicaldatabaseandtheconnectionofGISsoftware,basedonthetypeofmeteorologicaldata,filetypeandsoon.Itisbettertosolvetheproblemsofmassivedatawhichshouldbeanalysedandprocessed.Thismethodusestheprogrammingsoftware,databasesoftwareandGIStechnologytopreprocessthemassivemeteorologicaldata.Itprovidesefficientandauratedatastorageandmanagementformassanalysisofmeteorologicaldata.AndfinallythedatabaseconnectsdirectlyintotheanalysissoftwareArcGIS,whichisgoodatdataprocessing.Aordingtotestresults,thereliabilityandmaneuverabilityisverystrong,itissuessfultoachievethepre-processingofthemassivemeteorologicaldata. Keywords:GIS;Database;Meteorologicaldata;Pretreatment;ArcGis 1引言 地理信息系统(GIS)作为一门重要的信息技术,近年来在气象气候领域内引起了广泛的关注并得到了初步应用。1特别是随着现代气象观探技术的迅速发展,各级气象业务部门可获得的气象数据容量越来越大,海量的气象数据背后隐藏许多重要信息。但是在传统的气象数据库应用系统中,用户无法发现气象数据中存在的某种关系和规则,同时缺乏发现气象数据背后隐藏知识手段,从而出现“数据爆炸而知识贫乏”现象。2此外气象数据库系统作为气象信息共享平台的重要管理系统,其体系结构和技术的复杂程度均是前所未有的,需要在集约化和标准化原则下,充分利用成熟的商业数据库技术和大气科学领域的相关技术加以构建。3而GIS技术具有很好的数据分析和海量数据支持的能力。本文将GIS引入气象领域,同时GIS在气象领域的应用也是一个新的尝试。利用GIS提高了气象数据管理的可视化程度和人机对话功能。4尝试利用GIS技术为详细分析气象数据的组织结构、表达和处理方法做准备。5针对气象数据的存储和处理,目前有很多技术手段包括王杨刚等以面向对象的思想,运用C+技术设计并制作了自动气象站数据处理程序,它可以对22项气象数据进行预处理。6吴文玉以ArcGISDesktop9.3为地理信息系统平台,通过在ArcGIS下与远程气象数据库的连接方法,将数据库数据直接应用到GIS中,实现GIS与气象数据库的数据融合,具有较强的实用性。7无论哪种方法对气象数据库系统的建设是气象信息系统(气象信息共享平台)建设的核心和基础。8所以最有效的保存和交流使用数据的途径就是应用计算机技术建立数据库系统来归整,管理这些重要气象数据。9然后直接连接GIS软件使用GIS技术对气象数据进行处理。因为地理信息系统技术可以将气象数据所具有的空间特征、属性特征及时间特征等特点较好地表现出来,是实现空间数据管理的有效手段。10本文通过对气象数据的文件类型,存储格式进行研究后提出了一条采用GIS技术对海量气象数据进行预处理的方法。 2问题的提出 气象数据一般为多年的观测数据,数据的种类多,观测年限长,数据的存储文本文件多。如中国气象共享网下载的1970-xx年日值气象数据为例,数据时间跨度有44年,826个气象站台,分为7大类数据,超过15000天的观测数据,7000万行的记录数据,4亿多数据单元。数据总量达到5.9G之多。对海量气象数据进行存储,分析,管理和处理成为一个难题。目前的处理方式主要有两种方式:(1)在数据量不大的情况下,对数据进行人工筛选,然后导入Excel中进行处理。(2)根据要求通过编程实现对TXT格式的气象数据的处理。 气象数据的记录文件数量巨大,数据类型众多,文本格式数据的数据单元几乎都是采用空格的方式进行隔离,而Word无法对txt格式数据进行批量处理,Excel只能根据特殊符号或者根据一个空格一个格的形式进行数据导入而且数据的行数有限制也无法满足数据的批量入库和处理;利用编程的方式需要对数据进行大量的预处理,编程工作量较大。对于气象数据的分析往往需要地理信息数据,在现阶段基于GIS的气象数据预处理已经被广泛应用。针对于此,本文提出一种解决问题的思路:首先利用批处理命令处理文本数据,然后建立数据库并利用ArcSDE与ArcGIS相连实现数据的存储为数据分析做准备。 3解决问题的流程 气象数据是根据数据的类型,日期分批的按照TXT的格式进行存储并利用空格进行单元数据隔离。所以需要先对数据进行合并然后利用文本软件对数据进行批量预处理,再利用MSSqlServer进行批量入库和存储,最后利用ArcSDE进行数据连接,批量接入ArcGIS进行数据处理,分析和挖掘。具体技术路线如图1所示。 4气象数据处理流程 4.1数据批量预处理 气象数据是根据数据的类型,日期分批的按照TXT的格式进行存储并利用空格进行单元数据隔离的。所以需要先对数据进行合并然后才能对数据进行批量预处理。此处可利用windows的TXT批量合并命令代码实现,使用下面的代码命令可以使的所在一个文件夹中的所有文本文件合并入一个命名为0.txt的文本文件中,具体代码如下所示。 for%iin(*.txt)dotype%i0.txt 将该命令代码复制进文本文件中并将数据的格式名改为bat。 此处需先将气象数据中的数据按照数据的存储类型比如湿度,温度,气压等进行分批处理分别存储于不同的文件夹中,然后再进行数据合并。这样每一个气象类型中的0.txt文件都会存储着具有相同样式的行数据,便于高精确的批量处理。采用此种方法进行批量合并除了可以很好地进行数据预处理外,更重要的是非常简单高效,不需要任何复杂的编程和进行繁琐的软件操作。 4.2用宏命令批量处理数据 对数据按照数据类型进行合并处理后,需要对单个数据单元进行精确分离,以便于后面的数据导入。此处可利用宏命令对隔离数据的空格利用逗号进行替换,实现所有数据单元按照逗号形式进行隔离。这样后面的数据入库将会全部按照逗号进行隔离入库,不会出现空格和数据存储的错位。可以大幅提高数据的精确性。 此处可以用UltraEdit这款代码器对每一个气象数据类型下的0.txt文件进行处理。由于每一个0.txt文件数据量都很大,如果直接利用windows自带的文本器,容易导致器崩溃,且显示格式凌乱不利于处理。其他的文本器或者代码器如Notepad+,EditPlus等都存在着运行过慢或者数据量过大无法支持的问题。相关文本处理软件处理能力如表1所示: 利用UltraEdit启动宏命令后,利用宏录制下空格被逗号批量代替的过程和逗号被批量清理为一个数据单元一个逗号的过程形成宏命令。利用该命令就可以批量处理所有的0.txt文件实现所有数据的标准化,如图2所示。 数据导入完成后所有的气象数据按照地温、气压、蒸发、降水、湿度、日照、气温七类数据分表存储。可以根据需要对数据进行查询输出需要的数据。由于每一个数据表中都含有对应的站点号、经度、纬度、高程,年、月、日数据。 4.4数据库中的数据处理 由于气象数据中的经纬度数据值,是按照度分秒直接合并的,数据值不能直接使用,更不能实现对数据的直接操作,需要在数据库中对经纬度数据值进行批量处理,实现数据的标准化操作。 代码实现如下: EVP蒸发setX=(经度值/100)+(经度值%100)/(60+0.0) 注:EVP蒸发为数据库中的表,X为处理完成后所赋值的经度值,经度值代表数据库中EVP蒸发的非正常显示经度数据值。 代码运行后,所获得的数据值,完全可以达到数据的操作要求。 4.5利用ArcSDE连接气象数据库 ArcSDE是ArcGIS与关系数据库之间的GIS通道,它允许用户在多种数据管理系统中管理地理信息,并使所有的ArcGIS应用程序都能够使用这些数据。ArcSDE可以支持MSsqlserver,DBM,Oracle数据库。ArcSDE是一种数据连接方式,数据不需要经过繁杂的数据导入过程,而且可以保证数据的完整性。 打开ArcToolbox工具,选择数据管理工具-地理数据库管理-创建企业级地理数据库即可。为了连接已经建立的气象数据库我们在创建企业级数据库时,必须保证企业级地理数据库的实例名和数据名与气象数据库一致。 数据库连接完毕,在ArcGis中便可直接查看到气象数据库中的信息,可以直接进行数据挖掘和相关操作。 5结束语 本文介绍了一种基于GIS的海量气象数据预处理方法。该方法直接实现了海量气象数据的分类入库和管理,解决了一般软件由于数据支持能力限制而无法对海量气象数据进行存储和分析的问题,该方法不需要进行复杂的编程、数据精确度高、数据更新方便和可操作性强,节约了编程开发的时间和成本。该方法解决了海量气象数据下的部分数据挖掘和数据分析的问题,为气象数据基于地理信息的空间化分析提供了数据准备。 参考文献: 1吴焕萍.GIS技术在气象领域中的应用J.气象,xx(3):90-100. 2李集明,王国复.气象数据库系统总体设计综述J.气象科技,xx(S1):1-5. 3张波.数据挖掘在气象中的应用研究与实现D.电子科技大学,xx. 4李江南.GIS在气象数据处理中的应用J.广东气象,xx(4):14-15+9. 5何
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能视频剪辑器创新创业项目商业计划书
- 2025年环境影响评价公众参与机制在环境保护法律法规执行中的应用报告
- 现在进行式的课件
- 现代高效农业知识培训会课件
- 现代文阅读鉴赏课件
- 2025年教师资格证考试(中学)教育知识与能力冲刺模拟试题汇编解析版
- 2026届福建省泉州市南安第一中学化学高二上期中调研模拟试题含解析
- 2025年高考英语阅读理解专项训练试卷:冲刺押题及错题解析
- 新坐标英语2010年度市场工作总结与2011年工作计划
- 测量员岗位职责说明书
- 股权投资撤资通知书
- 应征公民政治考核表(含各种附表)
- T-CACM 1371.5-2021 中医药真实世界研究技术规范基于证据的中药有效性及安全性评价
- 跨文化沟通障碍原因分析及解决方法
- ±800kV等级及以上高压直流输电系统成套设计规程(修订)
- 2022版义务教育(道德与法治)课程标准(附课标解读)
- 店面业绩倍增内训课件
- 小学科学教师专题培训课件
- 《患者的安全转运》课件
- 《病史采集病历分析》课件
- 【新大纲新教材】2022年初级会计职称《经济法基础》精讲课件(1-8章完整版)
评论
0/150
提交评论