




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘技术在气象数据中的应用摘要:随着我国社会程度的提升,经济步伐的推进,我国的气象事业也在这个过程中得到了较大程度的开展。而在气象事业开展的过程中,伴随着是气象资料数据量以及覆盖规模的不断增大。面对这局部庞大的的数据,如何对其进展有效的查找、利用那么成为了我国气象行业人员非常关注的一项问题。在本文中,将就数据挖掘技术在气象数据中的应用进展一定的研究与分析。关键词:数据挖掘技术;气象数据;应用Abstract: along with our country social improvement, economic development,meteorological services in
2、China has been developed greatly in the process.In the process of the development of meteorological services, meteorological data along with the increasing scale and coverage. In the face of this part of the huge data, how to effectively search, its use has become a problem of great concern to the i
3、ndustry of our country. In this paper, the application of data mining technology in meteorological data on the study and analysis of some.Key words: data mining; meteorological data; application对于气象数据的搜集与分析有利于帮助我们对不同地区所具有的气象条件以及气象规律进展把握,以此使我们可以更好的对该地区某一时段下的气象情况进展预测。但是,这种数据的搜集就会使我们所具有的气象数据资料越来越多,难以对其
4、进展管理与应用。仅仅通过我们计算机方式的应用,也很难对这种规模较大的数据集进展处理,在这种情况下,就需要我们可以以数据挖掘技术的应用更好的实现气象数据的管理。1 数据挖掘流程1.1 确定对象在开展数据挖掘工作中,首先需要对业务所具有的问题进展明确的定义,帮助我们对数据挖掘的目的进展确定。虽然对于我们后续数据的挖掘结果会具有一定的不可预测性,但是对于我们问题探究的目的却需要具有良好的预见性,并以此针对性目确实实定帮助我们更好的开展后续工作。在这个环节中,主要具有数据预处理、数据转换以及数据选择这三个主要步骤。其中,数据选择是对同本次业务具有关联的维度或者数据进展选择,并从中选择出适宜本次数据挖掘
5、工作的相关数据;数据预处理那么是对本次研究数据所具有的质量进展研究,并以此帮助我们为后续的进一步分析作出准备,同时对数据操作所具有的类型进展确定;数据转换那么是要将不同类型数据通过一定的方式将其转换为我们所需要的数据分析模型,对于该模型而言,其是针对我们原有挖掘算法而建立的,而这种分析模型的建立也是我们开展数据挖掘工作的重要根底与重点环节。1.3 数据挖掘数据挖掘正是我们本次工作的核心环节,需要对所有数据预处理完成的、经过转换的数据进展全面的挖掘。在此过程中,除了需要我们以人工的方式对适宜本次挖掘工作所使用的算法进展选择之外,其余的工作都会以自动的方式开展。1.4 结果解释与评价在我们数据挖掘
6、工作完毕之后,往往会得到一系列规那么集,而这局部规那么集通常需要在专业人员对其进展一定的研究与合理的解释才可以被人们更好的掌握。对此,就需要我们对本次数据挖掘结果进展适当的解释与评价,进而使其可以具有更好的易用性以及广泛性。2气象资料特点2.1 数据量大气象资料可以说是我国历史最为长远、保存最为系统且完善的一类资源信息。尤其随着改革开放之后,我国已经积累了数量非常多的气象根底数据以及信息,且新的气象数据资料也以非常快的速度在每年增长,在我们实际处理时经常会出现冗余情况。2.2 多样性气象信息具有着非常多样化的种类,如高空气象资料、农业气象资料、日地物理资料、雷达资料、气象辐射资料、冰雪圈资料、
7、土壤与植被资料、气象灾害资料、地面气象资料、水文气象资料以及卫星资料等等。而气象资料所具有的载体也具有着很多种方式,如不同气象站所发布的气象原始报表,不同省市所发布的气象卫星云图以及雷达图等等。2.3 多维性在气象资料中,通常都具有着较多的气象要素,如高空资料以及地面资料往往具有着温度、日照以及气温等很多种要素。而在每一类要素中,也都具有着其所独特的属性维度。也正是根据这种特点,那么使气象资料往往具有着较为明显的多为特征。2.4 复杂性气象资料中所常见的数据类型主要有标称类型、二元类型、数值类型以及序列类型等等。比方降雨与否为二元类型、气压为数值类型等等。2.5 连续性在气象站中,无论是高空站
8、还是地面站,其所具有的气象要素属性值都是一种具有连续特征的数值,比方气压、温度以及气温要素。3 气象资料预处理3.1 缺失值处理在SPSS软件中,具有着很多种对于数据的缺失值处理方式。而对于气象数据来说,由于其所具有的变化是一个能量的动态变化过程,对此,我们对于气象数据所具有的缺失值那么使用Mean of nearby points方式进展,并对其中所具有的缺失值根据邻近三个小时所具有的数据平均值对缺失值进展替代。 3.2 气象资料属性泛化在数据维度泛化方面,需要严格的按照我国相关标准开展工作,比方在二氧化硫数据的泛化方面,其是否存在超标情况那么需要根据我国所制定的污染物浓度标准对其进展泛化。
9、即假设CO2所执行的为一级标准,那么那么可以根据其每小时所具有的浓度值同标准中的参考值0.15进展比对,并以此帮助我们判断该项参数是否存在超标的现象。而对于其所具有的超标、不超标现象来说,我们那么需要在对结果判断之后将其标记为是,否二元属性值。3.3 气象资料标准化在气象数据资料中,不同维度间数据往往具有着不一致的量纲,而我们在对其开展定量量测以及聚类分析时,也经常由于量纲所具有的不同而对最终的分析结果产生较大的影响。一般情况下,气象资料中所具有的风向数值都会控制在0至360之间,而假设污染因子的单位为毫克,那么其所具有的范围那么会在0至1之间,我们在对聚类进展应用时假设以间隔 作为评价,其主
10、要根据那么会在两个维度中更加倾向于风向维护。而为了可以对这局部维度间所具有的影响进展消除,就需要我们对这局部重点维度开展标准化预处理。在气象数据的标准化处理中,具有着很多种方式,Z标准化是我们应用较多的一类方式,即均值为0,方差为1。3.4 气象资料维归约在气象资料中有时候维度之间具有很强的依赖性或者说相关性,对于维度之间的这种依赖性或者相关性有时候在数据分析时候由于数据量宏大会导致多余的计算,所以对于一些需要把握主要的或者消除冗余的数据来进展数据分析时就可以采用主成分分析方法或者计算相关性来消除这些冗余的属性维度。4 气象资料孤立点分析在气象资料中的庞大数据中,我们在对其进展分析时往往忽略了
11、孤立点的存在,或者忽略了孤立点所具有的特殊意义。通常来说,人们认为孤立点仅仅是噪声数据的一种,且经常将孤立点分析这项工作作为了数据预处理进展处理,仅仅对其中可能对数据挖掘整体结果产生影响的因素进展了剔除。但是,在气象数据中,这局部孤立点往往具有着非常特殊的意义,通过孤立点数据的分析与检测,很容易帮助我们对很多灾害气象进展分析。目前,对于孤立点进展分析的技术主要有以下几种:4.1 基于统计方式首先,需要假设我们所具有的数据集可以满足某一种概率的分布形式,之后再根据其所具有的这种独特概率对数据集进展拟合,并通过不一致检验方式的应用对其中很多个数据对象开展不一致性测试。假设经过测试发现其存在着不符合
12、的情况,就可以认为其是一个孤立点。4.2 基于间隔 方式在该种方式中,我们可以将对于孤立点的分析视作邻居对象不充分的集合,且这种邻居对象也是根据对象所具有的间隔 进展定义的。通常来说,人们仅仅会通过DBp,d的应用对全局孤立点进展发现,而对于局部孤立点却很难判断。对此,我们那么可以认为孤立点概念不需要以一分为二的属性对其别离,而可以通过对象孤立度的制定对其所具有的模糊度进展衡量。4.3 基于密度方式基于密度的孤立点分析就是探测局部密度,通过不同的密度估计策略来检查孤立点。密度即指任一点和 p 间隔 小于给定半径 R 的领域空间数据点的个数。基于密度的孤立点分析最显著的特点就是给定了对象是孤立点
13、程度的定量量度,并且是数据具有不同密度的区域也能得到很好的处理。基于密度的孤立点分析较基于间隔 的孤立点分析更合理,但数据的计算复杂度较基于间隔 的孤立点分析要高许多。4.4 基于聚类方式聚类分析是用来发现数据集中强相关联的对象组,而孤立点检测是发现不与其他对象组强关联的对象。因此,孤立点分析与聚类是两个互相对立的过程。首先聚类所有的对象,然后评估对象属于簇的程度,对于基原型的聚类,可以用对象到它的簇中心的间隔 来衡量对象属于簇的程度。总得来说,数据挖掘技术在我国现今的气象数据处理中具有着较为重要的作用。在上文中,我们对于数据挖掘技术在气象数据中的应用进展了一定的研究,而在实际操作过程中,也需要我们在联络数据类别的根底上通过数据挖掘技术的应用获得更好
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水文地质测绘成果保密共享合同
- 餐饮企业加盟店选址与租赁合作协议
- 大数据仓储仓单质押担保协议
- 篮球健身课程计划与实施
- 私立学校插班生入学注册合同
- 房地产项目策划及销售合作协议
- 智能化产品宣传册设计与物联网技术合同
- 智能家居成果转化授权协议
- 护理人员继续教育培训计划
- 企业员工职业发展辅导计划
- 新能源汽车电机轴项目实施方案
- 2023年山东省青岛市中考地理试卷(附详细答案)
- 老年人能力评估标准解读(讲义)课件
- RTO工艺流程简介
- 电机行业报告
- 四年级下册道德与法治知识点归纳
- 小学标准作文稿纸模板
- 工程计量及合同结算支付流程图
- 粮食仓储(粮库)安全生产标准化管理体系全套资料汇编(2019-2020新标准实施模板)
- 人力资源管理学习通章节答案期末考试题库2023年
- 贵州省医疗服务项目收费标准
评论
0/150
提交评论