卫星遥感影像解译样本生产技术规程编制说明_第1页
卫星遥感影像解译样本生产技术规程编制说明_第2页
卫星遥感影像解译样本生产技术规程编制说明_第3页
卫星遥感影像解译样本生产技术规程编制说明_第4页
卫星遥感影像解译样本生产技术规程编制说明_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫星遥感影像解译样本生产技术规程

编制说明

一、概况

1.1任务来源

2023年7月24日自然资源部下达《自然资源部办公厅关于印发2023年度自

然资源标准制修订工作计划的通知》(自然资办发〔2023〕30号),本标准是

自然资源部发布的2023年自然资源卫星应用行业标准计划项目之一,项目编号:

202333003,标准计划名称《卫星遥感影像解译样本生产技术规程》。本标准由

全国地理信息标准化技术委员会卫星应用分技术委员会归口,由自然资源部国

土卫星遥感应用中心牵头起草。计划周期:24个月。

1.2目的意义

随着资源、高分等系列卫星陆续发射并投入使用,我国进入遥感大数据时代。

遥感影像在空间分辨率、光谱分辨率、时间分辨率及数据类型等方面得到极大

提升,可提供空间全覆盖、持续快速更新、稳定可靠运行的各类遥感影像数据

资源。但随之而来的是信息提取自动化、智能化水平与数据获取能力的巨大差

异,严重依赖人工对遥感影像目视判读的传统工作方式不能实现相关信息的快

速、准确提取,难以满足自动化、精细化、智能化的监测业务需求,严重制约

了遥感解译及应用工作的快速开展。

随着计算力的突破、遥感影像数据获取能力的暴发和算法的不断创新,在具

有鲜明“大数据”特征的遥感智能解译方向,以深度学习为代表的人工智能显

现出了勃勃生机。基于深度学习技术开展卫星遥感解译工作,其本质是从卫星

遥感大数据中利用带有标记的解译样本数据,自动抽取特征、学习规律、进行

1

推理,然后对结果进行优化提升的过程,类型丰富、种类齐全的遥感影像解译

样本数据可有效提升深度学习算法模型构建的准确性与自适应性。有研究表明,

要想在地类细分领域取得更好的模型效果,精准优质的样本数据十分重要,它

在极大程度上决定了人工智能算法模型的性能,能够满足实际应用需求的人工

智能算法模型有80%依赖于优质的样本数据,20%依赖于算法网络结构的设计。

但受限于没有统一的解译样本采集与生产相关的技术规程,解译样本数据多是

基于任务型采集的,在类别、尺寸、采集方法、质量、共享等多方面无法进行

有聚合,形成合力,较难形成大规模、高质量、多形态的卫星遥感影像解译样

本数据库,本项目通过开展卫星遥感影像解译样本(以下简称样本)采集技术

规程研究,约束和规范样本数据的数据源、采集方式、样本生产等内容,形成

一体化的采集与制作标准,指导样本数据的采集与生产,支撑遥感影像智能算

法模型的训练与应用。此项工作的开展具有重要的现实意义及广阔的应用前景。

1.3主要起草人及工作分工

编制任务下达后,自然资源部国土卫星遥感应用中心为牵头单位,武汉大学、

中国科学院空天信息创新研究院、湖南省第二测绘院、重庆市地理信息和遥感

应用中心、广东省国土资源技术中心、辽宁省自然资源事务服务中心、内蒙古

自治区测绘地理信息中心、湖北省航测遥感院等共同成立了编制组。编制组成

员包括总体负责人和长期从事卫星应用地理信息和遥感专业领域的专业技术人

员和专家分工合作开展标准各章节的编写,编制组主要人员组成及分工见表1。

表1编制组人员分工

序号姓名单位任务分工备注

自然资源部国土卫星遥感应

1王光辉项目负责人,负责组织实施

用中心

自然资源部国土卫星遥感应

2刘宇技术负责人,负责标准撰写

用中心

2

3乐鹏武汉大学负责标准编制的技术指导

中国科学院空天信息创新研

4陈正超负责标准编制的技术指导

究院

自然资源部国土卫星遥感应

5张涛标准编制组织协调

用中心

自然资源部国土卫星遥感应

6张伟负责标准技术验证及标准撰写

用中心

自然资源部国土卫星遥感应

7陆尘负责标准技术验证及标准撰写

用中心

自然资源部国土卫星遥感应

8王咏昕负责标准技术验证及标准撰写

用中心

负责标准技术验证,通读全稿并给出修

9曹里湖南省第二测绘院

改意见

重庆市地理信息和遥感应用负责标准技术验证,通读全稿并给出修

10何宗

中心改意见

负责标准技术验证,通读全稿并给出修

11雷丽珍广东省国土资源技术中心

改意见

辽宁省自然资源事务服务中负责标准技术验证,通读全稿并给出修

12吴伟

心改意见

内蒙古自治区测绘地理信息负责标准技术验证,通读全稿并给出修

13谭美淋

中心改意见

负责标准技术验证,通读全稿并给出修

14黄国清湖北省航测遥感院

改意见

1.4主要工作过程

1.4.1征求意见稿阶段

2023年1月-2023年8月,编制组开展了大量的调研工作,包括国内外有

关现有标准,以及卫星遥感影像解译样本采集及应用的实际实施情况,编制组

开始起草标准草案。

2023年9月-2024年11月,以标准草案为基础,编制组又以电话、社交软

件、电子邮件和视频会议的形式与自然资源遥感智能解译领域生产作业单位、

大学、科研院所的多位技术专家和生产专家进行多次交流探讨,并根据专家意

见对标准草案进行修改完善,于2024年11月完成了标准征求意见稿和编制说

3

明。

1.4.2送审稿阶段

暂无。

1.4.3报批稿阶段

暂无。

二、标准编制原则和确定标准主要内容的依据

2.1标准编制原则

(1)全面性

《卫星遥感影像解译样本生产技术规程》在编制过程中针对地表覆盖、目

标识别、变化检测、场景理解等多种类型卫星遥感影像解译样本数据进行了综

合考量,从数据源的质量、规范化的采集流程、标准化的采集要求等多方面对

样本数据的生产进行全面约束,保证本标准的全面性。

(2)适用性

《卫星遥感影像解译样本生产技术规程》在编制过程中考虑到了不同应用

场景下不同用户的广泛需求及多源遥感影像数据特点,提供灵活且通用的标准

和流程,确保在各种条件下能够采集到高质量和具有代表性的样本数据,满足

各类应用需求。

(3)可操作性

《卫星遥感影像解译样本生产技术规程》编制面向行业应用需求,进行了

充分的调研和实践,通过多个试点省份多轮次的验证与迭代优化,明确了样本

数据生产的总体要求、样本采集数据源、样本生产工作流程、样本数据采集、

样本集生产等内容与要求,具有较强可操作性。

4

(4)先进性

《卫星遥感影像解译样本生产技术规程》编制综合分析了深度学习等人工

智能解译技术发展现状与趋势及其对样本数据的要求,针对地表覆盖、目标识

别、变化检测、场景理解等不同的采集任务,对比了不同样本采集软件的采集

方式与流程,吸收、归纳总结了共性方法,保证其先进性。

2.2国内外调研情况

随着深度学习等人工智能技术方法在遥感解译领域的快速发展,大规模、

高质量、多形态的样本数据已成为卫星遥感影像解译的主要瓶颈之一。武汉大

学、中科院、DigitalGlobe等众多国内外高校、科研院所、企事业单位相继建

立各类样本数据集,但国内外尚未形成统一的样本采集技术规范或指导性文件。

自然资源部直属单位及相关省市单位,围绕业务需求,已逐步开展了相关基于

人工智能的遥感信息提取技术研究,初步探索开展了样本采集等相关工作。综

合相比,本次计划编制的《卫星遥感影像解译样本生产技术规程》聚焦于基于

卫星遥感影像数据的解译样本数据生产工作,结合自然资源监测监管、国土空

间规划、自然资源督察执法等不同方向的业务需求,充分发挥光学、SAR、高光

谱等多源遥感影像数据优势,形成一体化的样本数据采集与制作作业标准,支

撑深度学习等人工智能算法模型训练、优化及迭代,为卫星遥感智能解译技术

的快速发展提供标准保障。

2.3主要技术内容的说明

《卫星遥感影像解译样本生产技术规程》确立了卫星遥感影像解译样本生

产的基本要求和工作流程,规定了样本采集数据源准备、样本要素采集、影像

样本集生产、生产记录等阶段的操作指示,描述了过程记录等追溯方法。主要

技术内容的说明如下:

5

2.3.1基本要求

基本要求对样本数据的空间参考、时间系统、安全要求等方面做出规定,

确保样本数据的一致性和可用性。按照《国土资源部国家测绘地理信息局关于

加快使用2000国家大地坐标系的通知》(国土资发〔2017〕30号)要求,原国

土资源部(现自然资源部)确定,2018年7月1日后自然资源系统将全面使用

2000国家大地坐标系。因此,样本数据坐标系统采用2000国家大地坐标系。《国

务院关于启用“1985国家高程基准”的批复》(国函〔1987〕78号)要求,1985

国家高程基准作为全国新的统一的高程控制系统。因此,样本数据高程基准采

用1985国家高程基准。北京时间是中华人民共和国全境采用的国家标准时间,

基于东八时区(UTC+8),即东经120°经线的时间。卫星遥感影像解译样本的

采集与生产。因此,样本数据时间系统采用公历纪年,北京时间。同时,样本

数据采集过程中可能会涉及三调、地理国情监测等成果数据。因此,样本数据

采集、制作过程中需满足一定的安全要求,数据安全参照《GB/T39477信息安

全技术政务信息共享数据安全技术要求》。

2.3.2样本生产程序

样本生产包括样本采集数据源准备、样本要素采集、影像样本集生产3个

阶段,样本生产程序流程见图1。根据样本生产任务,选择样本采集区域并准备

相关数据。通过影像数据采集、已有成果数据采集等方式开展样本矢量采集工

作,并完成样本属性数据的录入与样本的质量检查,采集完成的样本要素数据,

按照样本采集区层级进行文件目录组织,通过样本裁切批量生产样本小片数据,

进而生成影像样本集数据,并完成影像样本集元数据录入、质量检查等工作,

并以文件夹的形式,按照一定规则进行存放。

6

图1样本数据生产程序流程图

2.3.3样本数据源准备

通过项目实践结合现有国内外样本数据采集方法,明确了遥感影像数据采

集、已有成果数据采集两种采集方式,并以此为依据,开展样本数据源准备工

作。基于遥感智能解译应用需求及工作任务,有针对性的选择工作区,并准备

配套的的采集数据。遥感影像数据为单景或多景镶嵌裁切的卫星遥感影像数据,

7

包括光学影像、高光谱影像及SAR影像,并对数据源及其处理结果的质量要求

做出进一步明确。

同时,以最大化利旧为原则,在样本数据采集过程中,可引入开源样本数

据集及三调、地理国情监测等已有成果。已有成果数据应完整覆盖样本采集区

范围,包括矢量成果数据和对应影像数据。如果已有成果只包括矢量数据,应

按照已有成果采集时采用的影像信息,匹配相应时相和分辨率的影像数据,已

有成果应明确成果分类内容、成果类别定义、采集时间等成果属性信息以及分

辨率、时相、波段数、像素位深、卫星名称、传感器类型等影像属性信息。

2.3.4样本要素采集

(1)样本要素采集主要包括样本矢量图斑采集、样本图斑属性赋值、样本

矢量与影像生成三部分。作业人员根据任务区特点及数据情况,通过遥感影像

样本采集、已有成果采集等方式,利用自动、半自动、人机交互等多种形式,

完成样本数据的采集与标准格式影像样本集制作。

遥感影像样本采集是利用人机交互方式,根据样本采集任务需要,采集单

类或多类地物样本图斑。每一个样本应能够代表所属的覆盖类型,能综合反映

该类型的总体特征,或者突出反映该类型某一方面的特征;在地物分布和覆盖

类型相对比较一致的区域内,样本总体在数量上应能代表该区域的整体特征,

在分布上应贴近地表覆盖类型分布的趋势。具体步骤如下:

a)基于待采集类别地物的影像特征,在遥感影像数据上采用人机交互方式

勾绘采集样本图斑矢量边界,或基于影像分割算法对影像进行分割,提取符合

待采集类别地物特征的分割矢量图斑,生成样本图斑;

b)样本采集时应采集样本区内所有该类别样本图斑,确保无遗漏;;

c)采集的样本图斑拓扑关系应正确,无不合理悬挂点、伪节点,不同矢量

8

间共点、共线、共面时共部分应重合,相邻面间不应重叠,要素不应存在不合

理极小面、折刺、自相交等几何图形;

d)采集的地物样本位置与影像上的地物位置边缘吻合,边界应避免锯齿状

和明显扭曲;

e)e)影像上分界明显的地物界线,边界精度应在2~3个像素以内;特殊

情况,如高层建筑物遮挡、阴影等,采集精度应在5个像素以内;

f)通过分割生成的样本图斑,应对未满足b)~e)要求的矢量图斑通过人

机交互方式修改至满足要求。

已有成果采集主要是基于开源样本数据集或已有样本数据集,从中筛选符

合分类体系及任务要求的样本。筛选时明确样本数据的内容,采集属性信息、

样本影像、样本标注或样本矢量,保证样本数据的完整性。基于第三次全国国

土调查、地理国情监测、土地变更调查等的历史影像和矢量数据成果,根据分

类体系进行类别信息映射,整理加工后进行矢量数据综合、属性补充等,利用

程序实现样本数据的自动采集,具体步骤如下:

a)确定待采集地物类别与已有成果分类体系的类别映射关系,通过类别选

取或类别合并方法提取符合待采集类别要求的地物图斑,自动生成地物样本矢

量;

b)按照类别筛选两期同类型已有成果数据,提取特定类别图斑,可基于两

期成果数据自动提取生成变更类型样本矢量;

c)自动提取的样本矢量图斑精度如不符合遥感影像样本数据采集的要求,

应按照人机交互方式进行编辑修改直到满足要求。

(2)样本元数据信息主要记录了样本信息、影像信息、样本区信息、采集

信息等一些列内容,可确保数据的可追溯性与准确性。通过元数据,用户可快

9

速了解样本数据样本的来源、特性和适用场景,从而提高数据的利用效率。同

时样本数据也是数据管理的最小单元,完整、详实的信息便于后续样本数据的

入库管理、空间定位、检索查询及应用。样本元数据根据采集任务、数据源信

息、行政区划、采集信息等多项内容综合确定,元数据填写基本要求参考《参

考GBT39608-2020基础地理信息数字成果元数据》第4章节。

(3)通过开展样本数据质量检查,识别样本采集过程中的错误信息,进而

对样本数据错误信息进行修改,有效保证样本数据的正确性、准确性与可用性。

样本数据质量检查各项质量元素详细内容及要求按照GB/T17941第5章对应质

量元素的规定内容执行。

(4)样本数据按照样本采集区进行多层级文件目录组织,以一定数量或一

定区域的数据集为单位进行存放,采用统一的文件命名规则,便于识别与管理,

其数据组织方式参考《CH/T9012-2011基础地理信息数字成果数据组织及文

件命名规则》。

图2样本要素成果组织目录结构

2.3.5影像样本集生产

(1)样本数据采集与生产相关裁切条件设置主要综合考虑了目前主流深

度学习算法模型对样本数据的要求及现阶段计算资源的存储与计算能力,避免

10

过大数据导致数据处理效率低下。样本小片数据宜采用规则正方形,边长可取

512或1024等像素大小,样本小片裁切步长:应设定为样本小片尺寸的一半。

在样本裁切过程中为了便于组织,按照影像小片、标签小片和小片元数据分别

按照下列不同数据的分文件夹存放:

a)影像小片文件夹以“影像样本集名称+_image”命名;

b)标签小片文件夹以“影像样本集名称+_label”命名;

c)小片元数据文件夹以“影像样本集名称+_meta”命名;

样本小片命名:样本小片名称应由“影像样本集名称+样本小片编号”组

成,样本小片编号从1开始,位数不够时前面补0,样本影像小片、标签小片、

小片元数据采用同名称命名。

(2)样本小片格式采用主流、常用且兼容性较好数据格式,在实际使用过

程中,可根基不同深度学习算法模型对样本数据的格式要求,通过程序进行快

速转换。

a)影像小片宜采用.tif或.jpg格式,jpg格式应附带同名aux.xml文件记

录小片空间范围信息;

b)标签小片可根据需要采用下列不同的数据形式:

1)栅格类型宜采用.png或.tif数据格式,png数据格式应附带同名.aux.xml

文件记录标签小片空间范围信息,栅格标签小片中0值为背景区域;

2)矢量类型应采用.shp数据格式,矢量属性表中应有字段记录图斑类别信

息;

3)文本类型应采用.json数据格式,文件中应有字段记录图斑类别信息。

(3)通过软件或者程序代码对采集完成的影像样本影像和矢量数据进行

自动批量裁切,生成样本小片数据,具体步骤如下:

11

a)根据影像样本中影像数据行列数,在行、列方向上按照样本步长计算可

以裁切的小片个数;

b)从影像左上角行列号开始,分别在行、列方向上依次按照样本步长计算

每张样本小片左上角在影像数据中的行列号;

c)基于样本小片的左上角行列号和样本尺寸,计算得到样本小片四至范围

在影像上的行列号,并将行列号转换为该样本小片地理参考坐标,影像行列号

坐标转换为地理参考坐标;

d)根据样本小片空间范围,判断是否存在样本矢量,如果样本矢量为空,

则跳过该样本小片范围,

重新按照步骤b)计算下一张样本小片的左上角行列号,如果存在样本矢量

则执行下列步骤;

e)根据该样本小片空间范围,裁切样本矢量数据,生成规定格式和命名要

求的标签小片数据;

f)根据该样本小片空间范围,裁切样本影像数据,生成规定格式和命名规

范的影像小片数据;

g)基于裁切得到的影像小片和标签小片,计算生成该张小片元数据信息并

记录小片元数据,按照规定内容和格式要求生成小片元数据文件;

h)循环步骤b)、c)、d)、e)、f)、g),按照行列顺序生成每一张样本小片

数据,直到所有样本小片裁切完成,获得影像样本集所有样本小片数据。

(4)影像样本集元数据信息主要记录了基础信息、影像信息、区域信息、

制作信息等一些列内容,影像样本集元数据填写基本要求同样本元数据,参考

《参考GBT39608-2020基础地理信息数字成果元数据》第4章节。

(5)通过开展影像样本集质量检查,识别影像样本集中的错误信息,进而

12

对影像样本集错误信息进行修改,有效保证影像样本集的正确性、准确性与可

用性。影像样本集质量检查各项质量元素详细内容及要求按照GB/T17941第5

章对应质量元素的规定内容执行。

(6)影像样本集数据按照一定数量的影像小片、标签小片、小片元数据与

影像样本集元数据,以文件目录的形式进行组织,便于数据识别与管理。

图4影像样本集成果目录结构

三、验证试验的情况和结果

基于前期大量实验和自然资源部国土卫星遥感应用中心牵头的2023年度自

然资源部部省合作试点项目-自然资源遥感智能解译样本及光谱数据库建设关

键技术研究及应用示范项目,通过部省共建形成了遥感影像智能解译样本采集

系统、遥感影像智能解译样本数据管理系统。在此基础上,基于自然资源常态

化监测、督察执法、耕地非农化及耕地保护监测等重要业务需求,构建了地表

覆盖、目标识别、场景理解、变化检测等4大类样本数据的分类体系,通过影

像样本采集、已有成果采集两种采集方式,开展了多类型解译样本数据的采集

生产工作,共计300余万条,样本采集样例如下图所示。经验证,采集生产的

13

样本数据可支撑深度学习算法模型的训练与应用。通过该项工作的开展,明确

并验证了样本数据生产技术流程与方法,进一步凝练了样本数据生产过程中的

各项要求,有效确保了本技术规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论