版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫星遥感影像解译样本库建设规范
编制说明
一、概况
1.1任务来源
2023年7月24日自然资源部下达《自然资源部办公厅关于印发2023年度自
然资源标准制修订工作计划的通知》(自然资办发〔2023〕30号),本标准是
自然资源部发布的2023年自然资源卫星应用行业标准计划项目之一,项目编号:
202333002,标准计划名称《卫星遥感影像解译样本库建设规范》。本标准由全
国地理信息标准化技术委员会卫星应用分技术委员会归口,由自然资源部国土
卫星遥感应用中心牵头起草。计划周期:24个月。
1.2目的意义
卫星遥感影像解译样本(以下简称样本)是基于深度学习进行影像智能解译
的关键,它的好坏将直接影响最后的解译效果,一些大范围地物信息的提取,
更是依赖多源的遥感信息数据样本,满足智能训练和提取需求。目前,国内外
已有的样本数据多偏重于自然地物以及目标物,难以覆盖遥感影像解译的各种
应用场景,样本容量依然很难满足深度学习大范围提取的数据需求,且现有样
本数据多采用普通样本图片数据库的方式进行管理或直接已文件夹形式存储,
难以体现遥感影像地理空间位置、分辨率、传感器、采集时间等特有属性信息,
难以高效的进行管理和检索。
因此,针对样本数据体量太小、规格不统一等情况,为满足对于大规模卫星
遥感影解译样本数据库(以下简称样本库)的存储与管理需求,综合分析样本
数据数据结构与特点,合理设计样本库逻辑结构、库表结构,建立样本信息组
1
织与存储模型,实现海量样本的有效组织与存储,并以此形成样本库建设规范,
指导样本数据进行入库管理,建设大规模、规格统一、分布均匀、全场景地物
类型的样本数据库。
基于此样本库建设规范建设的样本库遵循统一规范的分类体系,具有空间分
布均匀、样本规格规范、覆盖全应用场景、样本影像多尺度、多传感器、多时
相的地表全要素样本数据,具备样本类型与类别动态扩展的能力,满足遥感智能
解译的精准解译要求,支撑遥感影像智能解译研究发展和行业遥感应用。
1.3主要起草人及工作分工
编制任务下达后,自然资源部国土卫星遥感应用中心为牵头单位,武汉大学、
中国科学院空天信息创新研究院、湖南省第二测绘院、重庆市地理信息和遥感
应用中心、广东省国土资源技术中心、甘肃省基础地理信息中心、广西壮族自
治区自然资源遥感院、湖北省航测遥感院等共同成立了编制组。编制组成员包
括总体技术负责人和长期从事卫星应用地理信息和遥感专业领域的专业技术人
员和专家分工合作开展标准各章节的编写,编制组主要人员组成及分工见表1。
表1编制组人员分工
序号姓名单位任务分工备注
自然资源部国土卫星遥感应
1王光辉项目负责人,负责组织实施
用中心
自然资源部国土卫星遥感应
2刘宇技术负责人,负责标准撰写
用中心
3乐鹏武汉大学负责标准编制的技术指导
中国科学院空天信息创新研
4许越负责标准编制的技术指导
究院
自然资源部国土卫星遥感应
5张涛标准编制组织协调
用中心
自然资源部国土卫星遥感应
6张伟负责标准技术验证及标准撰写
用中心
7陆尘自然资源部国土卫星遥感应负责标准技术验证及标准撰写
2
用中心
自然资源部国土卫星遥感应
8王咏昕负责标准技术验证及标准撰写
用中心
负责标准技术验证,通读全稿并给出修
9雷帆湖南省第二测绘院
改意见
重庆市地理信息和遥感应用负责标准技术验证,通读全稿并给出修
10马泽忠
中心改意见
负责标准技术验证,通读全稿并给出修
11耿欣广东省国土资源技术中心
改意见
负责标准技术验证,通读全稿并给出修
12李霞甘肃省基础地理信息中心
改意见
广西壮族自治区自然资源遥负责标准技术验证,通读全稿并给出修
13黄友菊
感院改意见
负责标准技术验证,通读全稿并给出修
14向浩湖北省航测遥感院
改意见
1.4主要工作过程
1.4.1征求意见稿阶段
2023年1月-2023年8月,编制组开展了大量的调研工作,包括国内外有
关现有标准,以及卫星遥感影像解译样本管理及应用的实际实施情况,编制组
开始起草标准草案。
2023年9月-2024年11月,以标准草案为基础,编制组又以电话、社交软
件、电子邮件和视频会议的形式与自然资源遥感智能解译领域生产作业单位、
大学、科研院所的多位技术专家和生产专家进行多次交流探讨,并根据专家意
见对标准草案进行修改完善,于2024年11月完成了标准征求意见稿和编制说
明。
1.4.2送审稿阶段
暂无。
1.4.3报批稿阶段
暂无。
3
二、标准编制原则和确定标准主要内容的依据
2.1标准编制原则
(1)全面性
《卫星遥感影像解译样本库建设规范》在编制过程中立足样本库建设的全
面性、扩展性,旨在构建一个大规模、多尺寸、多场景地物类型的样本库,涵
盖地表覆盖、目标识别、变化检测、场景理解等多种类型样本,保证了本标准
全面、灵活、可扩展。
(2)适用性
《卫星遥感影像解译样本库建设规范》在编制过程中考虑到了不同应用场
景下不同用户的广泛需求,契合遥感智能解译与信息提取的实际与后续库体扩
展要求,确保了本标准的适用性,体现了样本的综合信息,实现海量样本数据
的高效存储管理。
(3)可操作性
《卫星遥感影像解译样本库建设规范》编制面向行业应用需求,进行了充
分的调研和实践,通过多个试点省份多轮次的验证与迭代优化,明确了样本库
的数据内容、建库流程、库体创建、样本库建设、样本库测试与验收、验证方
法等内容与要求,具有较强可操作性。
(4)先进性
《卫星遥感影像解译样本库建设规范》编制综合分析了样本库建设的技术
发展现状及发展趋势,深度学习遥感智能解译技术发展及对样本数据的最新要
求,吸收、归纳总结了共性方法,保证其先进性。
2.2国内外调研情况
4
样本库建设是一项基础性工作。国内外多源卫星遥感影像解译样本数据集
通常是通过文件夹以文件形式进行组织,在样本格式、样本类型、分类体系、
样本属性等方面无法实现统一。武汉大学针对现有地理人工智能样本数据进行
整合建库,牵头编制了《地理人工智能样本数据库建设规范》确定了样本数据
内容、样本库系统设计、样本库建库、样本库系统集成等内容,但其缺乏卫星
遥感解译样本数据的细化规范要求与技术标准。现阶段,尚未有针对卫星遥感
影像解译样本数据建库的相关技术规范或指导性文件。自然资源部直属单位及
相关省市单位,围绕业务需求,已逐步开展了相关基于人工智能的遥感信息提
取技术研究,初步探索开展了样本库建设等相关工作。这些数据库较多侧重地
理信息相关内容,本次编制的《卫星遥感影像解译样本库建设规范》支持人工
智能解译样本数据建库管理,制定样本库建库流程,形成一体化的卫星遥感影
像解译样本管理的作业标准,可实现大规模、多时相、多尺度的样本库构建,
支撑卫星遥感影像解译技术发展。
2.3主要技术内容的说明
《卫星遥感影像解译样本库建设规范》规定了卫星遥感影像解译样本数据
库的数据内容、建库流程、库体创建、样本库建设、样本库测试与验收、验证
方法等内容与要求。主要技术内容的说明如下:
2.3.1总体要求
空间参考:坐标系统采用2000国家大地坐标系;高程基准:采用1985国
家高程基准;时间参考:日期采用公历纪年,时间采用北京时间。
样本数据质量要求应符合CH/TXXXX—XXXX《卫星遥感影像解译样本生产技
术规程》中样本要素采集质量要求与影像样本集生产质量要求的相关规定。
数据安全应符合《GB/T39477-2020信息安全技术政务信息共享数据安
5
全技术要求》的规定。
2.3.2样本库数据内容
本标准与《CH/TXXXX—XXXX卫星遥感影像解译样本生产技术规程》为配套
标准,《CH/TXXXX—XXXX卫星遥感影像解译样本生产技术规程》适用于基于
卫星遥感影像数据的解译样本数据生产工作,在其约束下生产的卫星遥感影像
解译样本或其他满足要求的样本数据根据本标准进行建库。因此,样本数据组
成、样本数据要求、影像样本集元数据等参照《CH/TXXXX—XXXX卫星遥感影
像解译样本生产技术规程》。
(1)样本数据组成:样本库样本数据为若干影像样本集,一组影像样本集
由n(n为自然数)张样本小片和影像样本集元数据组成。
(2)样本数据要求:影像样本集各项数据内容具体要求如下:
a)影像小片:为一期遥感影像数据或前后时相两期遥感影像数据,采
用.tif、.img或.jpg栅格数据格式,jpg格式应附带同名.aux.xml文件记录坐标
信息;
b)标签小片:可采用矢量、栅格或文本等不同形式的标注数据,矢量型标
签小片应为.shp格式,栅格型标签小片应为.tif或.png格式,文本型标签小片
应为.xml或.json格式;
c)小片元数据:记录单组小片数据的编号、样本有效占比等相关样本小片
属性信息,应为.xml格式。
影像样本集元数据:记录整组影像样本集的数据对应关系及相应属性信息,
包括样本集基本信息,样本集影像数据信息,样本集所属的区域信息,样本集
生产制作信息等,具体元数据项及填写规范按照CH/TXXXX—XXXX《卫星遥感影
像解译样本生产技术规程》附录E的规定执行。元数据文件应为.xml格式,采
6
用元数据项英文名称作为元数据项标记。
(3)样本数据组织:影像样本集数据组织应符合CH/TXXXX—XXXX《卫星遥
感影像解译样本生产技术规程》章节9.4.2的。
2.3.3样本库建库流程
样本库建库流程分为样本库建库与样本库测试与验收两部分:
(1)样本库建库:根据样本库数据内容与需求,进行样本库逻辑结构设计
和样本库表设计,并创建样本库初始库体,经过样本准备、数据预处理、样本
入库前检查、样本入库、样本入库后检查等步骤,将影像样本集数据存储到数
据库中。
(2)样本库测试与验收:对建设完成的样本库进行测试与验收,并对样本
库进行改进与优化。
样本库建库流程如图1所示。
7
图样本库建库流程
2.3.4样本库结构1
样本库结构主要包括样本库逻辑结构、样本库表设计、样本库表设计三部
分。面向样本数据管理需求,基于业务特性、技术标准、样本数据特点及应用
场景的综合考量,充分考虑样本数据的多样性、层次结构和数据间的关联,建
立符合数据模型的逻辑结构。依据《CH/TXXXX—XXXX卫星遥感影像解译样本
生产技术规程》,在样本数据采集时,需记录影像样本集、样本小片、样本集
元数据、小片元数据等一系列相关信息,影像样本集记录样本集ID,样本集名
8
称、样本集样本数量等信息。样本小片记录样本小片ID、样本集ID样本编号、
影像小片ID,标签小片ID等信息。样本集元数据记录样本集各项属性信息,包
括样本类型、分类体系、样本类别、样本尺寸、影像属性等。小片元数据记录
每一张小片样本的独立属性信息。通过逻辑结构设计,将样本数据实体建立1
对1或1对多的关系模式。在逻辑模型结果的基础上,设计了影像样本集数据
表、样本小片数据表、样本小片元数据表、影像样本集元数据表、影像样本集
影像属性表、分类体系表、样本区表、省级行政区表、市级行政区表、县级行
政区表等共10个表,表结构设计兼顾后续因业务、技术发展需求而进行扩展的
实际需求,具备良好的扩展性。同时,考虑到后续使用中会通过空间检索、属
性检索等多种方式进行数据查询,在表结构设计时设计索引字段,以提高查询
效率。在此基础上,实现样本库库体的创建,实现样本数据的高效存储与管理,
支持样本数据的检索、查询和应用。
(1)样本库整体逻辑模型如图2,由影像样本集、样本小片、影像和标签
数据文件、小片元数据和样本集元数据等实体组成,实体间联系如下:
a)一个影像样本集包含多个样本小片以及一个样本集元数据;
b)一个样本小片包含一个或两个影像小片数据、一个标签小片数据和零个
或一个小片元数据;
c)一个样本集元数据包含一个或两个与样本集影像类型对应的影像属性;
d)一个影像样本集对应一个分类体系、一个样本区和一个或多个行政区。
9
图2样本库逻辑结构
样本库组织:样本库将影像、标签数据文件和各类元数据分开组织,具体
组织原则与数据关联如下:
a)影像样本集信息采用数据库表组织方式;
b)样本小片信息采用数据库表组织方式,并与影像样本集建立关联;
c)影像、标签样本实体数据采用文件系统组织方式,并与样本小片建立关
联;
d)样本小片元数据采用数据库表组织方式,并与样本小片建立关联;
10
e)样本集元数据以及对应的影像属性采用数据库表组织方式,样本集元数
据与影像样本集建立关联;
f)影像样本集对应的分类体系、样本区和行政区,采用数据库表组织方
式。。
(2)样本库表结构设计:基于样本库逻辑模型,设计数据库物理表结构,
并按照软硬件配置、数据量估算,分配不同的表空间;确定样本库各类数据表
的字段名称、数据类型、宽度、值域范围、是否非空、备注说明等内容,选定
相应的索引关键数据项。表结构如下所示:
表影像样本集数据表(YXYBJ_YBJ)
字段英文名字段中文名数据类型空/非空说明
1
SetID样本集IDObjectID非空主键
SetName样本集名称String非空
SampleNum样本小片数量Int非空
表影像样本集样本小片数据表(YXYBJ_YBXP)
字段英文名字段中文名数据类型空/非空说明
2
SampleID样本小片IDObjectID非空主键
SetID样本集IDObjectID非空
SampleNo样本小片编号String非空
Raster样本影像数据ObjectID非空
两期影像小片中旧时
RasterOld样本影像数据(旧时相)ObjectID非空
相数据
Label样本标签数据ObjectID非空
像素与地理坐标转换
GeoTrans坐标转换参数Array
参数
表影像样本集样本小片元数据表(YXYBJ_XPYSJ)
字段英文名字段中文名数据类型空/非空说明
3
TileMetaID小片元数据IDObjectID非空主键
SampleID样本小片IDObjectID非空
SampleSize样本尺寸Int非空
ClassList样本类别列表Array非空列表记录多类编码
RegionRatio样本有效占比Double非空
SpatialRegion样本空间范围Json非空
CenterPoint样本中心点坐标Json非空
11
表影像样本集元数据表(YXYBJ_YBJYSJ)
字段英文名字段中文名数据类型空/非空说明
4
SetMetaID样本集元数据IDObjectID非空主键
SetID样本集IDObjectID非空
SampleType样本类型String非空样本应用类型
ClassSystem样本分类体系ObjectID非空
Label样本类别Array非空列表记录多类编码
SampleSize样本尺寸Int非空
SampleTime样本时间Date非空
两期影像小片中旧
SampleTimeOld样本时间旧时相Date非空
时相数据
ImageAttr样本影像属性ObjectID
两期影像小片中旧
ImageAttrOld样本影像属性(旧时相)ObjectID
时相数据
SpatialRef样本坐标参考系String非空
SpatialRegion样本空间范围Json非空
SampleArea样本区IDObjectID
Province省行政区String
City市行政区String
County县行政区String
ProductionUnit样本制作单位String非空
Producer样本采集人员String非空
CollectionTime样本采集时间Date非空
表影像样本集影像属性表(YXYBJ_YXSX)
字段英文名字段中文名数据类型空/非空说明
5
ImageID影像属性IDObjectID非空主键
SetID样本集IDObjectID非空
ImageType遥感影像类型String非空
Resolution影像分辨率Double非空
BandCount影像包含的波段数量Int非空
BandStru光学影像波段组成String光学影像填写
Spectrum高光谱影像光谱分辨率Double高光谱影像填写
WavelengthRange高光谱影像波长范围Double高光谱影像填写
FrequencyBandSAR影像工作频段DoubleSAR影像填写
PolarizationSAR影像极化方式StringSAR影像填写
PixelType影像像素存储类型String非空
PixelDepth影像像素位深Int非空
Platform影像拍摄载荷平台String
Satllite影像获取的卫星平台String
Sensor影像获取的传感器类型String
12
表分类体系表(FLTX)
字段英文名字段中文名数据类型空/非空说明
6
ClassID类别IDObjectID非空主键
ClassCode样本类别编码Long非空
ClassName样本类别名称String非空
Description类别描述String非空
ParentClassID父类IDObjectID首级分类为空
按照RGB顺序排列,用
ColorStr类别颜色字符串String非空
分号分隔
表样本区表(YBQ)
字段英文名字段中文名数据类型空/非空说明
7
ZoneID样本区IDObjectID非空主键
ZoneCode样本区编码Long非空
ZoneType样本区类型String非空
Landform地形特征String
Climate气候特征String
Hydrology水文特征String
表省行政区表(XZQH_SHENG)
字段英文名字段中文名数据类型空/非空说明
8
ProvinceID省IDObjectID非空主键
ProvinceCode行政编码Long非空
ProvinceName省名称String非空
表市行政区表(XZQH_SHI)
字段英文名字段中文名数据类型空/非空说明
9
CityID市IDObjectID非空主键
CityCode行政编码Long非空
CityName市名称String非空
ProvinceID所属省IDObjectID非空
表县行政区表(XZQH_XIAN)
字段英文名字段中文名数据类型空/非空说明
10
CountyID县IDObjectID非空主键
CountyCode行政编码Long非空
CountyName县名称String非空
CityID所属市IDObjectID非空
(3)样本库库体结构创建:数据库创建根据数据库设计内容构建数据库库
体,按照样本库的逻辑模型和库表结构,对每类数据分配物理空间,设置相关
13
参数,创建样本库及相关数据表,并建立数据库表关联。分配物理空间时,考
虑未来数据的扩充需求。
2.3.5样本库建设
(1)样本库建设参考了《GB/T33453-2016基础地理信息数据库建设规范》
中7.1的建库流程,并结合了样本数据特点,对样本库建设进行了整体设计。
(2)待入库的样本数据整体上可以细分为两大类,第一类是按照《CH/TXXXX
—XXXX卫星遥感影像解译样本生产技术规程》标准采集生产的样本数据,该类
按照样本库数据内容,生产制作或收集所需要的影像样本集数据以及相关资料
和属性信息,将收集的待入库样本数据存放在专设的存储空间上。对收集的影
像样本集数据进行整理,分析样本数据可用性、相关信息完整性、样本数据与
规范样本内容差异性等,并进行相应信息记录,对样本数据进行建档和备份。
第二类是开源卫星遥感影像解译样本数据或其他已有成果数据,针对此类数据
需基于样本数据库总体要求及实际情况进行预处理,使之满足数据库内容和数
据组织的质量要求。
(3)样本入库前检查项参照《GB/T41149-2021基础地理信息数据质量要
求与评定》标准及总体要求,从空间参考系、逻辑一致性、完整性、元数据等
角度开展样本数据检查,对于待入库样本数据检查存在问题的数据部分,需记
录错误类型,并依据样本数据内容进行规范修改,直到满足各项质量检查要求。
(4)样本数据入库可以选用人工手动添加或程序自动入库,各项数据入库
内容如下:
(5)样本入库后检查对已入库的数据库内样本数据进行内容检查。如果检
查入库后的样本数据存在错误,则将整组样本数据或样本集以及相应数据库记
录删除,并重新入库。
14
(6)自然资源部国土卫星遥感应用中心牵头的2023年度自然资源部部省
合作试点项目-自然资源遥感智能解译样本及光谱数据库建设关键技术研究及
应用示范,研发了遥感影像智能解译样本数据管理系统,实现了影像样本集入
库、样本数据入库,进一步为样本库的建设提供了有力依据。
三、验证试验的情况和结果
基于前期大量实验和自然资源遥感智能解译样本及光谱数据库建设关键技
术研究及应用示范项目等,通过部省共建形成了遥感影像智能解译样本采集系
统、遥感影像智能解译样本数据管理系统,开展了地表覆盖、目标识别、场景
理解、变化检测等多类型解译样本数据的采集工作,初步构建了自然资源卫星
遥感影像解译样本库。通过该项工作的开展,明确了样本库建库的规范与要求,
有效验证了建库流程,并对样本库数据内容、库体创建、样本库建设、样本库
测试与验收、验证方法等相关内容、技术流程与要求进行了进一步的规定与约
束,确保样本库建设的正确性、实用性和可操作性,同时对各省采集的样本数
据进行入库管理,如下表所示,该批次采集解译样本数据53万余条,样本数据
量600G,较好的支撑后续人工智能的快速应用。
表解译样本数据入库
2样本数量
人工目标地表覆盖变化检测其他类
22601
甘肃省
91419725
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药店企业财务制度
- 浮光报销财务制度
- 中国物流财务制度
- 物业业委会财务制度
- 工程造价公司财务制度
- 养老院老人康复设施维修人员管理制度
- 夜市活动引流方案策划(3篇)
- 圆形池子施工方案(3篇)
- 施工现场施工防生物污染制度
- 罕见肿瘤的表观遗传调控异常
- 2026年乡村医生传染病考试题含答案
- 金属厂生产制度
- 2026安徽淮北市特种设备监督检验中心招聘专业技术人员4人参考题库及答案1套
- 新零售模式下人才培养方案
- 上海市徐汇区2026届初三一模化学试题(含答案)
- 预中标协议书电子版
- 龟的解剖课件
- 蒙牛乳业股份有限公司盈利能力分析
- 2025民航西藏空管中心社会招聘14人(第1期)笔试参考题库附带答案详解(3卷合一版)
- (新教材)2026年人教版八年级下册数学 21.2.1 平行四边形及其性质 课件
- 2025年碳排放管理师考试试题及答案
评论
0/150
提交评论