元数据的概念_第1页
元数据的概念_第2页
元数据的概念_第3页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、元数据的概念元数据( Metadata ), 即关于数据的数据 , 是对数据和信息资源进行描述的信息。通常认为 , 元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系 , 不同领域的数据的元数据在内容上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据 , 它是实现地理空间信息共享的核心标准之一。 其中 , 对空间数据某一特征的描述 , 称为一个空间元数据元素。 空间元数据是一个由若干复杂或简单的元数据项组成的集合。 它与非空间元数据的主要区别在于其内容中包含大量与空间位

2、置有关的描述性信息。研究元数据的作用和意义元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来 , 元数据主要有下列几个方面的作用:1) 、用来组织、管理和维护空间数据 , 建立数据文档 , 并保证即使其主要工作人员退休或调离时 , 也不会失去对数据情况的了解2) 、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息 , 帮助数据使用者查询检索所需地理空间数据3) 、用来建立空间信息的数据目录和数据交换中心 , 提供通过网络对数据进行查询检索的方法或途径 , 以及与数据交换和传输有关的辅助信息4) 、通过空间元数据 , 人们可以接受并理解空间信息 , 帮

3、助数据使用者了解数据 ,以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起 , 进行不同方面的科学分析和决策。元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面 , 包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的 , 往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库 , 帮助潜在的用户找到其特定应用所需要的数据, 实现数据共享。一个完整的元数据系统通常包括三部分 , 即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具

4、 , 唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准 , 只有在统一的标准前提下 , 才能跨越操作系统平台和数据库软件平台进行数据的互操作 , 实现数据共享。DIF 元数据标准在地球科学(包括地圈、水圈、气圈、生命圈、卫星遥感科学)、空间科学和天文学领域 , 国际目录网络的目录交换格式是事实上的国际数据目录标准 , 并在上述科学领域获得了广泛的应用。一条完整的 DIF 记录包含了详细描述数据的各项信息字段。不过其中只有 8 个必选字段 , 完成这 8 个字段就可以在网上发布该数据 ( 集 ), 其它的可选字段扩展并进一步阐述数据信息 , 可以在以后逐步添加和更新。DIF 的字段中

5、有些是任意文本域 , 而另外一些则是有值域限制的, 比如空间范围、 时间限制等。因为包含了那些必需的信息 , 通过对一个 DIF 记录的查看 , 用户可以决定该数据集是否对自己有用。一条格式书写的数据目录共包含了三十多个数据目录元数(或者称为字段) , 按照性质分为必选、条件必选和可选三类 , 另外有些字段可以重复 , 比如数据集引用、参数、作者、联系电话等。 标准采用组结构 , 每组内容包括相关的各种内容 , 组可以嵌套。ISO 元数据标准目前 ISO/T211 正开展个国际标准项目的研制工作, 每个项目都是以一些比较成熟的国家标准、地区性标准为基础。该委员会下分五个工作组如图 , 分别从事

6、框架和参考模型、 地理空间数据模型和算法、 地理空间数据管理、 地理空间服务以及专用标准等方面的研究。在 ISO/T211 中, 元数据的内容标准由两大部分组成 , 一部分是标准化部分 , 它是用户必须遵循的标准 ; 另一部分是信息化部分 , 它用于通过提供示例等方法来帮助指导用户 , 以便更好地理解标准。同时为了使标准能够满足不同应用需求 , 把标准内容又分为目录信息和标准部分两层 , 其中目录信息用于从宏观上获取元数据信息 , 而标准部分则是元数据的详细信息 , 以全面地描述地理数据集的内容。ISO/T211 元数据标准的目的是提供一个描述地理空间数据集的过程, 以便用户能够查询和访问地理

7、空间数据, 并可以判断确定所拥有的数据集的适用性。具体来说就是通过建立一个元数据术语、定义及扩展的公用集合 , 使地理数据的管理、检索和使用更加方便有效, 为那些不熟悉地理空间数据的人们提供他们所需的地理数据信息。ISO/T211 元数据标准规定元数据的内容项分为三种类型必须型、条件型、可选型。元数据内容采用逐行方式表达 , 并且给出了元数据制作、管理规范。元数据标准的内容分为 14 类 , 每一类中又包括若干子类或具体元数据项 , 整个 ISO/FDIS19115 一共有 409 个具体的元数据项。 下表列出该标准中较高层次的元数据内容 :CSDGM元数据模型CSDGM的实现是通过制定一个描

8、述地理空间数据及其相应含义的集合。主要包括数据元素、复合元素。以及它们的定义以及数据元索提供值域的信息 , 用以描述数字地理空间数据集的元数据信息内容 . 数据元素被定义为数据一个逻辑上的原始项 , 一个数据元素的条目包括数据元素的命名、定义、缩略名和值域的描述信息而复合元素则是一组数据元素和其他复合元素的集合。 复合元素只能代表更高层次的概念抽象 , 而不能代表一个具体的数据元素。表一列出了元数据模型中的七个元数据主要子集以及其标识和内容描述。CSDGM在数据质量信息子集中定义了数据志的标准 , 数据志被定义为关于构建数据集的事件、参数和数据源信息和责任方信息现有的国内外元数据标准体系与比较

9、目前研究元数据标准的研究机构正在层出不穷地发展 , 它们所制定的元数据标准既有许多共同之处 , 又因行业自身特点而有其特殊的指标。现以 ISO/TC211 元数据标准为基础 , 从元数据的层次结构、元数据分级、元数据性质、元数据特征、 元数据内容、 元数据扩展六个方面来比较现有国内外元数据标准 , 并探讨其各自的优势和不足 , 见下表。由上表比较可以看出, 尽管各元数据标准因各自行业特色而有所不同, 但基本上都包括以下几方面在元数据性质上 , 都提供必选、一定条件下必选和可选三种性质。在元数据内容上 , 都有以下几方面1)标识信息唯一标识一个数据集 , 说明标题名称、其地理空间和时间范围、状况

10、、法律限制和保密限定所需的信息 , 是数据集的基本信息2) 空间数据组织信息包含与数据集中表示空间信息所用方法有关的信息 , 如数据结构及描述空间位置的方法和目标数目等3)空间参考信息:包含元数据的现势性及其负责单位信息4)实体及属性信息:包含数据集的内容及数据集中要素的类型、功能、属性等信息5)数据质量信息包含数据集质量的评价6)发行信息:包含有关获取该信息所需的数据发行者及买卖权限的信息。1、数据格式多样化和语义的差异化,导致数据之间的交互能力差;2、数据存储的形态多样化和分散的特点,增加了统的数据共享与体化集成的难度;3、数据应用需求的多样性增加了应用集成的难度。类别项目悬浮体悬浮体含量

11、分析POC 与 PON 浓度粒度粒度冰筏碎屑含量碎屑矿物(重矿物、轻矿物)矿物粘土矿物碳酸盐、蛋白石含量常量、微量元素地球表层化学沉积物分析Sr、Nd 、Pb 同位素有机元素 (TOC,TN)同位素 ( 13C, 15N)分子标志物硅藻柱状沉积物分析微体古生物磁学整体性质年代框架与沉积速率粒度矿物地球化学微体古生物浮游与底栖有孔虫有孔虫优势种的碳、氧同位素放射虫超微化石环境磁学颜色反射率电阻率、磁化率、 Gamma 密度等物理参数扫描 XRF 扫描210Pb 测年有孔虫或有机质AMS 14C 测年粒度与冰筏碎屑含量粘土矿物碳酸盐、蛋白石含量常量、微量元素Sr、Nd 、Pb 同位素有机元素 (T

12、OC,TN)同位素 ( 13C, 15N)分子标志物基础古生物(硅藻与有孔虫)有孔虫优势种的碳、氧同位素放射虫超微化石古地磁环境磁学与古地磁多管底层水与沉积物间隙水化学:早期成岩作用Cl,Mg 2+,Na+,SO42-,CO32-,HCO 3-,K +,Ca2+,CH4多管与柱状沉积物化学: Mn,Fe,Corg,TN, 硫化物等样品采集:站位,取样时间,经度坐标,纬度坐标,取样方式,样品特征重力:站位、经度坐标,纬度坐标,高程,观测日期,布格重力异常,均衡重力异常、中间层密度公式。磁力:站位,经度坐标,纬度坐标,高程,观测日期,观测值,日变,正常场,异常场。地震:站位,经度坐标,纬度坐标,震

13、源深度,震级,震中距在 DIF 中,下述六个字段是必需的:登录目录标识、登录目录名称、参数、原始数据中心、数据中心(包括名称、数据集标识、联系人等)及数据概要等。为使信息更加明晰,并尽可能与 FGDC的元数据标准一致,增加了一些字段,如传感器名称、地点、数据分辨率、计划、质量、访问和使用限制、分发、多媒体样本等。新增加的字段有助于用户更好的决定数据集的可用程度。DIF 字段中一部分是文本字段,其他字段则使用有效值。尽管 DIF 增加了若干字段,以求与 FGDC的元数据内容标准一致。但是,它仍然局限于数据字典范畴,重点从数据存储的角度说明数据, 缺乏数据分发、 数据使用等方面的信息。ISO/TC

14、211 的元数据标准草案该标准以 FGDC等现有标准为基础, 按照国际标准化组织制定的标准导则要求制定。其工作范围是: 定义说明地理信息和服务所需要的信息。它提供有关数字地理数据标识、覆盖范围、质量、空间和时间模式、空间参照系统和发行等信息。该标准适用于数据集编目、数据交换网络,以及数据集的详尽说明。适用于地理数据集、数据集系列、地理要素和属性。它定义:必选和一定条件下必选的元数据实体和元素提供元数据应用、数据发现、决定数据对于应用的适合程度、数据访问、数据转换和数据应用所需要的最少的核心内容;可选的元数据元素如果需要,对地理数据的更加详细的标准说明;为适应特殊需要对元数据进行扩展的方法。尽管

15、该标准是用于数字数据的,它的原则也能扩展用于许多其他形式的地理资料,如地图、图表、文本文件等。该标准的正文内容包括:工作范围、一致性、引用标准、术语和定义、符号( 和缩写词 ) 、元数据要求等。附录包括:A. 元数据特征、 B. 元数据模型、C.元数据扩展和专用标准(Profile)、 D.元数据的 ISO 标准相互参照、E. 元数据扩展方法、 F. 元数据实施、 G. 元数据的等级、 H.实施示例、 J. 参考文献。标准确定了两级元数据,即:一级元数据编目信息:包含数据集编目所需的最少的元数据内容。二级元数据,它包含八个子集和三个可重复的实体。八个子集是:标识信息。包含唯一标识一个数据集、说

16、明其空间和时间范围、状况、法律限制和保密限定所需的信息;时间质量信息。包含数据集质量的一般评价;数据志信息。包含有关数据集应用、数据源,以及生产数据集时所用的工艺方法;空间数据表示信息。包含与数据集中表示空间信息所用方法有关的信息;参照系统信息。包含数据集中应用的空间和时间参照系统说明;要素分类信息。包含数据集中具有的要素类型、要素功能、要素属性和要素关系的定义和说明;发行信息。包含有关获取信息所需的数据发行者及买卖权限的信息;元数据参考信息。 包含元数据现势性及其负责单位信息。三个可重复的实体不是独立的元数据子集,它们不单独使用,而总是作为一个单元插在前述某一个子集中,且仅作为该子集的实体和

17、元素。这三个可重复的实体是:引用文献信息实体。提供引用文献的标准格式;负责单位信息实体。包含与数据集有关的单位和/ 或个人的标识;地址信息实体。提供与数据集有关的单位和/ 或个人的地址及其他通信办法。1) 南极物理海洋和海洋气象数据库海洋气象气压、风速、风向、气温、湿度、总云量、低云量、能见度等海洋水文海水温度、海水盐度、流速、流向、水位、湍混合系数、水色、透明度、波高、波向、波周期等海冰(雪)海冰及其表层雪的物理特性、冰型、冰量、海冰面积、海冰(雪)厚度、海冰覆盖率、海冰密集度、冰表面特征、冰状、冰块水平尺度、冰漂流方向和速度、冰温、海冰盐度等。海- 冰- 气相互作用要素海 - 气边界层参数

18、(风速、温度、湿度、长波辐射、短波辐射、海- 气界面热量与动量交换、潜热、感热通量等) 、海冰冰芯化学与海冰生物、海冰区与气候相关的反照率和物质平衡要素等。2) 南极重点海域海底底质数据库悬浮体冰筏体底质沉积物类型矿物分布元素分布微生物古体分布悬浮体分布工程地质表生矿产资源古环境演化3) 南极海洋地球物理数据库历史资料重力异常、磁力异常、综合地球物理剖面、构造区划等多波束测探单道地震浅剖重力勘测磁力勘测4) 南极海洋化学与碳通量数据库海水化学要素常规要素(温度、盐度、溶解氧、 pH 、悬浮物),有机生源要素(溶解有机碳、溶解有机氮、颗粒有机碳和颗粒有机氮) ,营养盐(总氮、总磷、溶解态氮、溶解

19、态磷、硝酸盐、亚硝酸盐、铵盐、活性磷酸盐、活性硅酸盐等) 。沉积化学要素氧化还原环境( Eh、硫化物、 pH ),有机要素(有机碳、有机氮等),营养元素(总氮、总磷、生物硅等) ,沉积物成分等。海洋大气化学要素气溶胶, MSA ,气体(二氧化碳、甲烷气、二氧化硫、氮氧化物、碳黑等),营养盐(碳、氮、磷、铁、钠、钙、镁等)等要素。物质垂直输运考察沉积物捕获器颗粒物分析、 Th 同位素等。其它重要微量生源元素 Fe、F 等水体环境考察油类,重金属(铜、铅、锌、铬、镉、汞、砷等) 。大气环境重金属污染(铜、铅、锌、汞、铬、铝、钒等)。沉积污染物油类,重金属污染(铜、铅、锌、铬、镉、汞、砷等),持久性

20、污染有机物 (POPs) 等。生物体残毒石油类,重金属(铜、铅、锌、铬、镉、汞、砷等),持久性污染有机物 (POPs) 等CO2大气 CO2 、水体 pCO2 、溶解无机碳、碱度等。氟里昂大气和海水中氟里昂历史资料5) 南极海洋生物多样性与生态数据库生物多样性生境类型菌株资源信息遗传信息极地微生物天然产物海洋微生物信息浮游生物6) 南极磷虾等资源数据库磷虾分布七星柔鱼分布其它生物资源分布中心渔场分布7) 南极周边海域矿产资源数据库油气资源天然气水合物固体矿产资源历史资料8) 南极大陆站基生物生态环境本底数据库生态系统本底数据近岸海洋生态系统考察(浮游和底栖生物丰度、群落结构与空间分布)、潮间带

21、生态系统考察(软体动物、甲壳类、大型藻类)、陆地生态系统(苔藓、地衣、藻类组成与空间分布) 、陆地微生物考察(南极陆基环境微生物的多样性分布) 、淡水湖泊生态系统(浮游生物群落结构)、鸟类和哺乳动物(飞鸟、企鹅、海豹种类组成、数量与空间分布)环境本底数据大气(阴、阳离子,污染物) 、海洋(温、盐、营养盐、叶绿素、污染物)、淡水湖泊(温、盐、营养盐、叶绿素、污染物)、陆地(温度、酸碱度、污染物)人类活动考察数据考察内容、考察区域、参与人数等资料数据9) 南极大陆冰盖综合断面考察数据库冰盖综合断面冰穹 A 深冰芯钻探10) 大气、空间环境及天文观测数据库大气环境化学气溶胶的化学成分及浓度、粒度和形

22、态、分布和变化特征,影响气溶胶化学的关键生物和大气化学过程以及人类活动;持久性有机污染物;各种形态的汞及影响汞浓度变化的关键大气化学过程;臭氧、 CO、碳黑等大气痕量气体。中高层大气参量 25-75km 高度范围内大气的密度、温度、压力、湿度、波动、风场、各种大气微量成份以及气溶胶和云层特性, 80-100km高度范围内金属钠原子密度等11) 航空重磁和遥感数据库航空摄影LiDAR 探测、地面三维激光扫描航空重磁陆地地震台站数据大地电磁测深12) 南极大陆矿产资源数据库野外实地考察数据航空遥感波谱测量数据航空及地面磁法电法测量数据13) 北极物理海洋和海洋气象数据库1) 海洋气象气压、风速、风向、气温、湿度、总云量、低云量、能见度等2) 海洋水文海水温度、海水盐度、流速、流向、水位、湍混合系数、水色、透明度、波高、波向、波周期等3) 海冰(雪)海冰及其表层雪的物理特性、冰型、冰量、海冰面积、海冰(雪)厚度、海冰覆盖率、海冰密集度、冰表面特征、冰状、冰块水平尺度、冰漂流方向和速度、冰温、海冰盐度等。4) 海- 冰- 气相互作用要素海 - 气边界层参数(风速、温度、湿度、长波辐射、短波辐射、海- 气界面热量与动量交换、潜热、感热通量等) 、海冰冰芯化学与海冰生物、海冰区与气候相关的反照率和物质平衡要素等。14

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论