业务现状和数据现状分析.ppt_第1页
业务现状和数据现状分析.ppt_第2页
业务现状和数据现状分析.ppt_第3页
业务现状和数据现状分析.ppt_第4页
业务现状和数据现状分析.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中 国 地 质 大 学 资 源 信 息 系 统 第三章第三章 地矿资源勘查地矿资源勘查 系统分析系统分析 资源信息系统 目 录 第二节 业务现状和数据现状分析 2 第一节 系统需求与工作环境分析 3 1 第三节 实体(地质)模型研究 3 3 资源信息系统 第三章第三章 地矿地矿资源勘查系统分析资源勘查系统分析 业务现状分析、数据现状分析、业务现状分析、数据现状分析、 需求分析、工作环境分析、数据模型构建需求分析、工作环境分析、数据模型构建 资源信息系统 这项工作的主要任务,是在用户调查的基础上具体分析这项工作的主要任务,是在用户调查的基础上具体分析: : vv 资源勘查区都进行哪些方面的工作?资源勘查区都进行哪些方面的工作? vv 能获得哪些数据?能获得哪些数据? vv 这些数据可划分为几个类型?这些数据可划分为几个类型? vv 数据之间有何联系?数据之间有何联系? vv 哪些是基础数据?哪些是基础数据? vv 哪些是可以由基础数据生成的合成数据和综合数哪些是可以由基础数据生成的合成数据和综合数 据?据? vv 在进行业务现状和数据现状分析的同时,也应估计其不在进行业务现状和数据现状分析的同时,也应估计其不 远将来的变化与发展。远将来的变化与发展。 第二节第二节 业务现状与数据现状分析业务现状与数据现状分析 资源信息系统 一、业务现状与数据来源一、业务现状与数据来源 qq我国的资源勘查和工程勘查工作,通常是我国的资源勘查和工程勘查工作,通常是 在区域调查、普查找矿或工程规划的基础上在区域调查、普查找矿或工程规划的基础上 进行的。其工作步骤大致包括:进行的。其工作步骤大致包括: qq通过区调、找矿或规划工作来圈定远景区通过区调、找矿或规划工作来圈定远景区 或工程地址或工程地址; ; qq然后划分成一系列的勘查区,分阶段按规然后划分成一系列的勘查区,分阶段按规 定的相应精度逐步深入,直至达到查清所定的相应精度逐步深入,直至达到查清所 需要了解的情况。需要了解的情况。 qq前一阶段工作为后一阶段工作的设计提供前一阶段工作为后一阶段工作的设计提供 依据依据 资源信息系统 (资源勘查工作的主要技术手段有资源勘查工作的主要技术手段有 ( 露头观测、露头观测、 ( 钻探、钻探、 ( 坑探、坑探、 ( 物探物探( (包括地震、磁法、大地电磁法、电法等包括地震、磁法、大地电磁法、电法等) ) ( 实验室测试。实验室测试。 (在一般情况下,其地质数据的来源,主要是在一般情况下,其地质数据的来源,主要是 岩芯描述、测井、采样化验、日常生产记录、岩芯描述、测井、采样化验、日常生产记录、 水文地质调查、综合研究与编图,此外查阅前水文地质调查、综合研究与编图,此外查阅前 人成果也可获得大量数据。下面结合各种类型人成果也可获得大量数据。下面结合各种类型 勘查区的实际情况作一介绍。勘查区的实际情况作一介绍。 资源信息系统 vv 岩芯编录资料是各种资源勘查工作最重要的基础资料岩芯编录资料是各种资源勘查工作最重要的基础资料 之一。此种来源的数据,项目最多,种类复杂,数量也之一。此种来源的数据,项目最多,种类复杂,数量也 最大。不同类型勘查区的具体情况会有一些差别,但总最大。不同类型勘查区的具体情况会有一些差别,但总 的情况是相似的。一般地说,一个金属、非金属、煤炭的情况是相似的。一般地说,一个金属、非金属、煤炭 或水利水电勘查区从普查阶段开始,经详查阶段到精查或水利水电勘查区从普查阶段开始,经详查阶段到精查 阶段结束,大约要施工钻孔阶段结束,大约要施工钻孔100100200200个,工程量个,工程量10,00010,000 100,000100,000米。按照已有的描述方式,其属性数据的数据米。按照已有的描述方式,其属性数据的数据 量可能接近或超过量可能接近或超过20M20M字节;如果作为空间数据描述字节;如果作为空间数据描述( (野野 外编录图件、素描图、照片和综合柱状图外编录图件、素描图、照片和综合柱状图) ),则可能超过,则可能超过 100M100M字节。字节。 1.1.岩芯编录岩芯编录 资源信息系统 vv 这类数据主要来源于钻孔、泉、井和河、湖的实际观测这类数据主要来源于钻孔、泉、井和河、湖的实际观测 、试验,也有部分来自气象观测和民间访问。相对而言,、试验,也有部分来自气象观测和民间访问。相对而言, 这部分的属性数据较少,约有这部分的属性数据较少,约有1M1M字节,但空间数据较多,字节,但空间数据较多, 可能超过可能超过100M100M字节字节) )。水文地质调查数据以定量数据为主,。水文地质调查数据以定量数据为主, 可靠性高,使用价值也高,未来的改变不会太大,但会随可靠性高,使用价值也高,未来的改变不会太大,但会随 着时间的推移而不断积累。目前许多勘查单位由于经费条着时间的推移而不断积累。目前许多勘查单位由于经费条 件和技术条件限制,某些观测与试验都较为简单,有些必件和技术条件限制,某些观测与试验都较为简单,有些必 要的调查内容如水源污染状况等都被省略了。因此在条件要的调查内容如水源污染状况等都被省略了。因此在条件 改善并严格管理的情况下,数据量将会有成倍的增加。改善并严格管理的情况下,数据量将会有成倍的增加。 2.2.水文地质调查水文地质调查 资源信息系统 vv 这类数据主要来源于实验室对各种岩石、矿石、煤、这类数据主要来源于实验室对各种岩石、矿石、煤、 石油、天然气、矿物、化石、地下水等的测试、化验。石油、天然气、矿物、化石、地下水等的测试、化验。 其中,各项工业分析、元素分析、选矿及工艺性质试验其中,各项工业分析、元素分析、选矿及工艺性质试验 占有很大的比重。这类数据几乎全是定量的属性数据,占有很大的比重。这类数据几乎全是定量的属性数据, 项目齐全,可靠性最高,未来的变动也将最少。从各类项目齐全,可靠性最高,未来的变动也将最少。从各类 勘查区的现状及未来发展的可能看,其最终数据量可达勘查区的现状及未来发展的可能看,其最终数据量可达 10M10M字节。字节。 3.3.样品测试、化验样品测试、化验 资源信息系统 vv 测井数据主要是空间数据。各类型勘查区已有的钻孔测井数据主要是空间数据。各类型勘查区已有的钻孔( ( 井井) )几乎都有测井数据,但几乎都有测井数据,但8080年代中期之前多数旧钻孔年代中期之前多数旧钻孔( (井井 ) )都是以照像方式记录的,目前已在不同程度上采用数字都是以照像方式记录的,目前已在不同程度上采用数字 测井仪。照像记录的测井数据,无法直接进入属性数据库测井仪。照像记录的测井数据,无法直接进入属性数据库 ,只能通过扫描仪或手扶跟踪数字化仪录入空间数据库中,只能通过扫描仪或手扶跟踪数字化仪录入空间数据库中 。如果用户需要,也可通过手工方法量出每个层位的峰值。如果用户需要,也可通过手工方法量出每个层位的峰值 ,再作为常规属性数据存入属性数据库中,提供用户进行,再作为常规属性数据存入属性数据库中,提供用户进行 各种查询检索和统计分析。至于数字测井数据,可以直接各种查询检索和统计分析。至于数字测井数据,可以直接 转储到空间数据库中。一个勘查区的测井数据量通常在转储到空间数据库中。一个勘查区的测井数据量通常在 500M500M字节以上。由于数据量巨大,许多勘查单位采取另建字节以上。由于数据量巨大,许多勘查单位采取另建 专项数据库的方式来管理。专项数据库的方式来管理。 4.4.测井测井 资源信息系统 vv 航空、航天遥感信息对资源勘查的作用越来越大。其用途航空、航天遥感信息对资源勘查的作用越来越大。其用途 除了指示地质构造和地层界线之外,还可用于辅助进行资源预除了指示地质构造和地层界线之外,还可用于辅助进行资源预 测与矿体圈定。测与矿体圈定。 vv 遥感数据通常以磁带和照片遥感数据通常以磁带和照片( (图象图象) )形式存在。数据磁带可形式存在。数据磁带可 以通过接口将数据直接转储到空间数据库中,而照片以通过接口将数据直接转储到空间数据库中,而照片( (图象图象) )则则 需通过扫描方式转储到空间数据库中。需通过扫描方式转储到空间数据库中。 vv 航空、航天遥感和地面测量数据主要是空间数据,属性数航空、航天遥感和地面测量数据主要是空间数据,属性数 据所占比例较小。一个勘查区所涉及的范围有限,航天遥感和据所占比例较小。一个勘查区所涉及的范围有限,航天遥感和 地面测量的数据量通常不会很大,估计其原始数据量有地面测量的数据量通常不会很大,估计其原始数据量有3030 50M50M字节。如果将大比例尺的航空照片包括在内,则扫描数字字节。如果将大比例尺的航空照片包括在内,则扫描数字 化后的数据量将达到化后的数据量将达到300M300M字节以上。字节以上。 5.5.航空、航天遥感与地面测量航空、航天遥感与地面测量 资源信息系统 vv 在勘查设计及勘查总结报告的编写过程中,资料整理、分析、编图、模在勘查设计及勘查总结报告的编写过程中,资料整理、分析、编图、模 拟和专题研究,也能获得大量新的数据。这类数据一般是由上述各种基础拟和专题研究,也能获得大量新的数据。这类数据一般是由上述各种基础 数据综合而成的,例如,勘查区的概况、自然地理条件、地质体与矿体的数据综合而成的,例如,勘查区的概况、自然地理条件、地质体与矿体的 形态特征、矿体的稳定性、矿区构造特征、某些储量计算参数、矿区地质形态特征、矿体的稳定性、矿区构造特征、某些储量计算参数、矿区地质 与成矿规律的各种分析数据和各种相应的分析图件、综合图件,等等。与成矿规律的各种分析数据和各种相应的分析图件、综合图件,等等。 vv 其中的属性数据,按数据库规范化要求和最小冗余规则,是不应该存入其中的属性数据,按数据库规范化要求和最小冗余规则,是不应该存入 数据库中的,但它们之中有的使用频率较高,为了缩短查询途径,提高效数据库中的,但它们之中有的使用频率较高,为了缩短查询途径,提高效 率,可以建立一些专项数据库文件来存放,这一点是符合率,可以建立一些专项数据库文件来存放,这一点是符合“控制冗余控制冗余”规规 则的。则的。 vv 各种分析图件和综合图件,例如各种勘探剖面图、平面图、综合柱状图各种分析图件和综合图件,例如各种勘探剖面图、平面图、综合柱状图 和专项研究图件,大多具有类型繁多、结构复杂、数据量巨大的特点。数和专项研究图件,大多具有类型繁多、结构复杂、数据量巨大的特点。数 据总量可达据总量可达100M100M字节以上。这些图件都是通过人机交互方式编制的,需要字节以上。这些图件都是通过人机交互方式编制的,需要 在编绘成功后立即存入空间数据库中,以备本单位经常性使用或提供网络在编绘成功后立即存入空间数据库中,以备本单位经常性使用或提供网络 检索服务。检索服务。 6.6.综合研究综合研究 资源信息系统 vv 管理数据:包括日常钻探与测井的生产记录、勘查管理数据:包括日常钻探与测井的生产记录、勘查 队的人员编制与生产设备数据。作为生产管理的必要队的人员编制与生产设备数据。作为生产管理的必要 参数,这些参数也应当存入数据库中。其数据量不大参数,这些参数也应当存入数据库中。其数据量不大 ,总数不过几,总数不过几M M字节,存入统一的勘查区点源数据库字节,存入统一的勘查区点源数据库 中也不会影响系统的性能。中也不会影响系统的性能。 vv 如果条件允许,可以将勘查区的人员编制、生产设如果条件允许,可以将勘查区的人员编制、生产设 备与劳资、人事等合并在一起,另外建立一个办公自备与劳资、人事等合并在一起,另外建立一个办公自 动化系统或企业管理信息系统,效果会更好一些。动化系统或企业管理信息系统,效果会更好一些。 7.7.其它来源其它来源 资源信息系统 二、资源勘查数据的分类二、资源勘查数据的分类 属性数据属性数据 空间数据空间数据 属性数据是研究对象的各种特征与性属性数据是研究对象的各种特征与性 质的定性与定量描述,可以是字符型的质的定性与定量描述,可以是字符型的 ,也可以是数值型的,也可以是数值型的. . 空间数据是研究对象的空间位置及其空间数据是研究对象的空间位置及其 相互间拓扑关系的表达,可以是字符和相互间拓扑关系的表达,可以是字符和 数值形式,也可以是图形形式,在机器数值形式,也可以是图形形式,在机器 内可采用栅格数据结构存贮,也可采用内可采用栅格数据结构存贮,也可采用 矢量数据结构存贮矢量数据结构存贮. . 从描述对象的本质特征看,资源勘查数据可以分为从描述对象的本质特征看,资源勘查数据可以分为 资源信息系统 字符型数据字符型数据 图形型数据图形型数据 数值型数据数值型数据 其中,图形型数据既包括那些观测时其中,图形型数据既包括那些观测时 直接以图形形式记录下来的数据直接以图形形式记录下来的数据( (例如例如 模拟地震及模拟测井数据模拟地震及模拟测井数据) ),也包括用,也包括用 传统方法绘制的各种成品图件,它们传统方法绘制的各种成品图件,它们 经过栅格化或矢量化以后都可转化为经过栅格化或矢量化以后都可转化为 定量数据。定量数据。 表现形式上看表现形式上看, ,资源勘查数据可以分为资源勘查数据可以分为 日期型数据日期型数据 资源信息系统 注意注意: :在数据的表观形式和数学性质之间存在着一定在数据的表观形式和数学性质之间存在着一定 的包容关系,例如,字符型数据是定性数据的表现的包容关系,例如,字符型数据是定性数据的表现 形式,也可以是定量数据的概括和归纳;数值型数形式,也可以是定量数据的概括和归纳;数值型数 据首先是定量数据的表现形式,也可以是定性数据首先是定量数据的表现形式,也可以是定性数据据 的转换形式。的转换形式。 名义型数据名义型数据 比例型数据比例型数据 有序型数据有序型数据 从数学性质上看从数学性质上看, ,资源勘查数据可以分为资源勘查数据可以分为 间隔型数据间隔型数据 定性数据定性数据 定量数据定量数据 资源信息系统 字符型数据字符型数据 数值型数据数值型数据 本书的分类本书的分类: : 1)1)名义型数据名义型数据 2)2)有序型数据有序型数据 1)1)间隔型数据间隔型数据 2)2)比例型数据比例型数据 日期型数据日期型数据 图形型数据图形型数据 资源信息系统 1.1.字符型数据字符型数据 字符型数据是定性数据的表现形式,也可以是定量字符型数据是定性数据的表现形式,也可以是定量 数据的概括和归纳。它可以用汉字、拼音字母和外文字数据的概括和归纳。它可以用汉字、拼音字母和外文字 母的形式书写、存贮和处理,在特殊情况下也可以用数母的形式书写、存贮和处理,在特殊情况下也可以用数 字或数字与字母混合书写、存贮和处理。它包括名义型字或数字与字母混合书写、存贮和处理。它包括名义型 和有序型两种不同数学性质的数据。和有序型两种不同数学性质的数据。 1)1)名义型数据名义型数据 这种数据没有量的概念,只有客观地表达研究对象这种数据没有量的概念,只有客观地表达研究对象 的某些性质,而不包含相对重要性或相对幅度。例如:的某些性质,而不包含相对重要性或相对幅度。例如: 地层名称和代号、矿体和煤层的编号、含水层和隔水层地层名称和代号、矿体和煤层的编号、含水层和隔水层 的编号、断层名称和编号、岩石和矿物名称、矿石和矿的编号、断层名称和编号、岩石和矿物名称、矿石和矿 物的用途分类、岩石与矿物的颜色、断层的力学属性、物的用途分类、岩石与矿物的颜色、断层的力学属性、 矿体和煤层的形态、沉积体的形态以及可以用是非、有矿体和煤层的形态、沉积体的形态以及可以用是非、有 无来表达的各种二态变量等等。这种数据的数据量最大无来表达的各种二态变量等等。这种数据的数据量最大 ,约占勘查区属性数据总量的,约占勘查区属性数据总量的4040。 资源信息系统 2)2)有序型数据有序型数据 这种数据相互之间有程度上的差别,而无比例关系这种数据相互之间有程度上的差别,而无比例关系 。例如:矿物的硬度、碎屑岩的粒度分类、水体混浊度。例如:矿物的硬度、碎屑岩的粒度分类、水体混浊度 、地下水质量级别、煤的变质程度和煤级、地质构造复、地下水质量级别、煤的变质程度和煤级、地质构造复 杂程度、断层和褶皱的规模和级别、矿床和矿体的规模杂程度、断层和褶皱的规模和级别、矿床和矿体的规模 和级别、矿体和煤层的稳定性、矿体围岩采掘性能和力和级别、矿体和煤层的稳定性、矿体围岩采掘性能和力 学稳定性、勘查类型划分、矿产储量和资源量的类别和学稳定性、勘查类型划分、矿产储量和资源量的类别和 级别等等。这种数据量较少,约占属性数据总量的级别等等。这种数据量较少,约占属性数据总量的1515 。 字符型数据一般是离散型的,易于存入计算机字符型数据一般是离散型的,易于存入计算机( (通过通过 代码进行转换代码进行转换) ),但不便进行数值运算。只有当设法将其,但不便进行数值运算。只有当设法将其 转化或分解为数值型数据时,才能进行数值运算转化或分解为数值型数据时,才能进行数值运算。 资源信息系统 2.2.数值型数据数值型数据 数值型数据首先是定量数据的表现形式,也数值型数据首先是定量数据的表现形式,也 可以是定性数据的转换形式,主要包括间隔型数可以是定性数据的转换形式,主要包括间隔型数 据和比例型数据两种。数值型数据都是用数字来据和比例型数据两种。数值型数据都是用数字来 表达的。表达的。 1)1)间隔型数据间隔型数据 这种数据的特点是彼此之间不仅有大小和程度这种数据的特点是彼此之间不仅有大小和程度 之别,而且其差异是相等的,并且没有自然零值之别,而且其差异是相等的,并且没有自然零值 。例如,地层产状、钻孔及地质点的坐标与高程。例如,地层产状、钻孔及地质点的坐标与高程 、地温、气温与水温等等。这类数据量最少,约、地温、气温与水温等等。这类数据量最少,约 占资源勘查区属性数据总量的占资源勘查区属性数据总量的1010。 资源信息系统 2)2)比例型数据比例型数据 vv这是具有绝对零值的间隔型数据,这种数据不可这是具有绝对零值的间隔型数据,这种数据不可 能有负值存在。它们所反映的数量概念最完整,意能有负值存在。它们所反映的数量概念最完整,意 义最明确,不仅可以计算出同种数据之差,还可以义最明确,不仅可以计算出同种数据之差,还可以 算出差的倍数。矿体、煤层和地层的厚度、地球化算出差的倍数。矿体、煤层和地层的厚度、地球化 学勘查数据、矿石和矿物的化学成分测定成果,矿学勘查数据、矿石和矿物的化学成分测定成果,矿 石和围岩的物理性质和力学参数测定成果等等,都石和围岩的物理性质和力学参数测定成果等等,都 属于此种。目前这种数据量居第二位,约占资源勘属于此种。目前这种数据量居第二位,约占资源勘 查区属性数据总量的查区属性数据总量的3535。 vv地矿勘查过程中所获取的数值型数据主要是离散地矿勘查过程中所获取的数值型数据主要是离散 型的,但也有连续型的。例如数字测井的成果就是型的,但也有连续型的。例如数字测井的成果就是 连续型的。连续型的数据必须事先离散化后才能存连续型的。连续型的数据必须事先离散化后才能存 入属性数据库,但可以通过扫描方式或手扶跟踪数入属性数据库,但可以通过扫描方式或手扶跟踪数 字化方式直接存入空间数据库。字化方式直接存入空间数据库。 资源信息系统 vv地质科学长期以来属于描述性科学范畴,地质科学长期以来属于描述性科学范畴, 字符型的定性数据所占比例极大字符型的定性数据所占比例极大( (约约5555) )。 为了推进地质过程的定量研究,开展数值模为了推进地质过程的定量研究,开展数值模 拟和人工智能评价决策,应当加紧研究适合拟和人工智能评价决策,应当加紧研究适合 于字符型数据的数学方法并大力改进地质现于字符型数据的数学方法并大力改进地质现 象的描述方式。象的描述方式。 vv要变定性描述为定量描述,涉及一系列地要变定性描述为定量描述,涉及一系列地 质概念的更新和野外观测技术、观测方法的质概念的更新和野外观测技术、观测方法的 改进,需要多方面共同配合和长期努力。可改进,需要多方面共同配合和长期努力。可 以预料,随着地矿勘查技术和信息技术的发以预料,随着地矿勘查技术和信息技术的发 展,勘查设备不断现代化,勘查区数值型属展,勘查设备不断现代化,勘查区数值型属 性数据的绝对量和相对量将会急剧增加。性数据的绝对量和相对量将会急剧增加。 资源信息系统 3.3.日期型数据日期型数据 日期型数据专指那些以三段式字符型描述和存贮日期型数据专指那些以三段式字符型描述和存贮 的数据,如用于标识日期的年的数据,如用于标识日期的年/ /月月/ /日、用于标识具日、用于标识具 体时间的时体时间的时/ /分分/ /秒、用于标识角度和地理经纬度的秒、用于标识角度和地理经纬度的 度度/ /分分/ /秒等等,都可归入此类。这类数据量较少但秒等等,都可归入此类。这类数据量较少但 很重要,存贮和处理都较为麻烦。很重要,存贮和处理都较为麻烦。 目前,一般的数据库管理软件除年目前,一般的数据库管理软件除年/ /月月/ /日可以进日可以进 行数值转换处理外,都只能当作字符串来整体存贮行数值转换处理外,都只能当作字符串来整体存贮 和调出,否则必须先化为十进制数值型数据。某些和调出,否则必须先化为十进制数值型数据。某些 单位和个人利用字符串的定位截取和识别技术,开单位和个人利用字符串的定位截取和识别技术,开 发出了相应的数值转换处理程序,效果都很不错。发出了相应的数值转换处理程序,效果都很不错。 资源信息系统 4.4.图形型数据图形型数据 图形型数据原意是指那些观测时直接以图形或图象形图形型数据原意是指那些观测时直接以图形或图象形 式记录下来的数据,例如模拟地震数据、模拟测井数据式记录下来的数据,例如模拟地震数据、模拟测井数据 、航空照片、地表露头照片和野外素描等等。、航空照片、地表露头照片和野外素描等等。 有些图形,例如用数字地震和数字测井数据形成的剖有些图形,例如用数字地震和数字测井数据形成的剖 面图、曲线图和卫星照片,在实际工作中的应用比其原面图、曲线图和卫星照片,在实际工作中的应用比其原 始数值数据本身还要广泛,也归入图形型数据类。始数值数据本身还要广泛,也归入图形型数据类。 另有些图形,例如资源勘查报告所附的各种图件,由另有些图形,例如资源勘查报告所附的各种图件,由 于是采用人工方式编绘的,除了用计算机辅助编绘系统于是采用人工方式编绘的,除了用计算机辅助编绘系统 重新编绘的之外,也只能作为图形数据看待。重新编绘的之外,也只能作为图形数据看待。 资源信息系统 从以上分析可知,在每一个资源勘查区所获取的从以上分析可知,在每一个资源勘查区所获取的 资料数据,都具有资料数据,都具有来源众多、类型纷繁、数量巨大来源众多、类型纷繁、数量巨大 、结构复杂、用途广泛的特征、结构复杂、用途广泛的特征,归纳起来即为,归纳起来即为 多源多源 多类多类 多量多量 多维多维 多主题多主题 勘查数据的来源众多、勘查数据的来源众多、 类型纷繁和数量巨大的类型纷繁和数量巨大的 特征,已经在前面作过特征,已经在前面作过 介绍和分析,这里仅剖介绍和分析,这里仅剖 析其结构复杂、用途广析其结构复杂、用途广 泛的特征。泛的特征。 “五多五多 ”特征特征 三、资源数据特征的分析三、资源数据特征的分析 资源信息系统 代码代码是用来代表事物某种属性的一组有序字母是用来代表事物某种属性的一组有序字母数数 字串字串( (简称为字符串简称为字符串) )。代码可用来代替某一个名词。代码可用来代替某一个名词 、术语,甚至某一个特殊的描述短语。、术语,甚至某一个特殊的描述短语。 代码的功能主要是鉴别、分类和排序三种代码的功能主要是鉴别、分类和排序三种。其中,。其中, 鉴别功能是最基本的,也是必备的。鉴别功能是最基本的,也是必备的。 具备这三方面的功能,信息系统就具备共享性了。具备这三方面的功能,信息系统就具备共享性了。 共享性既是数据库设计的重要目标之一,也是整个共享性既是数据库设计的重要目标之一,也是整个 资源信息系统设计的重要目标之一。资源信息系统设计的重要目标之一。 共享性主要包括属性名、关系结构和属性域的共享共享性主要包括属性名、关系结构和属性域的共享 性。为此,在系统内一个代码只能唯一地标识一个性。为此,在系统内一个代码只能唯一地标识一个 属性;反之,一个属性只能有一个标准化代码。属性;反之,一个属性只能有一个标准化代码。 四、代码的分类与选择四、代码的分类与选择 资源信息系统 尽管由于习惯和历史的原因,各部门对尽管由于习惯和历史的原因,各部门对 于同一个属性可能会有不同的命名、描述和于同一个属性可能会有不同的命名、描述和 代号,但为了推进代号,但为了推进“数字地球数字地球”和和“数字国数字国 土土”计划,实现信息充分共享,同一字符型计划,实现信息充分共享,同一字符型 数据只能有一个标准代码,这也就是说,必数据只能有一个标准代码,这也就是说,必 须做到一事一码,一码一义,不允许重码、须做到一事一码,一码一义,不允许重码、 乱码、错码。西方国家过去曾有惨痛的教训乱码、错码。西方国家过去曾有惨痛的教训 ,这是不能忘记的。为此,各部门、各单位,这是不能忘记的。为此,各部门、各单位 都应当向国家标准词语和代码看齐。都应当向国家标准词语和代码看齐。 资源信息系统 词语代码的分类一般以结构为准,所谓的代码结构词语代码的分类一般以结构为准,所谓的代码结构 是指代码内部各个符号或符号组之间的关系。就目前情是指代码内部各个符号或符号组之间的关系。就目前情 况看,词语的代码结构类型有十种以上,但在地质与资况看,词语的代码结构类型有十种以上,但在地质与资 源勘查中常用的有五种,即特征组合结构、顺序结构、源勘查中常用的有五种,即特征组合结构、顺序结构、 助记结构、分类结构和混合结构。其代码的种类相应地助记结构、分类结构和混合结构。其代码的种类相应地 分为五种。分为五种。 特征组合码特征组合码 顺序码顺序码 助记码助记码 分类码分类码 混合码混合码 这五种代码体系都具有鉴别、分类和排序功能,但适用这五种代码体系都具有鉴别、分类和排序功能,但适用 范围和应用条件有所不同。范围和应用条件有所不同。 地质与资地质与资 源勘查中源勘查中 代码分类代码分类 资源信息系统 1.1.特征组合码特征组合码 构成构成 特征组合码由各具代表意义的几位字母或数字排列组合而特征组合码由各具代表意义的几位字母或数字排列组合而 成。通常是一个字母或数字代表描述对象的一种属性特征。成。通常是一个字母或数字代表描述对象的一种属性特征。 特征特征 特征组合码通常被用于各个单位和个人所开发的应用数据库特征组合码通常被用于各个单位和个人所开发的应用数据库 和数据、图型处理系统中。和数据、图型处理系统中。 优点优点 简单明了,易记易用。简单明了,易记易用。 缺点缺点 位数太少时容量有限,易发生重码,而位数多时又不易掌位数太少时容量有限,易发生重码,而位数多时又不易掌 握,容易产生混乱。当然,最大的缺点还在于难于进行标准化处握,容易产生混乱。当然,最大的缺点还在于难于进行标准化处 理,不可能以此为基础实现信息共享,在主题数据库和信息检索理,不可能以此为基础实现信息共享,在主题数据库和信息检索 系统系统( (网络网络) )中不宜独立使用。中不宜独立使用。 举例举例 用三位数字来表示岩石和矿物的颜色:第一位代表色调的用三位数字来表示岩石和矿物的颜色:第一位代表色调的 深浅:深浅:“0” 0” 不清楚,不清楚,“1” 1” 浅色,浅色,“2” 2” 正常色,正常色,“3” 3” 深色深色 第二位代表配色:第二位代表配色:“0” 0” 不清楚,不清楚,“1” 1” 红色,红色,“2” 2” 黄色黄色 ,“3” 3” 褐色,褐色,“4” 4” 绿色,绿色,“5” 5” 兰色,兰色,“6”6”紫色等紫色等 第三位代表主色:第三位代表主色: “1” 1” 红色,红色,“2” 2” 黄色,黄色,“3” 3” 褐色,褐色, 等等 资源信息系统 2.2.顺序码顺序码 构成构成 顺序码主要由按顺序排列的数字组成,有时也由按顺顺序码主要由按顺序排列的数字组成,有时也由按顺 序排列的字母组成。每一组代码只代表描述对象属性在整个序排列的字母组成。每一组代码只代表描述对象属性在整个 属性系列中的顺序。属性系列中的顺序。 特征特征 作为代码的字符串,通常要求长度统一,因此在编码作为代码的字符串,通常要求长度统一,因此在编码 时应当事先估计可能出现的最大长度,然后确定代码的位数时应当事先估计可能出现的最大长度,然后确定代码的位数 。 优点优点 最为简单明了。最为简单明了。 缺点缺点 顺序码在资源信息系统中不可能形成独立的代码体系顺序码在资源信息系统中不可能形成独立的代码体系 举例举例 岩层序号,从实测剖面起点开始由头至尾累计,或从岩层序号,从实测剖面起点开始由头至尾累计,或从 钻孔孔口开始由上而下累计。钻孔孔口开始由上而下累计。 资源信息系统 3.3.助记码助记码 构成构成 助记码是描述对象属性的一种形象化代码,比较容易记助记码是描述对象属性的一种形象化代码,比较容易记 忆。最常见的是采用描述对象属性的汉字拼音或外文单词的首忆。最常见的是采用描述对象属性的汉字拼音或外文单词的首 位字母来组合。国际通用的化学元素符号和地层代号都是这样位字母来组合。国际通用的化学元素符号和地层代号都是这样 构成的。构成的。 特征特征 助记码通常规定有统一的长度,不能任意加长,凡是超助记码通常规定有统一的长度,不能任意加长,凡是超 过位数的都要进行删减。删减的原则是,每一个描述方面过位数的都要进行删减。删减的原则是,每一个描述方面( (一个一个 定语或一个分词组定语或一个分词组) )留下一个字首。如果岩相的代码只取四位留下一个字首。如果岩相的代码只取四位 优点优点 比较容易记忆,可望文思义比较容易记忆,可望文思义. . 缺点缺点是容量有限,很容易发生重码、乱码现象是容量有限,很容易发生重码、乱码现象 举例举例例如,具有大型槽状交错层理的含砾砂岩,英文名称为例如,具有大型槽状交错层理的含砾砂岩,英文名称为 Large Large Scale Scale Trough Trough Cross Cross Bedding Bedding Gravel-bearing Gravel-bearing SandstoneSandstone,首位字母可组合成首位字母可组合成“LSTCBGS”LSTCBGS”。 资源信息系统 4.4.分类码分类码 构成构成 分类码是按照事物的属性类别划分数据集合的代码分类码是按照事物的属性类别划分数据集合的代码 体系。这种代码体系主要包括面分类码和线分类码两个体系。这种代码体系主要包括面分类码和线分类码两个 亚型,常为大型信息系统所采用。亚型,常为大型信息系统所采用。 1)1)面分类码面分类码 构成构成 这是采用面分类法建立起来的代码系统。面分类法这是采用面分类法建立起来的代码系统。面分类法 是将给定的母项按属性分成互不依赖的集合是将给定的母项按属性分成互不依赖的集合面的分面的分 类法。面分类没有刚性的分类结构和预先确定的最终集类法。面分类没有刚性的分类结构和预先确定的最终集 合,其中,对象的母项是以一些同一属性的对象的组配合,其中,对象的母项是以一些同一属性的对象的组配 来表征的。这些属性的值对应着指定属性的具体描述,来表征的。这些属性的值对应着指定属性的具体描述, 并且可以根据需要分解成很多互无联系的分面。并且可以根据需要分解成很多互无联系的分面。 资源信息系统 特征特征 在面分类代码体系中,分类的集合由具体属性的在面分类代码体系中,分类的集合由具体属性的 组配对象构成。这些属性取自某个相应的面。面分类代组配对象构成。这些属性取自某个相应的面。面分类代 码体系的容量同面的数目以及在面里具体属性的数量有码体系的容量同面的数目以及在面里具体属性的数量有 关。关。 优点优点 结构具有柔性,因为任何一个面的改变,不会对结构具有柔性,因为任何一个面的改变,不会对 其余的面产生本质的影响。此外,这种分类方法不仅能其余的面产生本质的影响。此外,这种分类方法不仅能 够从已有的面中形成新的分类集合,而且还可以不加改够从已有的面中形成新的分类集合,而且还可以不加改 造地将新的面列入分类目录,或者从中除去旧的面。面造地将新的面列入分类目录,或者从中除去旧的面。面 分类码的柔性使对象的聚合有了可能,并且可以实现按分类码的柔性使对象的聚合有了可能,并且可以实现按 任意组配面进行的信息检索。任意组配面进行的信息检索。 缺点缺点 面分类法的不足之处在于不能充分利用代码体系面分类法的不足之处在于不能充分利用代码体系 自身的容量,因为许多可能组配的面实际用不上。自身的容量,因为许多可能组配的面实际用不上。 资源信息系统 2)2)线分类码线分类码 构成构成 线分类码实际上是一种层次分类码。其划分方法线分类码实际上是一种层次分类码。其划分方法 如下:先在被划分的对象母项中选定若干个属性作为划如下:先在被划分的对象母项中选定若干个属性作为划 分标准,组成一些大的集合,接着在每个大集合中相应分标准,组成一些大的集合,接着在每个大集合中相应 选定划分标准,组成一系列小集合,然后,再分解更小选定划分标准,组成一系列小集合,然后,再分解更小 的集合,如此一层层地分解下去,直到具体对象。在各的集合,如此一层层地分解下去,直到具体对象。在各 大、小集合之间,形成线性的隶属关系。大、小集合之间,形成线性的隶属关系。 优点优点 线分类码的突出优点是结构清晰、易成体系、容线分类码的突出优点是结构清晰、易成体系、容 量较大。量较大。 缺点缺点 当被描述对象的属性分类层次过多时,码的长度当被描述对象的属性分类层次过多时,码的长度 需要约束;而当各种属性分类层次参差不齐时,需要借需要约束;而当各种属性分类层次参差不齐时,需要借 用多种编码方式来构成混合码,才能完整表达。用多种编码方式来构成混合码,才能完整表达。 资源信息系统 5.5.混合码混合码 构成构成 混合码是将特征组合码、顺序码、混合码是将特征组合码、顺序码、 助记码和分类助记码和分类 码按一定的规则联结起来的代码形式。我国技术监督局码按一定的规则联结起来的代码形式。我国技术监督局 所颁布的所颁布的地质矿产名词术语分类代码地质矿产名词术语分类代码国家标准国家标准 (GB964988)(GB964988),就是一种以分类码为格架的混合码体系就是一种以分类码为格架的混合码体系 。该标准有三个分册、共。该标准有三个分册、共1212万多条地矿术语及编码。万多条地矿术语及编码。 特征特征 该代码系统将代码分为数据项和文字值该代码系统将代码分为数据项和文字值( (字符值字符值) ) 两个层次,其中,数据项代码由两个层次,其中,数据项代码由6 6个英文字母个英文字母( (严格地说严格地说 是是2 2个拼音字母和个拼音字母和4 4个英文字母个英文字母) )组成,文字值代码由组成,文字值代码由1 1 8 8个阿拉伯数字组成。该代码体系规定,数据项代码的个阿拉伯数字组成。该代码体系规定,数据项代码的 第一、二位是地质学二级学科名前两个字的汉语拚音缩第一、二位是地质学二级学科名前两个字的汉语拚音缩 写,兼有面分类码和助记码性质,例如,岩石学取写,兼有面分类码和助记码性质,例如,岩石学取YSYS、 矿床学取矿床学取KCKC、煤地质学取煤地质学取MDMD、石油地质学取石油地质学取SYSY、水文地水文地 质学取质学取SWSW、工程地质学取工程地质学取GCGC、构造地质学取构造地质学取GZGZ。 资源信息系统 从第三位开始都是按从第三位开始都是按A AZ Z顺序排列的英文字母,其中第三顺序排列的英文字母,其中第三 和第四位通常是二级学科内的层次分类,兼有线分类码和顺序和第四位通常是二级学科内的层次分类,兼有线分类码和顺序 码的性质,例如码的性质,例如YSAYSA是岩石学序言、是岩石学序言、YSBYSB是岩石成分、是岩石成分、YSCYSC是岩石是岩石 结构、结构、YSDYSD是岩石构造,而是岩石构造,而YSBBYSBB是岩石的其它物质组分、是岩石的其它物质组分、YSBCYSBC是是 沉积岩结构组分等等;第五位代表组合数据项或数据项,也兼沉积岩结构组分等等;第五位代表组合数据项或数据项,也兼 有线分类码和顺序码的性质,例如,有线分类码和顺序码的性质,例如,YSBCAYSBCA代表碎屑颗粒、代表碎屑颗粒、 YSBCBYSBCB代表碳酸盐异化粒、代表碳酸盐异化粒、YSBCDYSBCD代表碎屑岩胶结物;第六位必代表碎屑岩胶结物;第六位必 定是数据项,例如,定是数据项,例如,YSBCBAYSBCBA代表碳酸盐异化粒的内碎屑、代表碳酸盐异化粒的内碎屑、 YSBCBBYSBCBB代表碳酸盐异化粒的球粒、代表碳酸盐异化粒的球粒、YSBCBCYSBCBC代表碳酸盐异化粒的代表碳酸盐异化粒的 团块、团块、YSBCBDYSBCBD代表碳酸盐异化粒的包粒等等,通常具有顺序码代表碳酸盐异化粒的包粒等等,通常具有顺序码 特征。特征。 如果二级学科内层次分类较少且最后一层数据项的量又过如果二级学科内层次分类较少且最后一层数据项的量又过 大,也有采用第五、六位顺序组合的编码方式,即由第五、六大,也有采用第五、六位顺序组合的编码方式,即由第五、六 位联合起来描述一个具体的属性。如果二级学科内的层次分类位联合起来描述一个具体的属性。如果二级学科内的层次分类 很少,也有从第四位就是属性的顺序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论