地质统计学中的区域化变量理论.doc_第1页
地质统计学中的区域化变量理论.doc_第2页
地质统计学中的区域化变量理论.doc_第3页
地质统计学中的区域化变量理论.doc_第4页
地质统计学中的区域化变量理论.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

世界地质第 16 卷第 2 期1997 年 6 月地质统计学中的区域化变量理论P an Guo ch eng李钟山 译夏立显 校摘要着重介绍了地质统计学中最基本的问题区域化变量理论, 包括对区域化变量的解释、概率表示、平稳假设, 以及协同区域化问题。 最后, 介绍了研究区域化变量的几个基本工具: 变差函数和协方差; 估计方差和离散方差。关键词地质统计学区域化变量变差函数在地质统计学发展中最基本的概念就是区域化理论。 在传统上许多统计技术并不考虑样品的空间分布, 因此所有的结果是出于单一总体在研究区服从一定的已知概率分布而考 虑的。值得提出的是, 经典的方法是基于不同位置的分布独立性概念。地质统计学实际上是 处理空间相依性。这里, 主要介绍一些区域化变量的基本概念。 这包括区域化变量的解释、概率表示和平 稳假设。 介绍变差函数和协方差的概念和定义, 它们是度量空间结构相依性的基本工具, 为 了度量空间分布的分散程度将讨论估计方差和离散方差。1区域化变量任何在空间上分布的变量均称作区域化变量。 许多地质特征可以作为这样的变量来对待, 因为它们与地理位置相关联。数学上, 一个区域化变量 ( 简记为 R ev) 是空间点 x 的函数, 在三维空间中 x 的坐标为(u , v , w )。 事实上, 许多区域化变量在空间上有很大的变异性, 很难用一个确定性函数来刻 划它的数学特性。通常, 一个矿床的矿石品位在三维空间中的变异由两部分组成: 局部随机的不规则变化 成分; 一般的结构连续性成分。 建立这些变量的模型必须充分考虑结构性和随机性两大部分。 图 1 表示金银矿床的一个钻孔, 其中结构性和随机性的作用是很显然的。 随机函数的概念列入地质统计学, 用于处理既有结构性又有随机性的地质特征。一个随机函数 (缩写 R F ) 表述如下:(1) 在任意点 x 处 z (x ) 为一个随机变量;(2) 点 x 1、x 2 处的随机变量 z (x 1 )、z (x 2 ) 通常是不独立的。 第一个特点反映了随机函数的随机性, 而第二个特点体现了空间变量的结构性, 在矿产译稿收到日期 1997 03 05 注 1 英尺= 0. 3048 m勘探和矿山开采中的许多实际问题中需要考虑这两种因素的模型。平稳假设2随机函数的概念提供了基本的区域化变量统计模型。 考虑随机函数 (R F )、z(x ) 在 n 维区域 8 中任意 m 个点 x j ( j =, m ) 上的实现, 这些实现的集合可1, 2,表示为: z (x j ) , j = 1, 2, m , 要 理 解这个变量集合的随机特性, 必须用 到 m个 变 量 的 联 合 分 布 函 数: F x 1, x 2, xm (z 1 , z m ) = P z (x 1 ) z 1 , z (x 2 ) z 2 ,z 2 ,图 1 金、银矿床钻孔显示结构性和随机性的图示, z (x m ) z m 它可以表示在空间中变化的 R F 的全部随机性质。 这种假设要求不易满足, 实际上只要满足一阶平稳就够了。事实上许多变量在某个有限地区中显示出类似的统计性质, 这种类似性保证了同一随 机函数的多种实现的等同性并得以进行某些统计推断。 例如, 由于均一性, 在两个不同点的 实现被看作是同一个点的重要再现。 此外, 在许多实际运用中, 这个完全的空间规律并不是 必需的; 取而代之的是, 为了获得可以接受的近似解, 前二阶矩就足够了。在许多线性地质统 计估计方法中, 仅用到前二阶矩。考 虑随机变量 z (x ) , 通常来说, 它的数学期望是关于 x 的一个函数, 即: E z ( ) = m(x ) , 在地质统计学中所用到的二阶矩包括协方差、方差、变差函数。 方差函数的定义如下:E z (x ) - m (x ) 2 V a r z (x ) =协方差函数定义为 C (x 1 , x 2 ) =E z (x 1 ) - m (x 2 )z (x 2 ) - m (x 2 ) , 其中 x 1 , x 2 代表两个不同的点。 把区域化变量 z (x ) 在 x 1、x 2 两点处的值之差的方差之半定义为变差函数, ( x 1 , x 2 ) = 0. 5, V a r z (x 1 ) - z (x 2 ) 即所有的二阶矩是通常的位置函数, 因为地质统计学考 虑诸点的空间相依性, 协方差函数和变差函数是线性地质统计估计中最基本的概念。这些等式显然都是依据空间上任意两点, 因此关于协方差和方差的推断需要许多的点对z (x 1 ) , z(x 2 ) 的实现, 这一点在许多实际问题中是很难达到的, 因为样品点数总是有限的。 为了进行统计推断, 有必要对区域化变量的性质列入一些恰当的假设, 最基本的假设叫作平稳假设。有许多不同的平稳性, 但是最基本的是二阶平稳和本征假设。二阶平稳假定如 下:在整个研究区内有 z (x ) 的数学期望存在且等于常数,E z (x ) =(1)mz (x ) 的协方差存在且只依赖于滞后 h ,C (h ) = E z (x + h ) , z (x ) -与 x 无关。 平稳协方差蕴含了平衡方差和平衡变差函数V a r z (x ) =C (0)下面的关系是显然的, 对所有的位置都满足m 2(2)(3)(h ) = C (0) - C (h )更有趣的是, 在二阶平稳假设下, 变差函数仅仅是验前方差与协方差之差。(4)上述关系假定了协方差和验前方差的存在性, 然而在一些物理过程中没有有限的方差和协方差 (见图 2 的例子) , 在那里尽管协方差不存在, 但是变差函数仍然是可以定义的。 因图 2 方差与离散场面积对数值的函数关系图此, 二阶平稳假设可以适当地减弱只要求变差函数的存在和平稳性, 这种放宽的假设叫做本征假设, 一个随机函数 z (x ) 认为是本征的, 如果:数学期望存在且不依赖于点的位置,E z (x ) =m变差函数是有限的, 且仅与任意两点的位移有关, 而与 x 无关, 即V a r z (x + h ) - z (x ) =z (h )(5)二阶平稳包含了本证假设 ( IH ) , 反之则不成立。 在实际上, 由于已知信息数据点的限制, 验证二阶平衡是困难的, 在中等的和大的尺度范围内的结构趋势的存在使平稳假设不能 用。本证假设提高了线性地质统计评价技术的适用性, 但是在研究区空间结构性很强的情况 下仍然难以适用, 这便是从平稳假设引出准平稳假设的原因。在大多数的地质统计应用中, 统计估计是与局部邻域相关的。例如克立金可以看作是一种滑动平均方法, 因此协方差和变差函数仅仅在有限范围内使用。在有限邻域内要求的平稳 性导出了所谓的准平稳性。 在这种情况下, 一个变化的邻域能够确定下来, 那么数学期望和 协方差能够当作平稳来考虑。 准平稳假设是一致性的范围和被利用的信息量之间的一种折衷。准平稳性是依赖于尺度的。事实上, 适当限定邻域的大小平稳是能实现的, 然而, 这样的 邻域大多不能提供足够的数据量用以进行估计和准平稳矩的推断。3正定条件变差函数和协方差函数的最基本要求是正定条件。 设 z (x ) 是一个平稳的随机函数, 其数学期望为 m , 协方差函数为 C (h ) , 变差函数为 (h ) , 假设 y 是一个线性结合, 即ni z (x i )y =i= 1其中 i 是权系数, 变量 y 必须满足的是方差非负, 即有V a r y =i jC (x i - x j ) 0。ij由此可见并非随便的一个函数都可以作为一个平稳区域化变量的协方差函数, 方差永远大于等于零。 满足上述条件的 C (h ) 称为是正定的。 据公式 (4) 上述方差可用变差函数表述如 下:C (0) i j - i j (x i - x j )V a r y =ij若i = 0, 由上面等式可以推导下式:ijii j -V a r y =(x i - x j ) ji因此, 变差函数必须是这样选择 的: 在条件 i i =协方差函数 C (h ) 正定, 必须具有如下性质:函数是对称的, 即: C (h ) = C (- h ) ;在零点, 函数是验前方差 V a r z (x ) ;函数满足许瓦兹不等式|C (h ) | C (0)。(h ) 是非负定的。0 之下, -空间相距较近的点对较相距较远的点对具有更高的相关性。 因此协方差函数的绝对值|C (h ) | 通常随| h | 的增加而减少。最大的协方差是验前方差 C (0) , 具最大的相关性; 而最小 的协方差为 0, 不相关。协方差的一般特点在图 3 得到了刻划。当距离超过变程为 a 时, 协差 为 0。如图 3 所示, 变差函数正好相反。变差函数具有如下性质: 变差函数是对称的: (h )图 3 协方差函数与变差函数关系图= (- h ) 0; 变差在原点为 0, 即 (0) = 0。 通常变差函数是一个关于距离| h | 的增函数。直观上, 随| h | 的增大, 空间上两点越来越不相似。 事实上, 许多变差函数当| h | 达到一定值后, (h ) 的值停止增长, 稳定在 () 附近, 称为基台值。基台值事实上是随机函数的验前方() = V a r z (x ) =凡具有一个“变程”和一个“基台值”的变差 函数, 都称为可迁移型的, 在这种可迁移型模型中, 任何一点与以 a 为半径的邻域内的 其它任何一点有空间相关性。前者与后者相互有影响, 一般随两点距离的增大而减弱。 当两者的距离超过变程以后, 空间两点不存在相关性了。 因此变程 a 可以作为地质分 带, 比如成矿带的划分界限。在许多实际应用中, 带的影响不仅仅局 限在球形范围内。因为没有理由确信成矿带 在每一个方向出现同样的连续性。 换句话 说, 许多地质现象, 比如金属矿床在三维空间上出现各向异性, 而不是各向同性。 在变差函数中, 距离 h 是一个矢量, 它的方向和 模长都是变化的。通常 (h ) 在每个方向 a 上C (0)代 表一套变差函数 ( | h | , a ) , 可以通过计图 4变差的物理结构模型和它的各向异性算和考查各个方向的变差函数来研究各向异性。例如, 各向异性可以在各个不同的方向改变变程而表示出来; 各向异性也可以通过在不同方向改变基台值而确定, 图 4 对变差变程和各 向异性的物理意义给出一个直观的解释。4协同区域化在空间分析中考虑的不仅仅是一个变量时, 变量之间的关联必须采用协同区域化结构来量化。例如, 在一个低湿热液金银矿床中, A u 2A g 的相关性紧密。了解这两种矿化元素之间的富集关系是很有意义的。 协同区域化可以采用与单变量的区域化相近的概率分布描述, m 个相关变量 z (x 1 ) ,z 2 (x 2 ) , z 2 (x )z m (x ) 的协同区域化可以表示为 m 维随机函数 R F z (x ) , z 2 ( x 2 ) , z m(x ) 的一个实现。二阶平稳假设的定义为:对任一随机函数 z k (x ) , 其数学期望值 m k 是一常数即:E z k (x ) =(6)m k;对每对区域化变量 z j (x ) , z k (x ) 交叉协方差函数仅依赖于位移 h;E z j (x + h ) r z k (x ) -对每对区域化变量, 交叉变差函数可定义为m km j = C j k (h )(7)j k (h ) = 0. 5E z j (x + h ) - z j (x )z k (x + h ) - z k (x ) (8)不同于变差函数, 当两个变量是负相关时, 交叉变差函数将取负值。 例如在某一具体的矿床中, 一种元素的增加对应着另一种元素含量的下降。 在二阶平稳假设下, 交叉协方差函 数存在保证了交叉变差函数的存在, 且具如下关系式:j k (h ) = C j k (0) - C j k (h ) - C k j (h )(9)这种关系表明交叉变差函数是关于 (h , - h ) 和 ( j , k ) 对称的, 而交叉协方差函数则不然:j k (h ) = k j (h ) , 且 j k (h ) = j k (- h )(10a)C j k (h ) = C k j (- h ) , 且 C k j (- h ) C k j (h )(10b )两个变量间的非对称的交叉关系可以通过交叉协方差来区分, 但是这无法从交叉变差函数中看出。例如, 金富集相对于银富集的迟后效应不能从交叉变差函数得到反映。在这种情况 下交叉协方差函数将取代交叉变差函数, 因为后者无法充分地反映变量之间的交叉关系。估计方差在地质统计学估计问题中, 一个最基本的数量指标是估计方差。 它用来度量估计值 z 35与真实值 z 之间的误差 z 3 - z。 为了定量刻划这个误差, 引入它的概率分布函数是必要的。误差 (x ) = z (x ) - z 3 (x ) 可以看作是 R F R (x ) 的一个实现。 如果在控制区实验误差的直方图是可以得到的, 在二阶平稳条件下, 可以推出随机函数 R (x ) 的完全分布。即使这样的直方图得不到, 误差分布函数的平稳数学期望 m e = E R (x ) 和方差 2 =V a r R (x ) 也是可以e计算到的, 数学期望刻划了误差的平均值, 而方差量化了误差的离散程度。对任何随机变量, 估计误差 R (x ) 可以用完全概率分布函数来表示:F (w ) = P R (x ) W 依据上述函数, 从理论上可以对任何给定的误差范围建立一个置信区间, 事实上由于已知信 息的局限性, 没有关于变量性质的一些假定, 是很难做到这一点的, 假如随机函数 R F R (x )是二阶平稳的, 误差落在任意区间 a , b 中的概率 P a R (x ) b =F (b) - F (a ) 是能够计算的, 类似地, 误差的均值和方差也容易计算。所要求的估计值应该满足下列两个条件: 平均误差接近于零; 误差的方差尽可能小。第一条性质称为无偏性, 而第二条叫做最小估计方差。尽管在估计时误差的分布函数不 知道, 但仍然能够基于数学期望和方差构造大小的置信区间。事实上, 当仅有一、二阶矩可以利用 时, 置信区间的建造要基于一 些 关 于 误差分布形式的假定, 例如正态分布。在采 矿中, 对许多变量的误差分布 显 现 出 与 正态曲线类似的对称性。 主要区别在于 估计误差出现比正态分布较 长 的 尾 端。 在两端估计将出现更大的误差。 采用经典 的准则, 置信区间 m e z e 包括了实 验误差的 95% 。 因为估计误差的分布接近 于 正 态, 95% 的 标 准 置 信 区 间 对 于 判 别地质统计学估计特性是一个可以接受 的准则, 图 5 表明了估计误差 曲 线 与 正态分布曲线的关系。 估计方差的深刻意义体现在线性估计量的使用中。 假设 z( x ) 是一个二阶平稳的 R F , 数学期望为图 5 实验误差曲线和标准正态分布曲线的对比图m , 协方差为 C (h ) , 变差为 (h ) , 假设z V (x ) 是中心点为 x 的体积 V 上的真实平均值, z 3()V x是 z V (x ) 的估计值, 它是在中心点 x 的另一个体积 V上的平均值:11VV (x )VV (x )z V (x ) =(y ) dyz V (x ) = z (y ) dyz在二阶平稳假设下, z V 和 z v 的期望值均等于m , 这表明估计量满足无偏性条件。估计方差定义如下:22e =E z V (x ) - z v (x ) 它可以表示为2 (e = C V , V ) + C (v , v ) - z C (V , v )(11)采用关系 C (h ) = C (0) - (h ) , 上述等式可用变差函数表示为:-2e =2 (V , v ) - (V , V ) - (v , v )(12)-量 (V , v ) 或 C (V , v ) 代表当矢量 h 的一端描述体积 V (x ) 而另一端描述 v (x ) 时, (h ) 或C (x ) 的平均值, 其它概念可类似定义。等式 (11)、(12) 中的关系表明了一些直观的事实, 它们是所有地质统计估计量的基础,通过 v 估计 V依赖于如下的因素:-空间域 V 的几何特性。 因为变差函数 (h ) 是关于空间距离的增函数。 (V , V ) 随着-V 范围的增大, (V , V ) 增大, 而估计方差减少。 对任何有固定距离的空间域 v , v , 大体积 V上的平均品位的估计值比小体积 V 上的估计值有较小的估计方差。 对固定大小的 V , 估计 方差的大小取决于 V 的几何性质。V 和 v 之 间 的 距 离, 当待估块段 V 和信息块段 v 之间-的距离增大时, (V , v ) 也增大,估计方差也如此。 信 息 块 段 v的 几 何 特-性, v 增大, ( (v , v ) 也增大, 于是估计方差将减小。 固定 V 、v以 及 两 个 域 间 的 距 离, 估 计 量图 6 待估块段 V 的形态受样品的影响(a) 比较精确; (b ) 不精确将会依赖于信息 v 的形态。 图 6 用例子说明了信息样品的几何形态对估计精确度影响。除了上述因素外, 估计的质量也依赖于区域化变量的结构特性, 比如各向异性。 例如在 带状矿床中, 矿化带上的品位值比其它各方向上的样品取较高的权。6 离散方差离散方差在采矿工业中的选择开采有重要的作用。 假设 V是整个采区的体积, 被分成N 块同样大小的生产单元 v。z v (x ) 和 z V (x ) 分别表示 v、V 上的平均品位。在采区 V 内的 N个单元品位值的离散程度可以用如下关系式来定义:N1 z V (x ) - z v (x i ) 2S 2 (x ) =(13)Ni= 1其离散程度也可以通过 N 个品位值的直方图观测到, 这些品位值在估计阶段通常不是都能得到的, 于是问题的焦点集中在估计平均值 z V (x ) 和方差 S 2 (x ) 上面, 从区域化的框架来说,z V (x )、z v (x )、S 2 (x ) 可以分别看作是随机函数 z V (x )、z v (x )、S 2 (x ) 的实现在平稳假设下, 随 机变量 S 2 (x ) 的数学期望就是在 V 内的生产单元 v 的离散方差, 即:D 2 (v V ) = E S 2 (x ) =E 1 z V (x ) - z v (x ) 2 (14)Ni离散方差不再依赖于点 x , 它仅依赖于 v、V 的几何形态, 并且与协方差 C (h ) 有关。D 2 (v V )能够根据一套相同的体积的V (x k ) , k = 1, 2, k 进行实验估计, 对于每一个开采面, 我们可以计算离差平方和 S 2 (k ) 的平均值, k 个离差的算术平均值可以看作 D 2 (v V ) 的样本估计。当 v 与 V 相比非常小时, 每个中心在 V 内的生产单元可以看作整个包含在 V种情况下, 边界效应可以忽略不计, 在 V 内 v 的离散方差可以定义为:内, 在这D 2 (v V ) = E 1 z V (x ) - z v (y ) 2 dy , v VV (x )(15)V也可以改写为:1VV (x )D 2 (v V ) =E z V (x ) - z v (y ) 2 dy ,v (16)V上述关系式表明, 离散方差 D 2 (v V ) 可以看作是用 V 内的每个单元 v 的品位 z v (x ) , 估计整个 z V (x ) 的估计方差的平均值。 当 v = 0 时, 单元 v 可以看作一个点, 在这种特殊的情况下,在 V 内点变量的离散方差为1VV (x )D 2 (0V ) =它在采矿工业中有很多用处。E z V (x ) - z v (y ) 2 dy ,v V(17)根据估计方差和变差函数之间的关系式 ( 12) , 离散方差可以通过承载 v 和 V 上的变差函数计算出来, 这离散方差可以看作是变差函数在 V 和 v 上的平均值的差:-D 2 (v V ) = (V , V ) - (v , v )(18)离散方差的最重要的特点是它的可加性, 这可由等式 (18) 中的线性表达式推得。 这种关 系是由 D G 克立格采用维特沃特斯兰德金矿数据从实验中发现的。 下面的克立格关系式在采矿工业中是非常出名的。D 2 (v G ) = D 2 (v V ) + D 2 (V G ) (19) 其中 v V G。例如, 上述关系表示在矿床 G 内的生产单元 v 的离散方差等于开采面 V 内 v 的离散方差和矿床 G 内开采面 V 的离散方 差之和。 通常有:D 2 (v G ) D 2 (V G ) ,v V这暗示随着承载的增大而离散度减小。例如,岩 心样品 (v 几公里) 比开采面 (V 几千吨) 的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论