《地质统计学》PPT课件.ppt_第1页
《地质统计学》PPT课件.ppt_第2页
《地质统计学》PPT课件.ppt_第3页
《地质统计学》PPT课件.ppt_第4页
《地质统计学》PPT课件.ppt_第5页
已阅读5页,还剩218页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

地质统计学 第一章绪论 地质统计学的概念 地质统计学的发展历程 地质统计学的发展趋势 地质统计学的研究内容 一 地质统计学的概念 地质统计学 Geostatistics Geostatisticsisconcernedwiththestudyofphenomenathatfluctuateinspaceand ortime GeostatisticsGlossatyandMuktilingualDictionaryR Olea editor OxfordUniversilyPressNewYork 1991 地质统计学是研究在空间 或时间 内变化的现象 它提供了一套理解和模拟空间变量的一套确定性和统计性的工具 地质统计学是数学地质的一个重要分支 而数学地质是地质科学中一门新的边缘学科 地质统计学是以区化变量理论作为基础 以变异函数为主要工具 对既有随机性又具有结构性的变量进行统计学研究的一门学科 侯景儒 1998 田世丰在 数学地质浅析 1998 一文中将地质统计学定义为 地质统计学是以矿石品位和矿床储量的精确估计为主要目的 以矿化的空间结构 空间相关 为基础 以区域化变量为核心 以变异函数为基本工具的一门新兴学科 地质统计学的定义 地质学 数学地质 地质统计学地质统计学是地质学由定性向定量化发展的产物 二 地质统计学的发展历程 1 萌芽阶段 20世纪40年代 50年代末 为寻求合理 先进的矿床储量估算方法 有人提出了变异函数 variogram 的基本概念 随后南非金矿的矿山地工程师克里格 krig 及南非统计学家西舍尔 H S Sichel 提出了根据样品空间位置不同 相关程度不同来计算块段品位及储量而使其估计误差最小的储量计算方法 2 形成阶段 20世纪50年代末 60年代 50年代末 法国概率统计学家马特隆 GMatheron 在克里格及西舍尔研究的基础上 对十几个不同类型的矿床继续深入研究 于1962年首先提出了区域化变量 regionalizedvariable 的概念 为了更好地研究具有随机性和结构性的自然现象 他提出了地质统计学 Geostatistics 一词 发表了 应用地质统计学论 从而为地质统计学奠定了理论基础 3 发展阶段 20世纪70年代 经过30多年的发展 地质统计学从理论研究到实践应用都有了一大批成果 其应用领域也不断地扩大和深入 在地质 矿山 环境保护 石油勘探 开发等10余个学科都不同程度地得到应用 越来越受到世界各国的重视 地质统计学在中国的发展历程 1 起步阶段 1977 1989 11 地质统计学1977年传入我国 当时由美国福禄尔采矿金属有限公司 的H M Parker博士随美中贸易全国委员会矿业代表团来华访问 纯属偶然机缘 阶段特点 1 以大专院校和有关工业部门的研究设计单位为活动主体 以出国学习深造 宣传 学术交流为主要形式 2 在理论研究方面 以普通克里格法为主 泛克里格 对数正态克里格 因子克里格有所涉及 3 零星的研究应用 随意性大 目的性不强 多应用于物探 化探 遥感数据处理及找矿预测等方面 地质统计学在中国的发展历程 2 发展阶段 1989 11 1995 10 1989年11月召开全国第一届地质统计学学术讨论会阶段特点 1 理论研究更加深入 涉及到的方法原理更加广泛 非平稳线性地质统计学 非参数地质统计学 多元地质统计学以及随机模拟等 2 在应用方面有了实质性的突破 采用地质统计学方法提交地质勘探成果为生产部门所接受 开始成为地质勘探 油田和矿山开发的使用方法 与生产实践结合得越来越紧密 3 开发出了一系列软件系统 如西安石油学院的的KMS克里格绘图系统 北京科技大学的三维普通克里格法程序系统 3DOK 地矿部的KPx2 0软件系统等 地质统计学在中国的发展历程 3 完善阶段 1995 10 阶段特点 1 与生产实践结合的更加紧密 注重解决实际问题 地质统计学的方法原理成功地应用到地质建模 成为今年来是由地质领域发展最快的技术之一 2 地质统计学的软件系统进一步成熟 3 无形资源评估将为地质统计学的应用提供更加广阔的市场 现在 地质统计学的应用已不仅仅限于地质领域 在环境科学 农田水利 土壤学 渔业 森林 海洋等方面也发挥这巨大的作用 三 地质统计学的发展趋势 1 从地质统计学的发展及应用看 它是一门新兴的交叉边缘学科 具有广阔的发展空间 2 由于研究对象的复杂性 地质统计学在许多多方面还存在着理论上的不足和不完善 要使地质统计学达到完全成熟和实用 还有许多工作待作 目前对于地质统计学的反对意见也很多 有人根本就不相信地质统计学的结果 3 地质统计学与其它学科的相互渗透 如贝叶斯理论 模糊数学及分维理论的结合 可能会产生新的突破 四 地质统计学的研究内容 随机变量变差函数克里格条件模拟 1 随机变量和随机函数 按定义 地质统计学是 研究在空间 或时间 内变化的现象 例如 岩石的物理性质包括 金属或污染源的含量 地理性质 人口密度 海拔高度 这些连续性变化的变量 离散性的变量如岩石类型 昆虫或化石的属种 沉积微相类型等 把任何未知样本看作一个随机变量 RV Z 这个随机变量的概率分布描述了有关Z的不确定性 随机变量 按照一定的概率分布能够取得不同数值的变量 随机变量的模型 即随机变量的空间分布 通常依赖于所处的空间位置 同时也随已有信息的变化而变化 连续型随机变量的随机函数连连续性随机变量Z u 的累积概率分布函数 ccdf 可以表示为 随机函数 离散型随机变量的随机函数在只能取得K个不同值的离散随机变量的情况下 使用类似的表示方法 2 变差函数 变差函数 Variogram 定义为两个相距h的随机变量的增量的方差变差函数是地质统计学研究的基本工具 其定义为两个相距h的随机变量增量协方差 表达式为 其中 C h 是平稳协方差函数是平稳方差 变差函数研究内容包括变差函数的定义 性质与功能 变差函数的理论模型以及变差函数的结构分析 3 克里格 克里格插值 krigging 克里格是根据协方差函数或者变差函数的先验模型 使估计方差达到最小的线性回归方法的综合 即最优线性 无偏估计 克里格算法的实值是利用邻近的数值Z a a 1 2 3 n 估计一个未取样值Z 主要研究各种克里格的数学基础 不同克里格方法的表达式及其应用条件 克里格在矿产估算中的应用 4 随机模拟 随机模拟是从一个随机函数 RF 模型中提取多个等概率的所有随机变量 RV 的联合实现 在随机模拟中 研究的内容包括随机模拟的定义及其与插值的区别 随机模拟的基本原理 随机模拟的分类 典型的随机模拟方法及其计算机实现 本课程还将介绍地质统计学在储层建模中的应用包括资料的准备建模的步骤 成果的显示等 地质统计学与经典统计学 经典统计学在地质研究中的缺陷1 经典统计方法在统计样品品位的频率及其分布时不考虑各样品的空间分布 但在地质研究中 很多地质变量的空间分布则是必须考虑的因素 经典统计学反映不了地质变量的空间变化性 2 经典概率统计学研究的对象必须是纯随机变量 而地质研究中的许多地质变量并不是随机变量 而是既有随机性又有结构性的变量 3 经典概率统计学所研究的变量原则上都是可以无限次重复试验或大量观察的 但地质变量则不行 因为一旦在矿体某处取一样品后 严格说来 就不可能在同一地方再次取到样品了 4 经典统计学一般要求每次抽取样品必须是独立进行的 但地质变量在两个相邻样品中的值就不见得一独立的 往往有某种成都的相关性 地质统计学的优点 1 地质统计学不是简单地把现成的概率统计理论 方法直接搬到地质领域中 而是根据地质变量本身的特点来选择合适的数学概念 理论 模型 方法 并加以改造 创新 使之适应地质变量的特殊性的要求 其最鲜明的特点就是地质与数学相结合 2 最大限度地利用了地质研究中所能提供的各种信息 包括空间信息 所有已知样品信息等 3 不但可以进行样品的整体估计 最重要的是可以进行样品的局部估计4 应用地质统计学方法得到的地质变量的精度比传统方法要精确 可以避免系统误差 5 地质统计学方法可以直接给出估计精度来 其标准就是克里格方差 6 应用地质统计学方法的计算机实现 实现地质变量的科学化 精确化和自动化 7 地质统计学中的条件模拟可以很好再现变量的空间变化性 是研究储层非均质性的有力工具 第二章预备知识 一 概率论基础二 随机变量及其概率分布三 随机变量的数字特征四 统计推断基础 一 概率论基础 1 随机事件概率论是研究自然界偶然现象的科学 在概率论中把偶然现象称为随机现象 在自然界 介于 必然事件 和 偶然事件 之间的即是 随机事件 这类事件的特征是在一定条件下可能发生 也可能不发生 或者在一定条件下有多个可能发生的结果 而其结果事先不能预测 2 统计概率频率 设随机事件A 在次试验中发生m次 其比值m n称为随机事件A的频率显然当重复试验的次数充分大时 随机事件A的频率 A 常常稳定在一个确定的数字附近 这就是概率 概率 在一定的相同条件下 重复作n次试验中发生了m次 当n充分大时 随机事件A的频率m n稳定在某一数字P附近 称数值P为该随机事件的概率 记为P A P性质 1 0 P A 1对于任意事件A 总有 2 P V 0V 不可能事件 3 P U 1U 必然事件 概率虽然是用频率来刻划的 但概率与频率是两个不同范畴的概念 随机事件的频率与进行的试验次数有关 而随机事件的概率则是客观事物本身的属性 一般地说 当试验次数足够大时 频率可作为概率的近似值 3 古典型概率古典概率是一类简单的随机现象 它具有如下特征 1 在观测或试验中 它的全部可能结果为有限个 记作E1 E2 E3 En 即穷尽性2 在几个可能结果中 任何两个可能结果不可能同时发生 即这些事件是两两互不相容的 即互不相容性 3 事件E1 E2 E3 En发生的可能概率相等 即等概率性 4 在n个可能结果中 至少有一个结果发生 即必然性 具备上述四种性质的事件群 称作完备群 组成完备群的事件叫基本事件 若试验时某一基本事件的发生能导致随机事件A的发生 则称这个基本事件有利于随机事件A 若以N个互不相容且等可能性的事件构成的完备群代表试验得到的一切可能结果 其中M各事件有利于随机事件A 随机事件A的概率便等于有利的基本事件数M与基本事件的总数N的比值 即 4 概率的基本运算1 加 P A B P A P B A B互不相容同理P A1 A2 A3 An P A1 P A2 P A3 P An 2 乘 事件A和事件B有连带关系 即在事件B已发生的条件下 事件A发生的概率 带有附加条件的概率 记作P A B 即或 不带有附加条件的概率 即事件B的发生不影响事件A出现的概率 故 全概率公式式中 PHi i 1 2 3 n 为已知事件Hi的概率 P A Hi 为事件A在Hi已发生的条件下的条件概率 Hi事件两两互不相容 是样本空间的一个分割 甲 乙 丙三个钻井队施工 甲 乙 丙钻井队打钻的孔数分别是总孔数的20 35 45 其见矿率分别是3 2 1 问从总钻孔中任意指定一个钻孔的见矿概率是多少 解 设H1为 甲用钻井队打钻的孔数 P H1 0 20H2为 乙用钻井队打钻的孔数 P H2 0 35H3为 丙用钻井队打钻的孔数 P H3 0 45A为 钻孔见矿数 即P A H1 0 03P A H2 0 02P A H3 0 01 逆概率公式 贝叶斯公式Bayes 假设事件A只能与两两互不相容的事件H1 H2 Hn之一同时发生 且有 为样本空间 则 该式称为逆概率公式 又可称作 后验概率 它反映了实验之后对各种发生 原因 可能性的大小 地质上的储层分类评价等可应用该方法 同理 二 随机变量及其概率分布 随机变量是基本事件的函数 一般定义为 根据随机实验的结果而取得不同数值的变量称作随机变量 一般用希腊字母 表示 随机变量可分为离散型的和连续型的两种 若随机变量所可能取的值可以一一列举出来 即是有限的 则为离散型随机变量 若随机变量所可能取的值不能意义列举出来 则称连续型随机变量 随机变量的取值可以通过随机事件概率的方法来研究 从概率角度出发 可以给随机变量下一个更为科学的定义 即 若某一试验结果可用一变量 来表示 依着两种不同类型的随机变量 有两种情形 1 若随机变量 是离散型的 则任一取值有确定的概率 2 若随机变量 是连续型的 则对任一实数 X有着确定的概率 此时则称 为一个随机变量 由定义可以看出 随机变量不仅需要给出它的取值范围 还需给出取值的概率 把变量 可能取的值及其相应的概率称为随机变量的概率分布 1 离散型随机变量的概率分布 1 伯努利实验和二点分布只有两个可能结果的实验 称作伯努利实验若随机变量的分布满足如下条件 则称服从二步分布 P为参数 二点分布又称作伯努利分布 2 二项分布若在相同的条件下进行n次独立试验 每次试验只有两种可能结果 成功或失败 分别记作A或 那么在n次试验中事件A出现的次数 是随机变量 服从于二项分布 出现K次的概率为 0 P 1 q 1 P 式中 为n次试验中事件A出现K次的概率 P为一次试验中事件A出现的概率 q为一次试验中事件不出现的概率 为二项系数 当n 1时 二项分布就是二点分布 3 泊松分布在一定的条件下 随机事件发生率总能相对稳在一定的值附近 这种随机现象服从泊松分布 若在一定时间或空间范围内 某随机事件的发生率是固定的 其随机概率 的概率分布服从 k 0 1 2 0 则称 服从泊松分布式中 k为指定的发生次数 e为自然对数的底 为参数 2 连续型随机变量的概率分布 1 正态分布若随机变量 的概率密度为 x u 则称 服从正态分布N 简记为 N和是两个参数 分别是随机就量 的数学期望和标准差 e是自然对数的底 为圆周率显然 当时此时的正态分布为N 0 1 称作标准正态分布 2 对数正态分布若随机变量 的概率密度为则称 服从对数正态分布 记作G为几何平均数 为标准差 连续型随机变量的分布类型很多 如均匀分布 指数分布 分布等等 正态分布是数理统计中最重要和最基本的 在客观的自然界中 许多随机变量服从或近似服从正态分布 而对于许多不呈正态分布的数据 经过对数处理后 表现除服从正态分布 二 随机变量的数字特征 1 数学期望所谓期望一般是指随机变量 取值的平均数 表示随机变量 取值集中位置或指平均水平 例如设随机变量 的概率分布是 我们希望找到一个能体现随机变量 取值的 平均 大小 这个取值 平均 大小的概念 就是随机变量 的数学期望 简称期望 1 离散型随机变量的数学期望设离散型随机变量的概率分布是 x1x2 xk PP1P2 PK 则称和数为随机变量 的数学期望 记作E 即 2 连续型随机变量的数学期望设连续型随机变量的分布频率为P x 则 落在无穷小区间内的概率 近似等于则有 则是的数学期望 或均值 数学期望的几个性质 常数的数学期望等于常数 常数与随机变量的乘积的数学期望等于常数与随机变量的期望的乘积 常数与随机变量的和的数学期望等于常数与随机变量的期望的和 2方差研究随机变量 仅仅知道体现随机变量取值平均大小的均值是不够的 还数学要知道随机变量的取值是如何在均值周围变化的 方差是用来反映随机变量取值分散程度的 是刻划分散性的指标 我们通常把随机变量的方差称作它的分布的方差 与数学期望一样 分离散型随机变量和连续型随机变量分别定义方差 1 离散性随机变量的方差设离散型随机变量的概率分布为 k 1 2 则称和数 为随机变量的方差 记作 显然当 的可能值不是有限个数时 要求级数D 收敛 若级数发散 则称 的方差不存在 2 连续型随机变量的方差设连续型随机变量的概率密度为P x 则称 为随机变量 的方差 记作D 显然且当积分发散时 方差不存在 从上市容易看出 D 实际上是 的函数 x E 2的数学期望 即D E x E 2 有时以方差的平方根来表示 记作 Grayscalehighlightsdiscontinuities Blackareasrepresentfaultplanes Areasarerevealedmoreclearlycomparedwithconventionalseismicvolumes Variancevolume 方差的应用实例 Highamplitudeeventscanbeseenterminatingagainstthefaultsinthevariancedata Varianceandamplitudecubeblendedtogether Byusingtransparencyonboththevarianceandamplitudecubes theentiresurveyfaultpatternandhighenergyamplitudescanbeviewedinonepanel Thisshowswherethepotentialprospectsareterminatingagainstthefaults VarianceCubemakesfaultinterpretationeasier Theimagedisplaysafaultplanetessellatedfromfaultpicks 方差的简单性质 D c 0常量的方差等于0 随机变量 与常量之和的方差等于 的方差 常量与随机变量 乘积的方差等于常量的平方与 的方差的乘积 两个相互独立的随机变量和的方差等于二者方差的和 3 协方差和相关系数自然界中的许多随机现象 同时要用几个随机变量来描述才能得到客观结论 这些随机变量之间 一般存在这某种联系 因此 在研究某一随机现象时 就需要把这些随机变量当作一个整体 即向量 来研究 在研究随机现象时 每一次试验结果看作一个向量 x1 x2 xn 而 x1 x2 xn 便是一个n维的随机向量 称为n维随机变量 一般把n各随机变量x1 x2 xn的整体 x1 x2 xn 称为n维随机向量 1 协方差协方差反映各个随机变量协同变化的密切程度 对于二维随机向量 协方差反映两个随机变量协同变化的程度 协方差的大小则反映了两个随机变量协同变化的密切程度 协方差记着Cov 显然 一个随机向量 x1 x2 xn 可以计算其两两随机变量的协方差 令可计算协方差矩阵B B是各对称矩阵 主对角线元素为方差 2 相关系数协方差是有量纲的量 它所反映的两个随机变量协同变纪的程度与随机变分的分散程度有关 为消除分散程度的影响 引入相关系数 r 0表示与不相关 表示与存在线性关系 大数定理和中心极限定理 在大量随机试验中 每次试验结果的偶然性在一定程度上可以互相抵消 互相补偿 从而显示出必然的规律 概率论揭示自然界中随机现象的方法 常常采用极限方法 从而有一系列极限定理导出 一类用来阐明大量随机现象平均结果稳定性的定理 统称为大数定理 另一类是随机变量和极限分布服从正态分布的条件是什么 这类定理称作中心极限定理 这是概率论中最基本的两个极限定理 1 大数定理 设 1 2 n是独立同分布的随机变量数列 其中E k D k k 1 2 存在 并对任何 0 有 其中Sn 1 2 n 只要n充分大 算术平均值 Sn n 接近于数学期望 通常把上式服从同一分布的随机变量数 1 2 n叫做服从大数定律 或称弱大数定律 若不考虑D k 是否存在 只要E k 存在 上式亦存在 即 这时把服从同一分布的随机变量数列 1 2 n称作服从强大数定律 大数定律揭示的规律是 只要n充分大 观测结果算术平均值接近于数学期望几乎是必然事件 2 中心极限定理 设 1 2 n是独立同分布的随机变量数列 且E k D k k 1 2 存在 同时D k 不等于0 一切实数a b 有 其中Sn 1 2 n 于是 因此上式可以写成 该式表明 只要n充分大 随机变量便近似服从于标准正态分布 从而近似地服从正态分布 中心极限定理表明了不论原始数据的分布如何 当样本增加到一定数目时 样本平均数的分布接近正态分布 即样本平均数的平均数等于总体平均数及样本平均数的方差等于总体方差除以样本大小 四 统计推断基础 统计推断的基本思路是 从研究对象的全体中 抽取一小部分来进行观察和研究 从而达到对全体 整体 进行推断的目的 所用的方法主要有参数估计和假设检验等方法 1 有关统计推断的几个基本概念总体 研究对象的全体样本 总体的一部分个体 组成总体的每个基本单元理论分布 总体的真实分布 F x 经验分布 样本的分布 Fn x 2 总体与样本数字特征 1 算术平均值2 几何平均值3 众数 对应于最大频数值的组中值 记为M纵4 中位数 样本值按从大到小的顺序排列后 居于中间位置的样品值 记为M中位5 方差 6 变异系数7 极差8 协方差9 相关系数 第三章区域化变量与变差函数 区域化变量及其基本特征 变差函数的定义 变差函数曲线 变差函数的理论模型 变差函数的结构分析 第一节区域化变量 区域化变量 RegionalizedVariable 是地质统计学研究的对象 它是一种在空间上具有数值的实函数 GMatheron 也就是说 它在空间的每一个点取一个确定的数值 即当由一个点移到下一个点时 函数值是变化的 区域化变量图示 区域化变量是以空间点x的三个直角坐标 xu xv xw 为自变量的随机场Z xu xv xw Z x 当对他进行一次观测后观测后 就得到了他的一个实现z x 它是一个普通的三元实值函数或空间点函数 区域化变量的两重性 观测前是一个随机场 依赖于坐标 xu xv xw 观测后是一个空间点函数 在具体的坐标上有一个具体的值 Z x2 Z x1 Z x6 Z x3 Z x5 Z x8 Z x4 Z x7 z x2 z x1 z x6 z x3 z x5 z x8 z x4 z x7 随机性 确定性 观测前随机变量的集合 观测后实数 实现 的集合 区域化变量举例 在地质 采矿领域中许多变量都可看成是区域化变量 资源储量 储层厚度 地形标高 矿石内有害组分含量 岩石破碎程度 孔隙度 渗透率 泥质含量等 有的是二维的 有的是三维的 区域化变量正是地质统计学研究的对象 区域化变量的功能 由于区域化变量是一种随机函数 因而能同时反映地质变量的结构性与随机性 当空间一点x固定之后 Z x 表示x点处的矿石品位 就是一个随机变量 体现了其随机性 在空间两个不同点x及x h 此处h也是个三维向量 hu hv hw 它的模表示x点与 x h 点的距离 处的品位Z x 与Z x h 具有某种程度的相关性 这就体现了其结构性的一面 区域化变量的属性 1 空间局限性2 连续性3 异向性4 相关性5 叠加性 空间局限性 区域化变量被限制于一定的空间 该区间称为区域化变量的几何域 例如 矿体的范围 油藏的范围 断块的范围等都可以看成是区域化变量的几何域 连续性 不同的区域化变量具有不同程度的连续性 这种连续性是通过区域化变量的变差函数来实现的 异向性 区域化变量在各个方向具有不同的性质时称为各向异性 否则称为各向同性 在地质上 各向异性是绝对的 而各向同性是相对的 percent Por Perm 相关性 区域化变量在一定的范围之内呈现一定程度的空间相关性 当超出这一范围之后 相关性变弱以至消失 叠加性 对于任一区域化变量而言 特殊的变异性可以叠加在一般的规律之上 地质统计学的若干基本假设 平稳假设 内蕴假设 估计方差 离差方差 平稳假设 stationaryassumption 任何统计的推断 不论是单变量的累积概率分布函数 cdf 或是它的任何阶矩 均质 方差 还是多变量的cdf及其任何阶矩 协方差 都需要重复取样 但是在许多情况下 在某一个位置 u 只有一个样品 那么z u 是已知的 就不需要考虑随机函数的模型Z u 也就是说 区域化变量的取值是唯一的 不能重复 为了克服这个困难 提出了如下的平稳假设 平稳假设 假设区域化变量Z x 的任意n维分布函数均不因空间点x发生位移h而改变 即 这种假设要求的条件太强了 实际上很难满足 在地质统计学中 只需要假设Z x 的一阶 二阶矩存在且平稳就够了 二阶平稳假设 当区域化变量Z x 满足下列两条件时 称其为二阶平稳的 1 在整个研究区内Z x 的数学期望均存在 且等于常数 即E Z x m 常数 x2 在整个研究区内Z x 的协方差函数存在且平稳 即只依赖于基本步长h 而与x无关 即 Cov Z x Z x h E Z x Z x h E Z x E Z x h E Z x Z x h m2 C h x h当h 0时 上式变为Var Z x C 0 x此式说明 方差函数也存在 且为常数C 0 本征假设 内蕴假设 在实际应用中 有时连二阶平稳假设的要求也不能满足 如协方差函数不存在或方差函数不存在等 这时 可以再放宽铁件 得到本征假设当区域化变量Z x 的增量 Z x Z x h 满足下列两条件时 称其满足本征假设 1 在整个研究区内有E Z x Z x h 0 x h若Z x x存在 则此条件等于E Z x E Z x h m 常数 x h2 增量 Z x Z x h 的方差函数存在且平稳 即方差函数不依赖于x Var Z x Z x h E Z x Z x h 2 E Z x Z x h 2 E Z x Z x h 2 2 x h 2 h x h 变差函数 变差函数是地质统计学所特有的基本工具 它既能描述区域化变量的结构性变化 又能描述其随机性变化 是地质统计学计算的基础 变差函数的定义 设区域化变量Z x 定义在一维数轴x上 把Z x 在x x h两点处的值之差的方差之半定义为Z x 在x轴方向上的一维变差函数 记为 地质统计学上把2 x h 定义为变差函数 x h 称为半变差函数 一般情况下把 x h 称为变差函数 在二阶平稳假设或本征假设 内蕴假设 的条件下 有 E Z x E Z x h x h于是变差函数可以简化为 变差函数的简化 在内蕴假设的条件下 变差函数 x h 与x无关 只与分隔两个两个样品之间的距离h有关 x h 可以改写为 变差函数定义 变差函数是在任一方向 相距 h 的两个区域化变量值Z x 及Z x h 的增量的方差 它是h和 的函数 其通式为 连续情况下 离散情况下 实验变差函数 Experimentalvariogram 在实际应用中 样品的数目总是有限的 把有有限实验样品值构成的变差函数称之为实验变差函数 记为 h 理想的变差函数曲线图 C0 块金效应 它表示h很小时两点间的样品的变化 可以为0 称为无块金效应a 变程 当ha时 样品间就不存在相关性 a的大小反映了研究对象 如油藏 中某一区域化变量 如孔隙度 的变化程度 可以用在a范围以内的已知信息对待估区域进行预测 C C0 C1 称为总基台值 C1 基台值 是先验方差与块金效应之差c C C0 变差函数的性质 在二阶平稳假设下 这是一个非常重要而且极为有用的共识 它表明了在二阶平稳的假设条件下 变差函数 h 协方差函数C h 与先验方差函数C 0 三者之间的重要关系 1 协方差函数C h 的性质 2 变差函数 h 的性质 变差函数的理论模型 如同经典统计学那样 理论变差函数仅仅是几个简单的模型 这些理论模型将直接参与克里格和随机模拟计算 球状模型 球状模型图示 a是变程 一个主要特点是在原点附近的小范围内表现出线性行为 但在大距离时变得平缓当h为变程a时达到基台值 模型的另一个特点是原点的切线在2 3变程时便达基台值 这个事实在拟合实验变差函数时非常有用 标准化后的球状模型 均值为0 方差为1Var Z x 1 C 球状模型可写成 高斯模型 高斯模型图示 式中a不是变程 由于当时 即当时 h C0 C所以该模型的变程为 h C 高斯模型 标准化后的高斯模型 高斯模型是一种连续性好但稳定性差的模型 指数模型 当h 3a时 即当h 3a时 h C0 C 所以该模型的变程约为3a 三种变差函数的比较 变差函数的功能 变差函数在地质统计学中占有非常重要的地位 它不仅是许多地质统计学计算的基础 而且变差函数能够反映区域化变量的许多重要性质 1 通过编程反映变量的影响范围2 变差函数在原点处的形状可以反映变量的空间连续性 1 抛物线型 反映变量具有高度的连续性 2 直线型 反映区域化变量具有平均的连续性 3 间断型 有块金效应型 反映变量的连续性很差3 不同方向上的变差图可反映区域化变量的各向异性4 变差函数如果是跃迁型的 一个变程和一个基台值 其基台值的大小可反映变量在该方向上变化幅度的大小5 块金常数的大小可反映区域化变量的随机性大小 结构分析 Structureanalysis 当作出实验变差函数图以后 最好是用一种合适的理论变差函数来拟合它 然后就可以对所研究的区域化变量进行分析 但是在实际工作中 区域化变量的变化性很复杂 它可能在不同的方向上有不同的变化性 或者在同一个方向上包含着不同尺度上的多层次的变化性 因而无法用一种理论模型来拟合它 为了全面了解区域化变量的变异性 就必须进行结构分析 结构分析的定义 所谓结构分析 就是构造一个变差函数模型对于全部有效结构信息作定量化的概括 以表征区域化变量的主要特征 结构分析的主要方法是套合结构 neststructure 所谓套合结构 是分别把出现在不同距离h上和 或 不同方向 上同时起作用的变异性组合起来 套合结构的表示方法 套合结构可以表示为多个变差函数之和 每一个变差函数代表种特定尺度上的变异性 一套合结构的表达式为 套合结构的实现 一个方向上的套合结构 不同方向上的套合结构 几何异向性及其套合结构 带状异向性及其套合结构 一个方向上的套合结构 套合结构中每一个变差函数代表一种特定尺度上的变异性 可以是不同模型的变差函数 例如某区域化变量在某一方向上的变异性由 0 h 1 h 2 h 组成 总的套合结构是 h 0 h 1 h 2 h 0 h 表示微观上的变化性 其变程a极小 可近似地看成纯块金效应 1 h 代表矿层及岩层的变化 可以用一个球状模型来表示 其变程a1 10 一个方向上的套合结构 2 h 可能表征矿化带的范围 也是一个球状模型 其变程a2 200m 套合结构的具体表达式为总的套合结构是 h 0 h 1 h 2 h 其中a1 a2 具体表达式就是分段函数叠加表达式 北东南西向的变程为1600米 基台值23 5 块金常数为0 北西南东向的变程为600米 基台值20 5 块金常数为0 结构分析的一般步骤 1 选择符合研究目的的区域化变量2 对被研究的数据进行仔细的审议3 数据的统计分析4 实验变差函数的计算5 进行不同方向的套合6 结构模型的检验7 对变差函数进行地质解释 数据分布概率图 累积概率曲线 井距概率统计 井距累积概率统计 变差函数实例 空间变差函数 垂直变差函数 指数模型 球状模型 高斯模型 分形模型 指数模型 球状模型 高斯模型 分形模型 平面变差函数 变程椭圆 第三章克里格 Kriging 克里格法是法国G Matheron教授以南非矿山地质工程师D G Krig的名字命名的一种方法 也称为克里金法 Kriging 从数学角度抽象来说 普通克里格法是一种对空间分布数据求最优 线性 无偏内插估计量 BestLinearUnbiasedEstimation 简写为BLUE 的方法 若用矿业上的术语具体说 它是根据一个待估块段邻域内的若干信息样品的数据 在考虑了这些样品的形状 大小及相互位置关系 以及品位的变差函数模型提供的结构信息之后 为了对该块段品位作出一个线性 无偏 最小估计方差的估计而对每个样品值分别赋予一定的权系数 最后加权平均来估计该块段品位的方法 简言之 克里格法就是一种特定的滑动加权平均法 克里格的定义 Kirigingis acollectionofgeneralizedlinearregressiontechniquesforminimizinganestimationvariancedefinedfromapriormodelforacovariance GeosatisticalGlossaryandMultilingualDictionary 克里格是 根据协方差函数的先验模型 使估计方差达到最小的线性回归方法的综合 克里格法与传统估值法的区别 多边形法主要是根据多边形块段内的一个已知资料来估算值 没有考虑周围其它已知信息 可说是一孔之见 剖面法和三角形法所利用的每一个已知数据在估算中的贡献是相同的 即都是等权的 没有区别不同情况给以不同的权 距离反比法前进了一步 考虑了周围的样品 而且也对各数据用样品到待估块段中心的距离的导数为权进行了加权平均 但没有考虑样品之间和样品与待估块段之间的空间构形几何因素的影响 同时也没有考虑到所研究变量的空间分布结构信息 即变差函数 克里格法克里格法最大限度地利用地质上提供的上述各种信息 对各样品数据赋以适当的权系数 就可给出更为切合实际的 更精确的估计 克里格法可以避免系统误差 克里格的类型 克里格法多种多样 对各种不同的目的和不同的条件 需要选用不同的克里格法在满足二阶平稳假设 或本征假设 时 可用普通克里格法在非平稳 或说有漂移存在 现象中 可用泛克里格法在计算局部可采储量时要用到非线性估计量 就可用析取克里格法当区域化变量服从对数正态分布时 可用正态对数克里格法对有多个变量的协同区域化现象 可用协克里格法此外还有因子克里格法 指示克里格法等 x4 Z x 满足二阶平稳假设估计以x0为中心的域V中品位的平均值 所使用的线性估计量 求出权系数 保证Zv 是一个线性 无偏 最小估计方差的估计量 称 i 克里格权系数Zv 克里格估计量 记为Zk 这时的估计方差称为克里格方差 记为 k2 E Z x m E Z x Z x h 2 2 h E Z x Z x h m2 C h 克里格算法概述 在克里格算法中 关键是要解决两个问题 列出并求解克里格方程组 以求出诸克里格权系数 i来求出这种估计的最小估计方差 克里格方差 简单克里格 SimpleKriging 当E Z x m 常数 令Y x Z x m 则E Y x E Z x m E Z x m 0 x其协方差函数为E Y x Y y C x y 要估计的是 所用的估计量为 式中 Yi Zi m i 1 2 n 所以估计Z V 的问题就简化为估计Y V 的问题了 由于 另一方面 故 所以YV 是Y V 的无偏估计量 估计方差表达式 为了使上式达到最小 将上式对 i求偏导数 并令其为0 则有 即得简单克里格方程组 为了求出既无偏差又使估计偏差 E2 E Y V YV 2最小时的诸权系数 i 首先需要写出估计偏差的表达式 将 两端均乘以 i 并对i从1到n求总和 则有 将其估计方差公式 得 由于Y V 的简单克里格估计量为 故Z V 的简单克里格估计量为 即 普通克里格 OrdinaryKriging 当E Z x m为为未知常数时 就成为普通克里格 此时要估计 所用的估计量为 要求出诸权系数 i i 1 2 n 使得ZV 是Z V 的无偏最小估计方差的估计量 及普通克里格方差 k2 无偏性条件 一方面 另一方面 最优性条件 即估计方差最小条件 满足无偏条件下估计方差公式 而要求出无偏条件下使得估计方差达到极小的诸权系数 i i 1 2 n 这是个求条件极值的问题 要用拉格朗日乘数法 令 F是 i和 的 n 1 元函数 2 是拉格朗日乘数 求出F对n个 i和 的偏导数 并令其为0 即可得到普通克里格方程组 普通克里格方差的表达式 设 j j 1 2 n 和 都是从拉格朗日方程组中解出来的 则有 将上式两边均乘以 i 再对i从1到n求和 得 普通克里格方程组的变差函数形式 上述公式是用协方差函数表示的普通克里格方程组与普通克里格方差 他们也可以用变差函数 h 来表示在满足二阶平稳假设的条件下有C h C 0 h 将其分别代入普通克里格方程组与普通克里格方差中并化简 消去C 0 即可得到普通克里格方程组和方差的变差函数形式 若样品的承载较大时 不能看作点承载是 上述方程 组 可写为 协方差形式 变差函数形式 普通克里格方程组和普通克里格方差矩正表示法 为了书写简便和便于记忆 普通克里格方程组和普通克里格方差可用矩正形式表示 普通克里格法的计算实例 设有一个层状矿床 在平面上各点处的某金属品位Z x 时隔二阶平稳的区域化变量 其而未变差函数 h 是个二维各向同性的球状模型 其参数为C0 2 a 200 C 20 即 又设已知在平面上四个点S1 S2 S3 S4处的品位值分别是Z1 Z2 Z3 Z4 要据此估计S0点处的品位Z0 设Z0的普通克里格估计量为 则普通克里格方程组的的举证形式为 距阵元素 只要计算出各Cij 代入上式 即可得 K M2 再求出 K 的逆矩阵 K 1 便可得到普通克里格方程组的解为 当i j时 将以上各值代入普通克里格方程组的矩阵形式中 得 经计算得 从以上结果可以看出 Z1的权系数最大 Z4的权系数次之 这是很自然的 因为S1和S0最近 S4次之 S2与S0的距离虽比S3与S0的距离小 但 2却小于 3 这是由于Z2受到Z1的屏蔽作用 而Z3则没受到屏蔽的影响 如果估计P0点的值 由于数据构型不变 普通克里格矩阵 K 不变 只需重新计算 经计算得 克里格权系数的特点 克里格法的关键在于对参与估计计算的各个样品信息分别赋予合适的权系数 克里格权系数 它具有以下几个特点 1 无偏性 能保证E ZV E Zv 或者说他们满足无偏性条件 2 最优性 估计方差最小性 用克里格权系数构成的估计量不仅无偏 而且估计方差最小 等于克里格方差 3 对称性 当区域化变量Z x 具有各向同性结构时 在几何形状 位置上对待估承载V具有对称性的信息样品 i j在没有其他效应影响的条件下 有相同的权系数 4 减弱丛聚效应 declusteringeffect 也译作解串效应 用克里格法进行估计时 不会因为有一些样品从聚在一起而过分地增大了它们总的权数 5 屏蔽效应当块金常数为零或很小时 在待估块块段内部的样品的克里格权系数最大 块段周围第一圈样品的权系数也较大 第二圈系数明显减小 这就是克里格权系数的屏蔽效应 随着块金效应的增大 屏蔽效应变弱 6 克里格权系数可正可负 S1 1 S2 2 S8 8 S3 3 S5 5 S4 4 S6 6 S7 7 估计块段V的权系数特点 克里格法权系数 距离反比法权系数 协同克里格 Cokriging 在地质上 常遇到多个变量协同区域化的现象 如孔隙度 渗透率等协同区域化 可用K个区域化变量的集合表示 即 Zk x k 1 2 K 当某一个变量的取样量不足以获得所需精度的估计量 而其它变量却有较充足的取样量时 研究这个变量与其它变量的间的空间关系 借助其它变量的样品信息用协同克里格法就可以提高这个变量的估计精度 协同克里格 从理论上讲 协同克里格与普通克里格类似 没有本质区别 主要就是多用一个下标k来表示各个变量 设有K个变量构成协同区域化变量 Zk x k 1 2 K 假设它们是二阶平稳的 即有如下一阶矩 二阶矩存在且平稳 交叉协方差函数为 交叉变差函数为 设k0为k 1 2 K中某一特定值 即Zk0 x 为我们要估计的主变量 设要估计的中心点x0处的承载Vk0 x0 上Zk0 x 的平均值为 信息样品的有效数据集是 估计量ZVk0 是协同区域化的所有K个变量的全部有效数据的线性组合 协同克里格方程组 依据无偏性和最优性条件 可以得到协同克里格方程组 最优性 无偏性 这个方程组的未知数是个权系数及K个拉格朗日参数 k 共有个未知数 同时也有个线性方程构成这个方程组 协同克里格方差 有关协同克里格的几点说明 1 普通克里格方程组只要在二阶平稳条件下 总是既可以用协方差函数表 又可以用变差函数表示 而协同克里格方程组则不同 在二阶平稳假设的条件下 只有当Ck k h Ckk h 从而 k k h kk h 成立时 才可既用协方差函数表 又用变差函数表示2 只有当交叉协方差矩阵是严格正定的 才能满足协同克里格方程组具有唯一解 为此 只要采用正定的点协同区域化模型 并且没有一个数值相对于另一个数值来说是完全多余的即可 同时 仅当主变量的观测值个数不为零 时 无偏性条件才能被满足 3 如果协同区域化变量 Zk x k 1 2 K 的所有交叉协方差函数 或交叉变差函数 都与同一个基本模型 成比例 那么这些变量就被称为是本征协同区域化的 在这种条件下 如果每个变量Zk x 的数据构型 共K个数据构型 均相同 可以证明 某特定变量的协同克里格估计量恒等于只有的信息数据时的普通克里格估计量 因此 在这种条件下 只有当变量之一比其它变量采样不足时 才需要使用这种计算复杂的协同克里格法 指示克里格 IndicatorKriging 在地质研究上 常会出现以下几种情况 1 特异值的出现 这些特异值并非系统误差或者采集方法导致 而是实际存在的 特异值所占数据比例虽然小 但却具有十分重要的地质意义 2 在研究区域内存在离散化的区域内型 在每一种区域内具有自己特有的取值范围 3 对于地质研究中 出现某一截止值范围之外和之内的特殊地质意义的研究为了解决上述问题 地质统计学上出现了指示克里格这种非参数的地质统计学 它是在不必去掉重要而实际存在的特异值的条件下来处理各种不同的地质现象 并且给出一定风险条件下未知量Z x 的估计量记起空间分布 指示函数的表达形式 研究区域V内变量Z x 的的分布满足如下表达式 在域V内 低于边界值品位Z的变量Z x 所占区域A的比例为 在域V内 高于边界值品位Z的变量Z x 所占区域B的比例为 指示克里格方程组和方差 若给定一系列边界品位值Zl时 Zl l 1 2 L 则估计方程 依据无偏性和最优性可得到指示克里格方程组 泛克里格法UniversalKriging 二阶平稳的区域化变量E Z x m 常数 非平稳区域化变量E Z x m x 这里的m x 叫作漂移 drift 一般理解为 趋势 但其含义比趋势明确 m x 通常取x的多项式形式 在假设非平稳区域化变量Z x 的协方差函数 或变差函数 存在 并已知Z x 的漂移的形式为多项式的条件下 讨论各种线性无偏最优估计的问题 就叫做泛克里格法 它属于线性非平稳地质统计学范畴 几个基本概念 1 平稳和非平稳从数学上讲 似乎比较简单 若E Z x m即为平稳 若E Z x m x 即为非平稳 但实际上 并非那么简单 这涉及到一个观测尺度的问题 往往同一个现象 用不同尺度去观测 得出平稳或非平稳的结论往往会发生变化 2 漂移与剩余对于非平稳的 或说有漂移的 区域化变量Z x 假设它们可以分解为漂移和剩余两部分 即 Z x m x R x 其中m x E Z x 为在点x处Z x 的数学期望 称为漂移 而R x Z x m x 称为剩余 它是一个数学期望为零的区域化变量 E R x E Z x m x E Z x m x 0 剩余的变差函数 由于E R x 0 故R x 是一阶平稳的 如果R x 还满足二阶平稳或本征假设 则剩余的变差函数存在 公式如下 一般 漂移m x 表示Z x 的规则而连续的变化 而剩余R x 则可认为是围绕漂移m x 摆动的随机误差 且其数学期望为零 在Z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论