有序地质量最优分割法_第1页
有序地质量最优分割法_第2页
有序地质量最优分割法_第3页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 有序地质量最优分割法第一节 概 述地层划分与对比是煤田地质勘探的主要任务之一。在地质 工作中, 通常是寻找地层的不整合或假整合界线, 或者利用古生 物化石、 岩石矿物等地质特征对地层进行划分与对比。 这种划分 方法比较直观, 适用于较大地层单元的划分与对比。 当地质特征 间的差异性不显著时, 运用上述直观、 定性的方法来解决较小地 层单元的进一步划分就有一定的困难。 因此, 近年来开始利用有 序地质量,即运用数学方法, 并借于电子计算机定量地划分地层, 提出了“有序地质量最优分割法” 。地质数据中有相当多是有序的。这些按一定顺序排列的地 质变量,叫做有序地质量。例如,沿地层露头剖面采集

2、的岩石标 本;钻孔取出的岩芯样品;与这些岩石、样品有关的岩性、物理 化学和古生物数据; 以及地球物理测井数据等。 它们都是有序地 质量。这类数据的特点是样品的前后次序不能变更。所以,一些 不考虑样品排列顺序的数学处理方法, 对此不适用。 有序地质量 最优分割法,就是对一批有序数据(地质体)进行分段的统计方 法。设有n个按顺序排列的样品,每个样品测得p个变量,这批数据可用数据矩阵的形式表示为其中,x11x12x1px21x22x2pxn1xn2xnpXxilnxpxil 表示第 i 个样品第 l 个变量的取值。若对以上 n 个有序样品进行分割(分段),可能有12cn 1cn 2 c11 2n 1

3、 1种划分方法, 每一种分法称为一种分割。 在所有这些分割中, 存在这样一种分割,它使得各段(组)内部样品之间的差异性最 小(即样品数据的组内离差平方和最小) ,而使段(组)之间的 差异性最大(即样品数据的组间离差平方和最大)。这种对n个样 品分段并使组内离差平方和最小的分割方法,称为最优分割法。样品变量总离差平方和的分解式为TWB( 7 1)式中, T 为总离差平方和; W 为组内离差平方和; B 为组间 离差平方和。由式(7 1)可知,如果n个样品分为K段,每段的样品个 数为nk,若每个样品只取一个变量,则WK nk(Xikk 1 i 1Xk)2(72)K nkKB(Xkx)n k(Xk

4、x)k 1 i 1k 1(73)因此,寻求最优分割,就是用计算的分法找出使组内离差平 方和(w )最小的那些分割点。这与判别分析中费歇准则相似, 所以有序地质量最优分割法,有人又称为“ F-分割法”或“有序 样品的聚类分析”。第二节单元有序数据的最优分割若有n个有序样品,每个样品只取一个变量,则有n个有序数据序列,为X Xi, X2 , ,Xn现在试图将这n个样品按顺序分割为K段,使段(组)内离 平差和尽可能小,而组间离差平方和尽可能大。为此,用Xi,Xii, ,Xj表示从第i个样品数据开始至第j个样品数据为止的 某段样品,其中1 i j n该段样品变量的离差平方和为d(i,j)x x i,

5、ji(7-4)式中x i, j由于dg能够反映样品段Xi,Xii, ,Xj内样品间差异的情况,dg愈小,表示段内各样品之间差异性愈小;反之,x21 , x22 , x2n2XK2,XK2,和(段直径)分别为:品分为 K 段,XKnk,为最优K段分割Knkdi(i,j),d2(i, j), dK(i, j)x11 , x12 ,x1m其各段离差平方根据最优分割的表示段内各样品之间差异性愈大。因此,又把 的直径。原则,其组内离差平方和必须满足K nkWXikk 1 i 1d1 i, j d2 i.jXk i, jdk i, jmin(7-5)K 2nk xk i, j x maxk 1(7-6)在

6、实际应用时,往往事先不知道n个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、K段进行分析。一、最优二段分割若把n个有序样品Xi,X2, ,Xn分为两段,则有如下n 1种不同的分法,即X1 X2,X3 , ,XnX1,X2 X3,X4 , ,XnX1,X2,X3 X4,X5, ,XnX1,X2, ,Xn 1 Xn在上述 n 1 种分法中,究竟哪一种方法最优?只须计算出每 一种分割的组内离差平方和,并从其中找出组内离差平方和 W 最小的那一种分割,就是所求的最优二段分割。在n个有序样品中,对任意一个 j1 j n 1都可以确定一个 二段分割, 即 1, , j j 1, ,n 。

7、若把对 n 个样品在第 j 个样品处进 行的二段分割的组内离差平方和记为Wn 2; j d 1,1 d 2,n(7-7)式中, n 表示被分割的样品数; 2表示把 n 个样品分为二段;j 表示以第 j 个样品为分割点上述 n 1 种分割的组内离差平方和分别为Wn 2;1 d 1,1 d 2,nWn 2;2 d 1,2 d 3,nWn 2;n 1 d 1,n 1 d n,n在 i, , j 中,当 i j 时,则d 1,1 d 2,2 d n,n 0假设当j ai时,Wn 2; j达到最小,即Wn 2;a1min Wn 2; j1 j n 1则最优二段分割为XX2,,X& Xai, X

8、,其中X&为最优二段 分割点。二、最优三段分割若把n个有序样品Xi,X2, ,Xn分为三段,其中必有两个分割 点。假设第 a1 j 和第 j 个样品为分割点,则三段分割为X1, ,Xa1 Xa1 1, ,Xj X j 1, ,Xn 若把三段分割的组内离差平方和记为: Wn 3;a1, j ,其中 a1, j 为 两个分割点 1 a1 j 1;2 j n 1 ,则Wn 3;a1, jd 1,a1 d a1 1, j d j 1,nWj 2,a1 d j 1,n显然,如果有 Wn 3;a1,j 为最优三段分割,则 Wj 2;a1 必为最优 二段分割,否则必存在另一个最优二段分割 Wj 2;

9、a1 ,使Wn 3;a1, j Wn 3;a1, j这与Wn3;aj为最优三段分割相矛盾。因此,如果对 n个有 序数据进行最优三段分割,必须对任意一个 j 2 j n 1 ,即前 j 个数据先求出其最优二段分割,为Wj 2;a1 j d 1,a1 j d a11, j若Wj 2;a1min Wj 2;a1 j1 a1 j j 1则前 j 个样品的最优二段分割与xj 1, ,xn 构成一个三段分割。最后,找出一个适当的 j ,如 j a2 ,使得Wn 3;a1,a2 min Wj 2;a1 d j 1,n2mjinn1 Wn 3;a1 j , j则Xi, ,xaj xaj 1, ,Xa2 Xa2

10、 1, ,Xn为n个样品的最优三段分割, 其中ai和a2为最优三段分割点。三、最优 K 段分割若对n个有序样品数据Xi,X2, ,Xn进行最优K段分割,可先找 出 j K 1 j n 1 个样品的最优 K 1段最优分割,即Wj K 1;a1,a2, ak 2从而得 xa1 1, ,xa2xak 2 1, ,xj 与 xj 1, ,xn 构成 K 段分割,但不一定是最优 K 段分割。可选择一个适当的 j K 1 j n 1 ,如 j aK 1 时,使得Wj K 1;a1,a2, aK 2,aK 1 K m1 ijnn 1Wn K;a1 j ,a2 j , aK 2, j可得最优K段分割为Xi,,

11、X& Xa,出Xrk ! 1,, X.,其中xa1 , xa2 , ,xaK 1 为最优 K 段分割点。应当指出,分割的段数K一直可做到所要求的段数 K 为止;或者可以预先给定一个小正数 ,使 K 段分割的组内离差平方和Wn K;a1,a2, ,ak 1 后为止。这样得出的K 就是最后的分割的段数。由图 7 1所示,组内离差平方和是随分段段数 K 的增加而单调地减少。所以当 K n 时,组内离差平方和Wn n;a1,a2, ,an 10。因此,可根据组内离差平方和随段数增加而下降到比较稳定的时候(即 图中曲线平缓时)再确定分段段数。第三节多元有序数据的最优分割为了分层,有时需要汇集样品

12、更多的信息, 采用多个变量指标。例如,采集n个有序样品,每个样品测得 p个变量,原始数据可构成一个n p阶矩阵,为X11X12X1pXX21X22X2pXn1Xn2Xnpn p在多变量情况下,人们自然会联想到是否能将单元有序数据 最优分割原理引申到多元数据中来,以此对n个有序样品进行分割,一般最简单有效的办法就是把一段样品多个变量合并为一个 变量来处理,统一定义“段直径”。但是,为了使不同变量间具 有共同的数据基础,事先要对各个变量进行数据规范化处理,如使数据作正规化变换。原始数据矩阵中元素记为: Xii i 1,2, ,n;l 1,2, , p,则正规化数据为ZiiXii min 沟 max

13、 沟 min1 i n'1 i n1 i n(7-8)得正规化数据矩阵根据正规化数据,将样品段(7-9)式中1z i, JZj i 1 iZ11Z21Zzn1d i, jZ12Zi pZ22Z2pZn2Znp n p的段直径定义为2i, jn, 1,2,(7-10)若n个有序样品分为K段,每段内有nk个样品,则多元有序数据最优分割的原理与单元有序数据最优分割一样,使组内离差平方和Wn K;a1,a2,aK 1d1 i, j d2 i, jdK i, jKnk p_2ZkZk i,jk 1i1K minn 1 Wn K;a1 j ,a2 j , ,aK2 j ,j(7-11)应当指出,样

14、品的段直径除了用式(7-9 )定义外,还可用其他方法定义。如用样品数据绝对值距离来定义,即j p_D i, jx x i, ji 1(7-12)也可用其他度量空间的距离来定义。第四节 最优分割法的计算步骤1.数据正规化设原始数据阵为X11X12X1pxX21X22X2pXn1Xn2Xnpn p将X中的兀素Xil变换为ZilxHmin Xil1 i nmax Xilmin 沟.1 i n1 i ni 1,2, ,n;l 1,2, p得正规化数据矩阵Z11Z12Z1 pZZ21Z22Z2pZn1Zn2ZnPn p2.计算段直径矩阵Dd i, jZaZ i, j1 i j n其中i, j因为d i,j 0dj,i故必须计算竺丄个d i, j,得2d 1,1 d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论