(矿产普查与勘探专业论文)粗糙集理论及其在煤储层渗透性预测中的应用.pdf_第1页
(矿产普查与勘探专业论文)粗糙集理论及其在煤储层渗透性预测中的应用.pdf_第2页
(矿产普查与勘探专业论文)粗糙集理论及其在煤储层渗透性预测中的应用.pdf_第3页
(矿产普查与勘探专业论文)粗糙集理论及其在煤储层渗透性预测中的应用.pdf_第4页
(矿产普查与勘探专业论文)粗糙集理论及其在煤储层渗透性预测中的应用.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(矿产普查与勘探专业论文)粗糙集理论及其在煤储层渗透性预测中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

at h e s i ss u b m i t t e df o r t h ed e g r e eo fm a s t e r c a n d i d a t e :x i ey a n i s u p e r v i s o r :p r o f z h a oy o n g j u n s c h o o lo fg e o s c i e n c e s c h i n au n i v e r s i t yo fp e t r o l e u m ( e a s t c h i n a ) 关于学位论文的独创性声明 本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得 的成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致 谢外,本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得 中国石油大学( 华东) 或其它教育机构的学位或学历证书而使用过的材料。与我一同工 作的同志对研究所做的任何贡献均已在论文中作出了明确的说明。 若有不实之处,本人愿意承担相关法律责任。 学位论文作者签名: 吼砑卜乡月3 日 学位论文使用授权书 本人完全同意中国石油大学( 华东) 有权使用本学位论文( 包括但不限于其印刷 版和电子版) ,使用方式包括但不限于:保留学位论文,按规定向国家有关部f - j ( 机 构) 送交学位论文,以学术交流为目的赠送和交换学位论文,允许学位论文被查阅、 借阅和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、 缩印或其他复制手段保存学位论文。 保密学位论文在解密后的使用授权同上。 学位论文作者签 指导教师签名: f7 6 月 日 多月罗 日 摘要 煤储层渗透率是煤层气勘探有利目标区评价的重要参数之一,目前煤田勘探区渗 透性的数据很少甚至没有,煤层气勘探也只有常用的一些方法及很少的实测资料。粗 糙集理论作为处理不确定和不精确数据的有效方法,在数据挖掘过程中发挥了很大作 用,它在很多领域中也都取得了成功的应用,本文将粗糙集理论应用于煤储层渗透性 预测中,将为煤储层渗透性预测提供一种新思路。 本文首先对粗糙集基本理论进行了概述,阐述了知识、不可分辨关系、属性重要 度等重要概念,然后介绍了研究区的地质概况,包括构造特征、地层特征、煤层分布 等。重点分析了煤储层渗透性的主要影响因素,并且挑选出合适的影响因素作为影响 因子。在粗糙集理论基础上,重点阐述了基于粗糙集理论的建模步骤:建模假设;指 标的选择,即选择合理的影响因素作为条件属性;数据预处理,包括对原始数据的补 齐和离散化;属性约简;抽取规则;最后进行规则的检验。在研究过程中,利用v c + + 6 o 对粗糙集理论的主要算法进行了程序实现。 对沁水盆地南部地区进行实证研究,选择基于差别矩阵的属性约简算法对决策表 进行处理,建立了研究区的渗透性预测的规则模型,利用测试集对模型精度检验,规 则模型精度为9 0 ,说明模型有较好的预测能力。利用得到的规则模型在研究区进行 渗透性预测,发现研究区渗透率分布呈现南高北低的趋势,研究区南部晋城地区渗透 率普遍大于1 1 0 。3 心,该区是勘探开发重点区域。粗糙集理论核心是知识约简,通 过对知识的约简,可以发现潜在的规律,在建立煤储层渗透性预测模型中,充分发挥 了粗糙集简化样本和提取核心属性的优势。 关键词:沁水盆地,粗糙集,属性约简,渗透性 s t u d yo nr o u g hs e tt h e o r yi nt h e p r e d i c t i o no f c o a lr e s e r v o i rp e r m e a b i l i t y x i ey a n i ( i n v e s t i g a t i o na n d e x p l o r a t i o no fm i n e r a lr e s o u r c e s ) d i r e c t e db yp r o f e s s o rz h a oy o n g j u n a b s t r a c t c o a lr e s e r v o i rp e r m e a b i l i t yi sa l li m p o r t a n tp a r a m e t e ro fe s t i m a t i n gf a v o r a b l e e x p l o r a t i o nt a r g e ta r e a h o w e v e r , t h e r ea l eo n l yc o m m o nm e t h o d sa n dl i t t l ed a t ai nt h ec o a l e x p l o r a t i o na r e a r o u g hs e tt h e o r yw o r k sa sa ne f f e c t i v ew a yo fd e a l i n g 、析t l lu n c e r t a i n t y a n di m p r e c i s ed a t a i tw o r k sw e l ld u r i n gt h ep r o c e s so fd a t am i n i n g i ti su s e ds u c e s s f u l yi n a l lf i e l d s i nt h i sp a p e rt h er o u g hs e tt h e o r yi su s e di nt h ep r e d i t i o no fc o a lr e s e r v o i r s p e r m e a b i l i t ya n dp r o v i d e sa n e wm e t h e df o ri t f i r s t l y , t h i sp a p e rs u m m a r i z e st h er o u g hs e tt h e o r ya n de x p o u n d ss o m ei m p o r t a n t c o n c e p t s ,s u c ha sk n o w l e d g e ,i n d i s c e m i b i l i t yr e l a t i o n ,a t t r i b u t ei m p o r t a n c ea n ds oo n i t o u t l i n e s t h er e g i o n a lg e o l o g y t h i sp a p e rc e n t r e so nt h em a i ne f f e c tf a c t o r si n c l u d i n g e f f e c t i v es t r e s s ,c l e a t ,b u r i e dd e p t ha n ds oo n a f t e rt h a ti tc h o o s e ss u i t a b l ee f f e c tf a c t o r sa s i m p a c tf a c t o r s t h ep r o c e s so fe s t a b l i s h i n gt h em o d e li sb a s e do nt h er o u g hs e tt h e o r y c o n s i s t so fa s s u m p t i o n s ,t h ec h o i c eo fi n d i c a t o r sd a t a , p r e p r o c e s s i n g ,a t t r i b u t er e d u c t i o n , r u l ec r e a t i o na n dr u l et e s t i n g d u r i n gt h es t u d y , t h ep r o g r a mr e a l i z e dt h em a i na l g o r i t h m so f t h er o u g hs e tt h e o r yu t i l i z i n gv i s u a lc + + 6 0 t h i st h e s i su s em o d l e si ns o u t h e mq i n s h u ib a s i nt od oe m p i r i c a ls t u d y a n ds e l e c t d i s c e r n i b i l i t ym a t r i xa t t r i b u t er e d u c t i o na l g o r i t h ma n dh e u r i s t i cv a l u er e d u c t i o na l g o r i t h m f o rp r o c e s s i n gt h ed e c i s i o nt a b l e t h er e s u l t ss h o wt h a tt h em o d eo ft h ep r e d i t i o no fc o a l r e s e r v o i rp e r m e a b i l i t yw h i c hi sb a s e do nt h er o u g hs e tt h e o r yh a sg r e a tp r e d i c t i v ea b i l i t y t h ea c c u r a c yr a t ei s9 0 w h i c hs h o w st h a tt h em o d e lh a sg o o dp r e d i c t i v ea b i l i t y w eu s e t h er u l e st op r e d i c tp e r m e a b i l i t yd i s t r i b u t i o ni nt h es t u d ya r e a p e r m e a b i l i t yd i s t r i b u t i o n p e r m e a b i l i t yd i s t r i b u t i o no ft h es t u d ya r e as h o w st h a tt h es o u t ha r e ai sh i g h e rt h a nt h en o r t h a r e a 1 1 1 ep e r m e a b i l i t yo fj i n c h e n gi sg e n e r a l l yg r e a t e rt h a n1 1 0 。p m 2 ,i ti sc o n c l u d e dt h a t j i n c h e n ga r e ai sf a v o r a b l ez o n e sf o re x p l o r a t i o n k n o w l e d g er e d u c t i o ni st h ec o r eo fr o u g h t h e t h e 第二章粗糙集理论基础9 2 1 集合论基本概念9 2 2 粗糙集理论基础9 2 2 1 知识与知识库9 2 2 2 不可分辨关系1o 2 2 3 上近似、下近似及边界区1 1 2 2 4 属性依赖性。1 2 2 2 5 属性重要度1 2 2 3 属性约简1 3 2 3 1 信息系统的属性约简1 3 2 3 2 决策表的属性约简1 3 2 4 ,j 、2 吉1 4 第三章研究区地质概况1 5 3 1 构造特征15 3 2 地层特征_ 15 3 2 1 前寒武系15 3 2 2 下古生界1 6 3 2 3 上古生界17 3 2 4 中生界l7 3 2 5新生界17 3 3 煤层分布特征l7 3 3 1太原组18 3 3 2 山西组l8 3 4 煤岩储层特征1 8 3 4 1 宏观煤岩特征18 3 4 2 微观煤岩特征19 3 4 3 煤质特征2 0 3 5 小结2 0 第四章煤储层渗透性影响因素分析。2 1 4 1 地应力与有效应力2 l 4 2 储层压力2 2 4 3 害0 理2 2 4 4 煤层厚度2 4 4 5 埋深2 5 4 6 煤阶及煤变质作用2 7 4 7 有机显微组分和煤岩类型2 7 4 8 煤体结构2 8 4 9 小结2 9 第五章基于粗糙集理论的煤储层渗透性预测模型3 0 5 1 建模基本步骤3 0 5 2 指标的选择31 5 3 数据预处理。3 3 5 3 1 空值处理方法3 3 5 3 2 属性离散化3 4 5 4 属性约简3 5 5 5 导出不精确决策规则。3 9 5 6 样本测试与判别4 0 5 7 软件设计及实现4 1 5 7 1软件设计4l v 4 2 4 2 一4 4 4 4 4 5 4 5 4 6 4 7 4 8 4 9 5 0 5 1 。5 2 参考文献5 3 致 射5 8 烷,煤层 早进行煤 年代。其 气成藏勘 探与发开理论。我国对煤层气的勘探开发比美国落后,2 0 世纪8 0 年代开始对煤层气 技术进行研究和试验,由于我国含煤盆地具有复杂的热演化史和构造变形史,导致煤 储层物性差异大,孔渗性低,构造样式复杂,几个高级煤、无烟煤和贫煤是富产煤层 气的主要煤级。近些年来,通过对我国煤储层的特征进行一系列的研究取得了很大的 成果,已经基本形成了一套完备的理论方法。有效预测煤储层的渗透性,对煤层气的 勘探开发有非常重要的意义,渗透性是直接制约着煤层气勘探选区的参数,如何对我 国的煤储层的特点展开研究,构建煤储层物性描述的理论与模型,并最终用来预测渗 透性,是研究的主要方向之一。近年来,在煤储层渗透性研究方面取得了重大的进展, 表现在以下几个方面: ( 1 ) 煤储层渗透性影响因素方面,a m m o s o v 等【1 1 、s o m e r t o n 等网、g a s h 等【3 1 、m c k e e 等【4 】、薛永超等5 1 、毕建军等 6 1 、傅雪海掣7 】等人分别在有效应力、煤级、割理发育、 沉积相、煤层的埋藏深度等方面做了很多研究。 ( 2 ) 从定性评价转向定量评价发展,主要的表现是煤储层渗透性的预测方法开始 和先进理论技术相结合,主要与地质统计分析方法、计算机、室内实验和测井评价、 分形理论等的结合。比如s m y t h 等【8 】通过显微地层学与统计学方法来预测煤储层渗透 性,梁冰等【9 】将分形理论和实验室测试结合起来研究阜新煤田的储层;张有生等【1 们用 马尔柯夫的过程原理方法来研究煤储层的非均质性。 ( 3 ) 煤储层组成由基质孔隙和孔隙一裂隙系统发展为由显微裂隙、割理基质和孔 隙组成的三元结构体系【1 1 1 ,其中,基质孔隙是煤储层的吸附场所,显微裂隙是割理和 煤基质孔隙连接的桥梁。 第一章前言 渗透性是煤储层有利勘探区块评价的重要参数之一,由于不同影响因素的影响, 有时相同煤层相邻地区的煤储层渗透性也不相同,非均质性非常强。目前,常用的煤 储层预测研究方法的实测资料不多,开展煤储层渗透性预测非常有必要,现有的预测 方法有: ( 1 ) 曲率分析法 地层弯曲程度用曲率来定量描述。在后期构造应力的作用下,原始近水平的岩层 会发生弯曲,当弯曲达到极限时,在弯曲较大的地方产生构造裂隙,弯曲程度越大曲 率越大,在褶皱轴两侧构造转折部位及断裂两侧是构造裂隙的的发育区,也是煤层的 高渗区。用曲率值可以预测高渗区。 ( 2 ) 构造应力场法 构造应力场控制着割理的发育情况,同时也决定了煤层受破坏的程度,影响煤储 层中的裂隙保存情况。一般情况下,构造应力越大渗透率越低,通过对古构造应力场 恢复和现代应力场大小与方向测定可以预测渗透率情况。 ( 3 ) 煤体结构法 不同煤体结构煤的渗透率不相同。碎裂煤与原生煤因为割理和构造裂隙比较发育, 所以渗透性好,碎粉煤和糜棱煤中的割理被扭曲变形,构造裂隙紊乱,从而减小了渗 透率,获得不同煤体结构煤分布是预测渗透率的比较好的方法之一。通过野外露头、 煤矿中的煤层断面、钻孔的煤心等都可以直接观察到,并且结果比较真实。 ( 4 ) 裂隙观测法 裂隙发育程度决定了渗透率的大小,裂隙展布方向决定了渗透率方向,总之,裂 隙是决定煤储层渗透性的关键因素。对裂隙进行宏观微观的观测是预测渗透率最直接 有效的方法。对裂隙的观察主要包括对裂隙高度、宽度、长度、走向、倾向、连通性 和层面形态的观察,确定裂隙发育程度,从而预测煤储层的高渗区。 ( 5 ) 煤层透气性系数 煤层透气性系数反映了瓦斯在煤层中流动难易程度,透气性系数越大说明气体在 煤层中越容易流动,反映出渗透率也就越大;相反,如果透气性系数小,渗透率也就 越小。 1 1 2 粗糙集研究现状 波兰学者z p a w l a k 1 2 1 在1 9 8 2 年提出了粗糙集理论,粗糙集理论是一种处理不确 2 中国石油大学( 华东) 硕士学位论文 定和不精确数据的工具。该理论研究的对象是不确定,不精确的信息,在现实世界中 有着广泛的应用。 在粗糙集理论研究方面,建立了p a w l a k 粗代数理论,讨论了粗糙集的粗糙积分、 代数结构、粗糙逻辑等,研究了它的粗半群、格论性质等。拓展研究主要包含关系的 推广、与模糊集理论的结合、变精度粗糙集和概率粗集模型等内容,比如基于一般二 元关系粗糙集模型,将对象所在等价类看做是该对象的一个领域,从而推出基于领域 算子的粗集模型。在属性约简算法【1 3 1 刀方面,利用属性约简算法,去除掉多余的属性, 提高知识的发现效率也减少了知识的冗余,如a s k o w r o n 【1 8 】提出差别矩阵属性约简 法,就是导出差别函数求解析取范式,算法直接易理解;另外,启发式属性约简算法 包括信息熵法【1 9 1 和属性重要度法。粗糙集理论通过与其它的软计算方法的结合使用会 达到更好的效果,比如人工神经网络、遗传算法和粒计算等,它们之间互补但不能相 互取代,相互结合使用会使推理和学习有更好的效果。 粗糙集软件开发方面,r o s e t t a 软件是波兰华沙大学与挪威科技大学一起开发的一 款比较著名的粗糙集软件,这个软件应用比较广泛,此软件可以处理很多种格式的数 据和文本等【2 0 】。美国肯萨斯k a n s a s 大学也开发了一款软件名为l e r s ,这款软件是基 于粗糙集的经验学习系统,美国国家航空航天管理局约翰逊空间中心已经将这款软件 应用于研究和实验【2 1 1 。p o z n a nu n i v e r s i t y 开发了r o u g h c l a s s 软件和r o u g h d a s ,这两 款软件在研究和实践中都有广泛的应用 2 2 1 。除此之外,还有从数据中归纳得到决策规 则的系统软件p r o b r o u g h 。g r o b i a n 也是非常有名的软件,该软件是用卅编写,用于 粗糙集理论的数据分析。 在粗糙集应用方面的发展也很快,虽然粗糙集理论至今只有二十几年的发展历史, 但取得了令人瞩目的研究成果,是一种非常有前途的软计算方法,为处理不确定信息 提供了强有力的分析手段,具有广阔的发展空间,目前主要应用于以下几个方面: ( 1 ) 数据库知识发现方面应用 2 3 彩】:粗糙集理论方法是数据库知识发现的重要方 法,是数据库技术和人工智能的热点。经过粗糙集理论方法处理过的知识比以前更加 容易处理,而且更加简练。除此之外,这种方法伸缩性比较强,可理解性好,知识便 于存储,抗噪音能力强,知识开放性好,粗糙集理论可以对数据进行属性约简,这也 大大提高了知识的发现效率。 ( 2 ) 模式识别中的应用【2 眈8 】:在模式识别中,主要的用处是可以选取表征这种模 式的特征项。 3 第一章前言 ( 3 ) 医疗诊断中的应用【2 9 - 3 0 :将是否得病作为决策属性,粗糙集理论经过属性约 简,值约简,得到病人是否得病的决策规则,用这些规则来判断病人是不是得病。 ( 4 ) 人工神经元网络中应用【3 1 3 3 】:粗糙集理论简化网络训练样本的数据集合,通 过约简,把重要信息保留,去掉多余信息,从而提高了速度和效率,获得了很好的效 果。 ( 5 ) 粗糙控制中应用【3 4 】:把控制过程的有代表性的状态,以及在这种状态下研究 人员采取的策略记下来,形成决策表。通过约简得出决策规则。据观测到的数据得到 控制策略,就是从范例中学习,这种方法属于智能控制范畴。 ( 6 ) 在决策分析中应用【3 5 刁6 】:粗糙集允许对象中存在不完整不明确的属性,粗糙 集弥补了普通决策方法中的不足之处。 由于粗糙集理论在应用方面的出色表现,已经受到油气勘探开发工作者的关注, 在勘探开发过程中,获得资料有限和地质因素的不确定性,利用粗糙集理论进行定量 评价,使得评价结果更加客观,提高了综合评价的精度,对编制油气发展规划、进行 油气勘探风险评价、制定综合评价精度等有很重要意义。目前在油气勘探开发方面应 用较多的是以下几方面: ( 1 ) 构建石油安全监测预警指标体系 构建石油安全监测预警指标体系,就是利用粗糙集软件,保持分类能力不变情况 下,对各项指标属性约简,然后值约简,最后提取最小决策规则,挖掘出有用的信息, 得到影响石油单圈预警的最主要的因素,最后根据决策规则,对未来石油安全走势作 出预测预警。 ( 2 ) 地质风险评价与决策分析 构建全面的风险指标评价体系,用粗糙集重要度的概念对风险指标进行筛选,在 传统风险评价方法基础上,将粗糙集和决策者先验知识结合起来,实现了属性基本概 率分配问题,也解决了风险评价中面临大量定性指标难评价的问题。这为风险评价和 决策分析提供了新的思路。 ( 3 ) 油气勘探数据处理和挖掘 数据处理挖掘对实现油田智能化和决策现代化非常重要。利用粗糙集理论,对油 田生产中大量的生产管理数据和成果数据进行挖掘,利用其求各项参评地质因素的属 性重要度,权值化处理以后作为其权重系数,探索油田生产中的规律性。预测油藏开 发的指标和未来生产状况,有效的进行生产的调整,为参与市场竞争做客观决策。 4 中国石油大学( 华东) 硕十学位论文 ( 4 ) 储层缝洞预测 是否能够预测缝洞系统发育情况及其位置,直接影响勘探的效果,非常受油气勘 探专家的重视,利用粗糙集方法对提取的地震属性进行属性约简,获得属性约简组合, 用约简的地震属性作为条件属性,缝洞发育的情况作为决策属性,构建了储层缝洞预 测模型。 ( 5 ) 岩性识别 在粗糙集理论的基础上,引入了支持度作为条件属性和决策属性间的度量,将粗 糙集理论和模糊分析理论结合在一起,把测井信息优化,并且应用于岩性识别,结果 表明,这种方法快速,容易实现,提高了岩性识别的正确性,为岩性的识别提供了新 思路。 ( 6 ) 油气储层预测 油气储层预测准确与否直接决定了勘探的成功与失败,对属性进行离散化,然后 构建决策表,再进行属性约简,约简可以有效去掉地震属性中的冗余属性,不仅降低 了预测识别时的维数而且也使得预测结果更加有效。 1 2 选题依据及研究意义 煤储层有很强的非均质性,受不同影响因素的影响,同一个煤层相邻的部位渗透 性相差都很大。目前煤储层渗透率也仅有一些注入压降等方法测得的少量数据,如何 充分利用现有的资料对煤储层渗透性进行预测是一个有待解决的重要问题。 近年来,沁水盆地( 图1 1 ) 已成为煤层气勘探开发重要的领域。该地区煤层厚度大, 分布广而稳定,埋深适中,含气量大,被认为是我国最有勘探开发潜力的地区之一。 除了上面有利条件外,该区也被认为是渗透率预测很困难的地区之一,因为该区储层 演化程度高、裂隙分布不均、构造条件非常复杂、埋深浅等原因制约着进一步的勘探 部署工作。 p a w l a k 教授在1 9 8 2 年提出粗糙集理论,粗糙集也称为粗集,该理论能够定量处 理不一致、不精确、不完备的信息与知识。粗糙集理论核心是通过对知识的约简,发 现潜在的规律,在渗透率预测中可以充分发挥粗糙集简化样本和提取核心属性的优势。 粗糙集理论有其显著特点,就是不需要提供问题所要处理的数据之外的任何先验信息, 对问题的不确定性描述相对比较客观真实。由于渗透率主控因素不是唯一的,将粗糙 集理论等先进方法引入到煤储层渗透性研究中,获取煤储层渗透性主控因素,将更有 5 第一章前言 效的指导煤储层渗透率预测。 本论文依托国家重点基础研究发展规划项目中国煤层气成藏机制及经济开采基 础研究之子课题煤储层物性非均质性及控制机理( 编号:2 0 0 2 c b 2 11 7 0 2 ) ,以山 西沁水盆地南部为研究区,在前人研究成果的基础上,引入粗糙集理论,进行储层的 渗透性预测研究。 粗糙集作为处理不确定性信息强有力分析手段,在各个方面都取得令人瞩目的成 果,但是在煤储层的渗透性方面的研究不多。本文为煤储层渗透性研究提供了一种简 洁有效的新方法,可以获取有效的煤储层参数,为煤层气开发方案的制定提供科学依 据。如何应用粗糙集理论对渗透率影响因素参数分析、筛选,并在充分研究区域地质 背景的基础上,对煤层气有利孔渗区做出综合评价和优选,建立一套普适性、易操作 性的渗透性评价与研究的方法是本文工作的重点。因此,开展此次研究既有理论意义, 又有实用价值。 1 3 研究目标、主要研究内容 1 3 1 研究目标 本文从沁水盆地南部地质背景入手,分类研究煤储层渗透性的主要控制因素,重 点分析各因素与渗透率的相互作用、数值关系,在此基础上建立一套基于粗糙集理论 的适合煤储层渗透率预测的多因素模型,总结和提出煤储层渗透性预测方法,并对方 法的适用情况进行研究,从而为研究区煤层气勘探开发有利目标区做出评价和优选。 研究过程中,利用v i s u a lc + + 6 o 进行基于粗糙集软件开发。 1 3 2 主要研究内容 ( 1 ) 研究区地质背景分析 立足于现有的区域地质背景资料,分析研究区的构造、沉积和储层发育特征,重 点研究和总结影响煤储层渗透率的各类因素。 ( 2 ) 基于粗糙集的煤储层渗透率主要影响因素的获取 煤储层渗透率主要受裂隙系统的发育程度、有效应力、煤层埋藏深度、变质程度 和地应力等多种因素的影响。 在地质基础研究与地球物理基础研究的基础上,应用粗糙集理论,从原始的各类 数据中提取有用的知识或规则,依据这一思想,将已知的影响渗透率的因素作为条件 6 图圈网 陋焦作io 左投i 例 市 县,镇 f 阚 铁路 e = l 省分界线 _ 沁水盆地 囫 工口置 性约简,得 图l - l 沁水盆地地理位置图 ( 3 ) 属性约简算法研究 决策表的属性约简算法包括基于差别矩阵的属性约简算法,基于属性重要度的属 性约简算法等。选择一种算法符合研究区数据特点,并且约简效率较高,是研究的重 点。 ( 4 ) 基于粗糙集理论煤储层渗透性的预测方法研究 在上述研究的基础上,结合前人研究成果,选择一种符合研究区数据特点并且约 简效率较高的算法,抽取规则来建立渗透率预测模型。并且在研究区随机抽取测试集, 进行模型的检验和修正,总结一套适合研究区煤储层渗透性预测的方法。 1 4 研究方法、技术路线 本文利用粗糙集理论强大的数据处理功能来建立基于粗糙集理论的煤储层渗透性 预测模型,研究主要采用定性分析与定量分析相结合、理论分析与实证分析结合的方 法。 建立基于粗糙集的煤储层渗透性预测模型。建立模型前,先要对影响煤储层渗透 7 第一章前言 性的因素做定性和定量分析,选择渗透性主控因素。粗糙集理论的优势之一是可以将 定性数据和定量数据结合在一起分析。在对研究区区域地质和各个影响因素进行深入 分析以后,以粗糙集作为理论基础,构建了基于粗糙集理论的煤储层渗透性预测模型, 并且检验了模型的精确程度,使模型更有实际应用的意义。图1 - 2 是技术路线图。 图l - 2 技术路线图 8 中国石油大学( 华东) 硕: 学位论文 第二章粗糙集理论基础 粗糙集是刻画不确定性和不完整性的数学工具,可以揭示潜在的规律。粗糙集理 论是在经典集合理论发展基础上衍生而来的,在讨论粗糙集理论之前,先介绍经典集 合理论的一些基本概念。 2 1 集合论基本概念 定义2 1 被研究的对象按某一特点或目的被组合在一起形成的整体叫做集合。集 合中任何一个元素叫做集合中的元素。 定义2 2 处理现实问题时,限制在某一个区域范围中的现实个体或称对象、样本、 元素。由对象构成的非空有限集合称之为论域,记为u 。 定义2 3 集合c 和集合d 的笛卡尔积为c x d ,c xd 是二元组集合 ( c ,回l c c d d ) 。 定义2 4 定义集合c 、d 的笛卡尔积c x d 的子集为c 到d 的一个二元关系。 定义2 5 设r 是c 上的二元关系,则有以下性质: ( 1 ) 自反性 若集合c 中的每一个元素c 与其自身之间都有关系j i c ,记为crc ,则称r 是自 反的。 ( 2 ) 对称性 若集合c 中的任意元素c 和cl ,有crc l 蕴含c lrc ,则称r 是对称的。 ( 3 ) 传递性 若集合c 中的任意元素趴cl 和c 2 ,有crcl 且clrc 2 蕴涵着crc 2 ,则尺称为 是传递的。 由集合和集合之间的特性关系,得到以下重要的概念: 定义2 6 若集合c 上的关系r 是传递的、自反的和对称的,称r 是一个等价关系。 2 2 粗糙集理论基础 2 2 1 知识与知识库 粗糙集理论中的“知识是一种对对象分类的能力,对现实世界个体和事物运动 9 第二幸粗糙集理论基础 状态及变化规律的描述与分类。这里所说的“对象是指任何事物,比如过程与时间、 抽象概念、状态、实物等等。实际上,知识是信息经过加工改造而成的。它一般分为 说明性知识、控制性知识、过程性知识。说明性知识为了提供概念和事实;控制性知 识包含各种处理、策略,用来协调整个问题求解过程;过程性知识利用说明性知识对 客观个体进行分类。 粗糙集理论认为知识直接与真实或者抽象世界的不同分类模式联系起来。任何事 物都可以用知识来描述,据这些事物的属性不同和特征不同可以进行分类,这样,知 识就有了颗粒性。 定义2 7 我们感兴趣的对象组成非空有限集合u 称为论域,u 的任何一个子集 彳u ,称为论域u 的一个范畴或者概念。为了规范化,规定空集是一个概念,即空 概念。论域u 中任何子集簇为关于u 的知识,论域中每一个子集表示它的一个信息粒。 2 2 2 不可分辨关系 定义2 8 设r 是u 上的一个等价关系,u 在等价关系r 下的所有等价类构成的集 合,可以表示为u r = “,x 2 ,x n ,即关系r 产生的分类,这个分类称为关于【,的 一个知识,记为【x 】矗= y uix r y ,表示元素x 在关系r 下所包含的等价类。 定义2 9 设s = ( 玑a ) 是一个信息表,b 彳,定义b 在u 上的不可分辨关系厶 为: 厶= ( x ,y ) u xu - f ( x ,口) = f ( y ,口) ,v a b ) 如果( x ,y ) 厶,n x 和y 称为b 不可分辨。不可分辨关系是二元关系,满足自反性, 即对象和它本身的关系xi bx ;满足对称性,即如果石i sy ,nyi sx ;同时也满足 传递性,如果zi sy r y 厶z ,女l i jx i sz 。 能够看出,由b 决定的划分即厶的所有等价类族,用u l 表示( 简记为u b ) , 包含元素x 的等价类用,口( x ) 表示,划分u b 的块或者厶的等价类称之为召的基本 集。论域u 在等价关系尸l 下的分类记为:u e ,在等价关系b 下分类记为:u 最, 则不可分辨关系b = 1 n d ( p 。,最) 由两者叠加而成,如图2 一l 所示: 1 0 不可分辨关系是粗糙集理论的基石,它的意思是如果研究对象是不可分辨的,那 么它们的某些特征肯定是相同的。如果研究对象有相同的特征,称它们是没有差别的 对象,不可分辨关系在粗糙集理论中地位很重要,是其他概念的基础和前提。 粗糙集产生的不确定性是由于知识的不完全性产生的,而模糊集产生的不确定性 是因为模糊集本身概念不确定性产生的。等价类构成了知识的粒度。粗糙集基于知识 表达中的不可分辨关系来描述知识的不确定性。 不可分辨关系是一个等价关系,通过不可分辨关系得到决策系统的划分,划分后 的等价类称为不可分辨类。【叫足表示含有元素x u 的r 等价类,即和x 具有关系r 的 记录归为一类,表示为u i n d ( r ) 。 2 2 3 上近似、下近似及边界区 从集合论角度出发,集合么与集合b 关系有三种:集合彳中元素都不属于集合b ; 集合彳中的一部分元素属于集合b ;集合么中元素全都属于集合曰。上、下近似和边 界区是粗糙集中用来对集合之间对象不确定、不精确关系测量与刻划的。 定义2 1 0 设s 为信息表,x 为u 的非空子集,曰么且召。集合x 的曰上近 似定义为:曰( x ) = x 阢l ( x ) n x 定义2 1 1 设s 为信息表,x 为u 的非空子集,b 彳且b 。集合x 的召下近 似定义为:垦( x ) = x 矾i n ( x ) 互x ) 定义2 1 2 定义x 的b 边界域为b n b ( x ) = 召( z ) 一旦( x ) ,砌b ( x ) 也称为可疑域。 如果石的b 边界域为空,即若砌。( x ) ,则集合x 就是关于b 的精确集合,即x 可表 第二章舄i 糙集理论桀础 示为一定数量的b 基本集的并集;如果砌曰( x ) 妒,则集合x 是关于口的一个粗糙概 念,可利用上、下近似集合来近似( 图2 - 2 ) 。 论域u l 整个区域包含的元素 i p 7 1r 网呵r 铆盼瑷慰瞄一f 翟翟艄闶 r x u r :图中所有 方格组成的集 r ( x ); 1 ,合即沦域在 i 等价天系rf 的 : 分类模式 p 一 集合x “ ,。+ 一 图2 - 2 粗糙集基本概念示意图 2 2 4 属性依赖性 发现属性之间依赖性是数据分析的一个很重要的问题。如果属性集d 中的所有属 性值被属性集c 的属性值所决定,就称d 完全依赖于c ,记作c d 。可以利用属性 集c 来建立属性集d 的划分u 。严格的说,当且仅当l 冬厶时,属性集d 完全依 赖于属性集c 。属性的完全依赖性的一般化是属性的部分依赖性,部分依赖性就是属 性集d 中只有某些属性值由c 中的属性值决定的。 定义2 1 3 设c ,dca 是两个属性集,x u d ,定义 p o s c ( d ) = u x e u ,d ( x )( 2 - 1 ) 为划分u d 关于c 的正域。 定义2 1 4 设c ,dc 彳是两个属性集,定义 胛,d ) :单 ( 2 2 ) 为属性集c 与d 之间的依赖度。r ( c ,d ) 有时也称为关于c 的分类质量,根据c 能被 准确分类的对象在整个系统中的比例。 2 2 5 属性重要度 定义2 1 5 属性c 的重要性定义为: ) ( c ) = 出号掣 对属性集合曰来说,属性重要性定义为: 1 2 :1 丛三掣 ( 2 3 ) ,( c ,d ) 中国石油大学( 华东) 硕士学位论文 ) ( c ) = 盥号掣 2 3 属性约简 :1 兰! g :墨:罂 ( 2 4 ) = - 一一 i 厶一rj ,( c ,d ) 属性约简是指保持信息系统分类能力不变的情况下,删除不重要和不相关的属性。 粗糙集理论的核心之一是属性约简。 经过很多学者的研究,属性约简分为两类,即针对信息系统的和针对决策表的。 决策表又分为两种情况:不一致决策表与一致决策表。属性约简基本概念主要有核、 属性重要性、必要属性等。 2 3 1 信息系统的属性约简 定义2 1 6 四元组s = ( 阢a ,nf ) 称为一个信息系统,u 称为论域,u 为对象 的非空有限集合组成;圪是属性a 的值域;么表示属性非空有限集合;f :u xa 专v 是一个信息函数,为每个对象的每个属性赋予一个信息值,即:口以x uf 【x 国圪 定义2 1 7g 呒f l ts = ( 阢a ,1 i , f ) 为信息表,b ar a b ,如果,口= 厶一l 口 , 称属性a 在丑中是不必要的即多余的,否则,a 在b 中是必要属性。如果属性集曰中 的每一个属性都是必要的,就称属性集曰是独立的;如果不是所有属性都是必要的, 称属性集b 是相依的。 设d i 冬b ,如果d 是独立的,且jd = i b ,则d 是b 的一个约简。属性集b 的所 有约简组成的集合记为r e d ( b ) 。约简与整个属性集分类能力相同,被约简掉的属性是 冗余属性,去掉冗余属性,信息系统分类能力不会改变,去掉必要属性,分类能力就 会改变。 定义2 1 8 有一个属性集曰,定义属性集的核为它的所有的约简交集,即: c o r e ( b ) = n r e d ( 召) ( 2 - 5 ) 核包含于每一个约简中,是最重要的属性子集,在不改变分类能力的前提下,其 中的任何元素均不能被去掉。 2 3 2 决策表的属性约简 决策表中包含了大量实例的信息,如何从表中抽取得到适用度最大的规则,让经 1 3 第二章粗糙集理论基础 过处理的决策表每条记录代表类相同规律特征的实例,就需要对决策表进行约简, 约简以后得到的规则有较高的适应性。 定义2 1 9 四元组s = ( 玑a , f ) 是一个决策表,其中: 阢u = x 。,x :,x 。 称为论域,是对象的非空有限集合; c u d :c = a l 口c ) 称为条件属性集,每个q c ( 1 j m ) 称为c 的一个简单属 性: d = dd d ) 称为决策属性集,_ n c f id = ,c ,d ; v :矿= u v ( v a c u d ) 是z 信息函数f 的值域,而圪表示值域; f f = f 口i 乞:u 专圪,v a cud 表示决策表的信息函数,为属性a 的信息函 数。当1 n d ( c ) i n d ( d ) 时,我们称决策表是相容的( 一致的或协调的) ,其中i n d ( c ) , i n d ( d ) 分别表示条件等价类和决策等价类。 定义2 2 0 设四元组s = ( 阢c u d ,以f ) 是一个决策表,c 与d 之间的依赖度为 厂( c ,d ) ,属性集p c 是c 的一个d 约简,当且仅当: ( 1 ) r ( p ,d ) = r ( c ,d ) ( 2 ) v p cp ,r ( p ,d ) r ( p ,d ) 属性集c 中所有d 约简记为r e 如c ,所有d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论