油井技术数据库的建构与运用_第1页
油井技术数据库的建构与运用_第2页
油井技术数据库的建构与运用_第3页
油井技术数据库的建构与运用_第4页
油井技术数据库的建构与运用_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

油井技术数据库的建构与运用

引言

随着石油工业的发展和信息科学的进步,钻井信息的应用越来越显示出它的重要性。钻井数据资源的管理和应用是否有效,直接影响到钻井的效果和效益。随着钻井工艺技术的复杂多样、钻井数量的急剧增加、以及先进测量仪器和手段的引入,钻井数据资源海量增加,加强对这些数据资源的存储、管理和应用,提高钻井信息化建设的水平已成为一项紧迫而又艰巨的任务。数据仓库是一种信息系统的数据存储理论,它强调利用某些特殊数据存储方式,让所包含的数据,特别有利于分析处理,以产生有价值的信息并依此作决策。

1数据库理论

1.1数据仓库

数据仓库对多个分布式的数据库提供统一管理,是支持管理决策过程、面向主题的、集成的、相对稳定的、随时间变化的数据集合。它从多个传统数据库中获取原始数据,先按决策的主题形成当前基础数据,再按综合决策要求形成综合数据,通过数据仓库访问工具向用户提供统一、集成的信息环境,为决策者提供完整、及时而准确的决策信息。数据仓库的四个主要特性:

面向主题

有别于一般OLTP系统,数据仓库的数据模型设计,着重将数据按其意义归类至相同的主题区,因此称为主题导向。

集成性

数据来自企业各OLTP系统,在数据仓库中是集成且一致的。

随时间变化

数据的变动,在数据仓库中是能够被记录以及追踪变化的,能反映出随着时间变化的数据轨迹。

相对稳定性

数据一旦确认写入后是不会被取代或删除的,即使数据是错误的亦同。。

1.2数据挖掘

数据挖掘是从海量数据中,提取隐含在其中的、人们事先不知道的但又可能有用的信息和知识的过程。数据挖掘的数据有多种来源,包括数据仓库、数据库或其他数据源。所有的数据都需要再次进行选择,具体的选择方式与任务相关。挖掘的结果需要进行评价才能最终成为有用的信息,按照评价结果的不同,数据可能需要反馈到不同的阶段,重新进行分析计算。

数据挖掘分为描述性和预测性两类。描述性数据挖掘提供数据的一般规律;预测性数据挖掘产生关于数据的预测。数据仓库与数据挖掘的关系如图1所示。

2应用现状

2.1国外应用现状

国外钻井服务商早在20世纪80年代开始就将信息技术应用到生产指挥中,取得了巨大经济效益。到90年代,开始研究建立集钻井数据采集、数据信息传输、钻井数据库、钻井工程设计、钻井施工监测和钻井生产指挥为一体的钻井信息系统,作用是钻井参数自动采集,生产信息及时送入现场计算机,通过通讯网络实时传送到总部信息中心,经过专家会诊做出决策,反馈到钻井现场进行实时监督,指挥钻井生产。下面以Schlumberger公司的产品为例,介绍一下国外的应用现状。

生产数据监测和数据分析软件,包含了基于数据挖掘的生产优化软件,以及桌面数据挖掘和数据驱动模型。

ProSource是斯伦贝谢新的信息管理应用软件,提供信息管理工作流程,具有利用一个易于使用的单一控制台从多个数据仓库浏览、创建、编辑和删除数据的能力,它能够在ArcSDE中创建并管理空间索引,用于对多个内容来源的信息进行直观聚合和管理。

DrillDB可以简化数据挖掘任务,支持决策过程并能访问正在进行的钻井作业的数字信息。Drill-DB支持SISDrillingOffice以及其它流行的钻井信息采集系统,可以集成多个钻井信息系统,使建立公司统一的钻井信息解决方案成为现实。

2.2国内应用现状

目前,国内还没有完整的或在用数据仓库,也还没有成型的数据挖掘软件,因此从期刊发表的情况来说明。表1数据来自《中国学术文献网络出版总库》关键词查询。

3面向钻井工程的数据仓库应用

3.1主题设计

数据仓库是面向主题的,因此数据仓库设计的第一步就是确定其主题。主题是在较高层次上将数据归类的标准,通常反映决策者最关心的问题。根据钻井决策的实际需求,主题设计如表2所示。

3.3钻井数据ETL

数据抽取Extraction:建立钻井数据规则化过滤器,去除潜在的不符合实际的错误数据。通过审计规则来确保数据的有效性。

①数据转换Transformation

通过建立钻井数据间的映射和转换关系,使源数据能够适应新的逻辑模型,统一转换后的数据名称和定义。

②数据加载Loading实时加载、快速加载。

3.4钻井数据统计分析

数据统计分析方法如表4所示。

3.5钻井数据多维分析处理

维是将一类数据组织到具有明细数据级别的分层结构中的字段。包含OLAP数据的数据结构,按维和数据字段进行组织,则称为多维数据集。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。例如钻头喷嘴数据结构,它可以逐级提供越来越详细的数据,形成井、井眼、钻头、喷嘴四个级别,既可以高层汇总又可以关注明细。多维数据查询流程如图2所示。

在对多维数据的统计分析中,传统的SQL查询语言显露了其局限性。一般的SQL语句查询方式,虽然也可以通过GroupBy来进行分组统计,但如果要对多维数据进行处理,形成一个既有小计又用总采用数据透视技术无疑是非常恰当的解决方案。

3.6钻井数据挖掘模型

①神经网络模拟人脑神经元结构,建立三大神经网络模型即自馈式、反馈式、自组织。神经网络的知识体现在网络连接的权值上,属分布式矩阵结构。通过神经网络的逐步计算来实现KDD的价值。

②遗传算法

模拟生物进化过程,由三个“算子”组成,选择:从旧种群父代选出生命力强的个体,产生新种群后代。交叉:选择两个不同个体的一部分交换,形成新个体。变异:对个体的某些基因进行变化。遗传算法的根本是产生优良的后代。应用于数据挖掘中,是在庞大的数据库中对知识的发现。目前已取得了显著的成效。

③可视化法

把数据库中的数据转化为可视的各种图形,对揭示庞大数据的状况、规律性等作用极大,使用户对数据“看”得更清晰、直观。大大拓宽了图表、文字的功能。

④决策树

将数据库中可能具有最大信息量的“字段”作为决策树的身躯,然后根据不同的“字段”建成树的分支,由此可建立决策树。决策树方法中尤以方法应用效果良好。

⑤关联规则:经典关联规则、序列模式、单维关联规则、多维关联规则。

⑥模糊聚类

根据模糊是客观存在的,形成了一整套模糊理论。数据挖掘就能利用此理论对实际问题以模糊研讨,直至达到模糊决策。

⑦粗糙集

⑧支持向量机

⑨孤立点分析

根据“数据挖掘”的上述方法可以对应得到数据挖掘的工具如神经网络工具、可视化工具、“模糊发现”工具、决策树工具等。实践证明,这些工具适用于大规模数据挖掘系统和开发环境,也适用于最终用户和开发人员的数据挖掘系统。面向钻井工程的数据仓库与数据挖掘应用过程如图3所示。

4结束语

因此,面向钻井工

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论