数据仓库论文关于油气生产数据仓库多维形式语言RMMDX设计论文范文参考资料_第1页
数据仓库论文关于油气生产数据仓库多维形式语言RMMDX设计论文范文参考资料_第2页
数据仓库论文关于油气生产数据仓库多维形式语言RMMDX设计论文范文参考资料_第3页
数据仓库论文关于油气生产数据仓库多维形式语言RMMDX设计论文范文参考资料_第4页
数据仓库论文关于油气生产数据仓库多维形式语言RMMDX设计论文范文参考资料_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库论文关于油气生产数据仓库多维形式语言RMMDX设计论文范文参考资料 摘要:油气生产数据仓库系统需要强大而灵活的多维数据查询功能与表现能力。对通过MDX和SQL实现多维分析的优缺点进行了比较,在此基础上提出了应用于油气勘探开发数据的多维分析形式语言RM_MDX。该多维查询语言以MDX标准语法为基础,根据项目应用背景进行了简化和优化处理,并通过用户自定义函数(存储过程)技术对RM_MDX语言做进一步扩展和改善,使其在针对油气生产数据仓库上的多维分析功能更加强大和容易实现。 关键词关键词:油气生产数据;数据仓库;多维分析形式语言;RM_MDX;解释模块 16727800(xx)011007402 0引言 油气生产数据仓库系统针对油气田生产业务数据,提供针对不同决策层所需要的多维数据分析结果,而其所处地理环境复杂,客户端类别多样,决定了标准多维分析语言的功能发挥受限,且容易导致系统设计的复杂性和冗余度过高。多维分析形式语言RM_MDX设计的目的在于实现油气勘探开发数据与用户的查询交互接口,该查询语言需要在生产数据立方体的基础上,展现形式多样且直观的多维分析结果,提供上卷、下钻、切片、切块等多维分析功能。油气生产数据仓库使用雪花模式来组织多维数据集,在建立维的结构时,注重对层次结构的设计。在设计查询语言时要考虑这些特征,同时也兼顾表达能力和易用性两方面的要求1。 1油气生产数据仓库系统对查询语言的要求 设计油气生产数据仓库的查询语言有两种选择:一种是使用扩展的SQL语言,根据系统的要求对SQL语言的语法结构做一些调整;另一种是使用MDX语言,进行多维查询语言的设计2。 通过以上的比较分析,可以认为在OLAP系统中MDX语言比扩展的SQL语言将更能有效地表达查询4,因而考虑使用前者作为油气勘探开发数据仓库系统的用户接口。 SQL Server Analysis Services中提供了多维表达式(MDX),但该语言过于复杂。本文将以扩展MDX的思路,并借助用户定义函数(存储过程)在服务器端提供的指定服务,来实现基于油气勘探开发数据仓库多维概念模型的多维分析形式语言Reduced and Meliorative MultiDimension Expression(简化改善的多维表达式,简称RM_MDX)。 2RM_MDX设计原则 在油气勘探开发数据仓库系统中,执行多维分析的终端设备并不仅仅限于台式电脑和移动电脑,还可能是其它一些便携设备,例如掌上电脑、基于PC工业标准设计的小型行业专用商用PC,以及其它一些硬件配置不高但是便于移动操作且安装着精简操作系统的查询终端等。这要求查询终端上所使用的多维分析表达式不能够过于复杂,要具有良好的表达能力和基本的多维分析功能,且安装使用简易,对操作系统环境无过多要求。其OLAP分析服务流程如图1所示。 从油气勘探开发数据仓库的应用特点出发,设计RM_MDX语言时应遵循4个基本原则:体现油气勘探开发数据仓库多维分析处理的特点,重在应用;提供符合油气生产数据分析的功能集,尽量降低其复杂度;对于某些特殊分析功能,可以考虑使用多种手段扩充;便于接口模块解释执行,方便与OLAP服务器的交互5。 3多维分析形式语言RM_MDX设计 多维分析形式语言RM_MDX既要满足油气生产数据仓库的分析查询需求,又要能够和主流数据仓库系统之间具备良好的用户接口。在充分研究标准MDX语法之后,从MDX语言的语法集中抽取了适当的基本语法,作为设计RM_MDX语言的基础,并结合具体业务需求,对多维分析查询语法做了一些扩展和形式限定。 RM_MDX语法的基本结构如下: SELECT , FROM WHERE , ; 其中,与代表轴维度,形式为: := ON(dimension_name) := ON(dimension_name) 也可以使用简化形式: := := 代表切片维度,用来将返回的数据限定为特定维度和成员条件。 代表数据立方名。 RM_MDX的优点主要表现在以下两个方面6: (1)SELECT子句在MDX基础上的改善:RM_MDX规定SELECT子句具备两个轴方向,更加方便地实现了多维结果在二维空间上的展现;成员的关系通过层次名和属性值来定义,有利于查询语义的表达,并快速确定其层次关系。(2)WHERE子句在MDX基础上的改善: RM_MDX的切片维度采用更加灵活的设计。WHERE子句由多个切片维度组成,切片维度与轴维度使用相同的结构,均代表同一个维度上的信息,这样将由单个成员构成切片维的元组; 在切片维度定义中,通过属性表达式来限制非层次属性,这样在RM_MDX的切片分析中,可以针对层次属性和非层次属性进行限制。 对MDX语言进行改善后,形成了RM_MDX的基本语法。改善过程遵循了设计原则,语言功能达到了预期的设计目标。 本文主要采取了以下两种策略来扩展RM_MDX的功能: (1)使用.NET用户自定义函数来改善MDX。在油气数据分析过程中,经常会碰到类似这样的需求,即者想要查询每年净利润和基于装载日期的利润累加总和。为了执行此类操作,使用.NET编写自定义函数,运转于服务器端,调用多维分析指令时则将成员及其对应的值传递到形参列表。 (2)使用AMO存储过程和AMOMD Server存储过程来改善MDX。在油气勘探开发数据仓库系统中,改善MDX查询更多的是使用AMO存储过程和ADOMD Server存储过程。在分析油井生产数据时,管理者有时仅需要在某一范围生产数据中取样,比如返回区块1中所有油井列表中前10%的井生产数据,以分析该区块中油井含水率的变化趋势。存储过程的引入,使得RM_MDX能高效地实现此类多维分析功能。 4RM_MDX解释模块设计与实现 解释模块介于前端查询分析工具与OLAP服务器之间,它是RM_MDX与Analysis Services之间的接口,其主要功能为:检查RM_MDX查询语句的词法、语法及语义;根据RM_MDX的语法规则将RM_MDX查询语句转换为标准多维表达式。RM_MDX解释模块架构如图2所示。 图2RM_MDX解释模块架构 词法分析对MDX语句从左至右进行扫描,按词法规则识别单词符号(关键字、标识符、数字、运算符和特殊符号等),并产生用于语法分析的终结符流;过滤掉RM_MDX语句中的解释和空白(由空格、制表符等引起);记录输入的RM_MDX字符串的位置信息,以便出现词法或语法错误时,出错处理模块可以报告输入MDX语句错误的具体位置。语法分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论