




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SQL Server数据库的三种版本及OLAP方法的研究郑琛(北京师范大学,北京 100875)摘要:SQL Server 是一个全面的、集成的、端到端的数据解决方案,它为企业中的用户提供了一个安全、可靠和高效的平台用于企业数据管理和商业智能应用。OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。本文介绍了自2000年以来SQL Server数据库的三种版本(SQL Server 2000、SQL Server 2005、和SQL Server 2008)的各自的特性和优点,及其功能差别。通过在SQL Server 2008版上研究其OLAP的主要分析方法。关键词:SQL Server; OLAP;SQL Server是一个关系数据库管理系统。它最初是由Microsoft、Sybase和Ashton-Tate三家公司共同开发的,于1988年推出了第一个OS/2版本。在Windows NT推出后,Microsoft与Sybase在SQL Server的开发上就分道扬镳了,Microsoft将SQL Server移植到Windows NT系统上,专注于开发推广SQL Server的Windows NT版本。Sybase则较专注于SQL Server在UNIX 操作系统上的应用。1. 引言2000年初,微软发布了其第一个企业级数据库系统SQL Server 2000,其中包括企业版、标准版、开发版、个人版四个版本,同时包括数据库服务、数据分析服务和英语查询三个重要组成。此外,它还提供丰富的管理工具,对开发工具提供全面的支持,对于Internet应用提供不错的运行平台,对于XML数据也提供了基础的支持。借助这个版本,SQL Server成为了最广泛使用的数据库产品之一,也牢固树立了它在数据库产品中“三驾马车”居其一的地位。该版本继承了之前版本的优点,同时又比它增加了许多更先进的功能。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行Microsoft Windows 98 的膝上型电脑到运行Microsoft Windows 2000 的大型多处理器的服务器等多种平台使用。2005年,五年之后,在整个应用开发环境几乎已经“变了人间”之后,微软发布了新一代数据库产品SQL Server 2005,为IT专家和信息工作者带来了强大的、熟悉的工具,同时减少了在从移动设备到企业数据系统的多平台上创建、部署、管理及使用企业数据和分析应用程序的复杂度。 通过全面的功能集、和现有系统的集成性、以及对日常任务的自动化管理能力,SQL Server 2005 为不同规模的企业提供了一个完整的数据解决方案。SQL Server 2005不难看出,仅从开发周期上SQL Server 2005已经是慢工出的细活,就在发布了SQL Server 2005不久,微软服务器产品资深副总裁Paul Flessner先生就微软的数据平台远景和发展路线图进行了明确说明要通过支持不断增大的存储、更多设备间的操作交易性(例如:RFID设备)、更加智能化和移动化的方法,实现微软在数据库领域的远景目标“Your Data, Any Place, Any Time”。2008年,SQL Server 2008即将于第三季度正式发布,SQL Server 2008是一个重大的产品版本,它是一个全面的数据库平台,使用集成的商业智能(BI)工具提供了企业级的数据管理。SQL Server 2008数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能,可以构建和管理用于业务的高可用和高性能的数据应用程序。它推出了许多新的特性和关键的改进,使得它成为至今为止的最强大和最全面的SQL Server版本。2. SQL Server数据库的三种版本及其特性自2000年以来,SQL Server数据库提供了三种常用的版本,分别是:SQL Server 2000、SQL Server2005和SQL Server 2008。随着版本的不断更新以及新功能的加入,越来越方便人们管理和操作数据库。2.1 SQL Server 2000的特性(1) Internet 集成SQL Server 2000 数据库引擎提供完整的XML 支持。它还具有构成最大的Web 站点的数据存储组件所需的可伸缩性、可用性和安全功能。SQL Server 2000 程序设计模型与 Windows DNA 构架集成,用以开发 Web 应用程序,并且SQL Server 2000 支持 English Query 和 Microsoft 搜索服务等功能,在Web 应用程序中包含了用户友好的查询和强大的搜索功能。(2) 可伸缩性和可用性同一个数据库引擎可以在不同的平台上使用,从运行 Microsoft Windows® 98 的便携式电脑,到运行 Microsoft Windows 2000 数据中心版的大型多处理器服务器。SQL Server 2000 企业版支持联合服务器、索引视图和大型内存支持等功能,使其得以升级到最大 Web 站点所需的性能级别。(3) 企业级数据库功能SQL Server 2000 关系数据库引擎支持当今苛刻的数据处理环境所需的功能。数据库引擎充分保护数据完整性,同时将管理上千个并发修改数据库的用户的开销减到最小。SQL Server 2000 分布式查询使您得以引用来自不同数据源的数据,就好象这些数据是 SQL Server 2000 数据库的一部分,同时分布式事务支持充分保护任何分布式数据更新的完整性。复制同样使您得以维护多个数据复本,同时确保单独的数据复本保持同步。可将一组数据复制到多个移动的脱接用户,使这些用户自主地工作,然后将他们所做的修改合并回发布服务器。(4) 易于安装部署和使用SQL Server 2000 中包括一系列管理和开发工具,这些工具可改进在多个站点上安装、部署、管理和使用 SQL Server 的过程。SQL Server 2000 还支持基于标准的、与 Windows DNA 集成的程序设计模型,使 SQL Server 数据库和数据仓库的使用成为生成强大的可伸缩系统的无缝部分。这些功能使您得以快速交付 SQL Server 应用程序,使客户只需最少的安装和管理开销即可实现这些应用程序。(5) 数据仓库 SQL Server 2000 中包括析取和分析汇总数据以进行联机分析处理 (OLAP) 的工具。SQL Server 中还包括一些工具,可用来直观地设计数据库并通过 English Query 来分析数据。SQL Server 2000版本具有如下一些优点:(1) 高性能设计,可充分利用WindowsNT的优势。 (2) 系统管理先进,支持Windows图形化管理工具,支持本地和远程的系统管理和配置。(3) 强壮的事务处理功能,采用各种方法保证数据的完整性。(4) 支持对称多处理器结构、存储过程、ODBC,并具有自主的SQL语言。 SQLServer以其内置的数据复制功能、强大的管理工具、与Internet的紧密集成和开放的系统结构为广大的用户、开发人员和系统集成商提供了一个出众的数据库平台。2.2 SQL Server 2005的特性(1) 企业数据管理表1. 管理上的特性技术性能高可用性SQL Server 2005的失败转移集群和数据库镜像技术确保企业向员工、客户和合作伙伴提交高度可靠和可用的应用系统。管理工具SQL Server 2005引进了一套集成的管理工具和管理应用编程接口(APIs),以提供易用性、可管理性、及对大型SQL Server配置的支持。安全性增强SQL Server 2005旨在通过数据库加密、更加安全的默认设置、加强的密码政策和细化许可控制、及加强的安全模型等特性,为企业数据提供最高级别的安全性。可伸缩性SQL Server 2005可伸缩性的先进性包括表格分区、复制能力的增强和64位支持。(2) 开发人员生产力 表2. 开发上的特性技术性能Common Language Runtime (CLR)集成SQL Server 2005引入了使用Microsoft .NET 语言来开发数据库目标的性能。深入的XML集成SQL Server 2005提供一种新的XML数据类型,使在SQL Server数据库中存储XML片段或文件成为可能。Transact-SQL增强新的查询类型和在交易过程中使用错误处理的功能,为开发人员在SQL Server查询开发方面提供了更高的灵活性和控制力。SQL 服务代理SQL服务代理为各个级别的可伸缩性提供一种创新的、分发的、异步的应用系统体系结构。 (3) 商务智能表3. 商务智能上的特性技术性能分析服务分析服务对数据仓库、商务智能和line-of-business解决方案的可伸缩性、可管理性、可靠性、可用性和可规划性提供扩展。数据转换服务(DTS)对DTS结构合工具的全部重新设计为开发人员和数据库管理员提供了增强的灵活性和可管理性。报表服务报表服务是一种新的报表服务器和工具箱,用于创建、管理和配置企业报告。数据挖掘数据挖掘的功能得以增强,主要归功于四种新的运算法则、改进的数据模型和处理工具。2.3 SQL Server 2008的特性SQL Server 2008出现在微软数据平台愿景上是因为它使得公司可以运行他们最关键任务的应用程序,同时降低了管理数据基础设施和发送观察和信息给所有用户的成本。对于SQL Server系统而言,SQL Server 2008已经不简单的是一个数据存储仓库,它可以通过新增的功能逐渐演化成更加智能的数据平台。SQL Server 2008在设置和安装方面都做了大量的改进,将配置数据和引擎分开,从而使得创建基本的未配置系统的磁盘映像变成可能,将数据分布到多个服务器也变得更加容易。改版本具有以下特点:(1) SQL Server集成服务SQL Server集成服务(SSIS)是一个嵌入式应用程序,用于开发和执行ETL(解压缩、转换和加载)包。SSIS代替了SQL 2000的DTS(数据转换服务)。整合服务功能既包含了实现简单的导入导出包所必需的Wizard导向插件、工具以及任务,也有非常复杂的数据清理功能。另外,SQL Server 2008集成服务有很大的改进和增强,在执行程序方面能够更好地并行执行,这样的功能在SQL Server 2005集成服务中,数据管道不能跨越两个处理器。而SSIS 2008能够在多处理器机器上跨越两个处理器,而且它在处理大件包上面的性能得到了提高。Lookup功能也得到了改进。Lookup是SSIS一个常用的获取相关信息的功能。Lookup在SSIS应用中很常见,而且可以处理上百万行的数据集,但是性能方面可能很差。SQL Server 2008对Lookup的性能作出很大的改进,而且能够处理不同的数据源,包括ADO.NET,XML,OLEDB和其他SSIS压缩包。(2) 分析服务SQL Server分析服务(SSAS)为商业智能应用程序提供联机分析处理(OLAP) 和数据挖掘功能。在新一版的SQL Server 2008中也得到了很大的改进和增强。IB堆叠做出了改进,性能得到很大提高,而硬件商品能够为Scale out管理工具所使用。Block Computation也增强了立体分析的性能。(3) 报表服务SSRS(SQL Server 报表服务)的处理能力和性能得到改进,使得大型报表不再耗费所有可用内存。另外,在报表的设计和完成之间有了更好的一致性。SQL SSRS 2008还包含了跨越表格和矩阵的TABLIX。Application Embedding允许用户点击报表中的URL链接调用应用程序。(4) Office 的集成SQL Server 2008能够与Microsoft Office 2007完美地结合。例如,SQL Server Reporting Server能够直接把报表导出成为Word文档。而且使用Report Authoring工具,Word和Excel都可以作为SSRS报表的模板。Excel SSAS新添了一个数据挖掘插件,还提高了其性能。(5) 数据加密允许加密整个数据库、数据文件或日志文件,无需更改应用程序。这样做的好处包括:同时使用范围和模糊搜索来搜索加密的数据,从未经授权的用户搜索安全的数据,可以不更改现有应用程序的情况下进行数据加密。(6) 热添加CPU 允许CPU资源在支持的硬件平台上添加到 SQL Server 2008,以动态调节数据库大小而不强制应用程序宕机。注意,SQL Server已经支持在线添加内存资源的能力。(7) 审计除了登录/登出和权限更改的标准审计外,SQL Server 2008允许监控数据的更改或访问。通过DDL创建和管理审计,同时通过提供更全面的数据审计来简化遵从性。(8) 数据压缩对于SQL Server的数据压缩而言,主要的目的是实际的表的尺寸的减小。据微软所说,使用压缩时会轻微的增加CPU的使用,整个系统的性能会因为I/O的减少而得多提升。更有效地存储数据,并减少数据的存储需求。数据压缩还为大I/O边界工作量(例如数据仓库)提供极大的性能提高。(9) 资源管理器SQL Server 2008里资源管理器是崭新的。管理器用于限制用户或用户组使用高级别的资源。能够监视的项目包括CPU带宽、超时等待、执行时间、阻塞时间和空闲时间。如果达到资源管理器的阈值,系统可以触发一个事件或停止进程。在资源管理器里使用的一系列的步骤将在以后的文章里介绍。由此可见,SQL Server 2008系统依靠的技术更新为用户提供对于管理数据和功能变革的全面挑战。具有在关键领域方面的显著的优势,SQL Server 2008是一个可信任的、高效的、智能的数据平台。SQL Server 2008是微软数据平台愿景中的一个主要部分,旨在满足目前和将来管理和使用数据的需求。它推出了许多新的特性和关键的改进,使得它成为至今为止的最强大和最全面的SQL Server版本。3. 联机分析处理(OLAP)60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展(数据以表格的形式而非文件方式存储)。1993年,E.F.Codd提出了OLAP概念,认为OLTP已不能满足终端用户对数据库查询分析的需要,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,E.F.Codd提出了多维数据库和多维分析的概念,即OLAP。 OLAP的概念OLAP(联机分析处理) 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。(OLAP委员会的定义)OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。3.2 OLAP的作用联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。联机分析处理具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对基于大量复杂数据的分析变得轻松而高效,以利于迅速做出正确判断。它可用于证实人们提出的复杂的假设,其结果是以图形或者表格的形式来表示的对信息的总结。它并不将异常信息标记出来,是一种知识证实的方法。3.3 OLAP的特点(1) 快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户的大部分分析要求做出反应。(2) 可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。(3) 多维性:多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。(4) 信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。3.4 OLAP多维数据结构(1) 超立方结构(Hypercube) 超立方结构指用三维或更多的维数来描述一个对象,每个维彼此垂直。数据的测量值发生在维的交叉点上,数据空间的各个部分都有相同的维属性。(收缩超立方结构。这种结构的数据密度更大,数据的维数更少,并可加入额外的分析维)。(2) 多立方结构(Multicube)即将超立方结构变为子立方结构。面向某一特定应用对维进行分割, 它具有很强的灵活性,提高了数据(特别是稀疏数据)的分析效率。3.5 OLAP多维数据分析(1) 切片和切
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 推广总监面试题目及答案
- 荔湾区前年数学试卷
- 硚口区初三五调数学试卷
- 2025年小学综合d类试题及答案
- 2025年小学科目二试题及答案
- 2025年小学生排队试题及答案
- 2025课一考试题及答案
- 2025安全法的考试题及答案
- 2025证券投资顾问考试题目及答案
- 2025公务员精神测试题及答案
- 不使用童工的承诺书中英文版本
- 国际贸易理论与实务(陈岩 第四版) 课件全套 第0-16章 绪论、国际贸易理论、国际贸易政策-国际贸易方式
- 公司跟合作社合作协议书
- 局部麻醉知情同意书
- 五年级下册计算题400道及答案
- 班主任量化管理考核细则及工作量化考评办法
- 汽车维修厂投资计划书
- 叉车操作规程管理制度
- 人工智能伦理与法律简介
- 章义伍-流程为王
- 小学生品德发展与道德教育PPT完整全套教学课件
评论
0/150
提交评论