SQL SERVER数据库性能优化研究(论文)_第1页
SQL SERVER数据库性能优化研究(论文)_第2页
SQL SERVER数据库性能优化研究(论文)_第3页
SQL SERVER数据库性能优化研究(论文)_第4页
SQL SERVER数据库性能优化研究(论文)_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、吉林大学珠海学院毕 业 论 文sql server数据库性能优化研究researching of the sql server database performance optimization系别:计算机科学与技术专业名称:计算机科学与技术学生姓名:李信龙学号:04050722指导教师姓名、职称:崔树林、讲师完成日期 2009年 5月 13 日吉林大学珠海学院本科毕业论文开题报告选 题sql server数据库性能优化研究院 系计算机系专 业计算机科学与技术学生姓名李信龙指导教师崔树林本选题的背景、意义及国内外发展状况: 数据库技术是计算机科学技术发展最快、应用最广泛的领域之一,在信息管理自

2、动化程度日益提高的今天,数据库技术已经成为现代计算机信息系统和应用系统的基础和核心。数据库技术最初产生于20世纪60年代中期,从最初的层次模型、网状模型,到目前的关系模型、面向对象模型,己经过40年左右的发展。数据库建设是现代信息产业的基本建设工程,一个国家拥有多少自己的数据库,能用数据库提供多少服务,是各国经济实力、文明程度和科技水平的重要标志。我国引进数据库技术始于20世纪70年代末,自进入20世纪80年代以来,我国数据库建设有了较大发展,从微型计算机上运行的数据库到当前大型数据库系统的引入和应用。但从对数据库系统的应用效果和对数据库技术指标掌握上来比较,与发达国家之间仍然存在较大的差距。

3、数据库技术应用从传统的商务数据处理不断扩大到许多新的领域,如计算机图像处理、多媒体应用、商业管理、gis等,要使这些领域中应用的信息系统高效、正常、安全地运行,其中最为显著的就是数据库的性能问题。在网络应用和电子商务高速发展的时代,信息系统在国民经济建设中担负着越来越重要的任务,如何使有限的计算机系统资源充分发挥应有的作用?如何保证用户的响应速度和服务质量?如何保证未来的某个时间保持现有的运行性能?这些问题都属于数据库性能优化的范畴。随着数据库规模的不断扩大,数据库系统的性能问题也越来越突出,数据库应用系统能否正常、高效地运行倍受关注,数据库优化技术方法的探索具有非常重要的意义。研究内容: 由

4、于数据库调优涉及很多方面的知识,本论文将从几个方面研究:数据库逻辑结构和物理结构的优化、sql语句优化、合适索引的创建、sql server分区技术等等。 1、数据库逻辑结构和物理结构的优化 设计应用的开始步骤之一就是表(或关系)的设计,数据将要存储在表中。一旦应用系统运行起来,修改表的设计有可能需要修改许多运用程序,这是我们不愿意看到的,而且修改后还要进行测试。因此,在最初就设计好数据库的表是很重要的。规范化是设计数据库表的理论指导。 2、索引调优 在良好的数据库设计基础上,能有效地使用索引是数据库取得高性能的基础,数据库采用基于代价的优化模型,它对每一个提交的有关表的查询,决定是否使用索引

5、或用哪一个索引。因为查询执行的大部分开销是磁盘i/o,使用索引提高性能的一个主要目标是避免全表扫描,因为全表扫描需要从磁盘上读表的每一个数据页,如果有索引指向数据值,则查询只需读几次磁盘就可以了。所以如果建立了合理的索引,优化器就能利用索引加速数据的查询过程。但是,索引并不总是提高系统的性能,在增、删、改操作中索引的存在会增加一定的工作量,因此,在适当的地方增加适当的索引并从不合理的地方删除次优的索引,将有助于优化那些性能较差的数据库应用。实践表明,合理的索引设计是建立在对各种查询的分析和预测上的,只有正确地使索引与程序结合起来,才能产生最佳的优化方案。3、sql优化在使用sql时往往会陷入一

6、个误区,即太关注于所得的结果是否正确,而忽略了不同的实现方法之间可能存在的性能差异,这种性能差异在大型的或是复杂的数据库环境中(如联机事务处理oltp或决策支持系统dss)中表现得尤为明显。本人在工作实践中发现,不良的sql往往来自于不恰当的索引设计、不充份的连接条件和不可优化的where子句。在对它们进行适当的优化后,其运行速度有了明显地提高研究方法、手段及步骤:一、阅读相关数据库理论书籍,用这些理论来证明调优方法的合理性二、上网查找具体数据库性能调优的技术实现。 三、设计一个具体实例进行比较调优前和调优后的差别 四、与有这方面实践经验的同事交流和讨论参考文献:1 dennis shasha

7、 著 孟小峰译数据库性能调优:原理与技术m机械工业出版社, 2004-05-012 itzik ben-gan, dejan sarka, roger wolter著 赵立东 译 microsoft sql server 2005 技术内幕:t-sql程序设计m 电子工业出版社, 2007-08-013 kalen delaney 著 聂伟, 方磊, 揭磊骏译 microsoft sql server 2005技术内幕:存储引擎m 电子工业出版社, 2007-09-014 jim gray andreas reuter 著 孟小峰译事务处理(概念与技术)m 机械工业出版社 2004-1-15

8、王珊, 萨师煊 著数据库系统概论第四版m 高等教育出版社2006-5-16 silberchatz ,abraham著 杨冬青, 唐世渭 译数据库系统概念(原书第4版)m 机械工业出版社 2003-3-17 严蔚敏, 吴伟民著数据结构(c语言版)m 清华大学出版社 2007-03-01摘 要数据库系统的性能最终决定数据库的可用性和生命力。大多数数据库系统在运行一段时间后都会存在一定的性能问题,主要涉及数据库硬件、数据库服务器、数据库内存、应用程序、操作系统、数据库参数等方面。因此,基于数据库系统的性能调整与优化对于整个系统的正常运行起着至关重要的作用。数据库性能调整与优化涉及到多个层面,通过统

9、一规划、系统分析做出相应的调整,可以提高数据库的稳定性和可用性,保障系统高效地运行,解决系统瓶颈,节约系统开销,具有良好的应用价值。同时也对理论研究提供了一定的方法指导。基于此,论文根据本人在实际工作中遇到的问题和平时对数据库的使用经验,将数据库设计、合理的索引添加以及sql语句优化等方面的性能调整与优化问题作为主要研究内容,对其进行了深入地分析和讨论,给出了一般情况下sql server数据库应用系统的性能调整策略及优化方法。首先,介绍了数据库性能调整的相关研究背景、论文选题意义以及数据库性能调整与优化架构,涉及性能调整与优化的概念、性能评价指标以及数据库优化的主要方面。其次,对常用的几种优

10、化技术进行了详细地介绍与说明。总结归纳了数据库逻辑结构和物理结构的优化、sql语句优化的实质与目的、方法与技巧,索引创建的相关规则,sql server分区技术等。最后提出一个针对sql server数据库的系统性能总体调整策略。最后,对sql server数据库性能调整与优化问题进行了总结。关键词:数据库;sql server;性能优化abstractthe performance of database systems eventually determines their availability and survivability. most of them will bring ab

11、out some performance problems more or less after running for a period of time, which mainly involve database hardware, database server, database memory, applications, operating systems and database parameters, etc. therefore, performance tuning and optimization of database systems, which concern mul

12、tiple aspects, are very vital to the normal running of the whole system. through a unified plan and systematical analysis to make appropriate adjustment, the stability and availability of database will be improved, high running efficiency will be guaranteed, system bottleneck will be solved, system

13、overhead will be reduced, considerable applicability and in the meanwhile will be obtained, and some guidelines for theoretical research will be provided. based on the above-mentioned idea, by problems meeting in working experience of using sql database, the paper principally pays attention to the r

14、esearch on the performance tuning and optimization of sql statements, and makes a deep analysis and discussion. it suggests in general some performance tuning strategies and optimization approaches of sql server application systems to drive the development of sql server performance management and op

15、timization technology.firstly, the paper introduces the corresponding research background of performance tuning of database, significance of selected topic and framework of performance tuning and optimization of database including their concepts, performance evaluation index and primary aspects of o

16、ptimization.secondly, several common optimization techniques are introduced and explained in detail. this paper summarizes optimization of database logical structure and physical structures, methods and techniques of sql optimization, relevant rules of index creation, and intelligent use of sql serv

17、er partitioning techniques. the fore-and-aft performance indexes of various optimization techniques are analyzed and compared. an overall tuning strategy of system performance for sql server databases is put forward in the end.finally, this paper summarizes and prospects the problems of performance

18、tuningand optimization of sql server databases.keywords:database;sql server;performance;optimization目录1 绪 论11.1课题研究背景11.2研究意义与目的11.3研究的内容与组织结构22 数据库性能优化架构32.1性能调整与优化概述32.2数据库优化的目标32.2.1提高系统的吞吐量32.2.2缩短系统的响应时间42.3性能调整的步骤42.3.1优化业务逻辑52.3.2调整数据结构设计52.3.3优化数据库的逻辑结构52.3.4优化数据库的操作53 性能优化技术介绍63.1数据库结构优化63.

19、1.1数据库逻辑结构的优化63.1.2数据库物理存储结构的优化63.1.3使用分区73.2 sql查询语句的优化93.2.1合理使用索引93.2.2优化sql语句的一些具体策略114 商品订单管理系统数据库设计165 优化实例185.1数据库物理结构的优化185.2添加必要的索引185.2.1确定预索引字段205.2.2创建适当的索引205.2.3实验结果分析205.3 sql语句的优化216 总 结24参考文献25致 谢261 绪 论1.1课题研究背景数据库技术是计算机科学技术发展最快、应用最广泛的领域之一,在信息管理自动化程度日益提高的今天,数据库技术已经成为现代计算机信息系统和应用系统的

20、基础和核心。数据库技术最初产生于20世纪60年代中期,从最初的层次模型、网状模型,到目前的关系模型、面向对象模型,己经过40年左右的发展。数据库建设是现代信息产业的基本建设工程,一个国家拥有多少自己的数据库,能用数据库提供多少服务,是各国经济实力、文明程度和科技水平的重要标志。我国引进数据库技术始于20世纪70年代末,自进入20世纪80年代以来,我国数据库建设有了较大发展,从微型计算机上运行的数据库到当前大型数据库系统的引入和应用。但从对数据库系统的应用效果和对数据库技术指标掌握上来比较,与发达国家之间仍然存在较大的差距。数据库技术应用从传统的商务数据处理不断扩大到许多新的领域,如计算机图像处

21、理、多媒体应用、商业管理、gis等,要使这些领域中应用的信息系统高效、正常、安全地运行,其中最为显著的就是数据库的性能问题。在网络应用和电子商务高速发展的时代,信息系统在国民经济建设中担负着越来越重要的任务,如何使有限的计算机系统资源充分发挥应有的作用?如何保证用户的响应速度和服务质量?如何保证未来的某个时间保持现有的运行性能?这些问题都属于数据库性能优化的范畴。随着数据库规模的不断扩大,数据库系统的性能问题也越来越突出,数据库应用系统能否正常、高效地运行倍受关注,数据库优化技术方法的探索具有非常重要的意义。1.2研究意义与目的sql server在数据库领域一直占据着不小的份额。sql se

22、rver现在可用于大型机、客户/服务器以及pc平台,适合于各种操作系统,包括microsotf windows和windows nt、0s/390(mvs)、各种unix操作系统、linux等。同时,sql server数据库在国内外也获得了诸多成功应用。企业资源规划应用程序包、数据仓库以及许多公司的客户应用系统都要依赖sql server。sql server数据库产品在整个数据库产品的应用中占据了不小的比例,并且有不断上升的趋势。sql server数据库系统博大精深,其系统管理工作非常复杂。对于sql server数据库来说,操作系统的性能、服务器硬件的性能、数据库的设计、表空间的规划、

23、聚簇的使用、并行控制等无一不影响其运行的整体性能。sql server数据库服务器是高度可优化的软件产品,对sql server数据库进行性能调整与优化具有非常重要的意义。目前国内外关于sql server数据库系统的应用实例优化并不多,而且讲解比较理论化。因此,本文根据自己平时的实际工作所遇到的一些问题和自己对sql server数据库的使用经验,主要从数据库设计优化、索引添加、查询优化这三个方面进行实验测试,通过对各种优化技术的介绍、分析和研究,对使用不同优化技术前后的性能评价指标进行比较,体现各种优化技术对数据库运行效率的影响程度,提出sql server数据库应用系统性能优化的合理方法

24、。使得能有效的使用sql server数据库产品,将它的性能调整到更适合自己的需要。1.3研究的内容与组织结构数据库性能问题是当今诸如管理信息系统等众多数据库应用系统所面临的共同问题,为了解决系统运行过程中遇到的种种瓶颈,对数据库性能调整理论和应用的研究是迫切需要的。本文对目前sql server数据库性能调整的一些优化技术的应用实践进行了讨论,具有一定的理论研究价值和现实意义。各章节安排如下:第一章综述了数据库性能调整的研究现状和发展概况,阐述了论文研究的意义与目的。第二章介绍了数据库性能调整与优化的主要目标,分析了系统性能评价指标和数据库性能优化的主要方面。第三章对性能优化技术介绍。第四章

25、详细介绍了sql server数据库性能调整与优化的相关技术,包括数据库逻辑结构和物理结构的优化、sql语句优化、合适索引的创建、sql server分区技术等等。第五章开发了一个商品订单管理系统作为测试用例,对如何优化数据库的性能进行具体的测试和分析。第六章总结全文,肯定了数据库性能调整的应用价值。2 数据库性能优化架构2.1性能调整与优化概述性能调整(performance tuning)是一项活动,这项活动通过优化应用程序、修改系统参数、改变系统配置(硬件调整)来改变系统性能。性能调整包括对硬件配置操作系统(os)与关系型数据库管理系统(rdbms)配置,以及对访问这些组件的应用的详细分

26、析与优化。系统性能的判定标准依赖于性能衡量的研究,通常认为性能的指标可以通过处理一个事务所需的i/o量、cpu时间量、以及响应时间来衡量。性能会随特定环境的不同而变化,并受应用程序、体系结构和资源、服务器以及并发活动的具体情况影响。性能调整的一个主要目标是消除瓶颈。瓶颈(bottle neck)是性能限制的重要因素,它可以是硬件或软件,如果不是在正确配置和调整的系统中,就会严重地影响系统性能。减少瓶颈可以最大地发挥一个系统的性能。为有效地对系统进行调整,必须遵循一套特定的步骤或方法,去调整和优化系统中的所有组件,包括应用、硬件与sql server。首先,讨论将涉及系统调整的不同组件。在本章后

27、面部分,着重介绍性能调整的方法论。2.2数据库优化的目标有不同的方式确定性能调整工作的目标。数据库应用系统可以用各种定量的方法分析,其中最重要指标如下:2.2.1提高系统的吞吐量吞吐量是指给定时间内服务器能够处理的查询总数,即每个单元时间完成的工作,以每秒钟的事务量(tps)表示;该值越高越好。提高系统的吞吐量也有两种方法:l 在同样的资源环境下做更多的工作(通过减少服务时间);l 通过减少总的响应时间使工作做得更快。要做到这一点,可以将用户等待的资源加倍,如系统受到cpu限制,则可以增加cpu的数量。在任何一个系统中,吞吐量和反应时间作为调整目标通常是互相对立的。如果反应时间长(坏),吞吐量

28、或许高(好)。如果吞吐量低(坏),反应时间或许短(好)。多数的并发用户在一定时间内使用一个系统,每个用户很有可能比平时要经历更长的延迟,但是通过系统的事务数量将会更大。相反,假如减少在某一个时间窗口中访问系统的并发用户数量,以在该时间内完成的全部事务量减少为代价,每个用户将会享受到更快的反应时间。现在考虑一个为客户预定体育比赛门票的公司。如果该公司的营业时间为每天8小时,并且在销售市场体育比赛门票的第一天必须卖出25000张门票,那么该公司的门票预定系统的吞吐量必须等于或大于每小时3125笔事务。吞吐量=(25000笔事务/8小时)=3125笔事务/小时,或52.1笔事务/分钟。当然,以8小时

29、的时间间隔来计算系统需要达到的吞吐量是不现实的,因为并不是所有需求都是匀速到达系统。在设计系统软硬件规模和规划系统能力时,我们是根据系统最忙碌的时间段来计算系统所要达到的吞吐量的。这是设计数据库系统的一条著名规律:为最糟糕的情况设计系统的软硬件规模。2.2.2缩短系统的响应时间系统响应时间是指从用户按下最后一个提交按钮到所有数据都显示在显示设备上所花费的时间。以毫秒或秒表示,该值越低越好。系统响应时间的实质就是终端用户为等待后台事务处理所花费时间。响应时间通常也称为用户收到查询正被处理的直观确认时刻所感知的时间长度。数据库用户响应时间又可以分为系统服务时间和用户等待时间两项,即:数据库用户响应

30、时间=系统服务时间+用户等待时间。因此,获得满意的用户响应时间有两个途径:l 减少系统服务时间,即提高数据库的吞吐量。l 减少用户等待时间,即减少用户访问同一数据库资源的冲突率。尽管某些数据库系统需要实现系统可能达到的最高吞吐量,但另一些系统可能有严格的系统响应时间要求。在这种环境中,漫长的系统响应时间常常意味着客户只能在线等待,这将阻碍其他用户使用系统。这种情况往往意味着失掉商机,所以缩短系统响应时间是非常重要的。对于那些对响应时间有严格要求的系统,必须采取不同的方法对系统进行调整。为了缩短系统响应时间,可以使系统以远低于其实际吞吐能力的吞吐量运行或是将批理作业放在非营业时间内处理。2.3性

31、能调整的步骤不少人认为数据库应用系统的性能调整是在系统运行出现问题时才进行的,其实,这种看法是片面的。性能调整和优化工作是在进行系统计划和设计阶段就已经开始了,并且一直贯穿系统的运行周期。在计划阶段就仔细地考虑性能调整工作,这会大大减轻系统运行后的性能调整工作。在数据库的性能调整过程中需要应用程序设计人员、应用程序开发人员、数据库管理员以及系统管理员共同完成。下面以优先顺序给出性能调整的步骤:2.3.1优化业务逻辑为了得到最佳的性能,在数据库设计过程中要采用业务逻辑。这就关系到对整个系统的高层分析和设计。像是否在系统范围内采用线程服务器这样的配置问题就是这一阶段需要考虑的问题。这样设计者将性能

32、要求同具体的业务需求直接联系起来。2.3.2调整数据结构设计在数据设计阶段,设计人员必须决定哪些数据是应用所需的,同时还要考虑哪些关系是重要的,以及它们的属性是什么,还要确定哪些属性可以作为主键(primary key)或外键(foreign key)。最后,要构造好信息来更好地满足性能目标。这一阶段需要对数据进行仔细分析,避免数据冗余,同时要考虑合理分布数据,以防止数据存取的拥挤,如是否使用数据库的分区功能,以及对于经常访问的数据库表是否需要建立局部还是全局索引等。2.3.3优化数据库的逻辑结构这一阶段就是通过增加、减少或调整逻辑结构,如考虑在主键和外键上建立索引之外增加其它索引以提高系统性

33、能。2.3.4优化数据库的操作这一阶段主要是在优化数据库服务器之前,首先确保在应用中已充分利用了为了提高性能而设计的sql以及其中的一些特殊功能。如在sql server数据库中的数组的处理、sql优化器、行级锁管理以及sql server查询分析器等。应用程序的执行最终将归结为数据库中的sql语句执行,因此sql语句的执行效率最终决定了数据库的性能。3 性能优化技术介绍3.1数据库结构优化一个数据库系统的生命周期可以分成:设计、开发和成品三个阶段。在设计阶段进行数据库性能优化的成本最低,收益最大。在成品阶段进行数据库性能优化的成本最高,收益最小。要在sql server方案中实现最优的性能,

34、最关键的是要有一很好的数据库设计方案。在实际工作中,许多sql server方案往往是由于数据库设计得不好导致性能很差。所以,要实现良好的数据库设计就必须考虑这些问题。3.1.1数据库逻辑结构的优化一般来说,逻辑数据库设计的不合理容易产生以下问题,数据冗余、更新异常、插入异常、删除异常。所以逻辑数据库设计至少应满足规范化的前3级标准:第1规范:没有重复的元组或多值的列。第2规范:每个非关键字段必须依赖于主关键字,不能依赖于1个组合式主关键字的某些组成部分。第3规范:每个非关键字段必须依赖于主关键字,不能依赖于1个组合式主关键字的某些组成部分,也不能依赖于另1个非关键字段。遵守这些规则的设计会产

35、生较少的列和更多的表,因而也就减少了数据冗余,也减少了用于存储数据的页。但表关系也许需要通过复杂的合并来处理,这样会降低系统的性能。某种程度上的非规范化可以改善系统的性能,非规范化过程可以根据性能方面不同的考虑用多种不同的方法进行,所在在进行数据库逻辑结构设计时应综合考虑数据冗余和基于连接的查询带来的性能问题。3.1.2数据库物理存储结构的优化数据文件和日志文件的位置和分布对系统的性能非常重要。数据库设计的两条关键性的指导原则如下:将序列访问的文件分离到专用的磁盘上,并通过将数据文件分散到各个磁盘上而允许并行i/o。1.与每个表列相关的数据类型应该反映数据所需的最小存储空间,特别是对于被索引的

36、列更是如此。比如能使用smallint类型就不要用int类型,这样索引字段可以被更快地读取,而且可以在1个数据页上放置更多的数据行,因而也就减少了i/o操作。2.l server分区技术把一个频繁使用的大表分割开,并放在多个单独的智能型磁盘控制器的数据库设备上,这样也可以提高性能。因为有多个磁头在查找,所以数据分离也能提高性能,sql server的分区技术将在下面讲到。3.sql server段把文本或图像列的数据存放在1个单独的物理设备上可以提高性能。1个专用的智能型的控制器能进一步提高性能。3.1.3使用分区超大型数据库的大小常常达到数百gb,有时甚至要用tb来计算。而单表的数据量往往会

37、达到上亿的记录,并且记录数会随着时间而增长。这不但影响着数据库的运行效率,也增大数据库的维护难度。除了表的数据量外,对表不同的访问模式也可能会影响性能和可用性。这些问题都可以通过对大表进行合理分区得到很大的改善。当表和索引变得非常大时,分区可以将数据分为更小、更容易管理的部分来提高系统的运行效率。如果系统有多个cpu或是多个磁盘子系统,可以通过并行操作获得更好的性能。所以对大表进行分区是处理海量数据的一种十分高效的方法。下面通过一个具体实例,介绍如何创建和修改分区表,以及如何查看分区表。分区功能是sql server 2005新增的一个功能,表分区分为水平分区和垂直分区。水平分区将表分为多个表

38、。每个表包含的列数相同,但是行更少。例如,可以将一个包含十亿行的表水平分区成12个表,每个小表表示特定年份内一个月的数据。任何需要特定月份数据的查询只需引用相应月份的表。而垂直分区则是将原始表分成多个只包含较少列的表。水平分区是最常用分区方式,本文以水平分区来介绍具体实现方法。平分区常用的方法是根据时期和使用对数据进行水平分区。例如本文例子,一个短信发送记录表包含最近一年的数据,但是只定期访问本季度的数据。在这种情况下,可考虑将数据分成四个区,每个区只包含一个季度的数据。下面具体介绍一下使用分区表的方法。1.建文件组立分区表先要创建文件组,而创建多个文件组主要是为了获得好的i/o平衡。一般情况

39、下,文件组数最好与分区数相同,并且这些文件组通常位于不同的磁盘上。每个文件组可以由一个或多个文件构成,而每个分区必须映射到一个文件组。一个文件组可以由多个分区使用。为了更好地管理数据(例如,为了获得更精确的备份控制),对分区表应进行设计,以便只有相关数据或逻辑分组的数据位于同一个文件组中。使用alter database,添加逻辑文件组名:aer databasedeandbadd filegroupfg1dandb为数据库名称,fg1文件组名。创建文件组后,再使用alter database将文件添加到该文件组中。ater databasedeandbadd file(name=fg1,fi

40、lename=c:deandatafg1.ndf,size=3072kb,filegrowth=1024kb)to filegroupfg1类似的建立四个文件和文件组,并把每一个存储数据的文件放在不同的磁盘驱动器里。2.创建分区函数创建分区表必须先确定分区的功能机制,表进行分区的标准是通过分区函数来决定的。创建数据分区函数有range“left|/right”两种选择。代表每个边界值在局部的哪一边。例如存在四个分区,则定义三个边界点值,并指定每个值是第一个分区的上边界(left)还是第二个分区的下边界(right)。代码如下:create partition functionsendsmspf

41、(datetime)as range right for values(20070401,20070701,20071001)3.创建分区方案创建分区函数后,必须将其与分区方案相关联,以便将分区指向至特定的文件组。就是定义实际存放数据的媒体与各数据块的对应关系。多个数据表可以共用相同的数据分区函数,一般不共用相同的数据分区方案。可以通过不同的分区方案,使用相同的分区函数,使不同的数据表有相同的分区条件,但存放在不同的媒介上。创建分区方案的代码如下:create partition schemesendsmsps as partitionsendsmspf to (fg1,fg2,fg3,fg4

42、) 4.创建分区表建立好分区函数和分区方案后,就可以创建分区表了。分区表是通过定义分区键值和分区方案相联系的。插入记录时,sql server会根据分区键值的不同,通过分区函数的定义将数据放到相应的分区。从而把分区函数、分区方案和分区表三者有机的结合起来。创建分区表的代码如下:create table sendsmslog(idintidentity(1,1)not null,idnumnvarchar(50)null,sendcontenttextnullsenddatedatetimenotnull,)on sendsmsps(senddate)5.查看分区表信息系统运行一段时间或者把以前

43、的数据导入分区表后,我们需要查看数据的具体存储情况,即每个分区存取的记录数,那些记录存取在那个分区等。我们可以通过$partition.sendsmspf来查看,代码如下:select$partition.sendsmspf(o.senddate)aspartition number,min(o.senddate)asmin senddate,max(o.senddate)asmax senddate,count(*)asrows in partitionfrom dbo.sendsmslog as ogroup by$partition.sendsmspf(o.senddate)order

44、bypartition number6.维护分区分区的维护主要设计分区的添加、减少、合并和在分区间转换。可以通过alter partition function的选项split,merge和alter table的选项switch来实现。split会多增加一个分区,而megre会合并或者减少分区,switch则是逻辑地在组间转换分区。3.2 sql查询语句的优化数据库的优化通常可以通过对网络、硬件、操作系统、数据库参数和应用程序的优化来进行。最常见的优化手段就是对硬件的升级。根据统计,对网络、硬件、操作系统、数据库参数进行优化所获得的性能提升,全部加起来只占数据库系统性能提升的40%左右,其余

45、的60%系统性能提升来自对应用程序的优化。许多优化专家认为,对应用程序的优化可以得到80%的系统性能的提升。应用程序的优化通常可分为两个方面:源代码和sql语句。由于涉及到对程序逻辑的改变,源代码的优化在时间成本和风险上代价很高,而对数据库系统性能的提升收效有限。所以sql语句的优化对数据库系统的性能起着决定性的作用。sql语言是一种灵活的语言,相同的功能可以使用不同的语句来实现,但是语句的执行效率是很不相同的。程序员可以通过查看查询计划来比较各种实现方案,并选出最优的实现方案。总得来讲,程序员写sql语句需要满足考虑如下规则:3.2.1合理使用索引索引是一种供服务器在表中快速查找一个行的数据

46、库结构。在关系数据库中,一个行的物理位置无关紧要,除非数据库需要找到它。为了能找到数据。表中的每一行均用一个rowid来标识,rowid告诉数据库这一行的准确位置(指出行所在的文件、该文件中的块、该块中的行地址)。每一个索引条目都由一个键值和rowid组成。可以索引一个列或一组列,sql server用b树结构存储索引条目,以保证用最短路径访问键值,当一个查询访问索引时,就能找到与查询条件相匹配的索引条目。与条目相匹配的rowid值指向sql server提供相关行的物理位置,以减轻定位数据所需要的i/o负担。从大多数系统应用实例来看,查询操作在各种数据库的操作中,所占的比重最大。索引是数据库

47、的重要的数据结构,它的根本目的就是为了提高查询速度。实践证明在数据库编程中,合理使用索引文件,对于改善数据查询速度有着举足轻重的作用,可以极大改善数据库应用程序的性能。在应用过程中,用户的查询条件可能是多种多样的,如果能根据用户查询建立和选择索引,对于保证应用程序的性能很有帮助。1.索引的使用要恰到好处,一般使用的原则为:(1)为主键所在的列创建索引。为经常进行连接,但是没有指定为外键的字段建立索引,而不经常连接的字段由数据库优化器自动建立索引。(2)在频繁进行排序或分组(即使用group by或order by操作)的字段上建立索引。(3)在条件表达式中经常用到的不同值较多的字段上建立索引,

48、在不同值较少的字段上不要建立索引,如性别字段就不需要建立索引。不要在在查询很少引用的列上创建索引。(4)如果经常同时使用多个字段排序,可以在这些字段上建立复合索引。要尽量使关键查询形成索引覆盖,其前导字段一定是使用最频繁的字段。(5)查看索引并删除不使用的索引,维护索引需要一定的硬盘空间和时间,需要频繁进行数据查入操作的数据库应该有较少的索引,需要频繁进行读取操作的数据库应该有更多的索引。(6)在聚集索引中,避免包括不必要的列,尽可能使用较小的数据类型,例如用varchar代替char。(7)考虑使用聚集索引来支持排序和范围查询,在为数据检索而优化表的时候,聚集索引应该支持对记录组的检索。为了

49、聚集键选择列或列组,其中聚集键根据需要经常排序的排序数据或对必须一起访问的记录进行分组。(8)具有高选择性的列是索引的好候选列,具有高密度的列是索引最糟糕的候选列。2.维护索引在创建索引后,必须维护索引以确保可以获得最佳的性能。经过一段时间后,数据会变得支离破碎,要根据组织环境对数据碎片进行整理。sql server 2000索引优化向导是一个你会马上喜欢上的工具。虽然并不完美,但是这个工具可以评估查询运行性能,并基于查询,提出数据表上是否该添加聚集/非聚集索引的建议。索引优化向导在sql server 2000事件探查器的“工具”菜单下可以找到。使用索引优化向导前,首先要创建工作负载。工作负

50、载表示一个事件跟踪或者t-sql脚本。在很多情况下,你应该选择使用事件跟踪,因为它反应了真实的数据库行为。工作负载的创建必须能体现一段时间内每天数据库使用的情况。这样,索引优化向导就可以基于这些实际运行的统计行为来提出有用的建议。当工作负载创建后,索引优化向导就很跟踪它。索引优化向导所做的就是从工作负载中提取行为样本,然后利用查询优化器进行分析。一旦索引优化向导分析完工作负载后(如果工作负载很大,这会运行几个小时那么长),基于对工作负载的分析,提出最佳的聚集/非聚集索引建议。另外,如果数据库上已经有索引了,并且索引优化向导发现这些索引不是最佳的,那么会建议你移除。3在数据库中放置索引用户可以指

51、定一个表的索引放置的位置。一个表的索引就该放置在与数据表不同的物理磁盘上,这样可以减少文件之间的磁盘争用。3.2.2优化sql语句的一些具体策略1.应用程序中,保证在实现功能的基础上,尽量减少对数据库的访问次数;通过搜索参数,尽量减少对表的访问行数,最小化结果集,从而减轻网络负担;能够分开的操作尽量分开处理,提高每次的响应速度;在数据窗口使用sql时,尽量把使用的索引放在选择的首列。2.算法的结构尽量简单;在查询时,不要过多地使用通配符如select * from t1语句,要用到几列就选择几列,如:select col1,col2 from t1;在可能的情况下尽量限制结果集行数,如:sel

52、ect top 300 col1,col2,col3 from t1,因为某些情况下用户是不需要那么多的数据的。不要在应用中使用数据库游标,游标是非常有用的工具,但比使用常规的、面向集的sql语句需要更大的开销;按照特定顺序提取数据的查找。3.避免使用不兼容的数据类型。例如float和int、char和varchar、binary和varbinary是不兼容的。数据类型的不兼容可能使优化器无法执行一些本来可以进行的优化操作。例如:select name from employee where salary60000在这条语句中,如salary字段是money型的,则优化器很难对其进行优化,因为

53、60000是个整型数。我们应当在编程时将整型转化成为货币型,而不要等到运行时转化。4.尽量避免在where子句中对字段进行函数或表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:(1)select * from t1 where f1/2=100应改为:select * from t1 where f1=100*2(2)select * from record where substring(card_no,1,4)=5378应改为:select * from record where card_no like5378%(3)select member_number,first_name

54、,last_name from members wheredatediff(yy,datofbirth,getdate()21应改为:select member_number,first_name,last_name from members wheredateofbirth0(2).select sum(t1.c1)from t1 where exists(select*from t2where t2.c2=t1.c2)两者产生相同的结果,但是后者的效率显然要高于前者。因为后者不会产生大量锁定的表扫描或是索引扫描。8.如果你想校验表里是否存在某条记录,不要用count(*)那样效率很低,而且浪费服务器资源。可以用exists代替。如:if(select count(*)from table_name where column_name=xxx)0可以写成:if exists(select*from table_name where column_name=xxx)9.经常需要写一个t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论