版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
------------------------------------☆自考乐园---心境随缘,诚与天下自考人共勉!!!☆自考乐园---分享快乐,你的快乐老家!!!☆自考乐园---引领成功,你的精神乐园!!!QQ群名:自考乐园_计算机网络;QQ群号:63803088------------------------------------数据库系统原理复习资料1.1.1数据、数据库、数据库管理系统、数据库系统数据(Data):描述事物的符号记录。数据与其语义是不可分的。数据库(DataBase,DB)长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库管理系统(DataBaseManagementSystem,DBMS)位于用户与操作系统之间的一层数据管理软件。主要功能包括以下几个方面:1.数据定义功能:数据定义语言(DataDefinitionLanguage,DDL)2.数据操纵功能:数据操纵语言(DataManipulationLanguage,DML)3.数据库的运行管理:统一管理、统—控制,以保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复。4.数据库的建立和维护功能:数据库初始数据的输入、转换功能,重组织、性能监视、分析功能等数据库系统(DataBaseSystem,DBS)指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。数据库管理员(DataBaseAdministrator,DBA)1.1.2数据管理技术的产生和发展数据库技术是应数据管理任务的需要而产生的。数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。数据管理则是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。数据管理技术经历了人工管理、文件系统、数据库系统三个阶段。人工管理阶段(20世纪50年代中期以前)特点:(1)数据不保存(2)应用程序管理数据,数据需要由应用程序自己管理,没有相应的软件系统负责数据的管理工作。应用程序中不仅要规定数据的逻辑结构,而且要设计物理结构,包括存储结构、存取方法、输入方式等。因此程序员负相很重。(3)数据不共享:数据是面向应用的,一组数据只能对应一个程序。(4)数据不具有独立性数据的逻辑结构或物理结构发生变化后,必须对应用程序做相应的修改。文件系统阶段(50年代后期-60年代中期)特点:(1)数据可长期保存(2)由文件系统管理数据相互独立的数据文件;“按文件名访问,按记录进行存取”的管理技术;记录内的结构性而整体无结构;存取方法转换使应用程序与数据之间有了一定的独立性;数据在存储上的改变不一定反映在程序上。(3)数据共享性差,冗余度大文件仍然是面向应用的;数据的冗余度大;数据的修改和维护困难(4)数据独立性差不容易扩充;数据与程序之间仍缺乏独立性;是一个无弹性的无结构的数据集合。数据库系统阶段(60年代-)特点:(1)数据结构化数据结构化是数据库与文件系统的根本区别。文件系统中,尽管其记录内部已有了某些结构,但记录之间没有联系。数据的最小存取单位是记录。数据库系统实现整体数据的结构化,描述数据时不仅要描述数据本身,还要描述数据之间的联系。数据不再针对其一应用,是面向全组织,具有整体的结构化。数据的最小存取单位是数据项。(2)数据的共享性高,冗余度低,易扩充面向整个系统的数据库系统中的数据可以被多个用户、多个应用共享使用。共享导致数据冗余度低,同时可避免数据之间的不相容性与不一致性。容易增加新的应用,这就使得数据库系统弹性大,易于扩充。(3)数据独立性高物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。也就是说,数据在磁盘上的数据库中怎样存储是由DBMS管理的、用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变了,应用程序不用改变。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不变。数据独立性是由DBMS的二级映象功能来保证的。(4)数据由DBMS统一管理和控制数据库的共享是并发的(Concurrency)。DBMS还必须提供的数据控制功能:(1)数据的安全性(Security)(2)数据的完整性(Integrity)正确性、有效性和相容性(3)并发(Concurrency)控制(4)数据库恢复(Recovery)数据库技术的发展是沿着数据模型的主线展开的。数据模型是现实世界数据特征的抽象。数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟。数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。根据应用的不同目的,数据模型划分为两类:概念模型(信息模型)按用户的观点来对数据和信息建模;主要用于数据库设计。数据模型按计算机系统的观点对数据建模;主要包括网状模型、层次模型、关系模型等,主要用于DBMS的实现。1.2.1数据模型的三个要素1.数据结构是所研究的对象类型的集合。与数据类型、内容、性质有关的对象(例如网状模型中的数据项、记录,关系模型中的域、属性、关系等)。与数据之间联系有关的对象(例如网状模型中的系型)。数据结构是对系统静态特性的描述。数据结构是刻画一个数据模型性质最重要的方面。2.数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。数据库主要有检索和更新(包括插入、删除、修改)两大类操作。数据操作是对系统动态特性的描述3.数据的约束条件是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。1.信息世界中的基本概念(1)实体(Entity)客观存在并可相互区别的事物称为实体。(2)属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。(3)码(Key)唯一标识实体的属性集称为码。(4)域(Domain)属性的取值范围称为该属性的域。(5)实体型(EntityType)用实体名及其属性集合来抽象和刻画同类实体,称为实体型。(6)实体集(EntitySet)同型实体的集合称为实体集。(7)联系(Relationship)在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。实体之间的联系通常是指不同实体集之间的联系。两个实体型之间的联系可以分为三类:一对一联系(1:1),如“班级-班长”一对多联系(1:n),如“班级-学生”多对多联系(m:n),如“课程-学生”1.2.2数据模型数据库领域中最常用的数据模型有四种层次模型(HierarchicalModel),如IBM的IMS系统网状模型(NetworkModel),如DBTG系统关系模型(RelationalModel),如Oracle,Sybase面向对象模型(ObjectOrientedModel)模式(schema):是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到具体的值。模式的一个具体值称为模式的一个实例(instance)。同一个模式可以有很多实例;模式是相对稳定的,而实例是相对变动的;模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。不同的DBMS在体系结构上通常都具有相同的特征,即采用三级模式结构并提供两级映象功能。模式(Schema)也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。它是数据库系统模式结构的中间层模式实际上是数据库数据在逻辑级上的视图。一个数据库只有一个模式。数据库模式以某一种数据模型为基础,统一综合地考虑了所有用户的需求,并将这些需求有机地结合成一个逻辑整体。模式定义包括数据的逻辑结构定义、数据之间的联系定义以及安全性、完整性要求的定义。DBMS提供模式定义语言(模式DDL)来严格地定义模式。外模式(ExternalSchema)也称子模式(Subshema)或用户模式,它是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式的子集。一个数据库可以有多个外模式。外模式是保证数据库安全性的一个有力措施。DBMS提供子模式定义语言(子模式DDL)来严格地定义子模式。内模式(InternalSchema)也称存储模式(Storageschema),一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。例如,记录的存储方式是顺序存储、按照B树结构存储还是按hash方法存储;索引按照什么方式组织;数据是否压缩存储,是否加密;数据的存储记录结构有何规定等。DBMS提供内模式描述语言(内模式DDL,或者存储模式DDL)来严格地定义内模式。优点:数据库的二级映象保证了数据库外模式的稳定性,从而从底层保证了应用程序的稳定性。数据和程序之间的独立性使得数据的定义和描述可以从应用程序中分离出去。另外,由于数据的存取由DBMS管理,用户不必考虑存取路径等细节,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。层次数据模型的优缺点优点:很少几条命令就能操纵数据库,使用简单;对于实体间联系是固定的,且预先定义好的应用系统,采用层次模型性能优于关系模型;良好的完整性支持;缺点:对于多对多联系,通过引入冗余数据解决;对插入和删除操作限制多;查询子女结点必须通过双亲结点;网状数据模型的优缺点优点:能够更为直接地描述现实世界;具有良好的性能,存取效率较高;缺点:其DDL(数据定义语言)语言极其复杂;数据独立性差;关系数据库的优缺点优点:建立在严格的数学概念的基础上的;关系模型的概念单一;关系模型的存取路径对用户透明,数据独立性高,安全保密性好;缺点:查询效率不如非关系数据模型;数据库管理系统它是数据库系统的核心,是为数据库建立、使用和维护而配置的软件;建立在操作系统的基础上,位于操作系统与用户之间的一层数据管理软件;负责对数据进行同一的管理和控制;DBMS的功能数据定义;数据操纵;数据库运行管理;数据组织、存储和管理;数据库的建立和维护;数据通道接口;DBMS的组成:数据定义语言及其翻译处理程序;数据操纵语言及其编译(或解释)程序;数据库运行控制程序;实用程序1:实体:客观存在并可相互区别的事物。 2:模式:数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。 3:候选码:关系中能唯一地标识一个元组的属性或属性组。 4:函数依赖:设R(U)是属性集U上的关系模式,X,Y是U的子集,若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数决定Y或Y函数依赖于X,记为XY。 5:事务:用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。1:数据库系统的特点:数据结构化,数据共享性高、冗余度低、易扩充,数据独立性高,数据由DBMS统一管理和控制。2:查询优化的一般准则:①选择运算应尽可能先做。②在执行连接前对关系适当地预处理。③把投影运算和选择运算同时进行④把投影同其前或其后的双目运算结合起来。⑤把某些选择同在它前面要执行的笛卡尔积结合起来成为一个连接运算。⑥找出公共子表达式。3:数据库设计的特点:数据库建设是硬件、软件、干件的结合,把结构设计和行为设计密切结合起来。4:事务的四个特性:原子性、一致性、隔离性和持续性。
1.数据库数据具有__永久存储有组织和可共享_三个基本特点。2.试述数据、数据库、数据库系统、数据库管理系统的概念。数据:描述事物的符号记录称为数据。数据的种类有文字、图形、图象、声音、正文等等。数据与其语义是不可分的。数据库:数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库系统:数据库系统(DBS)是指在计算机系统中引入数据库后的系统构成。数据库系统由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。数据库管理系统:数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。用于科学地组织和存储数据、高效地获取和维护数据。DBMS主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。3.使用数据库系统有什么好处?使用数据库系统的好处是由数据库管理系统的特点或优点决定的。使用数据库系统的好处很多,例如可以大大提高应用开发的效率,方便用户的使用,减轻数据库系统管理人员维护的负担等。总之,使用数据库系统的优点是很多的,既便于数据的集中管理,控制数据冗余,可以提高数据的利用率和一致性,又有利于应用程序的开发和维护。读者可以在自己今后的工作中结合具体应用,认真加以体会和总结。4.数据库管理系统是数据库系统的一个重要组成部分,它的功能包括数据定义功能数据操纵功能数据库的运行管理数据库的建立和维护功能。5.数据库系统是指在计算机系统中引入数据库后的系统,一般由数据库数据库管理系统(及其开发工具)应用系统数据库管理员构成。6.试述文件系统与数据库系统的区别和联系。件系统与数据库系统的区别:文件系统面向某一应用程序,共享性差、冗余度大,独立性差,纪录内有结构、整体无结构,应用程序自己控制。数据库系统面向现实世界,共享性高、冗余度小,具有高度的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力7.数据库管理技术的发展是与计算机技术及其应用的发展联系在一起的,它经历了三个阶段:__人工管理________阶段,_____文件系统_____阶段和______数据库系统____阶段。9.数据库具有数据结构化、最小的__冗余度________、较高的____数据独立性______等特点。数据库系统的主要特点有:一、数据结构化数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。二、数据的共享性高,冗余度低,易扩充数据库的数据不再面向某个应用而是面向整个系统,因此可以被多个用户、多个应用、用多种不同的语言共享使用。三、数据独立性高数据独立性包括数据的物理独立性和数据的逻辑独立性。数据库管理系统的模式结构和二级映象功能保证了数据库中的数据具有很高的物理独立性和逻辑独立性。四、数据由DBMS统一管理和控制数据库的共享是并发的共享,即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。数据库是长期存储在计算机内有组织的大量的共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。DBMS在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对系统进行恢复11.DBMS还必须提供____数据的安全性______保护、_数据的完整性_________检查、_____并发控制、数据库恢复等数据控制功能。12.数据库管理系统的主要功能有哪些?①数据库定义功能;②数据存取功能;③数据库运行管理;④数据库的建立和维护功能。13.模式(Schema)是数据库中全体数据的___逻辑结构_______和_____特征_____的描述,它仅仅涉及到______型____的描述,不涉及到具体的值。14.试述数据模型的概念、数据模型的作用和数据模型的三个要素。数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和操作手段的形式构架。一般地讲,数据模型是严格定义的概念的集合。这些概念精确地描述系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据操作和完整性约束三部分组成。①数据结构:是所研究的对象类型的集合,是对系统的静态特性的描述。②数据操作:是指对数据库中各种对象(型)的实例(值)允许进行的操作的集合,包括操作及有关的操作规则,是对系统动态特性的描述。③数据的约束条件:是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。15.三级模式之间的两层映象保证了数据库系统中的数据能够具有较高的__逻辑独立性________和__物理独立性________。16.试述概念模型的作用。17.根据模型应用的不同目的,可以将这些模型划分为两类,它们分别属于两个不同的层次。第一类是__________,第二类是__________。18.定义并解释概念模型中以下术语:实体,实体型,实体集,属性,码,实体联系图(E-R图)19.数据模型的三要素是指__________,__________,__________。实际数据库系统中所支持的主要数据模型是__________,__________,__________。20.试述网状、层次数据库的优缺点。21.试述关系模型的概念,定义并解释以下术语:(1)关系(2)属性(3)域(4)元组(5)主码(6)分量(7)关系模式22.数据模型中的__________是对数据系统的静态特征描述,包括数据结构和数据间联系的描述,__________是对数据库系统的动态特征描述,是一组定义在数据上的操作,包括操作的涵义、操作符、运算规则及其语言等。23.试述关系数据库的特点。24.用树型结构表示实体类型及实体间联系的数据模型称为__________模型,上一层的父结点和下一层的子结点之间的联系是的联系。25.试述数据库系统三级模式结构,这种结构的优点是什么?26.用有向图结构表示实体类型及实体间联系的数据模型称为__________模型,数据之间的联系通常通过__________实现。27.定义并解释以下术语:DDL、DML28.__________是目前最常用也是最重要的一种数据模型。采用该模型作为数据的组织方式的数据库系统称为__________。29.关系的完整性约束条件包括三大类:__________、__________和__________。30.什么叫数据与程序的物理独立性?什么叫数据与程序的逻辑独立性?为什么数据库系统具有数据与程序的独立性?31.试述数据库系统的组成。32.DBA的职责是什么?33.系统分析员、数据库设计人员、应用程序员的职责是什么?16、概念模型实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。17、概念模型数据模型18、实体:客观存在并可以相互区分的事物叫实体。实体型:具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类实体称为实体型。实体集:同型实体的集合称为实体集。属性:实体所具有的某一特性,一个实体可由若干个属性来刻画。码:唯一标识实体的属性集称为码。实体联系图:E-R图提供了表示实体型、属性和联系的方法:?实体型:用矩形表示,矩形框内写明实体名。?属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。?联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1,1:n或m:n)。19、数据结构数据操作完整性约束关系模型层次模型网状模型20、层次模型的优点主要有:1)模型简单,对具有一对多的层次关系的部门描述非常自然、直观,容易理解,这是层次数据库的突出优点;2)用层次模型的应用系统性能好,特别是对于那些实体间联系是固定的预先定义好的应用,采用层次模型来实现,其性能优于关系模型;3)次数据模型提供了良好的完整性支持。层次模型的缺点主要有:1)现实世界中很多联系是非层次性的,如多对多联系、一个结点具有多个双亲等,层次模型不能自然地表示这类联系。只能通过引入冗余数据或引入虚拟结点来解决。2)对插入和删除操作的限制比较多。3)查询子女结点必须通过双亲结点。网状模型:网状数据模型的优点主要有:1)能够更为直接地描述现实世界,如一个结点可以有多个双亲。2)具有良好的性能,存取效率较高。网状数据模型的缺点主要有:1)结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握。2)其DDL,DML语言复杂,用户不容易使用。由于记录之间联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径。因此,用户必须了解系统结构的细节,加重了编写应用程序的负担。21、关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。(1)关系:一个关系对应通常说的一张表。(2)属性:表中的一列即为一个属性;(3)域:属性的取值范围;(4)元组:表中的一行即为一个元组;(5)码:表中的某个属性组,它可以唯一确定一个元组;(6)分量:元组中的一个属性值;(7)关系模式:对关系的描述,一般表示为关系名(属性1,属性2,???,属性n)。22、数据结构数据操作23、关系数据模型具有下列优点:?关系模型与非关系模型不同,它是建立在严格的数学概念的基础上的。?关系模型的概念单一。无论实体还是实体之间的联系都用关系表示。操作的对象和操作的结果都是关系。所以其数据结构简单、清晰,用户易懂易用。?关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。当然,关系数据模型也有缺点,其中最主要的缺点是,由于存取路径对用户透明,查询效率往往不如非关系数据模型。因此为了提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统软件的难度。24、层次一对多25、数据库系统的三级模式结构由外模式、模式和内模式组成。(参见书上图1.29)外模式,亦称子模式或用户模式,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。模式,亦称逻辑模式,是数据库中全体数据的逻辑结构和特性的描述,是所有用户的公共数据视图。模式描述的是数据的全局逻辑结构。外模式涉及的是数据的局部的逻辑结构,通常是模式的子集。内模式,亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给DBMS管理,使用户能逻辑抽象地处理数据,而不必关心数据在计算机中的表示和存储。为了能够在内部实现这三个抽象层次的联系和转换,数据库系统在这三级模式之间提供了两层映象:外模式/模式映象和模式/内模式映象。正是这两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。26、网状指针27、DDL:数据定义语言。用来定义数据库模式、外模式、内模式的语言。DML:数据操纵语言。用来对数据库中的数据进行查询、插入、删除和修改的语句。28、关系模型关系数据库系统29、实体完整性参照完整性用户定义的完整性30、数据与程序的逻辑独立性:当模式改变时(例如增加新的关系、新的属性、改变属性的数据类型等),由数据库管理员对各个外模式/模式的映象作相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。数据与程序的物理独立性:当数据库的存储结构改变了,由数据库管理员对模式/内模式映象作相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性。数据库管理系统在三级模式之间提供的两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。31、数据库系统一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。32、负责全面地管理和控制数据库系统。具体职责包括:①决定数据库的信息内容和结构;②决定数据库的存储结构和存取策略;③定义数据的安全性要求和完整性约束条件;④监督和控制数据库的试用和运行;⑤数据库系统的改进和重组。33、系统分析员负责应用系统的需求分析和规范说明,系统分析员要和用户及DBA相结合,确定系统的硬件软件配置,并参与数据库系统的概要设计。数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。数据库设计人员必须参加用户需求调查和系统分析,然后进行数据库设计。在很多情况下,数据库设计人员就由数据库管理员担任。应用程序员负责设计和编写应用系统的程序模块,并进行调试和安装。1.试述关系模型的三个组成部分。2.关系数据模型中,二维表的列称为________,二维表的行称为________。3.试述关系数据语言的特点和分类。4.用户选作元组标识的一个候选码为________,其属性不能取________。5.定义并理解下列术语,说明它们之间的联系与区别:(1)域,笛卡尔积,关系,元组,属性(2)主码,候选码,外部码(3)关系模式,关系,关系数据库6.关系代数运算中,传统的集合运算有_____,_____,_____,_____。7.试述关系模型的完整性规则。在参照完整性中,为什么外部码属性的值也可以为空?什么情况下才可以为空?8.关系代数运算中,基本的运算是________,________,________,________,________。9.等值连接与自然连接的区别是什么?10.关系代数运算中,专门的关系运算有________,________,________。11.代数的基本运算有哪些?如何用这些基本运算来表示其他的关系基本运算?12.关系数据库中基于数学上的两类运算是________和________。13.关系代数中,从两个关系中找出相同元组的运算称为________运算。14.RS表示R与S的________。15.设有学生关系:S(XH,XM,XB,NL,DP)。在这个关系中,XH表示学号,XM表示姓名,XB表示性别,NL表示年龄,DP表示系部。查询学生姓名和所在系的投影操作的关系运算式是________________。16.在“学生-选课-课程”数据库中的3个关系如下:S(S#,SNAME,SEX,AGE);SC(S#,C#,GRADE);C(C#,CNAME,TEACHER),查找选修“数据库技术”这门课程学生的学生名和成绩,若用关系代数表达式来表示为________________。17.已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是________,系关系的外码是________,学生关系的主码是________,学生关系的外码是________。1、关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。2、属性记录或元组3、关系数据语言可以分为三类:关系代数语言,例如ISBL关系演算语言,包括:元组关系演算语言,例如APLHA,QUEL域关系演算语言,例如QBE具有关系代数和关系演算双重特点的语言例如SQL这些关系数据语言的共同特点是,具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。4、主码空值5、域:域是一组具有相同数据类型的值的集合。笛卡尔积:给定一组域D1,D2,…,Dn,这些域中可以有相同的。这组域的笛卡尔积为:D1×D2×…×Dn={(d1,d2,…,dn)|di?Di,i=1,2,…,n}其中每一个元素(d1,d2,…,dn)叫作一个n元组(n-tuple)或简称元组(Tuple)。元素中的每一个值di叫作一个分量(Component)。关系:在域D1,D2,…,Dn上笛卡尔积D1×D2×…×Dn的子集称为关系,表示为R(D1,D2,…,Dn)元组:关系中的每个元素是关系中的元组。属性:关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可以相同,为了加以区分,必须对每列起一个名字,称为属性(Attribute)。候选码:若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码(Candidatekey)。主码:若一个关系有多个候选码,则选定其中一个为主码(Primarykey)。外部码:设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外部码(Foreignkey),简称外码。基本关系R称为参照关系(Referencingrelation),基本关系S称为被参照关系(Referencedrelation)或目标关系(Targetrelation)。关系R和S可以是相同的关系。关系模式:关系的描述称为关系模式(RelationSchema)。它可以形式化地表示为:R(U,D,dom,F)其中R为关系名,U为组成该关系的属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象集合,F为属性间数据的依赖关系集合。关系:在域D1,D2,…,Dn上笛卡尔积D1×D2×…×Dn的子集称为关系,表示为R(D1,D2,…,Dn)关系是关系模式在某一时刻的状态或内容。关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。关系数据库:关系数据库也有型和值之分。关系数据库的型也称为关系数据库模式,是对关系数据库的描述,它包括若干域的定义以及在这些域上定义的若干关系模式。关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常就称为关系数据库。6、笛卡尔积并交差7、关系模型的完整性规则是对关系的某种约束条件。关系模型中可以有三类完整性约束:实体完整性、参照完整性和用户定义的完整性。其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。1)实体完整性规则:若属性A是基本关系R的主属性,则属性A不能取空值。2)参照完整性规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:?或者取空值(F的每个属性值均为空值);?或者等于S中某个元组的主码值。3)用户定义的完整性是针对某一具体关系数据库的约束条件。它反映某一具体应用所涉及的数据必须满足的语义要求。在参照完整性中,外部码属性的值可以为空,它表示该属性的值尚未确定。但前提条件是该外部码属性不是其所在关系的主属性。例如,在下面的“学生”表中,“专业号”是一个外部码,不是学生表的主属性,可以为空。其语义是,该学生的专业尚未确定。学生(学号,姓名,性别,专业号,年龄)专业(专业号,专业名)而在下面的“选修”表中的“课程号”虽然也是一个外部码属性,但它又是“选修”表的主属性,所以不能为空。因为关系模型必须满足实体完整性。课程(课程号,课程名,学分)选修(学号,课程号,成绩)8、并差笛卡尔积选择投影9、连接运算中有两种最为重要也最为常用的连接,一种是等值连接(equi-join),另一种是自然连接(Naturaljoin)。Θ为“=”的连接运算称为等值连接。它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。即等值连接为:RA=BS={trts|tr∈R∧ts∈S∧tr[A]=ts[B]}自然连接(Naturaljoin)是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且要在结果中把重复的属性去掉。即若R和S具有相同的属性组B,则自然连接可记作:RS={trts|tr∈R∧ts∈S∧tr[B]=ts[B]}10、选择投影连接11、在八种关系代数运算中,并、差、笛卡尔积、投影和选择五种运算为基本的运算。其他三种运算,即交、连接和除,均可以用五种基本运算来表达。交运算:R?S=R-(R-S)连接运算RS=?A?B(R?S)A?B除运算:R(X,Y)?S(Y,Z)=?X?-?X(?X???Y(S)?R)X、Y、Z为属性组,R中的Y和S中的Y可以有不同的属性名,但必须出自相同的域集。12、关系代数关系演算13、交14、自然连接15、π2,5(S)或πXM,DP(S)16、πSNAME,GRADE(S(SC(σCNAME='数据库技术'?)))17、系编号没有学号系编号1.试述SQL语言的特点。2.SQL的中文全称是________________。3.试述SQL的定义功能。4.SQL语言除了具有数据查询和数据操纵功能之外,还具有________和________的功能,它是一个综合性的功能强大的语言。5.在关系数据库标准语言SQL中,实现数据检索的语句命令是________。6.用SQL语句建立第2章习题5中的四个表。7.在SQL语言的结构中,________有对应的物理存储,而________没有对应的物理存储。8.针对上题中建立的四个表试用SQL语言完成第2章习题5中的查询。9.针对习题3中的四个表试用SQL语言完成以下各项操作:(1)找出所有供应商的姓名和所在城市。(2)找出所有零件的名称、颜色、重量。(3)找出使用供应商S1所供应零件的工程号码。(4)找出工程项目J2使用的各种零件的名称及其数量。(5)找出上海厂商供应的所有零件号码。(6)找出使用上海产的零件的工程名称。(7)找出没有使用天津产的零件的工程号码。(8)把全部红色零件的颜色改成蓝色。(9)由S5供给J4的零件P6改为由S3供应,请作必要的修改。10.关系R(A,B,C)和S(A,D,E,F),R和S有相同属性A,若将关系代数表达式:πR.A,R.B,S.D,S.F(R∞S)用SQL语言的查询语句表示,则为:SELECTR.A,R.B,S.D,S.FFROMR,SWHERE________________。11.什么是基本表?什么是视图?两者的区别和联系是什么?12.视图是从________中导出的表,数据库中实际存放的是视图的________。13.试述视图的优点。14.关系数据操作语言(DML)的特点是:操作对象与结果均为关系、操作的________、语言一体化并且是建立在数学理论基础之上。15.设有如下关系表R、S、T:R(BH,XM,XB,DWH)S(DWH,DWM)T(BH,XM,XB,DWH)(1)实现R∪T的SQL语句是__。(2)实现σDWH='100'?的SQL语句是__。(3)实现πXM,XB?的SQL语句是__。(4)实现πXM,DWH(σXB='女'?)的SQL语句是__。(5)实现R∞S的SQL语句是__。(6)实现πXM,XB,DWH(σXB='男'(R∞S))的SQL语句是__。16.所有的视图是否都可以更新?为什么?17.设有如下关系表R:R(NO,NAME,SEX,AGE,CLASS),主码是NO(1)插入一个记录(25,“李明”,“男”,21,“95031”);___。(2)插入“95031”班学号为30,姓名为“郑和”的学生记录;____。(3)将学号为10的学生姓名改为“王华”;_____。(4)将所有“95101”班号改为“95091”;_____。(5)删除学号为20的学生记录;____。(6)删除姓“王”的学生记录;___。18.哪类视图是可以更新的,哪类视图是不可更新的?各举一例说明。19.请为三建工程项目建立一个供应情况的视图,包括供应商代码(SNO)、零件代码(PNO)、供应数量(QTY)。针对该视图完成下列查询:(1)找出三建工程项目使用的各种零件代码及其数量。(2)找出供应商S1的供应情况。20.针对习题3建立的表,用SQL语言完成以下各项操作:(1)把对表S的INSERT权限授予用户张勇,并允许他再将此权限授予其他用户。(2)把查询SPJ表和修改QTY属性的权限授给用户李天明。21.在嵌入式SQL中是如何区分SQL语句和主语言语句的?22.在嵌入式SQL中是如何解决数据库工作单元与源程序工作单元之间通信的?23.在嵌入式SQL中是如何协调SQL语言的集合处理方式和主语言的单记录处理方式的?1、(1)综合统一。SQL语言集数据定义语言DDL、数据操纵语言DML、数据控制语言DCL的功能于一体。(2)高度非过程化。用SQL语言进行数据操作,只要提出“做什么”,而无须指明“怎么做”,因此无需了解存取路径,存取路径的选择以及SQL语句的操作过程由系统自动完成。(3)面向集合的操作方式。SQL语言采用集合操作方式,不仅操作对象、查找结果可以是元组的集合,而且一次插入、删除、更新操作的对象也可以是元组的集合。(4)以同一种语法结构提供两种使用方式。SQL语言既是自含式语言,又是嵌入式语言。作为自含式语言,它能够独立地用于联机交互的使用方式,也能够嵌入到高级语言程序中,供程序员设计程序时使用。(5)语言简捷,易学易用。2、结构化查询语言3、SQL的数据定义功能包括定义表、定义视图和定义索引。SQL语言使用CREATETABLE语句建立基本表,ALTERTABLE语句修改基本表定义,DROPTABLE语句删除基本表;使用CREATEINDEX语句建立索引,DROPINDEX语句删除索引;使用CREATEVIEW命令建立视图,DROPVIEW语句删除视图。4、数据定义数据控制5、SELECT6、对于S表:S(SNO,SNAME,STATUS,CITY);建S表CREATETABLES(SNOCHAR(3),SNAMECHAR(10),STATUSCHAR(2),CITYCHAR(10));P(PNO,PNAME,COLOR,WEIGHT);建P表CREATETABLEP(PNOCHAR(3),PNAMECHAR(10),COLORCHAR(4),WEIGHTINT);J(JNO,JNAME,CITY);建J表CREATETABLEJ(JNOCHAR(3),JNAMECHAR(10),CITYCHAR(10));SPJ(SNO,PNO,JNO,QTY);建SPJ表CREATETABLESPJ(SNOCHAR(3),PNOCHAR(3),JNOCHAR(3),QTYINT);7、基本表视图20、(1)把对表S的INSERT权限授予用户张勇,并允许他再将此权限授予其他用户。GRANTINSERTONTABLESTO张勇WITHGRANTOPTION;(2)把查询SPJ表和修改QTY属性的权限授给用户李天明。GRANTSELECT,UPDATE(QTY)ONTABLESPJTO李天明;21、在SQL语句前加上前缀EXECSQL。SQL语句的结束标志则随主语言的不同而不同。例如在PL/1和C中以分号(;)结束,在COBOL中以END-EXEC结束。22、数据库工作单元与源程序工作单元之间的通信主要包括:(1)SQL通信区SQLCA,用来向主语言传递SQL语句的执行状态信息,使主语言能够根据此信息控制程序流程。(2)主变量(HostVariable),1)用来实现主语言向SQL语句提供参数。2)将SQL语句查询数据库的结果交主语言进一步处理(3)游标(Cursor),解决集合性操作语言与过程性操作语言的不匹配通过游标逐一获取记录,并赋给主变量,交由主语言进一步处理。(详细解释参见《概论》3.7.2)23、用游标来协调这两种不同的处理方式。游标区是系统为用户开设的一个数据缓冲区,存放SQL语句的执行结果,每个游标区都有一个名字。用户可以通过游标逐一获取记录,并赋给主变量,交由主语言进一步处理。1.试给出各类关系系统的定义:最小关系系统;关系上完备的系统;全关系型的关系系统。2.试述全关系型系统应满足的十二条准则,以及十二条基本准则的实际意义和理论意义。3.试述查询优化在关系数据库系统中的重要性和可能性。4.试述查询优化的一般准则。5.试述查询优化的一般步骤。1、最小关系系统:一个系统可定义为最小关系系统,当且仅当它:(1)支持关系数据库(关系数据结构)。从用户观点看,关系数据库由表构成,并且只有表这一种结构。(2)支持选择、投影和(自然)连接运算,对这些运算不必要求定义任何物理存取路径。关系上完备的系统:这类系统支持关系数据结构和所有的关系代数操作(或者功能上与关系代数等价的操作)。全关系型的关系系统:这类系统支持关系模型的所有特征。即不仅是关系上完备的而且支持数据结构中域的概念,支持实体完整性和参照完整性。2、关系模型的奠基人E.F.Codd具体地给出了全关系型的关系系统应遵循的十二条基本准则。从实际意义上看,这十二条准则可以作为评价或购买关系型产品的标准。从理论意义上看,它是对关系数据模型的具体而又深入的论述,是从理论和实际紧密结合的高度对关系型DBMS的评述。准则0一个关系型的DBMS必须能完全通过它的关系能力来管理数据库。准则1信息准则。关系型DBMS的所有信息都应在逻辑一级上用一种方法即表中的值显式地表示。准则2保证访问准则。依靠表名、主码和列名的组合,保证能以逻辑方式访问关系数据库中的每个数据项(分量值)。准则3空值的系统化处理。全关系型的DBMS应支持空值的概念,并用系统化的方式处理空值。准则4基于关系模型的动态的联机数据字典。数据库的描述在逻辑级上应该和普通数据采用同样的表示方式,使得授权用户可以使用查询一般数据所用的关系语言来查询数据库的描述信息。准则5统一的数据子语言准则。准则6视图更新准则。所有理论上可更新的视图也应该允许由系统更新。准则7高级的插入、修改和删除操作。准则8数据物理独立性。无论数据库的数据在存储表示或存取方法上作任何变化,应用程序和终端活动都保持逻辑上的不变性。准则9数据逻辑独立性。当对基本关系进行理论上信息不受损害的任何改变时,应用程序和终端活动都保持逻辑上的不变性。准则l0数据完整性的独立性。关系数据库的完整性约束条件必须是用数据库语言定义并存储在数据字典中的,而不是在应用程序中加以定义的。准则11分布独立性。关系型DBMS具有分布独立性。准则12无破坏准则。如果一个关系系统具有一个低级(指一次一个记录)语言,则这个低级语言不能违背或绕过完整性准则。3、重要性:关系系统的查询优化既是RDBMS实现的关键技术又是关系系统的优点所在。它减轻了用户选择存取路径的负担。用户只要提出“干什么”,不必指出“怎么干”。查询优化的优点不仅在于用户不必考虑如何最好地表达查询以获得较好的效率,而且在于系统可以比用户程序的“优化”做得更好。可能性:这是因为:(1)优化器可以从数据字典中获取许多统计信息,例如各个关系中的元组数、关系中每个属性值的分布情况、这些属性上是否有索引、是什么索引,B+树索引还是HASH索引?唯一索引?组合索引?等等。优化器可以根据这些信息选择有效的执行计划,而用户程序则难以获得这些信息。(2)如果数据库的物理统计信息改变了,系统可以自动对查询进行重新优化以选择相适应的执行计划。在非关系系统中必须重写程序,而重写程序在实际应用中往往是不太可能的。(3)优化器可以考虑数十甚至数百种不同的执行计划,从中选出较优的一个,而程序员一般只能考虑有限的几种可能性。(4)优化器中包括了很多复杂的优化技术,这些优化技术往往只有最好的程序员才能掌握。系统的自动优化相当于使得所有人都拥有这些优化技术。4、下面的优化策略一般能提高查询效率:(1)选择运算应尽可能先做。(2)把投影运算和选择运算同时进行。(3)把投影同其前或其后的双目运算结合起来执行。(4)把某些选择同在它前面要执行的笛卡尔积结合起来成为一个连接运算。(5)找出公共子表达式。(6)选取合适的连接算法5、各个关系系统的优化方法不尽相同,大致的步骤可以归纳如下:(1)把查询转换成某种内部表示,通常用的内部表示是语法树。(2)把语法树转换成标准(优化)形式。即利用优化算法,把原始的语法树转换成优化的形式。(3)选择低层的存取路径。(4)生成查询计划,选择代价最小的。
1.在一个关系R中,若每个数据项都是不可再分割的,那么R一定属于_第一范式(1NF)。2.理解并给出下列术语的定义:函数依赖、部分函数依赖、完全函数依赖、传递依赖、候选码、主码、外码、全码(All-key)、1NF、2NF、3NF、BCNF、多值依赖、4NF。3.试由Armostrong公理系统推导出下面三条推理规则:(1)合并规则:若X→Z,X→Y,则有X→YZ(2)伪传递规则:由X→Y,WY→Z有XW→Z(3)分解规则:X→Y,Z?Y,有X→Z4.若关系为1NF,且它的每一非主属性都完全函数依赖于候选码,则该关系为2NF。6.如果X→Y和X→Z成立,那么X→YZ也成立,这个推理规则称为合并规则。7.如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选码,则称R为_3NF__关系模式。8.试举出三个多值依赖的实例。9.在函数依赖中,平凡函数依赖是可以根据Armstrong推理规则中的_自反_律推出的。11.关系模式规范化需要考虑数据间的依赖关系,人们已经提出了多种类型的数据依赖,其中最重要的是函数依赖和多值依赖。12.设关系模式为R(U,F),X,Y为属性集,X,Y?U。证明:(1)X?XF+(2)(XF+)F+=XF+(3)若X?Y则XF+?YF+(4)UF+=U13.设关系R(U),X,Y∈U,X→Y是R的一个函数依赖,如果存在X′∈X,使X′→Y成立,则称函数依赖X→Y是__部分_函数依赖。14.设关系模式为R(U,F),若XF+=X,则称X相对于F是饱和的。定义饱和集?F={X|X=XF+},试证明?F={XF+|X?U}。15.在关系模式R(A,B,C,D)中,存在函数依赖关系{A→B,A→C,A→D,(B,C)→A},则候选码是____A____,关系模式R(A,B,C,D)属于_(B,C)BCNF。16.在关系模式R(D,E,G)中,存在函数依赖关系{E→D,(D,G)→E},则候选码是___(E,G)_______,关系模式R(D,E,G)属于____(D,G)3NF________。17.在关系模式R(A,C,D)中,存在函数依赖关系{A→C,A→D},则候选码是_____A______,关系模式R(A,C,D)最高可以达到_____BCNF________。3、(1)已知X→Z,由增广律知XY→YZ,又因为X→Y,可得XX→XY→YZ,最后根据传递律得X→YZ。(2)已知X→Y,据增广律得XW→WY,因为WY→Z,所以XW→WY→Z,通过传递律可知XW→Z。(3)已知Z?Y,根据自反律知Y→Z,又因为X→Y,所以由传递律可得X→Z。14、证:1)证?F?{XF+|X?U}对任意A∈?F,由已知条件得A=AF+,因为A?U,A=AF+所以A∈{XF+|X?U}。2)证{XF+|X?U}??F对任意A∈{AF+|A?U},因为(AF+)F+=AF+(见习题7),令B=AF+,有BF+=B所以B∈?F即AF+∈?F,A∈?F得证。1.“三分________,七分________,十二分________”是数据库建设的基本规律。(问答题)2.试述数据库设计过程。3.十二分基础数据强调了数据的________、________、________和________是数据库建设中的重要的环节。4.试述数据库设计过程的各个阶段上的设计描述。5.试述数据库设计过程中结构设计部分形成的数据库模式。6.规范设计法从本质上看仍然是手工设计方法,其基本思想是________和________。7.试述数据库设计的特点。8.数据库的生命周期可分为两个阶段:一是数据库需求分析和________;二是数据库实现和________。9.数据库设计分为以下六个阶段_______、________、________、________、________和________。10.需求分析阶段的设计目标是什么?调查的内容是什么?11.数据字典的内容和作用是什么?12.数据库实施阶段包括两项重要的工作,一项是________,另一项是应用程序的________和________。13.什么是数据库的概念结构?试述其特点和设计策略。14.根据模型应用的不同目的,可以将这些模型划分为两类,它们分别属于两个不同的层次。第一类是________,第二类是________。15.什么叫数据抽象?试举例说明。16.用________方法来设计数据库的概念模型是数据库概念设计阶段广泛采用的方法。17.试述数据库概念结构设计的重要性和设计步骤。18.概念模型有以下特点:________、________、________、________。19.客观存在并可相互区别的事物称为________,它可以是具体的人、事、物,也可以是抽象的概念或联系。20.什么是E-R图?构成E-R图的基本要素是什么?21.唯一标识实体的属性集称为________。22.为什么要视图集成?视图集成的方法是什么?23.实体之间的联系有________、________、________三种。一对一一对多多对多24.什么是数据库的逻辑结构设计?试述其设计步骤。25.如果两个实体之间具有M:N联系,则将它们转换为关系模型的结果是________个关系。26.试述把E-R图转换为DBTG模型和关系模型的转换规则。27.ER模型是对现实世界的一种抽象,它的主要成分是________、联系和________。(问答题)28.你能给出由E-R图转换为IMS模型的转换规则吗?29.需求调查和分析的结果最终形成________,提交给应用部门,通过________后作为以后各个设计阶段的依据。30.规范化理论对数据库设计有什么指导意义?31.________表达了数据和处理的关系,________则是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。32.试述数据库物理设计的内容和步骤。33.数据字典中应包括对以下几部分数据的描述:________、________、________。34.你能给出关系数据库物理设计的主要内容吗?例如ORACLE数据库物理设计的内容。35.数据输入在实施阶段的重要性是什么?如何保证输入数据的正确性?36.各分E-R图之间的冲突主要有三类:________、________和________。属性冲突命名冲突结构冲突37.什么是数据库的再组织和重构造?为什么要进行数据库的再组织和重构造?38.在E-R模型向关系模型转换时,M:N的联系转换为关系模式时,其码包括________。39.关系数据库的规范化理论是数据库________的一个有力工具;ER模型是数据库的________设计的一个有力工具。40.数据库的物理设计通常分为两步:(1)确定数据库的________,(2)对其进行评价,评价的重点是________和________。41.任何DBMS都提供多种存取方法。常用的存取方法有________、________、________等。42.确定数据库存储结构主要指确定________、________、________、________、________等数据的存储安排和存储结构,确定系统配置参数等。43.________是数据库中存放数据的基本单位。44.在数据库运行阶段,对数据库经常性的维护工作主要是由________完成的。1、技术管理基础数据2、这里只概要列出数据库设计过程的六个阶段:1)需求分析2)概念结构设计3)逻辑结构设计4)数据库物理设计5)数据库实施6)数据库运行和维护这是一个完整的实际数据库及其应用系统的设计过程。不仅包括设计数据库本身,还包括数据库的实施、数据库运行和维护。设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。3、整理收集组织不断更新4、各阶段的设计要点如下:1)需求分析:准确了解与分析用户需求(包括数据与处理)。2)概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。3)逻辑结构设计:将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化。4)数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。5)数据库实施:设计人员运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。6)数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。5、数据库结构设计的不同阶段形成数据库的各级模式,即:在概念设计阶段形成独立于机器特点,独立于各个DBMS产品的概念模式,在本篇中就是E-R图;?在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式;然后在基本表的基础上再建立必要的视图(View),形成数据的外模式;?在物理设计阶段,根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。同学们可以参考《概论》上图6.4(P.209)。图中概念模式是面向用户和设计人员的,属于概念模型的层次;逻辑模式、外模式、内模式是DBMS支持的模式,属于数据模型的层次。可以在DBMS中加以描述和存储。6、过程迭代逐步求精7、数据库设计既是一项涉及多学科的综合性技术又是一项庞大的工程项目。其主要特点有:1)数据库建设是硬件、软件和干件(技术与管理的界面)的结合。2)从软件设计的技术角度看,数据库设计应该和应用系统设计相结合,也就是说,整个设计过程中要把结构(数据)设计和行为(处理)设计密切结合起来。8、设计阶段运行阶段9、需求分析概念结构设计逻辑结构设计物理设计阶段数据库实施阶段数据库运行和维护阶段10、需求分析阶段的设计目标是通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。调查的内容是“数据”和“处理”,即获得用户对数据库的如下要求:(1)信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。(2)处理要求。指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。(3)安全性与完整性要求。11、数据字典是系统中各类数据描述的集合。数据字典的内容通常包括:?数据项?数据结构?数据流?数据存储?处理过程五个部分其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构。数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。数据字典的作用:数据字典是关于数据库中数据的描述,在需求分析阶段建立,是下一步进行概念设计的基础,并在数据库设计过程中不断修改、充实、完善。(详细参考《概论》书上6.2.3。注意,数据库设计阶段形成的数据字典与第十一章DBMS中的数据字典不同,后者是DBMS关于数据库中数据的描述,当然两者是有联系的)。12、组织数据入库编码调试13、概念结构是信息世界的结构,即概念模型,其主要特点是:(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。(4)易于向关系、网状、层次等各种数据模型转换。概念结构的设计策略通常有四种:?自顶向下。即首先定义全局概念结构的框架,然后逐步细化;?自底向上。即首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构;?逐步扩张。首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构;?混合策略。即将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。14、概念模型数据模型15、数据抽象是对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。如分类这种抽象是:定义某一类概念作为现实世界中一组对象的类型。这些对象具有某些共同的特性和行为。它抽象了对象值和型之间的“ismemberof”的语义。在E-R模型中,实体型就是这种抽象。例如在学校环境中,李英是老师,表示李英是教师类型中的一员,则教师是实体型,李英是教师实体型中的一个实体值,具有教师共同的特性和行为:在某个系某个专业教学,讲授某些课程,从事某个方向的科研。16、实体—联系方法(E-R)17、重要性:数据库概念设计是整个数据库设计的关键,将在需求分析阶段所得到的应用需求首先抽象为概念结构,以此作为各种数据模型的共同基础,从而能更好地、更准确地用某一DBMS实现这些需求。设计步骤:概念结构的设计方法有多种,其中最经常采用的策略是自底向上方法,该方法的设计步骤通常分为两步:第1步是抽象数据并设计局部视图,第2步是集成局部视图,得到全局的概念结构(如图6.9所示,P216)。18、真实性易理解性易修改性易转换性19、实体20、E-R图为实体-联系图,提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。构成E-R图的基本要素是实体型、属性和联系,其表示方法为:?实体型:用矩形表示,矩形框内写明实体名;?属性:用椭圆形表示,并用无向边将其与相应的实体连接起来;?联系:用菱形表示,菱形框内写明联系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年辽宁冶金职业技术学院单招职业适应性测试试题及答案解析
- 2025年四川电影电视学院单招综合素质考试试题及答案解析
- 2025年长春金融高等专科学校单招综合素质考试题库及答案解析
- 2026年青岛职业技术学院单招综合素质考试题库及答案解析
- 2026南平建瓯市供销社公开招聘企业工作人员4人考试备考题库及答案解析
- 2025年安徽省高职单招职业适应性测试考试试题及答案解析
- 2025年江西师范高等专科学校单招综合素质考试题库及答案解析
- 2025年赤峰工业职业技术学院单招职业技能考试题库及答案解析
- 2025年六盘水幼儿师范高等专科学校单招职业适应性测试题库及答案解析
- 2026年成都农业科技职业学院单招综合素质考试题库及答案解析
- 2026春统编版二年级下册道德与法治教学设计(附目录)
- 2026年-(教科版2026新教材)科学一年级下册全册教学设计-新版
- 2026届云南省普通高中学业水平选择性考试调研测试政治试题
- 2026年就业市场:挑战与机遇并存高校毕业生就业指导与策略
- 2026中国科学院机关招聘应届毕业生5人笔试备考试题及答案解析
- 多囊卵巢综合征中西医结合诊疗指南(2025年版)
- 电梯安装安全培训讲议课件
- 2026年济南工程职业技术学院单招综合素质笔试模拟试题带答案解析
- 桌面盆栽行业分析报告
- 森林防火物资储备库建设标准
- 无人机救援方案
评论
0/150
提交评论