胡旺《数据库原理及应用》第1章概述v_第1页
胡旺《数据库原理及应用》第1章概述v_第2页
胡旺《数据库原理及应用》第1章概述v_第3页
胡旺《数据库原理及应用》第1章概述v_第4页
胡旺《数据库原理及应用》第1章概述v_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子科技大学计算机学院胡旺scuhuwang2020年5月2日星期六,数据库原理及应用第1章数据库系统概论,本章内容,生活中的数据库应用实例?校园学籍/成绩/财务信息管理系统银行业务管理系统电信业务管理系统火车、飞机的订票管理系统医院信息管理系统。,应用实例,有哪些共性?,医院信息管理系统(HIS)业务对象(实体)患者、医生、药品、处方。业务活动(联系)挂号、诊断、化验、检查、领药、交费。数据使用(检索)收入统计、病案分析、绩效评估、辅助决策。,应用实例,存在哪些问题?如何组织这些数据?如何存取这些数据?哪些人可以操作哪些数据?多人如何操作同一数据?出现故障后怎么办?如何分析数据和发现数据价值?,数据模型、规范化理论,数据定义和操作语言,安全性控制,并发性控制,数据恢复,数据仓库、数据挖掘(DIKV),课程内容,数据库技术研究和解决的问题数据管理的共性问题大量数据的有效组织和存储减少数据存储冗余;实现数据共享;保障数据安全;高效检索和处理数据;,课程介绍,数据库的地位数据库技术产生于六十年代末,是数据管理的最新技术,是计算机科学的重要分支。数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透。由于数据库系统具有数据结构化、最低冗余度、较高的程序与数据独立性等优点,较大的信息管理系统都是以数据库作为基础的。数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志,课程介绍,课程介绍,研究领域,本章学习目标掌握数据库的基本概念和相关术语;掌握数据库管理技术发展的3个阶段;了解数据库系统的一般构成;理解数据库系统模式结构;,概论,本章内容,数据、信息与数据处理数据库基本概念数据库数据库管理系统数据库系统关系列表和关系数据库,概论,概念术语,数据是一种符号序列,它的内容是事物特性的反映。数据是对现实世界的事物采用计算机能够识别、存储和处理的方式进行描述,或者说是计算机化的信息。数据的类型。不仅包括数字、字母、文字和其他特殊字符;而且还包括图形、图像、声音等多媒体数据。,概论,数据,概念术语,数据的语义描述一条数据(结构化数据)如下:(余颖,女,20,四川,销售部,2008,3000)语义解释:余颖是公司职员,女,20岁,四川人,2008年进入公司,月薪3000元;不懂语义则无法解释。,概论,数据,概念术语,信息是经过加工处理的数据,是人们消化理解了的数据,是数据的具体含义,是数据经过记录、分类、组织、连接或翻译后出现的意义。数据与信息既有联系又有区别。数据是信息的载体,而信息则是数据的具体含义。而且同一数据也可能有不同的解释。数据一般都可以表示成某种信息,但并非任何数据都能包含对人们来说有用的信息。信息是抽象的,不随数据设备所决定的数据形式而变化;而数据的表现形式却具有可选择性。,概论,信息,概念术语,数据处理是指将数据转换成信息的过程。数据处理的基本目的是从大量、已知数据出发、根据事物之间的固有联系和规律,通过分析归纳、演绎推导等手段,提出对人们有价值、有意义的信息,作为决策的依据。数据的简单处理包括组织、编码、分类、排序等;数据的复杂处理可以使用统计学方法、数学模型等对数据进行深层次的加工。,概论,数据处理,概念术语,数据库的定义数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合。数据库的特征数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小数据独立性较高易扩展,概论,数据库,概念术语,DBMS的定义一个能够让用户定义、创建和维护数据库以及控制对数据库访问的软件系统。DBMS组成:查询处理器和存储管理器。查询处理器主要有四部分:DDL编译器、DML编译器、嵌入式DML的预编译器及查询运行核心程序;存储管理器主要有四个部分:授权和完整性管理器、事务管理器、文件管理器及缓冲区管理器。,概论,数据库管理系统,概念术语,DBMS的功能:数据库定义功能提供数据定义语言(DDL,DataDefineLanguage)对各级数据模式进行精确定义,包括创建模式(schema)数据库(database)、表(table)、视图(view)等等。DBMS的功能:数据操纵功能数据库管理系统提供数据操纵语言(DML,DataManipulationLanguage),可以对数据库中的数据进行追加、插入、修改、删除、检索等操作。,概论,数据库管理系统,概念术语,DBMS的功能:数据库运行控制功能提供数据控制语言(DCL,DataControlLanguage)。数据库的恢复。在数据库被破坏或数据不正确时,系统有能力把数据库恢复到正确的状态。数据库的并发控制。在多个用户同时对同一个数据进行操作时,系统应能加以控制,防止破坏DB中的数据。数据完整性控制。保证数据库中数据及语义的正确性和有效性,防止任何对数据造成错误的操作。数据安全性控制。防止未经授权的用户存取数据库中的数据,以避免数据的泄露、更改或破坏。,概论,数据库管理系统,概念术语,DBMS的功能:数据库的维护功能包括数据库的初始数据的载入、转换功能、数据库的转储功能、数据库的重组织功能和性质监视、分析功能等。这些功能大都由各个实用程序来完成。例如装配程序(装配数据库)、重组程序(重新组织数据库)、日志程序(用于更新操作和数据库的恢复)、统计分析程序等。DBMS的功能:数据字典数据字典(DataDictionary,记为DD)。DD中存放着数据库三级结构的描述。对于数据库的操作都要通过查阅DD进行。现在有的大型系统中,把DD单独抽出来自成一个系统,成为一个软件工具,使得DD成为一个比DBMS更高级的用户和数据库之间的接口。,概论,数据库管理系统,概念术语,定义数据库系统(DatabaseSystem,简称DBS)是指在计算机系统中引入数据库后的系统构成。注:在不引起混淆的情况下常常把数据库系统简称为数据库。组成硬件系统数据库集合数据库管理系统及相关软件数据库管理员(DBA)用户,概论,数据库系统,概念术语,实体举例:在数据库系统中,一个实体可以是一个人、一个地方、一个事件或一个我们将要为其收集数据的物体。例如,在学校中,实体可能是学生、教师员工、课程等。所有的学生可以组成一个实体集。实体的属性:每个实体都有某些称为属性的特征,如学生实体可能包含以下属性:学生学号、姓名、性别、入学时间、专业方向等。每个属性必须恰当地命名,以便让用户能够知道它的内容,如学生实体,属性姓名可以存储为STU_NAME,性别可以存储为STU_SEX。,概论,实体与表,概念术语,表表是二维结构,它包括行和列。一个表包括一组相关的实体实体集。有时,术语实体集和表经常互换使用。,概论,实体与表,概念术语,关系数据库使用表来组织数据元素,每一个表对应于一个应用实体集,而每行则代表实体的一个事例。如医院管理系统中医生实体集对应数据库中的表Doctor,该表中的每一行则代表不同的医生。联系通过将来自于一个表的行标识符(医生编号)出现在一个表示诊断的行中,从而建立了该诊断与这个医生之间的联系。这种表之间通过属性进行联系,构成了关系列表,是关系数据库的一个基础。,概论,关系列表,概念术语,1970年,IBM研究室的TedCodd发表了一篇具有很大影响的关于关系数据库模型的论文,数据库系统发生了显著的变化。Codd提出数据库系统应为用户提供这样一种观点:即数据库系统是用一种称为“关系”的表来组织数据的。而在背后,可能有一个很复杂的数据结构,以保证对各种查询的快速响应。但与以前的数据库系统的用户不同,关系数据库系统的用户并不关心数据的存储结构,而是使查询能用很高级的语言来实现,从而大大提高了数据库开发人员的效率。,概论,关系数据库,概念术语,关系就是表。表的各列以属性开始,属性是列的入口。下表是一个名为Doctor(医生)的关系,记录的是医生的信息。,概论,关系数据库,概念术语,本章内容,数据管理的发展数据和数据管理技术数据管理技术的3个发展阶段人工管理阶段文件系统管理阶段数据库系统管理阶段,概论,产生与发展,数据管理技术面临挑战信息爆炸可能产生大量垃圾数据类型的多样化和一体化要求当前的数据管理还不能处理不确定或不精确的模糊信息数据库安全对数据库理解和知识获取的要求,概论,产生与发展,数据管理,数据管理技术面临挑战20世纪60年代,由于计算机的主要应用领域从科学计算转移到数据事务处理,促使数据管理应运而生,使数据管理技术出现一次飞跃。E.F.Codd提出关系数据库模型,在数据管理和理论方面产生了深远的影响。经过大批数据库专家十余年的不懈努力,数据库领域在理论和时间上取得令人瞩目的成就,它标志着数据管理的逐渐成熟,使数据管理技术出现了又一次飞跃。,概论,产生与发展,关键事件,时间:20世纪50年代中期以前计算机主要用于科学计算。外部存储器只有磁带、卡片和纸带等,还没有磁盘等直接存取存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理方式基本是批处理。特点:计算机系统不提供对用户数据的管理功能。数据不能共享。不单独保存数据。,概论,产生与发展,人工管理,时间:20世纪50年代后期至60年代中期。计算机不仅用于科学计算,还利用在信息管理方面。随着数据量的增加,数据的存储、检索和维护问题成为紧迫的需要,数据结构和数据管理技术迅速发展起来。外部存储器已有磁盘、磁鼓等直接存取的存储设备。软件领域出现了操作系统和高级软件。操作系统中的文件系统是专门管理外存的数据管理软件。数据处理方式有批处理,也有联机实时处理。,概论,产生与发展,文件系统,特点:数据以“文件”形式可长期保存在外部存储器的磁盘上。由于计算机的应用转向信息管理,因此对文件要进行大量的查询、修改和插入等操作。数据的逻辑结构与物理结构有了区别,但比较简单。程序与数据之间具有“设备独立性”,即程序只需用文件名就可与数据打交道,不必关心数据的物理位置。缺点:数据冗余。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。不一致性。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。数据联系弱。这是由于文件之间相互独立,缺乏联系造成的。,概论,产生与发展,文件系统,20世纪60年代后期数据管理技术进入数据库系统阶段。特点:数据结构不是面向单一的应用,而是面向全组织。数据冗余小,易扩充。数据独立于程序。统一的数据管理功能,包括数据的安全性控制、数据的完整性控制及并发控制。,概论,产生与发展,数据库系统,概论,产生与发展,阶段特点,概论,产生与发展,思考?为什么需要将程序与数据相分离?举例说明如何分离?,本章内容,概论,体系结构,数据库系统的物理组成数据库系统的分类数据库系统的模式构成,概论,体系结构,数据库系统在计算机系统中的位置,物理组成,概论,体系结构,组成部分硬件系统数据库集合数据库管理系统及相关软件数据库管理员用户,物理组成,概论,体系结构,硬件系统运行数据库系统的计算机需要有足够大的内存、足够大容量的磁盘等联机直接存取设备和较高的通道能力,以及支持对外存的频繁访问,还需要足够数量的脱机存储介质,如软盘、光盘、磁带等存放数据库的备份。数据库集合系统包括若干个设计合理、满足应用需要的数据库。,物理组成,概论,体系结构,数据库管理系统及相关软件数据库管理系统(DBMS)是为数据库建立、使用和维护而配置的软件,是数据库系统的核心组成部分。为满足自描述的需求,DBMS还要存储元数据,也就是关于数据的数据。此外支持数据库管理系统运行的操作系统、系统开发软件都是系统软件的组成。数据库管理员数据库管理系统一般需要专人来对数据库进行管理,这个人称为数据库管理员DBA。数据库管理员负责数据库系统建立、维护和管理。用户一类是最终用户,主要对数据库进行联机查询或通过数据库应用系统提供的界面来使用数据库,这些界面包括菜单、表格、图形和报表;另一类是专业用户,即应用程序员,他们负责设计应用系统的程序模块,对数据库进行操作。,物理组成,概论,体系结构,数据库管理员(DBA)职责决定数据库中的信息内容和结构决定数据库的存储结构和存取策略定义数据的安全性要求和完整性约束条件监控数据库的使用和运行周期性转储数据库:数据文件+日志文件系统故障恢复介质故障恢复监视审计文件数据库的改进和重组性能监控和调优数据重组数据库重构,物理组成,概论,体系结构,根据计算机系统的结构不同,数据库系统结构可分为:集中式客户机服务器式并行式分布式基于互联网,结构分类,概论,体系结构,集中式不但数据是集中的,数据的管理也是集中的,数据库系统的所有功能,从形式的用户接口到DBMS核心都集中在DBMS所在的计算机上。,结构分类,概论,体系结构,客户机/服务器数据库系统功能分为前端和后端。前端包括图形用户界面、表格生成、报表处理等工具;后端负责存取结构、查询计算和优化、并发控制及故障恢复等。前端与后端通过SQL或应用程序来接口。客户机主要负责数据表示服务,而服务器主要负责数据库服务。,结构分类,概论,体系结构,并行数据库系统并行体系结构的数据库是物理上连在一起的CPU,分为基本结构:共享内存(主存储器)结构(Shareed_Memory,简称SM结构)共享磁盘结构(Shared_Disk,简称SD结构)无共享资源结构(Shared_Nothing,简称SN结构)。,结构分类,概论,体系结构,分布式数据库系统(DDBS)分布式系统是多个物理上分散、逻辑上集中的数据库系统,系统中的数据分布存放在计算机网络的不同场地的计算机中。每一个场地都是独立的数据库系统,有自己的数据库、自己的用户、自己的CPU,运行自己的DBMS,执行局部应用,具有高度的自治性。同时各个场地的数据库系统又相互协作组成为一个整体。,结构分类,概论,体系结构,基于互联网的数据库系统数据库技术是计算机处理与存储数据的最有效、最成功的技术,而计算机网络的特点是资源共享,因此数据与资源共享这两种技术的结合即成为今天广泛应用的Web数据库(也叫网络数据库)。,结构分类,概论,体系结构,“型”和“值”的概念型(Type):对某一类数据的结构和属性的说明值(Value):是型的一个具体赋值例如:学生记录记录型:(学号,姓名,性别,系别,年龄,籍贯)该记录型的一个记录值:(900201,李明,男,计算机,22,江苏),模式结构,概论,体系结构,模式(Schema)数据库逻辑结构和特征的描述是型的描述反映的是数据的结构及其联系模式是相对稳定的模式的一个实例(Instance)模式的一个具体值反映数据库某一时刻的状态同一个模式可以有很多实例实例随数据库中的数据的更新而变动,模式结构,概论,体系结构,3层模式体系结构内模式(InternalSchema)概念模式(ConceptualSchema)外模式(ExternalSchema),模式结构,概论,体系结构,模式(也称概念模式或逻辑模式,数据库的总框架)数据库中全体数据的逻辑结构和特征的描述所有用户的公共数据视图,综合了所有用户的需求一个数据库只有一个模式模式的地位:是数据库系统模式结构的中间层与数据的物理存储细节和硬件环境无关与具体的应用程序、开发工具及高级程序设计语言无关模式的定义数据的逻辑结构(数据项的名字、类型、取值范围等)数据之间的联系数据有关的安全性、完整性要求DBMS提供数据定义语言DDL来描述逻辑模式。表结构的定义,模式结构,概论,体系结构,外模式(也称子模式、用户模式、视图)数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述;不同用户需求不同,看待数据的方式也可以不同,对数据保密的要求也可以不同,使用的程序设计语言也可以不同,因此不同用户的外模式的描述可以使不同的。数据库用户的数据视图,是模式的子集或变形,与某一应用有关的数据的逻辑表示sql定义的视图,模式结构,概论,体系结构,外模式的地位:介于模式与应用之间模式与外模式的关系:一对多外模式通常是模式的子集一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同外模式与应用的关系:一对多同一外模式也可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。外模式的用途保证数据库安全性的一个有力措施。每个用户只能看见和访问所对应的外模式中的数据,模式结构,概论,体系结构,内模式(也称存储模式)是数据物理结构和存储方式的描述是数据在数据库内部的表示方式记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)索引的组织方式数据是否压缩存储数据是否加密数据存储记录结构的规定要修改存储数据库的结构(例如,用倒排文件代替多链表),那么仅仅需要把这些修改反映在存储模式中;一个数据库只有一个内模式,模式结构,概论,体系结构,三级模式的示例,模式结构,概论,体系结构,三级模式的特点比较,模式结构,概论,体系结构,外模式/模式映射定义外模式与模式之间的对应关系每一个外模式都对应一个外模式模式映象映象定义通常包含在各自外模式的描述中保证数据的逻辑独立性当模式改变时,DBA修改有关的外模式模式映象,使外模式保持不变应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。数据库系统投入使用后,可能有必要修改模式(如增加新关系、属性、改变类型),这时:重新定义外模式/模式映象(DBA职责)=现存外模式不变=应用程序不变,模式结构,概论,体系结构,模式/内模式映射模式内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。例如,说明逻辑记录和字段在内部是如何表示的数据库中模式内模式映象是唯一的该映象定义通常包含在模式描述中保证数据的物理独立性当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式内模式映象,使模式保持不变应用程序不受影响。保证了数据与程序的物理独立性。当内模式发生变化时:重新定义模式/内模式映

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论