




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,第1章 数据库技术,数据库技术,电子教案 版本6.6,内容概述,教学进程,1.1 数据库技术的发展 1.2 数据库技术分类 1.3 数据库系统开发工具 1.4 数据库应用系统 1.5 数据库技术的研究方向 1.6 本章小结,1.1.1 数据库技术,数据库技术的概念:通过研究数据库的结构、存储、设计、管理以及应用的基本理论和实现方法,并利用这些理论来实现对数据库中的数据进行处理、分析和理解的技术。即:数据库技术是研究、管理和应用数据库的一门软件科学。 数据库技术的内容:通过对数据的统一组织和管理,按照指定的结构建立相应的数据库和数据仓库;利用数据库管理系统和数据挖掘系统设计出能够实现对数据库中的数据进行添加、修改、删除、处理、分析、理解、报表和打印等多种功能的数据管理和数据挖掘应用系统;利用应用管理系统最终实现对数据的处理、分析和理解。 数据库技术的特点: (1)数据库的定义、操纵、控制和统一管理能力。 (2)数据的快速处理、分析和理解能力。 (3)数据库技术与Web技术的融合。 (4)数据库技术的分布式并行处理能力。 (5)数据库技术的安全、完整和并发控制机制。 (6)数据库技术的数据恢复机制。,1.1.2 数据与数据库,数据(Data):用来记录或者标识事物的本质特征和物理状况的一串物理符号序列。 类型: 数值型数据:表示年龄、工资和单价等大小多少的数据, 字符型数据:表示人名、地名和物品等名称的数据, 日期型数据:表示工作、出生和入党日期等有关日期的数据, 逻辑型数据:表示结婚、党员等各种逻辑判断结果的数据, 音频数据:表示语音、声效和音乐的声音数据, 图形数据:表示直线、三角形和圆形等各种几何图形的数据, 图像数据:表示人物照片、风景照片和遥感图像的数据, 视频数据:表示电影剪辑的数据, 动画数据:表示计算机三维动画的数据, 多媒体数据(Multimedia Data):是指文本数据、声音数据、图形数据、图像数据、视频数据和动画数据等多种媒体的集合。,1.1.2 数据与数据库,数据库(Database,DB):组织、存储、管理数据的电子仓库,它是存储在计算机内的通用化的、综合性的数据的集合。其基本思想就是对所有的数据实行统一的、集中的、独立的管理,数据库独立于程序而存在,并可以提供给各类不同的用户共享资源。其特点是它具有统一的结构、较小的冗余度,较高的数据独立性和易扩展性。 多媒体数据库(Multimedia Database,MDB):能够支持文本数据、声音数据、图形数据、图像数据、视频数据和动画数据等多媒体数据的数据库。 数据库是数据的归宿。各种数据经过结构化处理后,按照统一的管理方式,最终均存入数据库中,以共享的方式提供给用户。,1.1.3 数据处理与数据库管理系统,数据处理(Data Processing):指人们在管理数据时,对大量杂乱无章的原始数据进行收集、整理、存储、分类、排序、检索、维护、计算、统计和传输等一系列加工处理的过程。 数据处理的过程:数据的传输、数据的收集、数据的存储、数据的加工和数据的输出等五大步骤。数据处理的目的是获得我们所需要的资料和整理出对人类社会生活有价值的数据(即:信息),作为在社会活动中做出正确决策的依据。 数据管理技术的六个阶段:人工管理阶段、文件管理阶段、数据库系统阶段、数据仓库阶段、数据挖掘阶段和数据分析阶段。前三个阶段是主要代表性阶段。,(1)人工管理阶段,人工管理阶段:是用于原始计算机的数据处理的初级阶段。数据处理的基本上由程序员手工方式处理。数据处理速度慢,准确性差。 特点: 数据结构:没有经过统一的结构化处理。 数据存储:硬件系统的存储设备容量和性能受限,一般不予保存。 数据管理:软件的数据管理能力较弱,数据需要程序自己管理。 数据共享:一个程序对应一组数据,使得数据之间不能共享。 数据冗余:由于不能共享,存在大量的冗余数据,浪费存储空间。 数据独立:数据和程序不具有相互独立性。 如果数据库的逻辑结构或者 物理结构发生变化时, 应用程序必须做相应的修改。 数据挖掘:没有数据仓库和数据挖掘技术,不具有数据挖掘能力。 数据分析:没有数据分析引擎和工具,不具有数据分析能力。 可视分析:没有出现数据可视化技术,不具有数据可视化分析能力。 人工管理阶段应用程序与数据之间的对应关系如图1.1表示。,(2)文件管理阶段,文件管理阶段:数据以文件方式存储,使用专门的文件管理系统按照一定的规则和方法对数据文件进行统一的组织、存储和管理,从而加快了数据处理速度,提高了的准确性。 特点: 数据结构:实现了记录格式的结构化处理,没有整体结构化存储。 数据存储:硬件系统的存储性能得到提高,数据处理可以永久保存。 数据管理:软件提供了文件管理系统,程序和数据之间可以按照文件系统提供的存取方法进行管理。 数据共享:数据之间不能共享。只是数据的管理及数据的存取由指定的文件系统来进行管理。 数据冗余:仍然大量的冗余数据,浪费存储空间。 数据独立:数据和程序不具有相互独立性。 数据挖掘:没有数据仓库和数据挖掘技术,不具有数据挖掘能力。 数据分析:没有数据分析引擎和工具,不具有数据分析能力。 可视分析:简单的数据绘图功能,不具有数据可视化分析能力。 文件管理阶段应用程序与数据之间的对应关系如图1.2表示。,(3)数据库系统阶段,数据库系统阶段:把所有的数据文件组织起来,按照指定的数据结构构成多个数据库,然后对所有的数据进行有组织的统一结构化管理。使得数据处理的速度更快,准确性更高。 特点: 数据结构:实现整体数据的结构化,按照统一的结构进行存储。 数据存储:硬件系统提供功能完善的快速存储设备,永久保存。 数据管理:软件系统提供功能完善的DBMS。数据由DBMS统一管理控制。 提供数据安全性保护、完整性约束、并发控制和数据恢复。 数据共享:程序和数据具有较高的共享性,使得数据可以共享。 数据冗余:存在较少的冗余数据,节省存储空间。 数据独立:具有较高的数据和程序的独立性。如果数据库的逻辑结构或 者物理结构发生变化时,应用程序可以不作修改, 或者作少量的调整,从而减轻了程序员的工作,容易扩充。 数据挖掘:DW和DM技术的雏形阶段,不具有数据挖掘能力。 数据分析:数据分析引擎和工具不完善,基本不具有分析能力。 可视分析:可视化技术雏形阶段,基本不具有可视化分析能力。 数据库系统阶段应用程序与数据之间的对应关系如图1.3表示。,1.1.3 数据处理与数据库管理系统,数据库管理系统(Database Management System,DBMS):是提供给用户,并帮助用户建立、使用和管理数据库的软件系统。它的职能是维护数据库、接受和完成用户提出的访问数据库中数据的各种请求。用户建立数据库的目的是使用数据库,并对数据库中的数据进行加工处理、分析和理解,数据库管理系统是帮助用户达到这一目的的工具和手段。 数据库管理系统是数据库系统的核心。它是建立在操作系统的基础上 ,位于操作系统与用户之间的一个数据管理软件,负责对数据库进行统一的管理和控制。数据库管理系统保证了数据的安全性和完整性,同时提供了数据的并发控制和数据恢复机制。,1.1.3 数据处理与数据库管理系统,数据库管理系统的主要功能: 数据定义:数据定义语言DDL。 数据操纵:数据操纵语言DML。对数据库进行插入、修改、删除、查询、表报和打印等基本操作。 数据控制:实现对数据库的安全性、完整性、数据并发和数据恢复等进行保护控制的数据控制语言DCL,保证数据的安全、正确、完整和有效。 数据存储:对数据库的统一组织、存储和管理,确定数据库文件的存储结构和访问方式,减少数据冗余,提高数据库的利用率。 数据接口:数据库管理系统需要提供数据接口功能。用于实现不同软件系统的之间的数据传输。 运行管理:是DBMS的核心内容。包括数据定义、数据操纵、数据控制和数据存贮的具体实现;对数据库的安全性、完整性、并发控制和数据恢复的控制管理;数据库的备份、重组织、性能的监视与分析等内部维护等。对数据库的所有访问操作都要在DBMS的相应控制程序的统一管理之下进行,以保护和保证数据的安全性、完整性、一致性和共享性。,1.1.4 信息与数据库系统,信息:是指对原始数据经过数据处理后所得到的对人类社会实践和生产活动产生决策影响的有价值的数据。信息是对客观事物本质的反映,是我们在社会活动中做出正确决策的重要依据。 信息和数据的关系:信息来源于数据,数据是信息的载体。信息的价值在于,它为人类在认识世界和改造世界的活动中,提供了重要依据。,1.1.4 信息与数据库系统, 数据库系统(Database System,简称DBS):是指在计算机系统中引入数据库后,由数据库、数据库管理系统、数据库应用系统、数据库设计员、数据库管理员和用户等构成的完整的计算机系统。 数据库系统的组成:由硬件、软件和人员三大部分组成。 (1)硬件:计算机硬件环境和专门于数据库管理的硬件设备。 (2)软件:操作系统、数据库开发工具(DBMS、数据库程序设计主语言和数据库专用工具)和数据库应用系统。 (3)人员:包括数据库设计员、数据库管理员、数据库程序员和用户。,1.1.4 信息与数据库系统,数据库管理员(Database Administrator,DBA):是指利用数据库管理系统对数据库进行建立、修改、使用和维护等工作的专门管理人员。 DBA的职责: (1)决定数据库中的信息内容和结构。 (2)决定数据库的存储结构和存取策略。 (3)定义数据的安全性要求和完整性约束条件。 (4)监控数据库的使用和运行。 (5)数据库的改进和重组重构。 数据库系统的组成如图1.6所示。数据库系统与计算机系统的关系如图1.7所示。,1.2 数据库技术分类,数据模型(Data Model):是指反映客观事物本质特征及其相互关系的实际问题的模拟和抽象。即:数据模型是针对实际问题,研究数据以及数据之间的关系,并最终解决实际问题的方法和步骤。它是一组概念或者公式的集合。在数据库技术中,用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。 数据库中数据集合之间存在着三种基本的关系: (1)一对一关系。记为1:1。(如:夫妻关系) (2)一对多关系。记为1:n。(如:班级与学生的关系) (3)多对多关系。记为n:m。(如:商店与顾客的关系) 建立数据模型应该满足要求: (1)数据模型能够真实的模拟实际问题。 (2)数据模型本身容易理解。 (3)数据模型易于计算机实现。,1.2 数据库技术分类,数据模型的组成要素 数据结构:是对数据库中数据对象的本质特性的静态描述。数据结构用于描述数据库的组成对象以及它们之间的关系。具体内容: 1)对象的集合:包括对象的特征、类型、内容等。 2)对象之间的关系:如对象之间的一对一、一对多和多对多关系。 数据操作:数据操作是指对数据库中数据对象所执行的操作和操作规则的集合。具体操作内容如下: 1)检索操作:对数据的索引、排序和查找等 2)更新操作:数据对象的插入、修改和删除等操作。 完整性约束:是指为了保证数据的正确性、有效性、相容性和完整性,用以限定符合数据模型的数据库状态以及状态的变化,而约定的数据及其联系所具有的一系列制约条件和约束规则。 数据完整约束规则:实体完整性、参照完整性和用户定义完整性等。,1.2 数据库技术分类,数据模型可分为三大类: 概念模型 逻辑模型 物理模型,(1)概念模型,概念模型:是指利用具有较强语义表达能力,而且能够方便、直接地表达应用中的各种语义知识的专用描述工具(实体-联系方法(E-R方法),按照统一的语法格式和描述方法,对现实世界中的实际问题进行抽象后,而建立的简单、整洁、清晰、易于理解的独立于DBMS逻辑结构的模型结构。 E-R模型:是指使用实体-联系方法所建立的用于描述概念模型中实体以及实体之间的关系的图形表示。即:E-R图。 用E-R图来描述概念模型。 概念模型:是数据库设计人员进行数据库设计的经典工具,是数据库设计人员和用户之间进行交流的语言。,(2)逻辑模型,逻辑模型:是指为了能够用DBMS实现用户需求,将其概念结构进一步转化为,适用于DBMS表示和实现的相应的数据模型。 常用模型:层次模型、网状模型、关系模型、面向对象模型、多维模型、数据挖掘模型和可视分析模型等。前四个是主要模型。 层次模型:针对数据问题,根据所研究的数据的特点,把它分成若干个集合,把具有图1.8的树状结构的数据模型称为层次模型 层次模型的结构特点:是某一特定集合(根节点)与下一层的若干集合有关系,而下一层的每一个集合又与位于它的下一层的集合有关系,依次下去。因此,层次模型结构就是由特定集合开始向下逐层辐射枝叶的一棵倒放的树。这是常用的数据结构之一,称为树状结构。层次模型的节点表示记录类型的数据,节点之间是一对多的关系。 层次模型的结构表示如图1.8。,(2)逻辑模型,网状模型:如果对我们所处理的数据,根据其特点,把它分成若干个集合。把具有图1.9的网状结构的数据模型称为网状模型(Network Model)。 网状模型的特点:是各个集合之间存在的关系构成一种网状结构。这种模型结构比较复杂。如学校中教师、学生和课程之间的关系。全国的电话网中各个电话用户之间的关系等。 网状模型的节点表示记录类型的数据,节点之间是多对多的关系。,(2)逻辑模型,关系模型(Relational Model):如果讨论的实际问题所涉及的各个数据之间的关系,能够表示成二维表格的形式,则具有这种结构的数据模型称为关系模型。 关系模型的特点:具有关系模型的数据,均可以用一张二维表格表示。实际上,每一张二维表格就是一种关系。关系的每一行称为一个元组或者记录。 关系的特征: 关系中的每一列数据具有同一类型。 关系的每一列都是不可再分的基本数据项,即满足第一范式(1NF) 关系中的每一列具有与其它列不重复的名字。 关系中的任意两个记录不能重复。 关系中一般都有一个属性能唯一标识一个元组。 表中的行、列的次序可以交换。,关系模型,职工信息表对应的关系模型(关系模式):如表1.1。 职工(编号,姓名,性别,年龄,职称,婚否,工资) 关系模型的结构:在关系模型中,需要加工处理的数据之间的关系均可以表示成二维表格,即具有二维表格格式的逻辑结构。 数据项:关系模型的每一列称为数据项,它用来描述每一列数据的共同属性。数据项也称为属性(Attribute)。它是关系数据库系统中的最基本的不可再细分的数据单位。属性的取值范围,称为域。,关系模型,【例1.1】表1.2中,学生信息表是关系模型。性别的域(即:性别的取值范围)为男和女。表1.3中,职工工资表不是关系模型,但是,我们可以把它转换为关系模型。即:使用基本工资、工龄工资和津贴三个数据项去替代原来的工资数据项。,关系模型,属性型:关系模型中,每一列数据都具有相同的数据类型。通常为了描述这些数据的共同属性而起的名字,称为属性型。亦称为属性名。 例如:编号、姓名和性别等。而所有属性名的集合就是关系模型的结构,即:关系模式(Relation Schema)。关系模型的结构是静态的。 属性值:关系模型所对应的关系表中每一列的数据称为属性的值。 例如:A00001、李明明和男等。而所有属性名和属性值的集合就是关系(Relationship)。关系是动态的。 属性:每一列的属性名和属性值构成的整体称为属性。 例如:表1.1中,每一列均为一个属性。姓名是一个字符型属性名,李明明和欧阳庆等是属性值;年龄是一个数值型属性名,26和25等是属性值。 元组:关系中的每一行(即记录)。描述一个个体的数据集合。它是由若干属性的属性值组成。组成元组的所有属性的长度总和称为元组的长度。根据元组在关系中的先后顺序,进行的自动编号,称为记录号。 例如:在表1.2中,99002、李四、18、和外语系所在元组的记录号分别为1,2,3和4。记录号一般是由系统按照元组的输入顺序而进行的自动编号,目的是方便操作数据库中的数据。,关系模型, 关系模型的组成层次:数据项、元组、关系、数据库和数据仓库等。 数据项:用来描述一组数据的共同属性,是组成关系模型的基本单位。 元组:用来描述一个个体的数据的集合,元组是由若干数据项的值组成。 关系:关系也称关系表,是具有相同性质的元组的集合,它是由若干个元组组成,它相当于一张关系表。 数据库:数据库是描述数据的所有关系的集合。它是由若干个关系组成。这些关系之间相互独立,由数据库管理系统实现统一组织、管理,从而实现对数据的共享。 数据仓库:数据仓库是数据的最高存储层次,是由数据库经过ETL之后生成的用于OLTP、OLAP和数据挖掘等高层数据分析的多维数据的集合。 关系模型的结构:是由若干个属性的值组成元组,然后再由若干个元组组成的关系,它是一种利用二维表格格式来表示物理数据的逻辑结构。所以它具有结构简单、清晰、表示能力强、用户易懂易用和具有严谨的数学理论支持基础等特点。使得它是目前相当流行的数据模型。,面向对象模型,面向对象模型(Object Oriented Model)是把面向对象的程序设计(Object Oriented Programming,OOP)方法和技术引入到数据库技术之后发展起来的新数据模型。,(3)物理模型,物理模型:是数据的物理存储模型,是用于描述数据在计算机内部的存储结构和存取方法的结构模型。它是对数据最低层的抽象。 建立物理模型的目的是利用合理的存储结构和存取策略,充分利用存储空间,实现快速存取,提高存取效率和存储空间的利用率。 物理模型是逻辑结构的最终物理实现,是为逻辑模型选取的最适合的物理环境。,1.2.2 数据库技术分类,1. 层次数据库技术 2. 网状数据库技术 3. 关系数据库技术 4. 面向对象数据库技术 5. 数据仓库技术 6. 数据发掘技术 7. 数据可视分析技术,1.3 数据库开发工具,结构化查询语言SQL:国际标准化组织ISO通过的关系数据库标准语言(RDBMS)。 SQL标准:SQL-86、SQL-89、SQL-92、SQL-99和SQL-2003。 常用DBMS产品: SQL Server; Oracle; Sybase; Informix; Microsoft Access; IBMBD2; Visual FoxPro; My SQL等。,SQL Server系列,SQL Server 2005的特点: (1) 综合统一:集DDL、DML和DCL一身,语言风格统一,独立完成数据库管理。 (2)高度非过程化 (3)面向集合操作:采用集合操作。查找、插入、删除和删除等操作是集合。 (4)一语两用:既是自含式语言,又是嵌入式语言。 (5)语法简单,易学易用:设计巧妙、语法简捷、易学易用、功能极强。完成数据库管理的核心功能只用9个动词(Create、Select、Drop、Alter、Insert、Update、Delete、Grant和Revoke等)。 SQL Server已经把先进的数据仓库、数据挖掘技术、可视分析技术和网络技术融入其中,从而提供功能更加丰富强大的数据库标准和数据库产品.,1.4 数据库应用系统,数据库应用系统:是指在计算机系统下,使用DBMS和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024成都冶金职工大学辅导员招聘笔试真题
- 文化旅游项目规划师笔试试题及答案
- 2025年隔离接地开关项目发展计划
- 2025年车用交流发电机合作协议书
- 玉林市陆川县招聘特岗教师笔试真题2024
- 2025年市场调查服务项目合作计划书
- 2025年经典心理健康知识竞赛考试练习题库(350题)【答案】
- 2025年事业单位考试中国古代近代文学史知识考试题库(五套)【答案】
- 活动总结范文学校五四青年节活动总结怎么写
- 粮食局员工年末述职报告范文
- 2025全员安全生产责任制范本
- 林业行政执法培训
- 高中英语必背3500单词表完整版
- 大连农商银行2024年招聘172人管理单位遴选500模拟题附带答案详解
- 安徽省工伤职工停工留薪期分类目录
- 广东省外语艺术职业学院后勤服务项目检查评分标准
- 以理解为中心的历史教育 西安张汉林 全国历史教育专家2016年夏高考研讨会最新材料
- 住院医师规范化培训心电图PPT课件.ppt
- 义务教育《道德与法治》课程标准(2022年版)
- 加强领导班子和干部队伍建设(同名14988)
- 中小学教育惩戒规则(试行)全文解读PPT专题课件
评论
0/150
提交评论