《数据管理技术》PPT课件.ppt_第1页
《数据管理技术》PPT课件.ppt_第2页
《数据管理技术》PPT课件.ppt_第3页
《数据管理技术》PPT课件.ppt_第4页
《数据管理技术》PPT课件.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章 数据管理技术,5.1 数据的组织,5.1 数据的组织,数据是信息的存在形式,而信息则是现实世界的反映。 数据组织的关键之一是建立数据世界与现实世界的准确 、完善的对应关系;之二是以高效、恰当的手段管理数据。,图 51 从现实世界到数据世界的映射,5.2 数据库与数据管理,5.2.1 数据的自由管理方式与文件管理方式 自由管理方式 数据的管理没有得到特别的关注; 数据修改及维护极为困难; 不同的程序无法有效地共享数据; 无序的管理。,5.2 数据库与数据管理(续),5.2.1 数据的自由管理方式与文件管理方式 文件管理方式 程序通过文件系统读入数据并执行数据操作; 降低程序的复杂程度; 可以在一定程度上实现不同程序间的数据共享。,图 52 文件数据管理方式,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统 1. 数据库 减少数据冗余 冗余就是数据的重复; 冗余数据意味着对某些事实的修改必须在多处进行,否则它们的值不相等,很难确定哪一个值是正确的。 获得数据独立性 在对数据结构进行修改时,不必修改处理该数据的应用程序。,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统(续) 2. 数据库管理系统(DBMS) 数据库管理方式,图 53 数据库管理方式,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统(续) 数据库管理系统处理数据的优势 集中管理数据、存取、利用和安全降低组织的信息系统环境的复杂性 ; 降低数据的冗余和不一致; 利用数据建立和定义的集中控制剔除数据的混乱; 降低程序与数据之间的相互依赖性; 大大增强了信息系统的适应性; 大幅度提升了信息的存取和利用的可能性。,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统(续),图 54 数据库在现代信息系统中的核心地位,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统(续) 3. 关系数据库 数据模型(数据库结构):组织记录及确定记录间关系的主要方法,包括: 层次数据库结构 网状数据库结构 关系数据库结构 面向对象数据库结构,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统(续) - 关系数据库:数据的逻辑结构是二维表。,表 51 关系表示例,5.2 数据库与数据管理(续),5.2.2 数据库与数据库管理系统(续) 关系模型中的主要术语包括: 关系(relation):对应于实体集合的二维表; 元组(tuple):也称为记录(record),即二维表中的一行,对应于一个实体; 属性(attribute):即二维表中的一列,代表实体的一个数据侧面,属性在元组上的取值就是数据项; 关系模式:即对关系的描述,用关系名(属性1,属性2,属性n)的形式表达。 例如:学生情况(学号,姓名,班级),5.2 数据库与数据管理(续),5.2.3 完整性约束及数据依赖关系 数据完整性约束是关系数据库设计的一项重要内容。 数据完整性约束包括三方面: 属性的值类型和值域:决定该属性的基本数据特征,例如性别、月份、班级; 实体完整性:每一条数据记录都应该具有身份标识,即非空、无重复主码; 参照完整性:反映数据属性值之间的某种“存在性”关系,体现了数据库表之间关系的维护。,5.2 数据库与数据管理(续),5.2.3 完整性约束及数据依赖关系(续),图 55 参照完整性,选课表的存在依赖于学生表与课程表的存在,5.2 数据库与数据管理(续),5.2.3 完整性约束及数据依赖关系(续) 数据依赖关系反映数据属性值之间的“对应”关系。 以函数依赖为例,属性组B依赖于属性组A(记为AB)是指:如果任两条记录的A值相等,则必有相等的B值与之相对应。换句话说,AB反映了“相等的B值对应相等的A值”这样的语义。,5.2.4 ER模型:实体关系模型,5.2 数据库与数据管理(续),图 56 ER图符号,图 57 一个大学的ER图,参与约束 秩约束,属性 关键属性 多值属性 派生属性 复合属性,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 从图5-7中可以看出: 大学是按照系组织而成的; 教师在行政上是属于一个系的,其他需要记录的属性包括姓名、ID#(工作证号)、地址、性别、薪水以及生日。教师存在层次组织结构,每个研究或教学小组都由一个组长领导; 教师教授课程,这些课程都有课程名称、一个唯一的课程编号、课时、教授学生最大容量以及所分配的教室;,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 从图5-7中可以看出(续): 每个学生都被分配到系,并会选修若干课程,课程成绩作为专门的属性保存。另外要保存学生的姓名、学号、性别、生日以及地址。此外,每个从事论文工作的还会有一个教师作为他的导师; 通常,出于人事管理和医疗保险等需要,学校还记录教师家属的有关信息,比如家属名称、性别、生日、和该教师的关系。,5.2 数据库与数据管理(续),5.2.4 ER模型(续) ER模型通过实体、关系和属性这三个方面来对现实世界中的对象进行描述。 实体 一个实体就是现实世界中的一个“事物”,它具有独立存在性,如一个特定的学生。 常用一个中间写有实体类型名称矩形框来表示。,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 属性 属性用来描述实体的性质,例如,一个教师实体就是通过姓名、ID#(工作证号)、性别、生日、地址以及薪水来进行描述的; ER图中用椭圆表示属性,属性名称放在椭圆中; 关键属性的值能对实体进行唯一标识;ER图中关键属性在属性名称下加下划线。,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 属性(续) 分为六类: 单值属性(single-valued attribute) 多值属性(multi-valued attribute) 简单属性(simple attribute) 复合属性(composite attribute) 存储属性(stored attribute) 派生属性(derived attribute),5.2 数据库与数据管理(续),5.2.4 ER模型(续) 关系 实体之间的联系。 在ER图中,每个关系类型是以菱形框表示,在框中是关系的名称,而且它通过一条直线和表示参与实体类型的方框相连。 实体间关系的种类: 一对一的对应关系(1:1 ) 一对多的对应关系(1:n) 多对多的对应关系(n:m),5.2 数据库与数据管理(续),5.2.4 ER模型(续) ER模型是概念模型,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 课堂练习1绘制某科研院所ER图,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 课堂练习1绘制某科研院所ER图,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 课堂练习1绘制某科研院所ER图,5.2 数据库与数据管理(续),5.2.4 ER模型(续) 课堂练习2绘制某生产车间ER图,5.2 数据库与数据管理(续),车间生产产品 产品由零件装配 零件存放在仓库 零件由供应商供应 仓库属于车间,5.2.4 ER模型(续) 课堂练习2绘制某生产车间ER图,5.2 数据库与数据管理(续),5.2.5 ER模型到关系数据库的转换 支持ER模型-关系数据库之间转换的开发工具: ERWin Oracle Developer Sybase PowerDesigner,图 59 ER模型与关系数据库结构,5.2 数据库与数据管理(续),5.2.6 在线事物处理(OLTP) 批处理模式(Batch processing):主要缺陷是商业业务与信息系统之间依赖程度很低; 事物处理模式:对业务职能的自动化以及对信息的储存、汇总、统计、查询等信息处理模式; 在线事务处理(Online transaction processing ):基于在线计算的事务处理,5.2 数据库与数据管理(续),5.2.7 数据库技术的新发展 (1)面向对象数据库 每个对象的数据、描述对象的行为、属性的说明三者是封装在一起的; 具备相同属性及方法的对象被归成为一个类。 (2)超媒体数据库 超媒体文件包括文本、图片、声音、视频等多种数据类型。,5.2 数据库与数据管理(续),5.2.7 数据库技术的新发展(续) (3)图像数据库 能够存入图像的数据库; 图片可以摄自照相机,也可以由扫描仪扫入,或从计算机屏幕拷贝下来。 (4)文档数据库 包括信件、备忘录、报告及组织其他文档中的数据; 文档管理系统也可以处理复合文档,即那些不仅包含文本而且包含图像、声音等的文档。,5.2 数据库与数据管理(续),5.2.7 数据库技术的新发展(续) (5)通用数据库系统 能处理各种类型的数据:传统文本数据、图像声音、超媒体文件、标准文本等,5.3 数据仓库与分析处理,5.3.1 从事物处理到分析处理 事务处理(Online Transaction Processing, OLTP) 分析处理(Online Analysis Processing, OLAP),图 510 OLTP和OLAP,5.3 数据仓库与分析处理(续),5.3.2 数据仓库 数据仓库(data warehouse) 即把一个组织中的历史数据收集到一个中央仓库中以便于处理; 是支持决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合; 是OLAP应用的环境和基础; 是当今信息管理中的主流趋势之一。,5.3 数据仓库与分析处理(续),5.3.2 数据仓库(续) 数据仓库和传统的数据库相比具有以下特征: 面向主题; 管理大量信息; 信息存储在多个存储介质上; 跨越数据库模式的多个版本; 信息的概括和聚集; 从许多数据来源中将信息集成并使之关联。,5.3 数据仓库与分析处理(续),5.3.3 在线分析处理(OLAP) 中西部以及山地区域的商店在十一月份售出的滑雪撬有多少是由A公司制造的。与去年和前年相比销售额有何不同、与实际计划相比又有何不同?本月的销售额度应该是多少? 商业数据事实上是一种多维数据,需要采用多维分析,通过在线分析处理(OLAP)来解决。,5.3 数据仓库与分析处理(续),5.3.3 在线分析处理(OLAP)(续) 在线分析处理主要完成以下一些功能: 给出数据仓库中数据的多维的逻辑视图; 通常包含交互式查询和对数据的分析; 提供分析的建模功能; 在各个维度上对数据进行多层次的概括统计,并能够实现不同维度的交叉概括计算; 支持功能模型以进行预测、趋势分析和统计分析;,5.3 数据仓库与分析处理(续),5.3.3 在线分析处理(OLAP)(续) 在线分析处理主要完成以下一些功能(续): 检索并显示二维或三维表格、图表和图形化的数据,并且应该能够容易地变换基准轴; 检索并显示二维或三维表格、图表和图形化的数据,并且应该能够容易地变换基准轴; 迅速响应查询; 具有多维数据存储引擎,按阵列存储数据,这些阵列是商业维的逻辑表示。,5.3 数据仓库与分析处理(续),5.3.3 在线分析处理(OLAP)(续) 数据仓库和OLAP产品 Oracle Express Server Oracle Discoverer IBM DB2 OLAP Server Sybase Adaptive Server IQ等,本章习题,数据的组织方式经历了哪些主要的发展阶段?传统的文件系统组织方式存在着哪些局限性?为什么说数据库有助于克服这些局限性? 与层次和网状数据库相比,关系数据库结构具有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论