版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章数据库与数据仓库信
息
管
理
系
统
开
发
结
构第四章数据库和数据仓库第一节数据管理第二节数据库与数据库管理系统环境第三节关系数据库模型第四节数据库的建立第五节数据仓库与数据挖掘第六节高级数据库技术和高级数据库应用第一节数据管理什么是数据管理数据组织的层次实体、属性和关键字数据管理的传统方法数据管理的数据库方法为什么要进行数据管理名称,时代,作者,规格,幅面,内容,卷前引首,前隔水,后隔水,题跋,历代收藏人,印章,真迹图,细部放大图……为什么要进行数据管理第一,“信息孤岛”问题日益严重,数据采集、整理、分析的繁重任务,多源异构的海量数据存储,信息资源有效利用的需求,旧有的数据管理与企业发展的冲突等等;第二就是系统的自动化程度不高,各个系统不能平滑地集成起来;第三就是信息系统的成本,我们曾谈到,信息系统集成成本比信息系统建设的成本高甚至几倍。什么是数据管理根据赛迪顾问的界定,中国数据管理技术应用软件主要包括:企业信息门户(EIP)、商业智能(BI)、内容管理(CM)、知识管理系统(KMS)和竞争情报系统(CIS)五大应用软件领域。数据管理的定义数据组织的层次数据按照层次方式进行组织由位、字节、字段、记录、文件和数据库组成位(Bit)位是计算机中最小的数据单位,其值为0或1,是一个二进位,表示一个导通或未通的电路。字节(Byte)字节是由若干位组成的,代表一个字符。字符是信息的最基本构架。(见ASCII码表)ASCII编编码表数据组织的层层次字段(Field)。多个字符组成成一个词或者者一个完整的的数字(如人人名或年龄)),字段是数据的的最小单位,,它不能再分分成有意义的的单位记录(Record)由与某个特殊殊对象或活动动有关的所有有字段组成。。文件(File)同一类型的所所有记录组成成一个文件文件就是与某某个特定主题题相关的数据据记录的集合合。(字母J的ASCII码)数据的层次举例文件字节字段纪录01001010900811刘汉云2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期学分及成绩的记录职员文件(名字字段)职员文件部门文件财务文件900811刘汉云2000-9-4900206李卓宇2002-7-2910810张昕阳2001-8-2模型的概念::对现实世界事事物特征的模模拟和抽象就就是这个事物物的模型。计计算算机不能直接接处理现实世世界中的具体体事物,所以以必须先把具具体事物转换换为抽象的模模型,然后再再将其转换为为计算机可以以处理的数据据,从而以模模拟的方式实实现对现实世世界事物的处处理。模型型应应满满足足以以下下要要求求::真实实地地反反映映现现实实世世界界;;易被被人人理理解解;;便于于在在计计算算机机上上实实现现;;基本本术术语语实体体::客客观观存存在在、、并并且且可可以以互互相相区区别别的的事事物物称称为为实实体体。。属性性::实实体体所所具具有有的的每每一一个个特特性性都都称称为为一一个个属属性性。。选选择择的的实实体体属属性性越越多多,,所所描描述述的的实实体体就就越越清清晰晰。。属属性性有有““型型””和和““值值””的的概概念念,,属属性性的的名名称称就就是是属属性性的的““型型””;;对对型型的的具具体体赋赋值值就就是是属属性性的的““值值””。。主键键值值((码码))::在在众众多多属属性性中中能能够够唯唯一一标标识识实实体体的的属属性性或或属属性性组组。。实体体集集::某某个个实实体体型型下下的的全全部部实实体体,,称称为为实实体体集集。。联系系::一一个个实实体体集集内内部部各各实实体体之之间间的的相相互互联联系系,,叫叫做做实实体体内内部部联联系系。。在在实实体体集集之之间间的的联联系系,,称称为为实实体体的的外外部部联联系系。。实体体、、属属性性和和关关键键字字实体体entity实体体是是所所收收集集的的数数据据相相关关的的一一类类事事物物,,可可以以是是物物,,人人,,实实际际的的东东西西,,或或者者具具体体的的东东西西员工工库存存客户户订单单教室室实体体、、属属性性和和关关键键字字属性性Attribute属性性是是实实体体的的某某一一方方面面的的特特征征学生生的的姓姓名名、、学学号号、、年年龄龄、、性性别别成成绩绩是是学学生生的的属属性性库存存号号、、说说明明、、现现有有数数量量、、在在仓仓库库中中的的位位置置等等是是库库存存的的属属性性实体体、、属属性性和和关关键键字字关键键字字PrimaryKey关键键字字是是用用来来识识别别记记录录的的一一个个或或一一组组数数据据项项,,是是识识别别记记录录和和文文件件中中查查找找记记录录的的标标志志学生生文文件件中中的的学学号号,,产产品品文文件件中中的的产产品品号号,,订订单单文文件件中中的的订订单单号号辅助助关关键键字字SecondaryKey不能能唯唯一一表表示示一一个个记记录录的的字字段段数据据管管理理的的传传统统方方法法利用用文文件件管管理理数数据据为每每个个应应用用程程序序分分别别创创建建和和存存储储数数据据文文件件的的数数据据管管理理方方法法都都称称为为传传统统方方法法应用程序A文件A应用程序B文件B应用程序C文件C数据据管管理理传传统统方方法法的的不不足足数据据冗冗余余大大冗余余是是指指在在多多个个数数据据文文件件中中重重复复出出现现相相同同的的数数据据。。数据据与与程程序序独独立立性性不不高高数据据文文件件和和维维护护它它的的相相关关程程序序之之间间过过分分依依赖赖。。数据据管管理理的的数数据据库库方方法法数据库是是逻辑相相关的记记录和文文件的集集合。把先前提提及的所所有存储储在独立立文件中中的记录录归并在在一个数数据库内内,以便便让不同同的应用用程序存存取。储存在数数据库中中的数据据既独立立于使用用它的计计算机程程序,也也独立于于存储它它的外部部存储器器的类型型。数据库管管理系统统中的模模式数据库管管理系统统中的模模式物理模式式:描述述数据的的物理存存储形式式,也称称内模式式,直接接与操作作系统或或硬件相相联系。。概念模式式(逻辑辑模式)):数据据库数据据的完整整表示,,是所有有用户的的公共数数据视图图。模式式仅仅涉涉及数据据类型的的描述,,不涉及及具体的的数据值值。子模式::针对每每一个用用户或应应用,又又由模式式导出若若干个子子模式((或叫外外模式、、用户模模式)。。子模式式是直接接面向用用户的,,用户能能够看见见并使用用的是逻逻辑结构构的局部部数据描描述。每每一个子子模式都都是模式式的一个个子集;;也可以以看作是是模式的的一个窗窗口。一一个数据据库系统统可以有有多个子子模式。。两级映射射可保证证三种模模式之间间的相互互独立性性。数据库管管理系统统DatabaseManagementSystem,DBMS在数据库库管理系系统中,,应用程程序不能能直接从从存储介介质获得得所需的的数据。。它必须须先将请请求提交交给DBMS,,由DBMS负负责从存存储介质质检索数数据并提提供给应应用程序序使用基于数据据库方法法的优点点减少数据据冗余,,更有效效利用存存储空间间并增强强数据的的完整性性。也为为组织提提供了更更大地利利用数据据的灵活活性。两个文件件中的数数据放在在了同一一个数据据库,可可以多种种方法定定位数据据并获得得要处理理的数据据共享数据据和信息息资源第二节数数据据库与数数据库管管理系系统环境境数据库及及其特征征数据库管管理系统统数据库查查询语言言数据的逻逻辑视图图和物理理视图数据库及及其特征征数据库的的定义数据库((Database))是一个个信息的的集合,,在这个个集合中中可以按按照信息息的逻辑辑结构对对其进行行组织与与存取。。数据库由由两部分分组成信息本身身信息的逻逻辑结构构数据库特特征信息的集集合数据库特特征逻辑结构构数据字典典包含信信息的逻逻辑结构构数据库的的特征信息中的的逻辑联联系建立信息息间的联联系或关关系意味味着找出出文件之之间的相相互关系系.主关键字字数据库文文件中的的一个字字段,唯唯一描述述一个记记录产品文件件中的产产品ID,供应应商文件件中的供供应商编编号外部关键键字一个文件件中的主主关键字字出现在在另一个个文件中中就是外外部关键键字,比比如产品品文件中中的供应应商文件件.数据库的的特征内在的完完整性约约束完整性约约束是保保证信息息质量的的一种规规则比如产品ID不能重重复产品文件件中的供应商ID不应该是是供应商商文件中中没有的的供应商ID数据库管管理系统统DatabaseManagementSystem是一组软软件,允允许组织织集中并并有效地地管理数数据以供供应用程程序访问问相当与应应用程序序和物理理数据文文件之间间的接口口数据库管管理系统统的组成成数据定义义语言数据操作作语言数据字典典数据库管管理系统统组成数据定义义语言描述数据据库内容容和结构构的正式式语言数据操作作语言操作数据据库中的的数据,提供了了一组提提取数据据的命令令数据字典典自动生成成或者手手工生成成的文件件,用来来存储数数据元素素的定义义和特性性。如用用途,物物理表现现,所属属关系,授权和和安全.被动的的,主动动的.数据字典典给数据流流程图中中每个成成分以定定义和说说明的工工具。在在数据流流程图中中仅对系系统逻辑辑功能的的总体框框架作了了描述,,缺乏详详细具体体的说明明。数据据字典的的作用是是对数据据流程图图中的各各种成分分,包括括数据项项、数据据结构、、数据流流、数据据存储、、处理功功能、外外部项等等的逻辑辑内容与与特征予予以详细细说明。。数据字字典中有有关系统统的详细细信息是是以后系系统设计计、系统统实施与与维护的的重要依依据。数据字典典编写的的基本要要求如下下:对数据流流程图中中各种成成分的定定义必须须明确、、易理解解、唯一一;命名、编编号与数数据流程程图一致致;符合一致致性与完完整性的的要求,,对数据据流程图图上的成成分定义义与说明明无遗漏漏项,无无同名异异义或异异名同义义;格式规范范、文字字精炼与与符号正正确。财务管理理第三层层工资管管理数据据流程图图数据字典典中的条条目数据项::是数据据处理中中不可分分割的基基本逻辑辑单位。。包括数数据项编编号、名名称、取取值范围围、数据据项类型型、长度度等。数据结构构:描述述数据流流/数据据存储的的逻辑组组成。数数据结构构条目内内容包括括:数据据结构名名称、编编号、包包含该结结构的数数据流/数据存存储的编编号、该该数据结结构中包包含的数数据项名名称等。。数据字典典中的条条目数据流::定义数数据流程程图中的的数据流流,内容容为数据据流的编编号、名名称来源源、去向向、包含含数据结结构的名名称以及及单位时时间(如如年月日日)传输输次数等等。数据存储储:存储储条目的的内容有有数据存存储的名名称、编编号、组组成(即即数据存存储包含含的数据据结构))、最大大记录数数等。处理功能能:条目目内容有有处理功功能的名名称、编编号、输输入数据据流、输输出数据据流、处处理逻辑辑概括等等。外部实体体:条目目内容有有外部实实体名称称、编号号、输入入数据流流、输出出数据流流等。数据库查查询语言言属于数据据操作语语言自然语言言自然语言言查询命命令LISTTHENAMESANDADDRESSESOFALLSUPPLIERSWHOLIVEINSHANGHAIQBEQueryByExample通过拖曳曳数据项项等方法法来查询询数据数据库查查询语言言SQLStructuredQueryLanguage结构化查查询语言言标准利用SQL可以以查询不不同数据据库管理理系统下下的数据据.基本形形式SELECT……FROM…WHERE…数据视视图和和逻辑辑视图图DBMS把把数据据的逻逻辑视视图和和物理理视图图分开开逻辑视视图以以最终终用户户所使使用的的直观观的方方式来来显示示数据据物理视视图则则显示示了数数据的的实际际组织织形式式以及及它在在物理理存储储介质质上的的结构构一个物物理视视图可可支持持多个个逻辑辑视图图DBMS使使用专专门的的数据据库管管理软软件,,使得得物理理数据据库可可用于于不同同应用用程序序所需需的不不同的的逻辑辑视图图。第三节节关关系数数据库库模型型四种数数据库库模型型层次型型网状型型关系型型目前使使用最最为广广泛面向对对象层次型型数据据库层次模模型::实体体之间间按层层次关关系来来定义义。实实体用用记录录表示示,实实体的的属性性对应应记录录的数数据项项。层层次模模型以以每个个实体体为结结点,,上层层结点点叫““父结结点””,下下层结结点叫叫“子子结点点”。。如下下图所所示仅有一一个无无双亲亲的根根结点点;根根结点点叶子子结点点根结点点以外外的子子结点点,向向上仅仅有一一个父父结点点,向向下有有若干干子结结点。。网状模模型数数据库库网状模模型::可表表达比比较复复杂的的实体体间关关系((多对对多)),但但当需需要对对系统统扩展展时,,对原原有数数据结结构及及应用用程序序的修修改,,需要要花费费更多多的代代价,,甚至至带来来严重重的后后果。。主要要特征征如下下:有一个个以上上的结结点无无双亲亲;至少有有一个个结点点有多多个双双亲;;关系数数据库库模型型利用一一系列列的二二维表表或文文件存存储信信息.在关系系模型型中,每个个二维维表都都描述述一种种关系系.关系是是表的的数学学术语语每一个个表或或关系系所保保存的的信息息都与与一个个特定定的实实体有有关.二维表表使描描述信信息间间的关关系十十分便便利,容易易处理理二维维表所所包含含的信信息.可以灵灵活地地查询询数据据库和和建立立报表表关系数数据库库模型型可以灵灵活地地查询询数据据库和和建立立报表表查询单单个表表和多多个表表不必建建立数数据项项之间间的所所有连连接,随时时可以以建立立.关系数数据库库模型型关系模型::以表格形形式作为基基本的存储储结构,通通过相同关关键字段来来实现表格格间的数据据联系。结结构简单、、易学易用用是其主要要特点,很很受用户欢欢迎,是目目前的主流流。由于系统中中实体包括括许多属性性,而这些些属性又会会被不同用用户的用户户使用,所所以将这些些属性一起起放在一个个数据表中中显然是不不合理的,,需要进行行分类与汇汇总,以编编制不同的的、且相关关联的表,,这就是所所谓的关系系。表具有以下下四个性质质:在表中的任任意一列上上,数据项项应属于同同一个属性性;表中所有行行都是不相相同的,不不允许有重重复行出现现;行的顺序无无关;列的顺序无无关,但不不能重复;;第四节关关系数据库库的建立确定实体和和关键字确定实体之之间联系利用E_R图得到关关系为每个关系系确定信息息(字段)用数据定义义语言创建建数据库学生修课管管理学生选修样样本报表确定实体和和关键字三个实体学生专业课程关键字学号专业号课程号确定实体之之间的联系系
--画画实体联系系图实体联系图图(Entity-RelationshipDiagram,E-R图)矩形表示实实体菱形表示实实体之间的的联系直线表示连连接1代表出现现一次,M代表多次次确定实体之之间的联系系
--画画实体联系系图确定实体之之间的联系系
--画画实体联系系图先画上矩形形填上实体名名判断是否有有联系有联系画上上菱形,判判断联系是是1还是M利用E-R图得到关关系将每一个实实体都转化化为一个关关系学生、课程程、专业将每一个多多对多的联联系都转换换为一个关关系联系的的名称为关关系的名称称选修将每一个一一对多的联联系都转换换为一个关关系分配合并具有相相同关键字字的关系::学生与分配配合并为每个关系系确定信息息(字段))确保每个关关系中所含含的信息确确实处于正正确的关系系之中这组信息只只依赖于所所属关系的的主关键字字专业名称信息不能从从其他的信信息中派生生出来用数据定义义语言创建建数据库根据前面四四步的结果果来,运用用数据定义义语言来创创建关系数据库三范范式在建立数据据库表时,,如何使数数据结构合合理有效,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年软件测试与质量保障策略笔试题目集
- 未来五年江河堤防等设施管理服务企业ESG实践与创新战略分析研究报告
- 未来五年菊苣种子企业ESG实践与创新战略分析研究报告
- 未来五年专用面粉企业县域市场拓展与下沉战略分析研究报告
- 未来五年成核剂企业ESG实践与创新战略分析研究报告
- 未来五年实时传输及监控系统装备市场需求变化趋势与商业创新机遇分析研究报告
- 未来五年射击场服务市场需求变化趋势与商业创新机遇分析研究报告
- 未来五年居民零售和互联网销售服务企业ESG实践与创新战略分析研究报告
- 企业内部控制制度评估与改进手册(标准版)
- 医院体外膜肺氧合技术管理规范解读
- 校园规划设计方案说明书
- 部队冬季预防训练伤
- (期末押题卷)广东省广州市2023-2024学年六年级上册数学高频易错期末提高必刷卷(人教版)
- 第五版-FMEA-新版FMEA【第五版】
- 眼科学-眼科常用检查法
- GB 25199-2015生物柴油调合燃料(B5)
- DB32/T+4396-2022《勘察设计企业质量管理标准》-(高清正版)
- 台州市街头镇张家桐村调研报告
- 压力排水管道安装技术交底
- 糖代谢紊乱生物化学检验
- 科技基础性工作专项项目科学数据汇交方案编制
评论
0/150
提交评论