04-数据库和数据仓库(信息系统,上海财经大学刘鹏)_第1页
04-数据库和数据仓库(信息系统,上海财经大学刘鹏)_第2页
04-数据库和数据仓库(信息系统,上海财经大学刘鹏)_第3页
04-数据库和数据仓库(信息系统,上海财经大学刘鹏)_第4页
04-数据库和数据仓库(信息系统,上海财经大学刘鹏)_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 数据库和数据仓库 第一节 数据管理 第二节 数据库与数据库管理系统环境 第三节 关系数据库模型 第四节 数据库的建立 第五节 数据仓库与数据挖掘 第六节 高级数据库技术和高级数据库应用第一节数数据管管理数据组织织的层次次实体、属属性和关关键字数据管理理的传统统方法数据管理理的数据据库方法法数据组织织的层次次数据按照照层次方方式进行行组织由位、字字节、字字段、记记录、文文件和数数据库组组成位(Bit)位是计算算机中最最小的数数据单位位,其值值为0或或1,是是一个二二进位,表示一一个导通通或未通通的电路路。字节(Byte)字节是由由若干位位组成的的,代表表一个字字符。字字符是信信息的最最基

2、本构构架。数据组织织的层次次字段(Field)。多个字符符组成一一个词或或者一个个完整的的数字(如人名名或年龄龄),字段是数数据的最最小单位位,它不不能再分分成有意意义的单单位记录(Record)由与某个个特殊对对象或活活动有关关的所有有字段组组成。文件(File)同一类型型的所有有记录组组成一个个文件文件就是是与某个个特定主主题相关关的数据据记录的的集合。(字母J的ASCII码)数据的层次举例文件字节字段纪录01001010900811刘汉云 2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期学分及成绩的记录职员文件(名字字段)职员文件部门文件财务文件900811刘

3、汉云 2000-9-4900206李卓宇 2002-7-2910810张昕阳 2001-8-2实体、属属性和关关键字实体entity实体是所所收集的的数据相相关的一一类事物物,可以以是物,人,实实际的东东西,或或者具体体的东西西员工库存客户订单教室实体、属属性和关关键字属性Attribute属性是试试题的某某一方面面的特征征学生的姓姓名、学学号、年年龄、性性别成绩绩是学生生的属性性库存号、说明、现有数数量、在在仓库中中的位置置等是库库存的属属性实体、属属性和关关键字关键字PrimaryKey关键字是是用来识识别记录录的一个个或一组组数据项项,是识识别记录录和文件件中查找找记录的的标志学生文件件

4、中的学学号,产产品文件件中的产产品号,订单文文件中的的订单号号辅助关键键字SecondaryKey不能唯一一表示一一个记录录的字段段数据管理理的传统统方法利用文件件管理数数据为每个应应用程序序分别创创建和存存储数据据文件的的数据管管理方法法都称为为传统方方法应用程序 A文件A应用程序 B文件B应用程序 C文件C数据管理理传统方方法的不不足数据冗余余大冗余是指指在多个个数据文文件中重重复出现现相同的的数据。数据与程程序独立立性不高高数据文件件和维护护它的相相关程序序之间过过分依赖赖。数据管理理的数据据库方法法数据库是是逻辑相相关的记记录和文文件的集集合。把先前提提及的所所有存储储在独立立文件中中

5、的记录录归并在在一个数数据库内内,以便便让不同同的应用用程序存存取。储存在数数据库中中的数据据既独立立于使用用它的计计算机程程序,也也独立于于存储它它的外部部存储器器的类型型。数据库管管理系统统DatabaseManagement System,DBMS在数据库库管理系系统中,应用程程序不能能直接从从存储介介质获得得所需的的数据。它必须须先将请请求提交交给DBMS,由DBMS负负责从存存储介质质检索数数据并提提供给应应用程序序使用基于数据据库方法法的优点点减少数据据冗余,更有效效利用存存储空间间并增强强数据的的完整性性。也为为组织提提供了更更大地利利用数据据的灵活活性。两个文件件中的数数据放在

6、在了同一一个数据据库,可可以多种种方法定定位数据据并获得得要处理理的数据据共享数据据和信息息资源第二节数数据库与与数据库库管理系系统环境境数据库及及其特征征数据库管管理系统统数据库查查询语言言数据的逻逻辑视图图和物理理视图数据库及及其特征征数据库的的定义数据库(Database)是一个个信息的的集合,在这个个集合中中可以按按照信息息的逻辑辑结构对对其进行行组织与与存取。数据库由由两部分分组成信息本身身信息的逻逻辑结构构数据库特特征信息的集集合数据库特特征逻辑结构构数据字典典包含信信息的逻逻辑结构构数据库的的特征信息中的的逻辑联联系建立信息息间的联联系或关关系意味味着找出出文件之之间的相相互关系

7、系.主关键字字数据库文文件中的的一个字字段,唯唯一描述述一个记记录产品文件件中的产产品ID,供应应商文件件中的供供应商编编号外部关键键字一个文件件中的主主关键字字出现在在另一个个文件中中就是外外部关键键字,比比如产品品文件中中的供应应商文件件.数据库的的特征内在的完完整性约约束完整性约约束是保保证信息息质量的的一种规规则比如产品ID不能重重复产品文件件中的供应商ID不应该是是供应商商文件中中没有的的供应商ID数据库管管理系统统DatabaseManagement System是一组软软件,允允许组织织集中并并有效地地管理数数据以供供应用程程序访问问相当与应应用程序序和物理理数据文文件之间间的接

8、口口数据库管管理系统统的组成成数据定义义语言数据操作作语言数据字典典数据库管管理系统统组成数据定义义语言描述数据据库内容容和结构构的正式式语言数据操作作语言操作数据据库中的的数据,提供了了一组提提取数据据的命令令数据字典典自动生成成或者手手工生成成的文件件,用来来存储数数据元素素的定义义和特性性。如用用途,物物理表现现,所属属关系,授权和和安全.被动的的,主动动的.数据库查查询语言言属于数据据操作语语言自然语言言自然语言言查询命命令LIST THENAMESANDADDRESSES OF ALLSUPPLIERSWHO LIVEINSHANGHAIQBEQueryByExample通过拖曳曳数

9、据项项等方法法来查询询数据数据库查查询语言言SQLStructured Query Language结构化查查询语言言标准利用SQL可以以查询不不同数据据库管理理系统下下的数据据.基本形式式SELECTFROMWHERE数据视图图和逻辑辑视图DBMS把数据据的逻辑辑视图和和物理视视图分开开逻辑视图图以最终终用户所所使用的的直观的的方式来来显示数数据物理视图图则显示示了数据据的实际际组织形形式以及及它在物物理存储储介质上上的结构构一个物理理视图可可支持多多个逻辑辑视图DBMS使用专专门的数数据库管管理软件件,使得得物理数数据库可可用于不不同应用用程序所所需的不不同的逻逻辑视图图。第三节关关系数数

10、据库模模型四种数据据库模型型层次型网状型关系型目前使用用最为广广泛面向对象象关系数据据库模型型利用一系系列的二二维表或或文件存存储信息息.在关系模模型中,每个二二维表都都描述一一种关系系.关系是表表的数学学术语每一个表表或关系系所保存存的信息息都与一一个特定定的实体体有关.二维表使使描述信信息间的的关系十十分便利利,容易易处理二二维表所所包含的的信息.可以灵活活地查询询数据库库和建立立报表关系数据据库模型型可以灵活活地查询询数据库库和建立立报表查询单个个表和多多个表不必建立立数据项项之间的的所有连连接,随随时可以以建立.第四节关关系数数据库的的建立确定实体体和关键键字确定实体体之间联联系利用E

11、_R图得得到关系系为每个关关系确定定信息(字段)用数据定定义语言言创建数数据库学生修课课管理学生选修修样本报报表确定实体体和关键键字三个实体体学生专业课程关键字学号专业号课程号确定实体体之间的的联系-画画实体联联系图实体联系系图(Entity-Relationship Diagram, E-R图)矩形表示示实体菱形表示示实体之之间的联联系直线表示示连接1代表出出现一次次,M代代表多次次确定实体体之间的的联系-画画实体联联系图确定实体体之间的的联系-画画实体联联系图先画上矩矩形填上实体体名判断是否否有联系系有联系画画上菱形形,判断断联系是是1还是是M利用E-R图得得到关系系将每一个个实体都都转化

12、为为一个关关系学生、课课程、专专业将每一个个多对多多的联系系都转换换为一个个关系联联系的名名称为关关系的名名称选修将每一个个一对多多的联系系都转换换为一个个关系分配合并具有有相同关关键字的的关系:学生与分分配合并并为每个关关系确定定信息(字段)确保每个个关系中中所含的的信息确确实处于于正确的的关系之之中这组信息息只依赖赖于所属属关系的的主关键键字专业名称称信息不能能从其他他的信息息中派生生出来用数据定定义语言言创建数数据库根据前面面四步的的结果来来,运用用数据定定义语言言来创建建关系第五节数数据仓仓库与数数据挖掘掘数据往往往放在不不同的数数据库系系统中数据难以以收集数据仓库库是通过过集成企企业的关关键运行行数据,产生一一致的、可靠的的、易于于访问的的数据形形式。数据仓库库数据仓库库(DataWarehouse)是信信息的逻逻辑集合合,这些些信息来来自于许许多不同同的业务务数据库库,并用用于支持持企业的的分析活活动和决决策任务务数据仓库库数据仓库库的特征征数据仓库库将来自自于不同同数据库库的信息息结合在在一起数据仓库库是多维维的包含若干干层的行行列数据字典典:信息息的逻辑辑结构、信息的的来源和和处理方方式数据仓库库支持决决策而不不是事务务处理联机分析析处理(OLAP)联机事物物处理(OLTP)数据挖掘掘工具Dat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论