下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2009 年 3 月全国计算机等级考试四级笔试试卷数据库工程师一、选择题(1-20 每题 1 分 ,21-30 每题 2 分 ,共 40 分 )下列各题 A 、B、C、 D 四个选项中,只有一个选项是正确的。请将正确选项填涂在答题卡相应位置上,答在试卷上不得分。1.按照数据库应用系统生命周期模型,在开发某数据库应用系统时,对系统采用的软硬件及技术方案等作出合理的评估并提出选择建议的工作属于(A )规划与分析阶段的系统规划与定义(B )规划与分析阶段的可行性分析(C)需求分析阶段的业务规则需求分析(D )系统设计阶段的总体设计_。2.关于数据库应用系统的需求分析工作,下列说法正确的是_。(A )
2、通过需求分析过程,需要确定出整个应用系统的目标、任务和系统的范围说明(B )在需求分析阶段,系统需求分析员要与用户充分沟通,并做出各类用户视图(C)数据需求分析的主要工作是要辩识出数据处理中的数据数据处理流程(D )数据操作响应时间、系统吞吐量、最大并发用户数都是性能需求分析的重要指标3.下列用于数据库概念设计的方法是_。(A )DFD 方法和 IDEFIX 方法(B ) ER 方法和 IDEF0 方法(C) ER 方法和 IDEFIX 方法(D )DFD 方法和 IDEF0 方法4.关于数据库概念设计阶段的工作目标,下列说法错误的是_。(A )定义和描述应用系统设计的信息结构和范围(B )定
3、义和描述应用系统中数据的属性特征和数据之间的联系(C)定义和描述应用系统中数据的属性特征和数据之间的联系(D )描述需要存储的记录及其数量5.下列不属于非平凡函数依赖的是_。(A )(CustomerID,ProviderID,BuyDate) GoodsName(B )(CustomerID,ProviderID,BuyDate) GoodsName(C)(CustomerID,ProviderID,BuyDate) GoodsClassID(D )(CustomerID,ProviderID,BuyDate) ProviderID6.有某数据库系统在运行过程中发生了系统故障,发生故障时正在
4、运行事务t1 和 t2。进行故障恢复时,在日志文件中发现有t1的事务开始记录而没有结束记录,有t2 的开始记录和结束记录,但t2 对数据库的修改还没有写到数据库中,从检查点开始正向扫描日志文件_。(A )扫描到t1 时,直接重做t1,扫描到 t2 时,将 t2直接撤消(B )扫描到t1 时,将 t1 加入重做队列,扫描到t2 时,将 t2 加入撤消队列(C)扫描到t1 时,直接撤消t1,扫描到 t2 时,将 t2直接重做(D )扫描到t1 时,将 t1 加入撤消队列,扫描到t2 时,将 t2 加入重做队列7.在大型企业的数据库应用系统设计中,对企业 (甲方) 和项目承担方 (乙方) 的人员角色
5、,下列说法一般来说不合理的是_。(A )甲方首席信息官和乙方项目经理要参与概念模型设计工作(B )甲方首席信息官要实际参与逻辑模型和物理模型设计与实施工作(C)逻辑模型设计完成以后,主要由乙方数据库工程师负责物理模型的设计与实现工作(D )甲方总经理、首席信息官、乙方项目经理和双方系统架构师一般都要参与系统规划与总体架构设计工作8.某企业需要在一个SQL Server 2000 实例上为多个部门构建不同的数据库,有一个通用的数据类型需要在这些不同的数据库中,则较好的实现方法是_。(A )在创建所有的用户数据库之前,将此数据类型定义在master 数据库中(B )在创建所有的用户数据库之前,将此
6、数据类型定义在model 数据库中(C)在创建所有的用户数据库之前,将此数据类型定义在model 数据库中(D )在创建所有的用户数据库之前,在每个数据库中分别定义此数据类型9.有教师表(教师号,教师名,职称,基本工资),其中基本工资和取值与教师职称有关,实现这个约束的可行方案是 _。(A )在教师表上定义一个视图(B )在教师表上定义一个存储过程(C)在教师表上定义插入和修改操作的触发器(D )在教师表上定义一个标量函数10.VB6.0 中 RecordSet 对象的 UPDATE 方法作用是 _。(A )在内存中开辟一个存放新记录的缓冲区(B )将数据缓冲区中的内容保存到数据库中(C)更改
7、用户屏幕上显示的数据(D )更改数据缓冲区中当前行指针的位置11.DBMS 通过加锁机制允许用户并发访问数据库,这属于DBMS 提供的 _。(A )数据定义功能(B )数据操纵功能(C)数据库运行管理与控制功能(D )数据库建立与维护功能12.计算机系和教务处要对某数据库进行访问,计算机系全体教师对此数据库中的全部数据具有查询权,教务处全体人员对此数据库中全部数据具有查询、插入、删除和修改权。在SQL Server 2000中 ,下列安全控制方法最合理的是_。( A )为计算机系每个教师授予每个表的SELECT权,为教务处全体人员授予每个表的SELECT 、 INSERT 、 DELETE 和
8、 UPDATE 权(B )为计算机系和教务处分别建立一个角色,将两个部门的每个职工设置为相应角色中的成员。将计算机系角色和教务处角色设置为此数据库的db_datareader 角色中的成员,将教务处角色设置为此数据库的 db_datawriter 角色中的成员(C)为计算机系和教务处分别建立一个角色,将两个部门的每个职工设置为相应角色中的成员。为计算机系角色授予每个表的SELECT 权,为教务处角色授予每个表的SELECT 、INSERT 、 DELETE 和 UPDA TE 权(D )将计算机系和教务处的每个职工都设置为db_owner角色中的成员13.在 SQL Server 2000 中
9、,通过构建永久备份设备可以对数据库进行备份,下列说法正确的是_。(A )不需要指定备份设备的大小(B )一个数据库一次只能备份在一个设备上(C)每个备份设备都是专属于一个数据库的(D )只能将备份设备建立在磁盘上14.关于查询优化问题,下列说法错误的是_。(A )将频繁地向数据库发送的某条查询语句用存储过程来代替,可以提高查询效率(B )为经常出现在查询条件中的属性建立索引,可以提高查询效率(C)先执行表连接条件,后执行查询条件,有利于提高查询效率(D )将频繁访问的视图物化并进行维护,有利于提高查询效率15.有教师表(教师号,姓名,所在系,工资),找出系内教师平均工资高于全体教师平均工资的系
10、 信息,正确的语句是 _。(A ) SELECT所在系, AVG (工资) FROM教师表WHERE A VG (工资) >( SELECT A VG (工资) FEOM教师表)(B ) SELECT所在系, AVG (工资) FROM教师表WHERE AVG (工资) >( SELECT AVG (工资) FEOM 教师表)GROUP BY所在系(C) SELECT所在系, AVG (工资) FROM教师表GROUP BY所在系HAVING A VG (工资) >( SELECT A VG (工资) FEOM教师表)(D ) SELECT所在系, AVG (工资) FROM
11、教师表GROUP BY所在系WHERE A VG (工资) >( SELECT A VG (工资) FEOM教师表)16.关于分布式数据库系统和并行数据库系统,下列说法正确的是_。(A )分布式数据库系统的目标是利用多处理机结点并行地完成数据库任务以提高数据库系统的整体性能(B )并行数据库系统的目的主要在于实现场地自治和数据全局透明共享(C)并行数据库系统经常采用负载平衡方法提高数据库系统的业务吞吐率(D )分布式数据库系统中,不存在全局应用和局部应用的概念,各结点完全不独立,各个结点需要协同工作。17.事务 T0、 T1 和 T2 并发访问数据项 A、 B 和 C,下列属于冲突操作的
12、是 _。(A )T0中的 read( A )和 T0中的 write ( A )(B ) T0 中的 read(A )和 T0中的 write ( A)(C) T0中的 write ( A )和 T2中的 write (C)(D)T1中的 read( C)和 T2中的 write ( C)18.关于数据仓库的特性_。(A )面向主题的特性是指在组织数据仓库数据时,需要将各种分析需求归类并抽象,形成相应的分析应用主题,并根据分析应用主题的数据需求设计和组织数据(B )集成特性是指需要将业务系统中的所有数据抽取出来,载入到数据仓库中(C)集成特性是指需要将企业整个架构中的各种数据和应用集中到数据仓
13、库中(D )随时间变化性是指数据仓库中的每个数据单元一般都有时间标志, 且其中各种数据 (包括原始数据)会随时间变化被经常修改19.下图是雇员表(雇员 ID ,姓名,年龄,部门)所对应的数据文件和索引文件示意图,其中雇员 ID 为主码。该索引属于 _。(A )聚集、稀疏、辅索引(B )非聚集、稠密、主索引(C)聚集、稀疏、主索引(D )非聚集、稠密、辅索引20.在为业务繁忙的企业的多个部门服务的数据库系统中,同时开展各部门的OLTP业务和数据分析业务会给数据库系统带来性能冲突,下列方案中无法从根本上解决性能冲突的是_。(A )抽取出各部门需要的分析数据,建立各部门独立的数据集市,将数据分析业务
14、转移到数据集市中(B )抽取出企业所有分析功能所需的分析数据,建立统一的企业级数据仓库环境,将企业的大部分分析业务转移到数据仓库环境中( C)抽取出企业的近期业务数据,建立操作型数据存储(ODS),将一些快速分析业务转移到操作型数据存储中(D )不建立新的数据存储体系,在基本业务处理时间内开展OLTP 业务,在其余时间开展分析业务21.关于数据库应用系统功能设计,有下列说法:、软件总体设计的依据包括需求分析阶段得到的数据流图,事务描述和业务规则等需求分析结果、软件总体设计一般用模块结构图表示,模块结构图主要关心模块的外部特性,即上下级模块、同级模块间的数据传递和调用关系,以及模块内部处理流程、
15、数据库事务设计的依据是事务自身的事务处理逻辑、总体设计阶段要对硬件平台、存储设备、操作系统、DBMS等做出合理选择,并进行初步配置设计上述说法错误的是_。(A )(B )和(C)(D )和22.对 SQL Server 2000 采用的备份和恢复机制,下列说法正确的是_。(A )在备份和恢复数据库时用户都不能访问数据库(B )在备份和恢复数据库时用户都可以访问数据库(C)在备份时对数据库访问没有限制,但在恢复时只有系统管理员可以访问数据库(D )在备份时对数据库访问没有限制,但在恢复时任何人都不能访问数据库23.关于UML的各种视图及其分类,下列说法错误的是_。(A )用例图、类图、对象图,组
16、件图和部署图都是静态视图(B )顺序图、交互图、状态图和活动图都是动态视图(C)类图和对象图都是结构视图(D )顺序图、状态图和组件图都是行为视图24.在支撑繁忙业务的并行数据库系统中,有一个数据量很大的表T( a1,a2, ,an),对该表的查询多数为针对主码a1 的范围查询和点查询,为了改善查询性能, 需要对该表进行划分。关于该表的划分和应用策略,下列说法错误的是_。(A )采用轮转法对T 中的元组进行划分,这样数据分布均匀,适合于点查询和范围查询(B )以 a1 为划分属性,对T 采用散列划分是一种可行的划分方法,有利于对该表的点查询(C)以 a1 为划分属性,对T 采用范围划分并建立主
17、索引,是一种有效的划分方法(D )以 a1 为划分属性,对T 采用散列划分和范围划分都有可能带来T 的各个数据分区的数据分布不均匀的问题25.在数据库物理设计阶段,需要考虑为关系表建立合适的索引,关于建立索引的描述,有下列说法 :、对于经常在其上需要执行查询操作并且数据量大的表,可以考虑建立索引、对于经常在其上需要执行插入、删除和更新操作的表,可以考虑建立索引、对于经常出现在WHERE 子句中的属性,可以考虑建立索引、对于经常出现在ORDER BY 子句, GROUP BY 子句中的属性,应尽量避免建立索引上述说法正确的是_。(A )、和(B )、和(C)和(D )和26.关于数据模型和模式结
18、构,有下列说法:、数据库系统的开发者利用数据模型描述数据库的结构和语义, 通过显示世界到信息世界再到机器世界的抽象和转换,构建数据库、数据结构模型是按用户的观点对数据进行建模, 是现实世界到信息世界的第一层抽象,强调语义表达功能,易于用户理解,是用户与数据库设计人员交流的工具、在数据模型中有"型 "和 " 值 " 的概念,其中值是对某一类数据的结构和属性的说明、在三级模式结构中,概念模式是对数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图上述说法正确的是_。(A )和(B )、和(C)和(D )和27.关于数据库应用系统设计,有下列说法、
19、数据库应用系统设计需要考虑数据组织与存储、数据访问与处理、应用设计等几个方面、在数据库概念设计阶段,当采用自上而下的然后合并各局部E-R 图,得到全局E-R 图、在数据库逻辑设计阶段,将关系模式转换为具体E-R设计时,首先设计局部DBMS 平台支持的关系表E-R图,、在数据库物理设计阶段,一般需要设计视图和关系模式的完整性约束上述说法正确的是: _。(A )、和(B )(C)和(D )和28.关于数据库事务设计,有下列说法:、事务是数据库系统中一组操作的集合,这些操作实现了应用领域中某些特定的业务规则、事务概要设计可以依据需求分析阶段得到的数据流图和事务说明规范、事务概要设计中的事务处理逻辑设
20、计一般需要充公考虑具体的DBMS 平台的实现方法、事务详细设计时,利用与具体DBMS 平台无关的 read 和 write表示事务对数据库中数据项的读写操作上述说法正确的是:_。(A )、和(B )、和(C)和(D )和29.某跨国公司的业务系统需要提供全球性服务,该业务系统需要 34 小时 *7 天在线服务, 系统业务繁忙, 为了保证业务系统中数据库中数据的安全,需要设计与实施数据转储机制,设完成该数据库每天数据增量的转储需要2 个小时, 在不考虑成本因素的情况下, 下列最合理的是 _。(A )配备高性能数据库服务器,通过事务传送机制实时地将数据库中的任何变化反映到备份环境中(B )每天划出
21、长度为2 小时的时间窗口tw ,在 tw 内采用静态转储方法实现每天数据增量的转储(C)每天划出长度为2 小时的时间窗口tw ,在 tw 内采用动态转储方法实现每天数据增量的转储(D )每周做一次完全转储,每天选择浮动时间段对变化的数据进行转储30.某个数据仓库中保存有商品销售明细数据表T商品号,数量,价格,时间 ,其细节数据保存期为 2 年,每年销售记录约有 5 千万挑。设前端应用需要针对这些数据进行每月重要商品销售情况与趋势分析,可供用户查询或分析的数据时间跨度最长为5 年,为了提高这项分析需求的执行效率,下列方案合理且有效的是_。(A )按月份为商品明细数据建立分区,并为商品销售明细数据
22、建立索引,每次分析时根据细节数据实时计算生成月粒度级数据,并用于趋势分析(B )按月份为商品明细数据建立分区,并为商品销售明细数据建立索引,建立视图 V1商品号,日销 售总数量,日销售总金额,日期,将 V1 作为数据分析源(C)在商品号属性上为T 建立索引,建立物化视图V2 商品号,日销售总数量,日销售总金额,日期) ,每天根据T 中新产生的数据对V2 进行增长式更新,并将V2 作为分析数据源(D )建立物化视图V3 商品号,月销售总数量,月销售总金额,月份),每天清空V3 ,并根据表 T 重新计算V3 ,并将 V3 作为分析数据源二、简答题(每题10 分,共 20 分)请使用蓝、黑色钢笔或圆
23、珠笔将答案写在答题纸的相应位置上,否则无效。1有如下2 个关系表Empeid,ename,age,did,salary),其各列含义为:职工号,姓名,年龄,部门号,工资Dept did ,dname, mgr_id ,其各列含义为:部门号,部门名称,部门经理职工号写出一条 SQL 语句,查询工资大于 10000,且与他所在部门的经理年龄相同的职工姓名。 (6 分)2有学生表学好,姓名,年龄,性别,系名,专业名,班号,设一个系可有多个专业,每个专业可有多个班,各班班号不重复,一个学生只在一个班学习,现经常需要按"系名 "和" 班号 " 进行查询,为提高查询
24、效率,需要为 " 系名 "和 " 班号 " 两个列建立一个非聚集索引,建立此索引有下 列两种方法:方法 1:索引列顺序为系名,班号方法 2:索引列顺序为班号,系名这两种方法哪个更合理?请简要说明原因。(4 分)针对你认为合理的方法,写出创建该索引的SQL 语句。( 3 分)(3)考虑定义在事务集(T1,T2,T3 上的调度S1 和 S2,S1 与 S2 是否是冲突等价的?为什么?( 7 分)三、设计与应用题(40 分)请使用蓝、黑色钢笔或圆珠笔将答案写在答题纸的相应位置上,否则无效。 1)某汽车维修公司需建立一个汽车维修数据库,该数据库中需要存储和管理下
25、列信息:车辆信息:车牌号,车型,发动机号,行驶里程,车辆所有人,联系电话维修项目:项目号,项目名称,维修费汽车备件:备件号,备件名称,备件单价,库存数量以上数据之间存在下列约束:可以对一个车辆进行多个维修项目,每个维修项目可用于多个车辆,维修项目完成后要在数据库中记录维修时间一种备件可用于多个维修项目,每个维修项目最多只使用一种备件,但每种备件的数量可以是多个。根据以上需求构建该数据库的概念模型画ER 图)。( 8 分)假设车辆信息有如下约束车牌号:标识属性,取值形式为:第1 个字符是 "京 " ,第 2 个字符为 "A" 到 "Z"
26、 的字母,第 3 到第 7 个字符均是 "0" 到 "9" 的数字。此列采用普通编码定长字符型,非空;车型:普通编码定长字符型,长度为6,默认值为 "轿车 ";发动机号:普遍编码定长字符型:长度为6,非空;行驶里程:整型,取值大于等于0;车辆所有人:晋通编码定长字符型,长度为8,非空;联系电话:普通编码定长字符型,长度为13,取值唯一。写出创建满足上述要求的车辆信息表的SQL 语句。注:表名、 列名均用题中给出的中文名, SQL 语句中的大、小写字母均可。( 8 分)2现有关系模式:教师授课教师号,姓名,职称,课程号,课程名,学分,教
27、科书名其函数依赖集为: 教师号 姓名,教师号 职称,课程号 课程名,课程号 学分,课程号 教科书名 指出这个关系模式的主码。(2 分)这个关系模式是第几范式,为什么?(4 分)将其分解为满足3NF 要求的关系模式分解后的关系模式名自定( 6 分)3为在某种程度上保证某数据库系统可靠地运行,在 SQL Server 2000 环境中, 对其制定有如下三种备份策略。 假设对此数据库进行一次完全备份需要4 小时,差异备份需要2 小时,日志备份需要1 小时。设所有备份都是从凌晨1:00 开始。策略 1:每周周日进行一次完全备份,每周周一至周六每天进行一次日志备份;策略 2:每周周日进行一次完全备份,每
28、周周一至周六每天进行一次差异备份;策略 3:每天进行一次完全备份。 假设需要保留一年的备份数据,比较三种备份策略所占用的空间。比较每种备份策略的备份和恢复速度。参考答案与分析一、选择题(1-20每题 1分 ,21-30每题 2分 ,共40分 )1 B2 D3 C4 D5 D6 D7 B8 B9 C10 B11 C12 B13 A14 C15 C16 C17 D18 A19 B20 C21 B22 D23 D24 A25 C26 A27 B28 D29 A30 C二、简答题答案答案:( 1) select a.* from Emp a,Dept b,Emp c where a.did=b.did
29、 and b.mgr_id=c.eid anda.salary>10000 and a.age=c.age(2)方法 1更加合理,理由如下:更加有利于减少索引层次,提高查询效率;更加符合使用习惯;更加便于(系、班)进行统计。 create index index_1 on 学生表(系名,班号)(3)不是等价冲突,因为 T1的 write ( Q)和 T2的 write ( Q)是冲突的,不可交换。三、设计与应用题答案答案:(1)概念模型如下: Create table 车辆信息 (车牌号char(7) Not NULL CHECK车牌号like(" 京 A-Z0-9 0-9 0
30、-9 0-9")车型char(6) default " 轿车 ",发动机号char(6) NOT NULL,行驶里程int CHECK( 行驶里程 >=0),车辆所有人char(8) NOT NULL,联系电话char(13) UNIQUE,PRIVATE KEY ( 车牌号 )(2)主码为:(教师号、课程号)第 1范式,因为存在部分依赖。分布方法为:教师表(教师号,姓名,职称)课程表(课程号,课程名,学分,教科书名)教师授课表(教师号,课程号)(3)占用空间量从大到小排序为:策略3,策略 2,策略 1备份速度从快到慢排序为:策略1,策略 2,策略 3恢复速
31、度从快到慢排序为:策略3,策略 2,策略 1三、 答案解析一、选择题1分析: 技术可行性是根据用户提出的系统功能、 性能及实现系统的各项的约束条件,对系统软件、 系统硬件、 技术方案做出评估和选择建议, 它属于规划与分析阶段的可行性分析。2分析:数据操作响应时间、系统吞吐量、最大并发用户数都是性能需求分析的重要指标3分析:用户数据库概念设计的方法包括E-R 方法和IDEF1X 方法等。4分析:数据库概念设计阶段的工作目标包括定义和描述应用领域涉及的数据范围;获取应用领域或问题域的信息模型;描述清楚数据的属性特征;描述清楚数据之间的关系;定义和描述数据的约束;说明数据的安全性要求;支持用户的各种
32、数据处理需求;保证信息模型方便地转换成数据库的逻辑结构(数据库模式) ,同时也便于为用户理解。5X Y ,但 Y X ,则称 X Y 是平凡函数依赖,否则称为分析:根据定义,若非平凡函数依赖。显然D选项属于平凡函数依赖。6分析:由事务的原子性可知,一个事务对数据库的所有操作是一个不可分割的工作单元,要么全部执行要么一个也不执行,所有由于 t1 事务没有结束记录,应该加入撤消队列,而 t2 又开始和结束记录却没有写入数据库,应该加入重做队列。7分析:物理模型的设计与实现工作应该主要由乙方数据库工程师负责,甲方首席信息官主要参与项目规划、需求分析以及概念模型设计阶段工作。8分析: model 数据
33、库时样板数据库,其中包含所有用户数据库的公共信息。所以较好的实现方法是在创建所有的用户数据库之前,将此数据类型定义在model 数据库中。9分析:触发器是一种特殊的存储过程,其特殊性在于它不需要由用户来调用,而是当用户对表中的数据进行 UPDATE、INSERT 或 DELETE 操作时自动触发执行。 触发器可使业务的处理任务自动进行。10分析: UPDATE方法是将新添加在缓冲区的记录或修改后的结果永久保存在数据库中11分析: DBMS的数据库运行管理与控制功能是指统一管理和控制数据库的建立、运行和维护, DBMS通过加锁机制允许用户并发访问数据库,这属于 DBMS提供的数据库运行管理与控制
34、功能。12分析: db_datareader 角色可以查询数据库中所有用户表中的数据, db_datawriter 角色可以更改数据库中所有用户表中的数据。13分析: SQL Server将备份数据库的场所称为备份设备,它支持数据库备份到磁带或磁盘上; 可以在一个备份设备上对同一个数据库进行多次备份,也可以在一个设备上对不同的数据库进行多次备份,可以将一个数据库备份到多个不同的备份设备上。14分析: 在优化查询的方法中将频繁地向数据库发送的某条查询语句用存储过程来代替 , 为经常出现在查询条件中的属性建立索引以及将频繁访问的视图物化并进行维护,都有利于提高查询效率, 但是先执行表连接条件, 后
35、执行查询条件, 不有利于提高查询效率,应该尽可能的先执行查询条件,把表连接条件放到最后执行。15分析:在分组查询中要用关键字 GROUP, AVG()、SUM()等函数作为查询条件时,必须放在 HAVING关键字后面,而不能用 WHERE关键字。16分析:分布式数据库要达到的目标是:本地自治、非集中式管理、高可用性、位置独立性、 分布式查询处理、分布式事务管理等。并行数据库系统的目标是利用多处理机结点并行的完成数据库任务以提高数据库系统的整体性能, 并行数据库经常采用负载平衡方法提高数据库系统的业务吞吐率。17分析:事务T1中的 read 操作与事务T2中的 write操作并发对数据项C进行访
36、问,执行的先后顺序不同结果也会不同, 不能交换这两个操作的先后顺序, 所以 D 选项是冲突操作。18分析: 数据仓库是一个面向主题的、 集成的、 非易失的, 且随时间变化的数据集合,用来支持管理人员的决策。数据仓库的主要特性( 1)主题与面向主题数据仓库中的数据是以面向主题的方式进行组织的,主题是一个抽象的概念,主题也可以称为分析主题或分析领域, 用于表示某一宏观的分析领城所涉及的对象, 以及与对象有关的数据的集合。目前,数据仓库主题数据的实现一般还是采用关系型数据库技术,即主题的对象以及对象所相关的数据还是通过一组关系表来实现的。( 2)集成集成是数据仓库数据的第二个特性, 也是最为重要的特
37、性。 人们一般把数据仓库的数据集成功能分成数据抽取、转换、清理(过滤)和装载这四项任务。数据集成主要完成从数据源获取数据, 并按目标数据模型要求, 如数据仓库核心层模型的要求对数据进行转换,并清除错误或无效数据,装载入目标数据体系中。( 3)不可更新在操作型环境下, 数据访问和处理一般以单条方式进行的, 数据一般是会被更改或更新的,但是, 数据仓库中的数据通常是以批量方式载入与访问的,在数据仓库环境中,并不进行一般意义上的数据更新。 需要注意的是, 不可更新并不意味着不再向数据仓库追加新的数据,只是表示一般不再对进入数据仓库的原始数据进行修改。( 4)随时间变化数据仓库的时变性是指数据仓库中的
38、每个数据单元都有时间标志,记录一般都加有时戳,有时记录中可能包含有事务的发生时间。同时, 数据仓库随时间变化的特性还指数据仓库在运行中必须不断捕捉操作型环境中的数据,并将新的数据集成后追加到其中。19分析: 聚集索引和非聚集索引:对数据文件和它的一个特定的索引文件,如果数据文件中数据记录的排列顺序与索引文件中索引项的排列顺序相一致,或者说, 索引文件按其查找码指定的顺序与数据文件中数据记录的排列顺序相一致,则该索引文件称为聚集索引( Clastering Index )。否则,该索引文件称为非聚集索引(NonclusteringIndex )。稠密索引和稀疏索引: 如果数据文件中的每个查找码值
39、在索引文件中都对应一个索引记录,则该索引称为稠密索引(Dense Index )。如果只是一部分查找码的值有对应的索引记录,则该索引称为稀疏索引(Sparse Index )。主索引和辅助索引:在数据文件包含主码的属性集上建立的索引称为主索引(PrimaryIndex )。在数据文件的非主属性上建立的索引称为辅索引(Secondary Index)。20分析: 解决企业联机事务处理业务和数据分析业务之间的性能冲突问题, 根本的解决途径是从联机事务处理环境中抽取数据, 建立新的数据分析环境, 即建立操作型数据存储,将分析业务转移到操作性数据存储中。21分析: 软件总体设计的依据包括需求分析阶段得
40、到的数据流图,事务描述和业务规则等需求分析结果, 总体设计得到的系统总体结构和分层模块结构可以用模块结构图表示,模块结构图主要关心模块的外部特性,即上下级模块、 同级模块间的数据传递和调用关系,与模块内部处理流程无关。22分析:在备份时对数据库访问没有限制,但在恢复时任何人都不能访问数据库。23分析:每一种 UML 的视图都是由一个或多个图( Diagram )组成的, UML 提供了 9 种不同的图, 分为两类, 一类是静态图, 包括用例图、 类图、对象图、 组件图、 部署图;另一类是动态图,包括顺序图、 交互图、 状态图和活动图。也可以根据它们在不同视图的应用,把它们分成:( 1)用例视图
41、:用例图( 2)结构视图:类图、对象图( 3)行为视图:顺序图、交互图、状态图、活动图( 4)实现视图:组件图( 5)环境视图:部署图24分析: 轮转法策略对于点查询和范围查询的处理非常复杂, 由于不知道所要查找的元组具体分布在哪个磁盘上,必须对所有磁盘都进行查找,明显降低了查询效率。25分析:索引技术(Indexing )是一种快速文件访问技术,它将一个文件的每个记录在某个或某些域 (或称为属性) 上的取值与该记录的物理地址直接联系起来,提供了一种根据记录城的取值快速访问文件记录的机制。对于经常在其上需要执行查询操作并且数据量很大的表,可以考虑建立索引;对于经常出现在where 子句、 order by子句和group by 子句中的属性就可以考虑使用索引;另外,索引技术是用来优化查询操作的,与插入、删除和更改操作没有关系。26分析:数据模型( Data Model)是数据库系统的形式框架,是用来描述数据的一组概念和定义。包括描述数据、数据联系、 数据操作、 数据语义以及数据一致性的概念工具。它是数据库系统的核心和基础。 按照数据模型在数据建模和数据管理中的不同作用,可以将其分为概念数据模型、数据结构模型和物理数据模型。概念数据模型也可简称为概念模型, 是按用户的观点对数据和信息进行建模, 是现实世界到信息世界的第一层抽象。数据结构模型也称为表示型或实现型的数据模型, 是机器
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物流行业司机安全驾驶及货物运输效率考核表
- 2025年广东省公务员申论模拟试卷(含答案)
- 2026年纺织科技公司董事会研发项目审议管理制度
- 慢性白血病患者的心理状态评估与疏导策略
- 用户司机平台协议书
- 提供原材料合同范本
- 放电缆施工合同范本
- 父母房屋转让协议书
- 政府广告合同协议书
- 指标房定金合同范本
- 城市综合交通规划报告范文
- (2025年)《巩固拓展脱贫攻坚成果同乡村振兴有效衔接应知应会》测试题及答案
- 高性能芳纶纤维生产线项目可行性研究报告
- 2025年生产厂长年度工作计划
- 游泳协会水质管理员考试题库及答案
- 印刷任务应急预案(3篇)
- 环境适应性总结
- 高校金融学教学大纲及教案
- 基于认知的动机激发策略-洞察及研究
- 商场会员维护培训课件
- 意大利安全培训资料课件
评论
0/150
提交评论