2026年软考-数据库系统工程师考试题库_第1页
2026年软考-数据库系统工程师考试题库_第2页
2026年软考-数据库系统工程师考试题库_第3页
2026年软考-数据库系统工程师考试题库_第4页
2026年软考-数据库系统工程师考试题库_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年软考-数据库系统工程师考试题库一、上午试题1.在计算机体系结构中,若CPU采用流水线技术执行指令,假设流水线分为5个阶段,每个阶段耗时1个时钟周期。现有10条指令连续进入该流水线,则执行完这10条指令所需的时钟周期数为()。A.10B.14C.15D.502.以下关于Cache(高速缓存)的描述中,错误的是()。A.Cache的引入主要为了解决CPU与主存之间速度不匹配的问题B.Cache的全相联映射方式比直接映射方式冲突概率更高,但空间利用率更高C.Cache替换算法中,LRU(最近最少使用)算法通常优于FIFO(先进先出)算法D.在写操作时,Write-Through(写通)策略比Write-Back(写回)策略更利于保持数据一致性3.操作系统通过信号量机制实现进程间的同步与互斥。若信号量S的当前值为-3,则表示()。A.有3个进程在等待该资源B.有3个进程正在使用该资源C.有3个进程处于就绪态D.系统发生死锁4.在TCP/IP协议簇中,负责将IP地址解析为MAC地址的协议是()。A.ARPB.RARPC.ICMPD.DHCP5.某二叉树的前序遍历序列为:A,B,D,E,C,F,中序遍历序列为:D,B,E,A,F,C,则该二叉树的后序遍历序列为()。A.D,E,B,F,C,AB.E,D,B,F,C,AC.D,E,F,B,C,AD.E,D,F,B,C,A6.在软件工程中,McCabe环路复杂度度量是衡量程序逻辑复杂性的重要指标。若某控制流图的环数为5,则该程序的环路复杂度为()。A.4B.5C.6D.77.下列关于数据库三级模式结构的描述,正确的是()。A.外模式是全局数据逻辑结构的视图B.模式是用户与数据库系统的接口C.内模式涉及数据的物理存储结构D.只有一个外模式和一个模式8.数据库系统的独立性是指()。A.数据逻辑结构与物理存储结构相互独立B.用户数据与应用程序相互独立C.数据的定义与数据的使用相互独立D.以上都是9.在关系代数中,设关系R有3个元组,关系S有4个元组,则R×A.7B.12C.1D.010.关系模式R(U,F)A.AB.BC.CD.D11.SQL语言中,用于授权的语句是()。A.GRANTB.REVOKEC.COMMITD.ROLLBACK12.若关系R和S的连接条件涉及两个关系的公共属性,且要求结果中包含所有公共属性值相等的元组,这种连接称为()。A.自然连接B.等值连接C.内连接D.外连接13.下列关于关系数据库规范化的叙述中,错误的是()。A.若X→Y且Y→Z,则X→Z,这被称为传递函数依赖B.若关系模式属于1NF,且每一个非主属性完全函数依赖于码,则该模式属于2NFC.若关系模式属于2NF,且不存在非主属性传递依赖于码,则该模式属于3NFD.BCNF是对3NF的放宽,允许某些特定的传递依赖存在14.在E-R模型向关系模型转换时,若实体间是1:N的联系,则通常将()。A.1端实体的码加入N端的关系中B.N端实体的码加入1端的关系中C.创建一个新的关系,包含两端实体的码D.不需要转换,直接忽略15.数据库设计中,需求分析阶段常用的工具是()。A.E-R图B.数据流图(DFD)C.判定表D.程序流程图16.事务的ACID特性中,C指的是()。A.原子性B.一致性C.隔离性D.持久性17.若事务T对数据对象A加了共享锁(S锁),则其他事务对A()。A.只能加共享锁B.只能加排他锁(X锁)C.不能加任何锁D.既可以加共享锁也可以加排他锁18.数据库恢复技术中,Redo日志的作用是()。A.撤销已提交的事务对数据库的修改B.重做已提交但未写入磁盘的事务对数据库的修改C.记录事务的回滚操作D.恢复未提交事务的修改19.故障恢复中的UNDO操作主要针对()。A.已提交的事务B.未提交的事务C.系统崩溃时正在进行的事务D.检查点之前的事务20.在数据库并发控制中,若两个事务互相等待对方释放锁,这种现象称为()。A.活锁B.死锁C.不可串行化D.丢失更新21.下列关于两段锁协议(2PL)的描述,正确的是()。A.事务在读任何数据前必须先对该数据加锁B.事务在释放任何锁后,不能再申请任何新的锁C.遵循两段锁协议的事务一定是可串行化的D.遵循两段锁协议一定不会发生死锁22.分布式数据库系统中,分片透明性位于()。A.全局外模式与全局概念模式之间B.全局概念模式与分片模式之间C.分片模式与分配模式之间D.分配模式与局部概念模式之间23.在分布式数据库的复制策略中,更新所有副本的同步复制方式的主要缺点是()。A.数据一致性难以保证B.更新开销大,可用性低C.读操作性能差D.容易产生网络瓶颈24.NoSQL数据库主要用于处理()。A.高度结构化的数据,强调事务一致性B.海量、高增长率、模式灵活的数据C.复杂的关联查询D.空间数据25.下列关于Redis数据库的描述中,错误的是()。A.Redis是键值对存储数据库B.Redis支持持久化,可以将内存中的数据保存到磁盘C.Redis默认支持复杂的表连接操作D.Redis通常用作缓存系统26.在大数据处理架构中,HDFS是()。A.分布式文件系统B.分布式计算框架C.分布式资源调度器D.分布式数据库27.MapReduce计算模型中,Map阶段的主要任务是()。A.数据汇总B.数据排序C.数据分解与映射D.数据输出28.下列关于数据仓库的描述,正确的是()。A.面向事务处理,数据是当前的B.面向分析处理,数据是历史的、集成的C.数据具有易变性D.数据是细节的,不进行聚合29.在数据挖掘中,Apriori算法用于()。A.分类B.聚类C.关联规则挖掘D.孤立点检测30.数据库安全性中,通过SQL注入攻击获取数据库信息的原理是()。A.利用数据库系统的缓冲区溢出漏洞B.在输入字段中恶意插入SQL代码片段C.通过网络嗅探截获数据包D.暴力破解用户密码31.设有关系模式R(A,B,C,D),函数依赖集F={AB→C,C→D}。关系模式R的规范化程度最高达到()。A.1NFB.2NFC.3NFD.BCNF32.若关系R有1000个元组,关系S有500个元组,执行RSA.50000B.500000C.1500D.100033.索引是提高数据库查询性能的重要手段。对于B+树索引,以下说法错误的是()。A.B+树是一个平衡的多路查找树B.B+树的所有叶子节点通过链表指针连接,适合范围查询C.B+树的非叶子节点仅存储索引键值,不存储实际数据D.B+树的根节点至少包含两个子树34.在嵌入式SQL中,主语言(如C语言)与SQL之间通信的主要方式是()。A.共享内存B.消息队列C.共享变量(宿主变量)和SQL通信区D.文件系统35.视图是数据库中的一个重要概念。下列关于视图的描述,错误的是()。A.视图是虚表,其数据在查询时动态生成B.视图可以简化复杂的查询语句C.通过视图可以限制用户访问某些敏感数据D.所有的视图都可以执行UPDATE操作36.数据库性能调优中,查询优化器主要关注()。A.磁盘I/O的物理布局B.内存分配策略C.查询语句的执行计划(AccessPath)D.网络传输协议37.下列哪种情况适合使用反规范化技术?()A.插入操作频繁,且数据一致性要求极高B.查询操作非常频繁,且涉及多表连接,系统主要瓶颈是I/OC.表的数据量非常小D.系统并发更新量极大38.在面向对象数据库中,继承机制使得子类可以继承父类的属性和方法。这对应于传统关系数据库中的()。A.外键约束B.视图C.类型层次(或超类/子类表)D.聚合39.OLAP(联机分析处理)的基本操作不包括()。A.上卷B.下钻C.切片和切块D.插入元组40.在Web数据库应用中,连接池技术的主要目的是()。A.防止SQL注入B.加密传输数据C.减少建立数据库连接的开销,提高性能D.实现负载均衡41.事务隔离级别中,允许读取“脏”数据(未提交数据)的级别是()。A.ReadUncommittedB.ReadCommittedC.RepeatableReadD.Serializable42.在数据库备份策略中,差异备份是指()。A.备份自上次完全备份以来改变的数据B.备份自上次差异备份以来改变的数据C.备份所有数据D.备份日志文件43.下列关于Hash索引的描述,正确的是()。A.Hash索引非常适合范围查询B.Hash索引不能利用索引进行排序C.Hash索引支持部分键匹配查询D.Hash索引在处理重复键值时效率极高44.在关系数据库中,空值(NULL)的处理比较特殊。下列关于NULL的描述,正确的是()。A.NULL=NULL的结果为TRUEB.NULL表示该属性没有值或未知C.COUNT(列名)会统计该列的NULL值D.聚合函数AVG遇到NULL时会报错45.在分布式事务中,两阶段提交协议(2PC)中,协调者在第一阶段询问所有参与者是否可以提交,若所有参与者均回复“是”,则协调者在第二阶段发送()指令。A.AbortB.CommitC.RollbackD.Prepare46.下列关于数据加密的描述,错误的是()。A.对称加密算法中,加密和解密使用同一个密钥B.非对称加密算法中,公钥用于加密,私钥用于解密C.数据库中存储密码时,通常存储加密后的密文D.MD5算法是一种可逆的加密算法,适合用于密码存储47.某公司数据库服务器CPU利用率长期处于100%,经检查主要由于大量复杂的全表扫描查询引起。下列优化措施最无效的是()。A.增加服务器的CPU核心数B.在查询涉及的列上创建合适的索引C.优化SQL语句,避免SELECT*D.增加内存,扩大BufferPool48.在关系模式R(A,B,A.AB.CC.BD.A49.下列关于触发器(Trigger)的描述,正确的是()。A.触发器可以显式调用B.触发器可以用于实现复杂的业务逻辑约束C.触发器在语句执行前触发,不能在语句执行后触发D.触发器不能跨表操作50.在数据字典中,存储“表中有哪些列”的数据属于()。A.用户数据B.元数据C.日志数据D.索引数据51.时空数据库是专门用于处理空间和时间数据的数据库。下列应用场景不适合使用时空数据库的是()。A.城市交通流量监控B.地理信息系统(GIS)C.简单的财务记账D.气象数据分析52.下列关于NewSQL数据库的描述,错误的是()。A.NewSQL旨在提供NoSQL的可扩展性,同时保持关系型数据库的ACID特性B.NewSQL数据库通常采用分布式架构C.MySQL属于典型的NewSQL数据库D.GoogleSpanner是NewSQL的代表产品之一53.在数据库概念模型设计中,确定实体间的联系类型时,若一个实体集中的一个实体与另一个实体集中的多个实体相关联,反之亦然,则这种联系是()。A.1:1B.1:NC.M:ND.1:1:154.下列SQL语句中,用于创建索引的是()。A.CREATEINDEXidxONtable(col);B.CREATEKEYidxONtable(col);C.ADDINDEXidxONtable(col);D.ALTERTABLEtableADDINDEXidx(col);55.在数据库逻辑结构设计中,将E-R图转换为关系模型后,还需要进行()。A.需求分析B.物理结构设计C.模式优化(规范化处理)D.数据库实施56.下列关于数据库完整性约束的描述,错误的是()。A.实体完整性保证主键不为空且唯一B.参照完整性保证外键值必须是referenced表中存在的主键值或为空C.用户定义完整性约束反映具体应用领域的数据语义要求D.违反完整性约束时,数据库总是拒绝执行该操作57.在统计数据库中,为了保护隐私,防止通过查询推导出个体信息,可以采取()。A.审计日志B.查询控制与扰动(如添加噪声)C.强制访问控制D.视图机制58.下列关于存储过程的描述,错误的是()。A.存储过程在服务器端运行,减少网络流量B.存储过程可以接受参数、返回状态值和结果集C.存储过程一旦创建,就不能修改D.存储过程可以提高执行效率59.在多线程环境中访问数据库,连接对象通常不是线程安全的。这意味着()。A.多个线程不能同时共享同一个连接对象B.多个线程必须串行化访问数据库C.数据库不支持多线程D.连接池无法在多线程中使用60.数据库应用系统设计中,模块化设计的主要目的是()。A.增加代码行数B.提高软件的可维护性和可重用性C.减少内存占用D.简化数据库设计61.下列关于关系代数除法运算的描述,正确的是()。A.R÷B.除法运算可以用来表达“包含所有”的查询C.除法运算的优先级高于笛卡尔积D.除法运算不满足交换律62.若事务T对数据对象A加了排他锁(X锁),则其他事务对A()。A.只能加共享锁B.只能加排他锁C.只能读不能写D.既不能读也不能写63.在数据库故障恢复中,检查点(Checkpoint)技术的作用是()。A.标记事务的提交点B.减少恢复时需要扫描的日志量C.记录死锁发生的时间D.同步缓冲区数据到磁盘64.下列关于B-树的描述,正确的是()。A.B-树的所有数据都存储在叶子节点B.B-树是B+树的一种变体,更适合磁盘存储C.B-树的非叶子节点也存储数据记录D.B-树的所有叶子节点之间没有指针连接65.在分布式数据库系统中,CAP定理指出,在分布式系统中,无法同时满足以下三点,最多只能同时满足两点()。A.一致性、可用性、分区容错性B.原子性、一致性、隔离性C.完整性、安全性、并发性D.可扩展性、可靠性、实时性66.下列关于MongoDB的描述,正确的是()。A.MongoDB是关系型数据库B.MongoDB使用表来存储数据C.MongoDB支持复杂的查询和索引D.MongoDB不支持事务67.在数据仓库中,事实表通常包含()。A.大量的文本描述信息B.维度属性和度量值C.主键和外键D.只有外键68.元数据管理是数据治理的重要组成部分。元数据主要描述数据的()。A.内容、结构、上下文B.备份时间C.存储路径D.访问频率69.下列哪种情况可能导致数据库出现“幻读”现象?()A.在ReadCommitted隔离级别下,事务A读取了范围数据,事务B在该范围内插入了新数据并提交,事务A再次读取该范围B.事务A读取了数据,事务B修改了该数据并提交,事务A再次读取C.事务A修改了数据,事务B读取了该数据D.事务A回滚了操作70.在数据库应用开发中,ORM(对象关系映射)框架的作用是()。A.将对象模型映射到关系数据库模型,实现以对象方式操作数据库B.优化SQL查询C.管理数据库连接池D.自动生成数据库备份71.下列关于数据库死锁预防的描述,正确的是()。A.一次性加锁法要求事务在开始时一次性申请所有需要的锁B.顺序加锁法允许事务随机申请锁C.死锁预防比死锁检测开销更大D.预防死锁通常采用超时机制72.在SQL中,EXISTS子查询与IN子查询的主要区别在于()。A.EXISTS只关心子查询是否返回行,IN关心返回的具体值B.EXISTS比IN效率总是更高C.IN不能处理NULL值,EXISTS可以D.两者完全等价73.下列关于位图索引的描述,正确的是()。A.位图索引适合高基数(HighCardinality,即唯一值多)的列B.位图索引使用位串来表示索引键值,适合OLAP环境C.位图索引在频繁更新的列上性能极佳D.位图索引占用空间通常比B+树索引小74.在数据库设计中,确定属性的数据类型属于()。A.需求分析B.概念结构设计C.逻辑结构设计D.物理结构设计75.2026年数据库技术发展的新趋势包括()。A.云原生数据库的普及B.AI驱动的自治数据库C.区块链与数据库的融合D.以上都是二、下午试题试题一(20分)阅读下列说明,回答问题1至问题4,将解答填入答题纸的对应栏内。【说明】某物流公司为了提升业务管理效率,拟开发一套“智慧物流管理系统”。该系统主要涉及车辆管理、货物管理、司机管理和运输业务管理。系统需求如下:1.公司拥有若干车辆,每辆车辆有唯一的车牌号、品牌、型号、购买日期和当前状态(空闲、维修中、运输中)。2.公司雇佣若干司机,每个司机有工号、姓名、电话和驾驶证号。一名司机可以驾驶多辆车辆(在不同时间),但在同一时间只能驾驶一辆车;一辆车在同一时间只能由一名司机驾驶。3.货物信息包括货物编号、名称、重量、体积和类别。4.运输业务是核心,包括运单号、发货时间、预计到达时间、实际到达时间和状态。每笔运单包含多个货物项。每笔运单必须指派一辆车和一名司机。5.系统需要记录车辆的维修记录,包括维修日期、维修内容和费用。【问题1】(4分)根据说明,设计实体-联系图(E-R图)。请给出实体、联系及其类型(1:1,1:N,M:N)。【问题2】(8分)将E-R图转换为关系模式,请标出每个关系模式的主键(下划线标出)和外键(波浪线标出)。【问题3】(4分)关系模式“运输业务”中包含属性:运单号、车牌号、司机工号、发货时间、状态等。假设存在函数依赖:运单号→{车牌号,司机工号,发货时间,状态},且{车牌号,司机工号}→运单号。判断该关系模式属于第几范式?并说明理由。【问题4】(4分)为了优化查询性能,系统经常需要按“发货时间”范围查询运单,同时需要快速查询特定车辆的所有运单。请给出在“运输业务”关系上建议建立的索引类型及索引列。试题二(20分)阅读下列说明,回答问题1至问题4,将解答填入答题纸的对应栏内。【说明】某在线教育平台的后台数据库使用MySQL。用户表(User)和选课表(Enrollment)结构如下:User(UserIDINTPRIMARYKEY,UserNameVARCHAR(50),EmailVARCHAR(100),BalanceDECIMAL(10,2));Enrollment(EnrollIDINTPRIMARYKEY,UserIDINT,CourseIDINT,EnrollDateDATETIME,StatusTINYINT,ScoreDECIMAL(5,2));其中,Enrollment.UserID引用User.UserID。【问题1】(6分)为了确保数据完整性,请用SQL语句定义User表和Enrollment表,要求包含主键、外键约束,并设置Balance默认值为0.00。【问题2】(6分)平台需要实现一个功能:查询“2024年1月1日”之后选课且状态为1(表示已结课)的学生姓名、课程ID和成绩。请写出该查询的SQL语句。【问题3】(5分)平台需要处理学生退课并退费的逻辑。请编写一段嵌入式SQL(C语言风格)或存储过程,逻辑如下:输入参数:p_EnrollID(选课ID),p_RefundAmount(退费金额)。1.检查该选课记录是否存在且状态为0(未结课)。2.如果存在,将该选课记录的状态更新为2(已退课)。3.根据UserID更新User表的余额,增加退费金额。4.提交事务。注意:需包含事务控制语句。【问题4】(3分)随着数据量增大,Enrollment表的查询速度变慢。DBA发现EnrollID是自增主键,但大部分查询是根据UserID进行的。请给出优化建议。试题三(21分)阅读下列说明,回答问题1至问题4,将解答填入答题纸的对应栏内。【说明】某物联网公司负责收集全球智能电表的数据。数据量极其庞大,每天产生数十亿条读数。读数数据包含:电表ID、时间戳、电压、电流、功率。系统架构设计如下:1.采用分布式数据库集群存储历史数据。2.采用Redis缓存最近1小时的热点数据,供实时监控大屏展示。3.采用HadoopHDFS存储原始日志文件,用于离线数据分析。【问题1】(5分)在该系统中,关系型数据库(如MySQL)可能成为瓶颈。请列举两个主要原因,并说明为什么NoSQL数据库(如Cassandra或InfluxDB)更适合存储此类时序数据。【问题2】(6分)在Redis缓存设计中,Key的设计至关重要。假设需要存储某个电表最近1分钟的功率读数,读数每5秒上报一次。请设计一个合理的Key命名规则,并说明选择的数据类型及其理由。【问题3】(5分)分布式数据库分片是解决数据量过大的常用手段。假设按照“电表ID”进行哈希分片。公式为:Sh【问题4】(5分)为了保证数据的一致性,当智能电表数据上报时,系统需要先写入Redis,再异步写入MySQL/HDFS。如果异步写入失败,如何设计补偿机制以保证数据不丢失?试题四(15分)阅读下列说明,回答问题1至问题3,将解答填入答题纸的对应栏内。【说明】某金融交易系统对数据的安全性要求极高。数据库管理员在配置数据库安全策略时,考虑了审计、加密和访问控制。【问题1】(5分)数据库审计是监控数据库活动的重要手段。请列举两条必须记录的审计事件,并说明触发审计日志记录的条件。【问题2】(5分)为了防止敏感数据(如用户身份证号、银行卡号)泄露,系统计划采用透明数据加密(TDE)技术。请简述TDE的工作原理及其对应用的影响。【问题3】(5分)SQL注入是Web应用常见的安全漏洞。请结合下面的PHP代码片段(模拟),指出其存在的安全漏洞,并给出修复建议。代码片段:qure三、答案与解析一、上午试题答案与解析1.答案:B解析:流水线执行公式为:T=k+(n2.答案:B解析:全相联映射方式允许数据块放入Cache中任意一行,冲突概率最低,空间利用率最高;直接映射冲突概率最高。选项B说全相联冲突概率更高是错误的。3.答案:A解析:信号量S的值若为负,其绝对值表示因等待该资源而阻塞的进程个数。故|−4.答案:A解析:ARP(AddressResolutionProtocol)用于将IP地址解析为物理地址(MAC地址)。RARP是反向地址解析协议。5.答案:A解析:由前序A(BDE)C(F)和中序DB(E)AFC(F)可知,根是A,左子树为B(D,E),右子树为C(F)。递归推导,后序遍历为DEBFCA。6.答案:B解析:McCabe环路复杂度V(G)=E−N+2P(其中E为边数,N为节点数,P为连通分量数)。或者7.答案:C解析:A错误,外模式是用户视图;B错误,模式是逻辑结构(全局),外模式是接口;C正确;D错误,可以有多个外模式。8.答案:D解析:数据库独立性包括物理独立性和逻辑独立性。物理独立性指用户程序与物理存储结构独立;逻辑独立性指用户程序与逻辑结构独立。故D最全面。9.答案:B解析:笛卡尔积结果元组数=R的元组数×S的元组数=3×4=12。10.答案:A解析:寻找函数依赖集F的闭包。=A,由A→B得B,由B→C得C,由C→D得D11.答案:A解析:GRANT用于授权,REVOKE用于回收权限。12.答案:A解析:自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且在结果中把重复的属性列去掉。13.答案:D解析:BCNF是对3NF的进一步规范化,消除了主属性对码的传递和部分依赖。BCNF的条件比3NF更严格,而非放宽。14.答案:A解析:1:N联系转换时,将1端的主码和联系本身的属性加入到N端的关系中作为外键。15.答案:B解析:需求分析阶段常用数据流图(DFD)、数据字典(DD)和判定表。E-R图用于概念结构设计。16.答案:B解析:ACID分别对应Atomicity(原子性)、Consistency(一致性)、Isolation(隔离性)、Durability(持久性)。17.答案:A解析:共享锁(S锁)与共享锁兼容,与排他锁互斥。故其他事务只能加S锁。18.答案:B解析:Redo日志重做已提交但可能因故障未写入磁盘的数据修改,确保持久性。19.答案:B解析:UNDO操作撤销未提交事务对数据库的修改,以回滚事务,恢复到事务前的状态。20.答案:B解析:死锁是指两个或多个事务互相等待对方持有的资源,导致都无法继续执行。21.答案:B解析:两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁:第一阶段(增长阶段)获得锁,第二阶段(缩减阶段)释放锁。一旦开始释放锁,就不能再申请新锁。B正确。C是充分条件,不是必要条件(遵循2PL一定可串行化,但可串行化不一定遵循2PL)。22.答案:B解析:分片透明性是最高级别的透明性,位于全局概念模式与分片模式之间,用户只需对全局关系操作,无需考虑数据如何分片。23.答案:B解析:同步复制要求更新所有副本才能提交事务,虽然数据一致性好,但延迟高,且只要一个副本不可用,写操作就失败(可用性低)。24.答案:B解析:NoSQL主要处理非结构化或半结构化数据,具有高扩展性、灵活的模式,适合海量数据和高并发场景。25.答案:C解析:Redis不支持复杂的表连接操作,它是Key-Value存储。26.答案:A解析:HDFS(HadoopDistributedFileSystem)是分布式文件系统。27.答案:C解析:Map阶段负责将输入的数据分解成(key,value)对,并进行初步处理(映射)。28.答案:B解析:数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持决策分析。29.答案:C解析:Apriori算法是最经典的关联规则挖掘算法。30.答案:B解析:SQL注入通过将恶意SQL代码插入到输入字段或查询字符串中,欺骗数据库服务器执行非授权命令。31.答案:B解析:候选码为AB。AB→C完全依赖。C32.答案:B解析:最大元组数发生在连接属性值完全相同的情况下。若R和S在A属性上只有1个公共值,且所有元组该值都相同,则结果为1000×33.答案:C解析:B+树的非叶子节点仅存储索引键值和指针,不存储实际数据(实际数据只存储在叶子节点)。这是B+树与B-树的重要区别之一。C选项描述正确。注:B+树非叶子节点确实不存储数据,所以C是正确的描述。等等,题目问的是“错误”的。B+树非叶子节点不存数据是特性。选项C说“非叶子节点仅存储索引键值,不存储实际数据”,这是正确的。选项B说叶子节点连接,正确。选项A平衡树,正确。选项D根节点至少两个子树,正确。等等,再看C。B+树非叶子节点确实不存Data。那么谁错了?B选项:B+树叶子节点通过链表连接,正确。D选项:B+树根节点若非叶子,至少两个孩子,正确。A选项:正确。C选项:B+树非叶子节点包含Key和Pointer。B-树非叶子节点包含Key,Pointer和Data(部分实现)。所以C是正确的。难道题目有误?或者是指C中“仅存储索引键值”?实际上还存指针。但通常描述说“索引项”。如果必须选一个,可能在B选项“适合范围查询”是B+树相对于B-树的优点,B+树确实适合。C选项“不存储实际数据”是B+树特征。可能题目选项设计有误,或者C被认为是不够严谨(因为存了指针)。但在软考中,通常认为C是正确的描述。再审视题目。啊,题目问的是错误。如果C是正确,那谁错?D:根节点若不是叶子,至少2子树。正确。A:正确。B:正确。可能是C被认为错误,因为非叶子节点还存储了指向子节点的指针,不仅仅是“索引键值”。但这太咬文嚼字。另一种可能是B选项,B+树叶子节点有指针,但通常说是“双向链表”或“链表”。B没错。再看D,根节点若只有一个节点(树只有根),根也是叶子,此时没有子树。但D说“根节点至少包含两个子树”,隐含了非叶子情况。通常命题是“非叶子根节点”。如果D没说“非叶子”,则D可能是错误(因为根可以是叶子)。选D。34.答案:C解析:嵌入式SQL通过宿主变量在主语言和SQL间传递数据,通过SQLCA(SQL通信区)传递状态信息。35.答案:D解析:并非所有视图都可更新。例如包含聚合函数、DISTINCT、GROUPBY等操作的视图是不可更新的。36.答案:C解析:查询优化器负责生成最高效的执行计划,决定如何访问数据(全表扫描还是索引扫描)以及连接顺序等。37.答案:B解析:反规范化通过引入冗余减少连接操作,提高查询性能,但牺牲写入性能和一致性。适合读多写少、I/O为瓶颈的场景。38.答案:C解析:面向对象中的继承对应关系数据库中的超类/子类表结构或类型层次。39.答案:D解析:OLAP操作包括上卷、下钻、切片、切块、旋转。插入元组是OLTP操作。40.答案:C解析:连接池复用数据库连接,避免频繁建立和断开连接的开销。41.答案:A解析:ReadUncommitted允许读取脏数据(未提交的数据)。42.答案:A解析:差异备份备份自上次完全备份以来变化的数据。日志差异备份才是基于上次日志备份。43.答案:B解析:Hash索引仅支持等值查询,不支持范围查询(A错),不支持排序(B对),通常不支持部分键匹配(C错)。Hash索引在处理键值冲突时需要拉链或开放寻址,效率取决于负载因子(D错)。44.答案:B解析:NULL表示未知。NULL与任何值比较(包括NULL)结果都是UNKNOWN(非TRUE)。A错。COUNT(列名)不统计NULL。C错。AVG忽略NULL。D错。45.答案:B解析:2PC第二阶段,若所有参与者都Prepare成功,协调者发送Commit命令。46.答案:D解析:MD5是摘要算法(哈希),不可逆,严格来说不是加密算法,且不适合密码存储(易被彩虹表破解,应加盐)。D说“可逆”是错误的。47.答案:A解析:全表扫描是CPU和I/O密集型。增加CPU核心数可能有一定帮助,但解决不了算法层面的低效(全表扫描)。根本解决方法是建索引或优化SQL。A相对最无效(治标不治本且可能效果甚微)。48.答案:A解析:根据Armstrong公理的传递律,若X→Y,Y→49.答案:B解析:触发器由事件触发,不能显式调用(A错)。可用于复杂逻辑(B对)。可以前触发也可以后触发(C错)。可以跨表(D错)。50.答案:B解析:关于数据库结构的信息(如表、列、权限)称为元数据。51.答案:C解析:简单的财务记账通常使用关系型数据库,不需要时空数据库特有的时空索引功能。52.答案:C解析:MySQL是传统的关系型数据库(虽然也有集群版),不属于NewSQL范畴(NewSQL强调分布式+ACID+Scaleout,如GoogleSpanner,TiDB)。53.答案:C解析:M:N联系。54.答案:A解析:SQL标准创建索引语法是CREATEINDEX。55.答案:C解析:逻辑设计后,通常需要进行规范化处理(模式优化),然后进入物理设计。56.答案:D解析:违反完整性约束时,数据库可以采取默认策略(如拒绝、级联、置空等),并非总是拒绝(例如设置了ONDELETECASCADE)。57.答案:B解析:统计数据库中,即使限制了元组访问,也可能通过集合查询推导出个体信息。扰动(添加噪声)是常用保护手段。58.答案:C解析:存储过程可以使用`ALTERPROCEDURE`或`CREATEORREPLACEPROCEDURE`进行修改。59.答案:A解析:连接对象不是线程安全的,多个线程不能共享同一个连接进行并发操作,否则会导致数据混乱或错误。60.答案:B解析:模块化旨在降低耦合度,提高内聚性,从而提高可维护性和可重用性。61.答案:B解析:除法运算用于查询“全部”类型的场景(例如查询选了全部课程的学生)。A是交运算。C优先级:乘除高于加减,但在关系代数中,乘积、连接、除法优先级通常高于并、差。D除法不满足交换律。62.答案:D解析:排他锁(X锁)与任何锁(S或X)都互斥。故其他事务既不能读也不能写。63.答案:B解析:检查点记录了某一时刻所有活跃事务。恢复时,只需检查点之后的日志进行UNDO/REDO,检查点之前的已提交事务对DB的影响已写入磁盘。64.答案:C解析:B-树的所有节点(包括非叶子)都存储数据记录(或指针)。B+树只有叶子存数据。A、B、D描述的是B+树。题目问B-树。65.答案:A解析:CAP定理:Consistency(一致性)、Availability(可用性)、Partitiontolerance(分区容错性)。66.答案:C解析:MongoDB是文档型NoSQL,支持复杂查询和索引。A错(非关系型),B错(集合Collection),D错(支持事务)。67.答案:B解析:事实表主要存储度量值(数值)和指向各个维度表的外键。68.答案:A解析:元数据描述数据的“关于数据的数据”,包括内容(业务含义)、结构(模式)、上下文(来源、所有者)等。69.答案:A解析:幻读是指在同一事务中,前后两次范围查询结果集数量不同(通常是因为其他事务插入了新行)。B对应不可重复读。C对应脏读。70.答案:A解析:ORM将对象映射到关系表,使开发者能用面向对象的方式操作数据库。71.答案:A解析:一次性加锁法(预加锁)要求事务开始时申请所有锁,可以破坏循环等待条件,预防死锁。72.答案:A解析:EXISTS返回布尔值,子查询有行则为True;IN用于值匹配。73.答案:BB解析:位图索引适合低基数(重复值多)的列,如性别、状态。它使用位串,非常适合OLAP(读多写少)。A错。C错(更新代价大,需锁定位图)。D通常比B+树小(取决于基数)。74.答案:D解析:确定数据类型属于物理结构设计的内容。逻辑设计确定模式和外键。75.答案:D解析:云原生、自治数据库(AI4DB)、区块链数据库均为当前及未来的重要趋势。二、下午试题答案与解析试题一【问题1】实体:车辆、司机、货物、运单、维修记录。联系类型:司机-车辆:M:N(不同时间一对多,整体多对多,但通常E-R图若强调“驾驶”行为,是M:N;若强调“当前状态”是属性。根据描述“一名司机可以驾驶多辆...同一时间一辆车一名司机”,这是典型的排班M:N关系)。运单-车辆:1:1(每笔运单指派一辆车,一辆车同一时间只能在一个运单中,虽然历史时间上1:N,但在运单实体定义的上下文中,运单与具体车辆是N:1,即运单侧是N,车辆侧是1。但题目问联系类型,运单与车辆是N:1)。运单-司机:N:1。运单-货物:1:N(一笔运单包含多个货物)。车辆-维修记录:1:N。【问题2】车辆(车牌号,品牌,型号,购买日期,当前状态)主键:车牌号司机(工号,姓名,电话,驾驶证号)主键:工号货物(货物编号,名称,重量,体积,类别)主键:货物编号运单(运单号,车牌号,司机工号,发货时间,预计到达时间,实际到达时间,状态)主键:运单号外键:车牌号,司机工号运单货物明细(运单号,货物编号,数量)主键:(运单号,货物编号)外键:运单号,货物编号维修记录(记录ID,车牌号,维修日期,维修内容,费用)主键:记录ID外键:车牌号【问题3】属于3NF。理由:候选码为运单号和{车牌号,司机工号}。非主属性为:发货时间,状态。不存在非主属性对码的部分依赖(因为码是单属性运单号)。不存在非主属性对码的传递依赖(运单号直接决定其他属性)。所以至少是3NF。但是,存在主属性对码的传递依赖吗?不,这里没有。是否达到BCNF?函数依赖{车牌号,司机工号}→运单号。决定因子{车牌号,司机工号}不包含码(运单号),且不是超码。所以不满足BCNF。故属于3NF。【问题4】建议建立B+树索引。索引列:1.在“发货时间”列上建立普通索引(用于范围查询)。2.在“车牌号”列上建立普通索引(用于点查询或查找该车辆的所有运单)。或者建立复合索引(车牌号,发货时间)如果查询总是先查车再查时间。试题二【问题1】```sqlCREATETABLEUser(UserIDINTPRIMARYKEY,UserNameVARCHAR(50),EmailVARCHAR(100),BalanceDECIMAL(10,2)DEFAULT0.00);CREATETABLEEnrollment(EnrollIDINTPRIMARYKEY,UserIDINT,CourseIDINT,EnrollDateDATETIME,StatusTINYINT,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论