2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A及答案_第1页
2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A及答案_第2页
2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A及答案_第3页
2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A及答案_第4页
2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》科目期末试卷A及答案_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》科目期末A及答案2025年兰州交通大学数据科学与大数据技术专业《数据库系统原理》期末A考生注意:1.本卷共六大题,满分100分,答题时间120分钟;2.所有答案须写在答题纸上,写在试题纸无效;3.可使用无编程功能计算器;4.与答题纸同时上交。一、单项选择题(每题1分,共15分)1.在关系模型中,下列关于候选键的描述正确的是A.候选键只能由一个属性构成B.候选键的值可以重复C.候选键的真子集也可能成为候选键D.候选键能唯一标识元组且其任何真子集都不能唯一标识元组2.设关系R(A,B,C)满足函数依赖集F={A→B,B→C},则下列对F的最小覆盖描述正确的是A.最小覆盖一定包含A→CB.最小覆盖可能去掉B→CC.最小覆盖中每个依赖右部均为单属性D.最小覆盖中左部属性数一定大于右部3.在SQL标准中,用于定义事务“读已提交”隔离级别的语句是A.SETTRANSACTIONREADCOMMITTEDB.SETSESSIONCHARACTERISTICSASTRANSACTIONREADCOMMITTEDC.BEGINISOLATIONLEVELREADCOMMITTEDD.STARTTRANSACTIONWITHREADCOMMITTED4.关于B+树索引,下列说法错误的是A.叶节点之间通过指针顺序链接B.非叶节点存储键值与指向子节点的指针C.叶节点包含指向实际数据记录的指针D.非叶节点也存储指向数据记录的指针5.在基于锁的并发控制中,若事务T1对数据项Q持有共享锁,事务T2对Q申请排他锁,则T2A.立即获得锁B.等待直到T1释放共享锁C.导致T1回滚D.导致T2回滚6.设关系R与S做自然连接,若R含m个元组,S含n个元组,则结果元组数A.一定等于m×nB.一定小于等于min(m,n)C.可能大于m+nD.可能为07.在分布式数据库中,采用“主副本+多从副本”策略主要解决A.数据分片B.全局死锁C.读扩展性与容错D.透明性8.关于视图的可更新性,SQL-92规定下列哪种视图理论上允许INSERTA.定义中含GROUPBYB.定义中含DISTINCTC.定义中含UNIOND.行列子视图且含主键9.在PostgreSQL中,对JSONB字段建立GIN索引属于A.聚簇索引B.倒排索引C.位图索引D.散列索引10.若系统采用WAL机制,崩溃恢复时首先重做A.所有已提交事务B.所有未提交事务C.所有检查点之前的事务D.所有日志记录11.在MapReduce与关系代数结合框架中,Selection操作最适合放在A.Map阶段B.Shuffle阶段C.Reduce阶段D.任意阶段均可12.关于函数依赖集F的闭包F⁺,下列说法正确的是A.F⁺大小与F相等B.F⁵⊆F⁺C.F⁺包含所有逻辑蕴含的依赖D.F⁺可通过Armstrong公理在多项式时间求出13.在数据仓库星型模式中,缓慢变化维度Type2采用A.覆盖旧值B.增加新列C.增加新行并标记版本D.新建表14.当执行计划出现“IndexOnlyScan”时,说明A.查询只需索引键即可返回结果B.查询无需任何索引C.索引已损坏D.需回表获取元组15.在CAP理论中,当网络分区发生时,系统选择放弃一致性而保证可用性,该策略称为A.StrongconsistencyB.EventualconsistencyC.LinearizabilityD.Serializability二、填空题(每空1分,共15分)1.关系数据库的三级模式结构是外模式、________、内模式。2.在SQL中,用于删除表定义及所有数据的命令是________。3.若事务T对数据项Q加了________锁,则其它事务对Q不能再加任何锁。4.在关系代数中,选择运算的符号是________。5.若F={A→BC,D→E},则(A)+=________。6.在分布式事务中,两阶段提交协议的第一阶段称为________阶段。7.在B+树中,阶数m指每个节点最多有________棵子树。8.数据仓库ETL的“T”指________。9.在PostgreSQL中,查看执行计划的命令是________。10.若关系R的候选键为{A,B},则R的任何非主属性必须________于{A,B}。11.在日志中,记录<T,Q,v1,v2>表示事务T对数据项Q由旧值v1改为新值v2,这种日志称为________日志。12.在并行数据库中,将表按某属性范围划分到不同节点的策略称为________划分。13.若系统采用多版本并发控制MVCC,读操作通过________版本避免加锁。14.在SparkSQL中,DataFrame的底层执行计划经过________优化器生成RDD。15.当关系模式达到________范式时,任何非平凡函数依赖的决定因素都包含候选键。三、判断题(每题1分,共10分,正确打“√”,错误打“×”)1.关系模型的完整性约束包括实体完整性、参照完整性和用户定义完整性。2.在SQL中,NULL参与任何比较运算结果仍为NULL。3.若F的最小覆盖与F相等,则F一定无冗余依赖。4.分布式数据库的透明性包括分片透明、复制透明和位置透明。5.在B+树中,叶节点存储实际数据记录,非叶节点仅存储索引键。6.触发器只能在INSERT事件发生后执行。7.若事务调度满足冲突可串行化,则一定满足视图可串行化。8.数据仓库中,事实表通常包含外键和度量值。9.在PostgreSQL中,共享锁与排他锁的兼容性矩阵是对称的。10.NoSQL数据库均不支持ACID事务。四、简答题(每题5分,共20分)1.简述数据库系统中“检查点”的作用及其对恢复时间的影响。2.说明关系模式分解的“无损连接”定义,并给出检验无损连接的chase过程核心思想。3.对比聚簇索引与非聚簇索引在存储结构与查询性能上的差异。4.解释分布式数据库中“最终一致性”与“强一致性”在用户体验上的具体差异,并举例说明。五、综合应用题(共25分)1.(8分)某高校选课系统涉及如下关系:Student(Sno,Sname,Sage,Sdept)Course(Cno,Cname,Ccredit,Cdept)SC(Sno,Cno,Grade)需求:(1)写出SQL语句,查询“计算机系”学生选修的“软件工程”课程的平均成绩;(2)创建视图V_CS,包含计算机系学生的学号、姓名及已获学分(Grade≥60则获得课程学分),并保证对该视图的更新操作能正确反映到基表;(3)说明在(2)中视图是否可更新,若不可更新请修改设计使其可更新。2.(8分)给定关系模式R(A,B,C,D,E,F)及函数依赖集F={A→BC,CD→EF,B→D,E→F}。(1)求R的候选键;(2)判断R最高满足第几范式,若未达到3NF,请分解为3NF并保持无损连接与依赖保持。3.(9分)某电商系统采用主从复制MySQL,订单表Orders(order_id,user_id,amount,status,create_time)日均写入500万行,查询多为近7天范围扫描。(1)设计分区策略并说明理由;(2)为提升查询性能,需建立索引,请给出索引列顺序并解释最左前缀原则如何利用;(3)若系统需支持幂等更新订单状态,请用SQL和唯一索引结合实现,并说明如何防止并发重复更新。六、设计论述题(15分)某市交通管理局拟建设“智慧交通大数据平台”,整合出租车GPS、公交车CAN总线、地铁闸机、共享单车锁桩四类数据,日均增量2TB,峰值并发写入10万条/秒,需支持实时查询最近30分钟路况、离线分析90天历史轨迹、按车牌号精确查询车辆近一年行程。请完成:1.给出逻辑数据模型(用E-R图文字描述即可),说明实体、属性、主键、外键及联系类型;2.选一种分布式数据库(HBase、Cassandra、TiDB、MongoDB四选一),论证其适用性,并设计物理表结构或集合结构,说明行键/分片键、列族/字段、压缩、TTL、副本策略;3.针对“实时查询最近30分钟路况”需求,给出流处理架构(组件、数据流、窗口类型、触发机制),并写出核心SQL或伪代码;4.针对“按车牌号精确查询车辆近一年行程”需求,设计二级索引或物化视图方案,评估写入放大与查询延迟;5.说明在数据retention与GDPR类似隐私条款下,如何安全删除或匿名化历史数据,并保证副本一致性。(答案区,请翻页)答案与评分标准一、单项选择题1.D2.C3.A4.D5.B6.D7.C8.D9.B10.A11.A12.C13.C14.A15.B二、填空题1.概念模式2.DROPTABLE3.排他4.σ5.ABC6.投票/Prepare7.m8.Transform9.EXPLAIN10.完全函数依赖11.物理/Redo12.范围13.快照14.Catalyst15.BCNF三、判断题1.√2.√3.√4.√5.×6.×7.√8.√9.×10.×四、简答题(要点答出即给满分,意思对即可)1.检查点将内存缓冲区已修改数据强制写入磁盘,并在日志中记录检查点标记;缩短恢复时重做日志长度,减少恢复时间。2.无损连接指分解后自然连接能恢复原始关系;chase过程通过函数依赖不断使两行在公共属性上相等,若最终生成一行全a符号则无损。3.聚簇索引叶节点即数据页,按索引键排序存储,范围查询快,一张表只能一个;非聚簇索引叶节点存指针或主键,回表成本高,可建多个。4.强一致性读写即时一致,如银行转账;最终一致性允许短暂不一致,如微信朋友圈点赞数,过几秒收敛;示例:用户A发评论,用户B立即查看可能看不到,刷新后可见。五、综合应用题1.(1)SELECTAVG(Grade)FROMStudentSJOINSCONS.Sno=SC.SnoJOINCourseCONSC.Cno=C.CnoWHERESdept='计算机系'ANDCname='软件工程';(2)CREATEVIEWV_CSASSELECTS.Sno,Sname,SUM(Ccredit)AStot_creditFROMStudentSJOINSCONS.Sno=SC.SnoJOINCourseCONSC.Cno=C.CnoWHERESdept='计算机系'ANDGrade>=60GROUPBYS.Sno,Sname;(3)该视图含GROUPBY,不可直接更新;改为行列子视图:CREATEVIEWV_CS_UPASSELECTSno,SnameFROMStudentWHERESdept='计算机系';对该视图执行INSERT时,INSTEADOF触发器将数据拆写基表。2.(1)求属性闭包:A⁺=ABCDEF,故候选键为A。(2)存在部分依赖与传递依赖,最高1NF;分解:R1(A,B,C),R2(B,D),R3(C,D,E,F)→进一步R3拆为R31(C,D,E),R32(E,F);验证无损:通过chase表可恢复;依赖保持:A→BC在R1,B→D在R2,CD→EF拆为CD→E与E→F,均保留。3.(1)按create_time做RANGE分区,每7天一个分区,便于快速删除旧数据;(2)联合索引(create_time,user_id,status),最左前缀利用create_time范围过滤,减少回表;(3)在order_id与status上建唯一索引UNIQ(order_id,status),更新前INSERTINTO…ONDUPLICATEKEYUPDATE实现幂等;或用版本号列version,更新时比较version+1,失败重试。六、设计论述题(参考要点,言之成理即可)1.逻辑模型:实体Vehicle(vehicle_idPK,type,license_plate,owner,reg_time)Device(device_idPK,type∈{taxiGPS,busCAN,metroGate,bikeLock},location,install_time)Trip(trip_idPK,vehicle_idFK,start_time,end_time,distance,avg_speed)LocationPoint(point_idPK,trip_idFK,lat,lon,speed,timestamp,device_idFK)联系:Vehicle1-NTrip,Trip1-NLocationPoint,Device1-NLocationPoint。2.选HBase:高吞吐顺序写、RowKey范围扫描、版本管理、TTL、压缩适合时空数据;表设计:表名:TRIPSRowKey:license_plate+timestamp(long)+trip_id(倒序)列族:F1{start_time,end_time,distance,avg_speed},F2{device_l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论