版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年大数据库试题及答案一、单项选择题(每题2分,共20分)1.以下关于关系模型中候选键的描述,正确的是()。A.候选键是表中可以唯一标识元组的一个属性B.候选键一定是主键C.一个关系中可以有多个候选键D.候选键不能包含多个属性2.在SQL中,若要查询“学生表”中年龄在20到25岁之间(包含20和25)的学生,正确的WHERE子句是()。A.WHERE年龄BETWEEN20OR25B.WHERE年龄BETWEEN20AND25C.WHERE年龄>=20OR年龄<=25D.WHERE年龄IN(20,25)3.下列关于B+树索引的说法,错误的是()。A.所有叶子节点通过指针连接,便于范围查询B.非叶子节点仅存储索引键和子节点指针C.适合频繁的插入、删除操作D.索引的高度通常比B树更低4.事务的ACID特性中,“隔离性”(Isolation)的作用是()。A.确保事务执行后数据保持一致性状态B.保证事务的所有操作要么全部完成,要么全部不执行C.防止事务执行过程中因系统故障导致数据丢失D.确保多个并发事务的执行结果与按某种顺序串行执行的结果一致5.某关系模式R(A,B,C,D),函数依赖为A→B,B→C,C→D,则R的最高范式是()。A.1NFB.2NFC.3NFD.BCNF6.分布式数据库中,“CAP定理”指的是()。A.一致性、可用性、分区容忍性不可同时满足B.完整性、原子性、持久性不可同时满足C.并发性、安全性、可靠性不可同时满足D.可扩展性、高吞吐量、低延迟不可同时满足7.数据仓库的核心特性是()。A.支持实时事务处理(OLTP)B.面向主题、集成、稳定、随时间变化C.强调数据的实时性和原子性D.仅存储当前最新数据8.以下SQL语句中,用于修改表结构的是()。A.UPDATEB.ALTERC.INSERTD.DELETE9.在Hive中,用于将结构化数据文件映射为数据库表的语句是()。A.CREATETABLEB.LOADDATAC.INSERTINTOD.SELECT10.关于数据库索引的优化,以下说法正确的是()。A.为所有列添加索引可以提高查询效率B.覆盖索引可以避免回表操作C.主键自动创建的是非聚簇索引D.索引越多,写入操作的性能越高二、填空题(每空2分,共20分)1.关系数据库中,关系的完整性约束包括实体完整性、参照完整性和__________。2.SQL中,用于返回查询结果前10行的子句是__________(假设数据库支持标准语法)。3.事务的隔离级别中,允许“脏读”但能避免“不可重复读”的是__________。4.数据仓库的ETL过程指的是__________、转换、加载。5.分布式数据库中,解决数据分片问题的常见策略包括水平分片、垂直分片和__________。6.在关系代数中,π(投影)操作的作用是__________。7.数据库恢复技术的基础是__________,其记录了数据库中所有更新操作。8.HBase的存储模型基于__________,数据按行键排序存储。9.若事务T1对数据A加了共享锁(S锁),则事务T2对数据A可以加__________锁(填“共享”或“排他”)。10.第三范式(3NF)要求关系模式中不存在非主属性对__________的传递函数依赖。三、简答题(每题8分,共40分)1.简述聚簇索引与非聚簇索引的区别,并说明各自的适用场景。2.解释“死锁”的概念,并说明数据库管理系统(DBMS)处理死锁的常用方法。3.对比OLTP(联机事务处理)与OLAP(联机分析处理)的主要差异(至少列出4点)。4.简述数据库设计中“逻辑设计”阶段的主要任务,并说明如何将E-R模型转换为关系模式。5.大数据场景下,传统关系型数据库(如MySQL)的局限性有哪些?分布式数据库(如TiDB)是如何解决这些问题的?四、设计题(每题10分,共20分)1.某高校需设计“学生选课管理系统”数据库,涉及的实体有:学生(学号,姓名,性别,年龄)、课程(课程号,课程名,学分)、教师(工号,姓名,职称)。其中,学生与课程之间存在“选课”关系(包含选课时间),教师与课程之间存在“授课”关系(包含授课学期)。要求:(1)画出E-R图(需标注实体属性、联系类型及联系属性);(2)将E-R图转换为关系模式(需标注主键和外键)。2.某电商平台需优化“订单表”的查询性能,已知高频查询场景包括:-根据用户ID查询最近3个月的订单(用户ID,下单时间);-根据订单状态(如“待支付”“已发货”)统计各状态的订单数量;-根据商品ID查询关联的订单详情(商品ID,订单金额)。请设计合理的索引策略(需说明索引类型、列顺序及原因)。五、编程题(共30分)1.(10分)使用SQL语句完成以下操作:(1)创建“员工表”(employee),包含字段:员工ID(emp_id,主键,INT类型)、姓名(emp_name,VARCHAR(50))、部门ID(dept_id,INT类型,外键关联部门表dept的dept_id)、入职日期(hire_date,DATE类型)、月薪(salary,DECIMAL(10,2));(2)向员工表中插入一条记录:emp_id=1001,emp_name='张三',dept_id=20,hire_date='2023-01-15',salary=15000.00;(3)查询部门ID为20的所有员工中,月薪高于部门平均月薪的员工姓名和月薪(要求使用子查询)。2.(10分)某公司“销售表”(sales)包含字段:销售ID(sale_id)、产品ID(prod_id)、销售日期(sale_date)、销售数量(qty)。请编写SQL语句:(1)按产品ID分组,查询每个产品2024年各季度的总销售数量(季度字段命名为quarter,总数量命名为total_qty);(2)使用窗口函数,计算每个产品的累计销售数量(按销售日期升序排列)。3.(10分)编写一个存储过程(存储过程名为get_dept_salary),输入参数为部门ID(dept_id),输出该部门员工的最高月薪、最低月薪和平均月薪。答案一、单项选择题1.C(候选键是能唯一标识元组的属性或属性组,一个关系可有多候选键,主键是选中的一个候选键)2.B(BETWEEN...AND...表示闭区间)3.C(B+树的结构更适合范围查询,但频繁插入删除可能导致页分裂,性能不如哈希索引)4.D(隔离性确保并发事务互不干扰,结果等价于串行执行)5.B(存在传递依赖A→C,A→D,不满足3NF)6.A(CAP定理指出一致性、可用性、分区容忍性三者不可全选)7.B(数据仓库面向主题,集成多源数据,长期存储历史数据)8.B(ALTER用于修改表结构,如添加列、修改约束)9.A(Hive通过CREATETABLE定义外部表或内部表,映射存储路径)10.B(覆盖索引包含查询所需所有列,无需回表)二、填空题1.用户定义完整性2.LIMIT103.读已提交(ReadCommitted)4.抽取(Extract)5.混合分片6.从关系中选取若干属性列组成新关系7.日志(或日志文件、事务日志)8.列族(ColumnFamily)9.共享10.候选键三、简答题1.区别:聚簇索引的存储顺序与数据行的物理存储顺序一致,一个表只能有一个聚簇索引;非聚簇索引的存储顺序与物理顺序无关,一个表可有多非聚簇索引。适用场景:聚簇索引适合主键查询或范围查询(如按时间排序的订单表);非聚簇索引适合频繁查询的非主键列(如用户表的手机号查询)。2.死锁:两个或多个事务因争夺资源而相互等待,导致无法继续执行的状态。处理方法:-死锁检测:DBMS定期检查事务等待图,发现环则选择代价最小的事务回滚;-死锁预防:通过顺序加锁、超时机制(如事务等待超时则回滚)避免死锁发生。3.差异:-目标:OLTP支持日常事务处理(如订单提交),OLAP支持决策分析(如销售统计);-数据量:OLTP数据量较小(实时更新),OLAP数据量极大(历史数据);-操作类型:OLTP以增删改(DML)为主,OLAP以查询(SELECT)为主;-响应时间:OLTP要求毫秒级响应,OLAP允许秒级或分钟级响应。4.逻辑设计任务:将概念模型(E-R图)转换为数据库管理系统支持的逻辑模型(如关系模型),并优化关系模式(如消除冗余、满足范式)。E-R转换规则:-实体转换为关系模式,属性为列,主键为实体标识符;-1:1联系可合并到任一实体或独立成表;-1:n联系合并到n端实体(添加1端主键作为外键);-m:n联系独立成表(包含两端主键及联系属性,组合主键)。5.传统数据库局限性:-扩展性差:单节点存储和计算能力有限,无法处理PB级数据;-并发性能低:高并发写入时锁竞争激烈;-容错性弱:单点故障导致服务中断。分布式数据库解决方式:-数据分片:将数据分散到多个节点,支持水平扩展;-分布式事务:通过两阶段提交(2PC)或TCC(补偿事务)保证一致性;-多副本机制:通过Raft或Paxos协议实现数据冗余,提高容错性。四、设计题1.(1)E-R图(文字描述):-实体“学生”属性:学号(主键)、姓名、性别、年龄;-实体“课程”属性:课程号(主键)、课程名、学分;-实体“教师”属性:工号(主键)、姓名、职称;-联系“选课”(学生-课程,m:n)属性:选课时间;-联系“授课”(教师-课程,1:n)属性:授课学期。(2)关系模式:-学生(学号,姓名,性别,年龄)主键:学号;-课程(课程号,课程名,学分)主键:课程号;-教师(工号,姓名,职称)主键:工号;-选课(学号,课程号,选课时间)主键:(学号,课程号),外键:学号→学生.学号,课程号→课程.课程号;-授课(工号,课程号,授课学期)主键:(工号,课程号),外键:工号→教师.工号,课程号→课程.课程号。2.索引策略:-用户ID+下单时间的复合索引(B树索引):用户ID为前导列,下单时间为第二列,支持“用户ID查询最近3个月订单”的范围查询(WHEREuser_id=?ANDorder_timeBETWEEN...);-订单状态的单列索引(B树索引):统计各状态订单数量时,索引可快速定位不同状态的记录;-商品ID的覆盖索引(包含商品ID、订单金额):查询商品关联订单详情时,索引直接返回所需数据,避免回表。五、编程题1.(1)```sqlCREATETABLEemployee(emp_idINTPRIMARYKEY,emp_nameVARCHAR(50)NOTNULL,dept_idINT,hire_dateDATE,salaryDECIMAL(10,2),FOREIGNKEY(dept_id)REFERENCESdept(dept_id));```(2)```sqlINSERTINTOemployee(emp_id,emp_name,dept_id,hire_date,salary)VALUES(1001,'张三',20,'2023-01-15',15000.00);```(3)```sqlSELECTemp_name,salaryFROMemployeeWHEREdept_id=20ANDsalary>(SELECTAVG(salary)FROMemployeeWHEREdept_id=20);```2.(1)```sqlSELECTprod_id,QUARTER(sale_date)ASquarter,SUM(qty)AStotal_qtyFROMsalesWHEREsale_dateBETWEEN'2024-01-01'AND'2024-12-31'GROUPBYprod_id,QUARTER(sale_date);```(2)```
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 常州市溧阳中学高三地理一轮复习东北农业作业
- 2025年高职化工装备技术(化工设备维护)试题及答案
- 2025年中职生命科学(生命现象基础)试题及答案
- 2025年高职审计(审计实务)试题及答案
- 2025年高职(电力工程及自动化基础)电力系统运维阶段测试题及答案
- 2025年中职婴幼儿早期指导(感官发育训练)试题及答案
- 大学(工程管理)项目进度控制2026年综合测试题及答案
- 2025年高职动物医学(动物疫病防治)试题及答案
- 2025年高职皮革制品设计与工艺(皮具设计技术)试题及答案
- 2025年中职林业病虫害防治(林业病虫害防治)试题及答案
- 动物尸体剖检(动物病理学课件)
- 客舱服务(空中乘务专业)全套教学课件
- 光伏电站收益率测算模型(带财务表)
- 银行个人贷款抵押合同
- 《羽毛球运动》优质课件PPT
- 三轴转台仿真设计设计说明书
- 2015年版干部履历表
- 陶棍陶板考察报告
- q gw2sjss.65金风风力发电机组防腐技术rna部分归档版
- 陕西北元化工集团有限公司 100 万吨 - 年聚氯乙烯项目竣工验收监测报告
- 向知识分子介绍佛教剖析
评论
0/150
提交评论