版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年groupby测试题及答案
一、单项选择题(每题2分,共20分)1.在SQL中,GROUPBY子句必须出现在下列哪种子句之后?A.SELECTB.WHEREC.HAVINGD.ORDERBY2.若查询语句为SELECTdept,COUNT()FROMempGROUPBYdept,则结果集中每一行代表:A.每个员工的编号B.每个部门的员工人数C.每个部门的平均工资D.每个部门的最高工资3.下列关于GROUPBY与聚合函数的说法正确的是:A.聚合函数可以脱离GROUPBY独立使用B.GROUPBY只能与SUM函数搭配C.使用了GROUPBY后SELECT列表中只能出现聚合列D.聚合函数必须出现在HAVING子句中4.在标准SQL中,GROUPBY子句不允许出现下列哪种元素?A.列名B.列别名C.表达式D.聚合函数5.执行SELECTregion,MAX(population)FROMcityGROUPBYregionHAVINGMAX(population)>1000000时,HAVING的作用是:A.过滤城市人口大于100万的城市B.过滤地区人口总和大于100万的地区C.过滤地区最大城市人口大于100万的地区D.过滤地区数量大于100万的地区6.当SELECT列表包含非聚合列时,下列哪项必须满足?A.该列必须出现在ORDERBY中B.该列必须出现在GROUPBY中C.该列必须出现在WHERE中D.该列必须出现在HAVING中7.在MySQL8.0中,执行SELECTa,b,cFROMtGROUPBYa,sql_mode含ONLY_FULL_GROUP_BY时,系统会:A.自动选择b和c的最大值B.报错C.返回第一行b和c的值D.忽略该模式继续执行8.下列哪种聚合函数在GROUPBY查询中忽略NULL值?A.COUNT()B.COUNT(col)C.MAX(col)D.SUM(col)9.执行SELECTYEAR(order_date)y,SUM(amount)FROMordersGROUPBYyWITHROLLUP时,最后一行y列的值为:A.0B.NULLC.合计年份D.报错10.在PostgreSQL中,GROUPBYGROUPINGSETS((a),(b),())等效于:A.ROLLUP(a,b)B.CUBE(a,b)C.三个独立GROUPBY结果UNIOND.两个独立GROUPBY结果JOIN二、填空题(每题2分,共20分)11.在SQL标准中,SELECT列表中所有非聚合列必须________。12.若需按季度汇总销售额,可使用函数________配合GROUPBY。13.GROUPBY子句中不能使用窗口函数,但可以在________子句中使用。14.当使用GROUPBYROLLUP(year,month)时,会产生________个分组级别。15.在Hive中,若启用严格模式,使用GROUPBY时必须添加________子句防止全表聚合。16.执行SELECTCOUNT(DISTINCTuid)FROMlogGROUPBYdate时,结果表示每日________。17.在Oracle中,GROUPBY支持________子句用于返回多维汇总结果。18.若需获取每个班级男生与女生的人数,应使用GROUPBYclass,________。19.在SparkSQL中,使用GROUPBY后调用collect_list()可实现________聚合。20.当GROUPBY与HAVING同时出现时,HAVING在逻辑上作用于________之后。三、判断题(每题2分,共20分)21.GROUPBY子句可以出现在子查询中。22.使用了GROUPBY后,WHERE子句中不能出现聚合函数。23.在MySQL中,GROUPBY默认按分组列升序排序。24.GROUPBYCUBE(a,b)产生的分组数量与GROUPINGSETS((a),(b),(a,b),())相同。25.在SQLServer中,GROUPBY列不能为text类型。26.执行SELECTa,b,SUM(c)FROMtGROUPBYa将报错,因为b未聚合也未分组。27.在BigQuery中,GROUPBY支持使用列偏移如GROUPBY1,2。28.使用GROUPBY后,SELECT列表中可以使用窗口函数。29.在Presto中,GROUPBY子句允许使用lambda表达式。30.当GROUPBY与DISTINCT同时出现时,DISTINCT总是先生效。四、简答题(每题5分,共20分)31.简述SQL查询语句中GROUPBY与HAVING的执行顺序,并说明各自作用。32.说明ONLY_FULL_GROUP_BY模式对查询结果的影响,并给出关闭该模式可能带来的风险。33.对比ROLLUP、CUBE与GROUPINGSETS三者在多维汇总场景下的差异,各举一例。34.在数据仓库场景下,如何利用GROUPBY进行近似去重计数,并说明其优缺点。五、讨论题(每题5分,共20分)35.讨论在分布式计算框架(如Spark)中,GROUPBY操作引发的数据倾斜问题及其优化策略。36.分析“先过滤后分组”与“先分组后过滤”在性能与语义上的差异,并结合索引与列式存储讨论最佳实践。37.探讨在实时流处理(如Flink)中实现GROUPBY窗口聚合时,如何平衡延迟、准确性与资源消耗。38.评估在隐私计算场景下,使用GROUPBY进行聚合查询时可能导致的敏感信息泄露风险,并提出缓解方案。答案与解析一、1B2B3A4D5C6B7B8B9B10C二、11出现在GROUPBY子句中12EXTRACT(QUARTERFROMdate)或TO_CHAR13SELECT14315WHERE16独立访客数17GROUPINGSETS18gender19列表20分组三、21√22√23√24√25√26√27√28×29×30×四、31.执行顺序:FROM→WHERE→GROUPBY→HAVING→SELECT→ORDERBY。GROUPBY按指定列分组,HAVING对分组结果进行聚合过滤,二者配合实现“先聚合后过滤”的语义。32.该模式要求SELECT列表中所有非聚合列必须出现在GROUPBY,否则报错,保证结果确定性;关闭后MySQL返回分组内任意行值,可能导致业务逻辑不可重复、数据质量下降。33.ROLLUP按层级生成小计与总计,如ROLLUP(year,month)产生(year,month)、(year)、()三组;CUBE生成所有维度组合,共2^n组;GROUPINGSETS可自定义组合,如GROUPINGSETS((year),(month))仅两组,灵活度最高。34.使用GROUPBY配合approx_count_distinct函数(Spark)或HyperLogLog,牺牲2%误差换取10倍以上性能提升;优点内存占用低、速度快,缺点为近似值,不适用于精确结算场景。五、35.数据倾斜表现为某分组键记录量极大,导致任务长尾;优化包括两阶段聚合(局部聚合+全局聚合)、加盐打散、自适应查询执行、倾斜键单独处理及广播小表等。36.WHERE在分组前过滤,减少扫描量,可利用索引;HAVING在分组后过滤,无法使用索引。列式存储下提前过滤显著减少IO;最佳实践为把非聚合过滤条件下推至WHERE,保留聚合过滤
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年性格及其调适测试题及答案
- 2026年电磁波谱测试题及答案
- 2026年泰康新人测试题及答案
- 2026年电话英语测试题及答案
- 2026年实力单身的测试题及答案
- 2026年资金管理测试题及答案
- 2026年攀比心理 心理测试题及答案
- 2026年淄博消防测试题及答案
- 物理竞赛试题范围及答案
- 外周介入试题及答案
- 对外投资合作国别(地区)指南-日本(2025年版)
- 2026年江苏省无锡市金桥双语实验学校中考物理一模试卷(含答案)
- 水土保持研究方法课件
- DB35T 2290-2026 非物质文化遗产 福州茉莉花茶窨制工艺
- 酒店民宿客房消杀消毒规范手册
- 2026江西赣州市章贡区社区工作者(专职网格员)招聘102人参考考试试题及答案解析
- 悼念亲人的追思词写作技巧与范例
- 烹饪实训室安全教育课件
- 2026春外研版七年级下册英语期末试卷二(含听力音频答案)
- 一升二年级数学暑假衔接巩固预习每日一练材料
- 锅炉MFT讲解课件
评论
0/150
提交评论