版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
零售大数据工程师考试试卷及答案一、填空题(共10题,每题1分)1.零售大数据中,______是指单位时间内完成的交易次数。2.Hadoop生态中,用于分布式存储的核心组件是______。3.RFM模型的F代表______。4.常用实时计算框架是______(举1个)。5.ABC分类法按______占比划分商品等级。6.数据清洗的步骤包括去重、补全、______等。7.SQL中SUM、COUNT属于______函数。8.线上销售中,访问页面后完成购买的比例叫______。9.Tableau属于______工具。10.常用离线计算框架是______(举1个)。二、单项选择题(共10题,每题2分)1.零售大数据特征不包括?A.体量大B.价值密度高C.速度快D.多样性2.HDFS默认块大小是?A.64MBB.128MBC.256MBD.512MB3.RFM模型中R值越高代表?A.最近消费越近B.最近消费越远C.消费频率越高D.消费金额越大4.以下是实时计算框架的是?A.HiveB.FlinkC.HBaseD.Pig5.安全库存公式不包括?A.平均日需求量B.订货周期C.需求波动系数D.商品单价6.“SELECTFROMtableWHEREid=1”属于?A.DDLB.DMLC.DCLD.TCL7.属于客户行为标签的是?A.年龄B.性别C.购买偏好D.职业8.Spark核心组件不包括?A.SparkCoreB.SparkSQLC.SparkStreamingD.SparkDB9.跳失率是指?A.仅访1页就离开的用户占比B.未购用户占比C.重复访问占比D.新用户占比10.属于NoSQL数据库的是?A.MySQLB.OracleC.MongoDBD.SQLServer三、多项选择题(共10题,每题2分)1.零售大数据应用场景包括?A.精准营销B.库存优化C.客户流失预警D.供应链管理2.Hadoop核心组件包括?A.HDFSB.MapReduceC.YARND.Spark3.RFM模型维度是?A.RecencyB.FrequencyC.MonetaryD.Member4.数据清洗常见问题包括?A.数据重复B.数据缺失C.格式错误D.数据不一致5.库存分析方法包括?A.ABC分类法B.EOQC.安全库存法D.聚类分析6.实时计算应用场景包括?A.实时交易监控B.实时推荐C.实时库存更新D.离线报表7.客户画像标签类型包括?A.基本属性B.行为C.价值D.偏好8.SQLDML语句包括?A.SELECTB.INSERTC.UPDATED.DELETE9.大数据可视化工具包括?A.TableauB.PowerBIC.EChartsD.Matplotlib10.供应链大数据应用包括?A.需求预测B.供应商评估C.物流优化D.库存共享四、判断题(共10题,每题2分)1.零售大数据价值密度高,每GB数据都有高价值。()2.HDFS适合存储小文件,不适合大文件。()3.RFM模型M值越高代表消费金额越大。()4.Flink支持Exactly-Once语义。()5.ABC分类中A类是销售额占比最高的少数商品。()6.SQLDDL用于数据操作(如INSERT)。()7.跳失率越高,用户体验越好。()8.MongoDB是关系型数据库。()9.Spark比MapReduce快,因采用内存计算。()10.客户流失预警只需分析行为数据,不用基本属性。()五、简答题(共4题,每题5分)1.简述零售客户画像构建步骤。2.简述HDFS主要特点。3.简述零售库存优化常用方法及作用。4.简述SparkCore核心概念(至少3个)。六、讨论题(共2题,每题5分)1.如何利用零售大数据提升线上店铺转化率?2.零售大数据在供应链管理中的挑战及解决方案?---答案部分一、填空题答案1.交易频次2.HDFS3.消费频率4.Flink(或SparkStreaming)5.销售额(或价值量)6.格式转换7.聚合8.转化率9.BI(商业智能)10.Spark(或MapReduce)二、单项选择题答案1.B2.B3.B4.B5.D6.B7.C8.D9.A10.C三、多项选择题答案1.ABCD2.ABC3.ABC4.ABCD5.ABCD6.ABC7.ABCD8.ABCD9.ABCD10.ABCD四、判断题答案1.×2.×3.√4.√5.√6.×7.×8.×9.√10.×五、简答题答案1.客户画像构建步骤:①数据采集:整合线上线下(购买、浏览、交易)数据;②数据清洗:处理缺失、重复、格式错误;③标签体系:按基本属性、行为、价值等定义标签;④画像生成:用聚类算法(如K-means)分组,可视化输出,支撑营销/库存优化。2.HDFS特点:①分布式存储:大文件切分块(128MB)分散存储;②高容错:3副本机制;③适合大文件:小文件效率低;④流式访问:优化批量处理;⑤主从架构:NameNode管元数据,DataNode存数据块。3.库存优化方法:①ABC分类:重点管A类(高价值少数);②EOQ:平衡订货/持有成本;③安全库存:避免缺货;④需求预测:算法预测销量;⑤库存共享:连锁间共享减少积压。4.SparkCore核心概念:①RDD:弹性分布式数据集,支持内存计算;②分区:数据分散到集群节点并行处理;③算子:转换(map/filter)生成新RDD,行动(count)触发计算;④依赖:窄依赖(单分区)/宽依赖(多分区,触发Shuffle)。六、讨论题答案1.提升线上转化率:①精准引流:分析搜索/浏览轨迹优化关键词;②个性化推荐:基于画像实时推“猜你喜欢”;③体验优化:降跳失率(改页面加载/详情页);④动态定价:结合需求预测调促销价;⑤流失挽回:对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年民法典总题库附答案
- 领导力培养与决策能力提升
- 2025年湖南省岳阳市华容县事业单位招聘水利水电知识练习题及答案
- (2025年)华宁县遴选面试真题及答案大全解析
- 2025年动脉硬化考题及答案
- (2025年)襄阳市南漳县辅警协警笔试笔试真题(附答案)
- 新课标新教材之群文阅读
- 2026云南玉溪市文化馆城镇公益性岗位招聘3人备考题库附参考答案详解ab卷
- 2026福建泉州晋江市第三实验小学春季自聘合同教师招聘1人备考题库及完整答案详解【夺冠】
- 2026河南洛阳商业职业学院招聘7人备考题库附参考答案详解(满分必刷)
- 输液港(植入式静脉给药装置)临床应用与管理规范
- 2026广东深圳市龙岗区宝龙街道招考聘员14人(2603批次)考试参考试题及答案解析
- 移动应用开发安全技术准则
- 2026年安徽商贸职业技术学院单招职业适应性测试题库附答案详解(突破训练)
- 2025安徽池州市石台县乡村振兴投资控股集团有限公司招聘4人笔试历年典型考点题库附带答案详解
- 西部机场集团招聘笔试题目
- 机关内部工作交接制度
- 血小板减少急救措施
- 上海市第一至十八届高一物理基础知识竞赛试题及答案
- PMC紧急订单作业流程图
- 中国药典2015版4部可见异物检查法
评论
0/150
提交评论