2026年数据分析师岗位面试技术问题与业务场景考核含答案_第1页
2026年数据分析师岗位面试技术问题与业务场景考核含答案_第2页
2026年数据分析师岗位面试技术问题与业务场景考核含答案_第3页
2026年数据分析师岗位面试技术问题与业务场景考核含答案_第4页
2026年数据分析师岗位面试技术问题与业务场景考核含答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年数据分析师岗位面试技术问题与业务场景考核含答案一、SQL查询题(共5题,每题8分,共40分)背景:某电商平台(地域:华东)2026年数据表结构如下-`orders`(订单表):`order_id`(订单ID,主键),`user_id`(用户ID),`product_id`(产品ID),`order_time`(订单时间),`total_amount`(订单金额),`status`(订单状态,'已完成'、'已取消'等)-`users`(用户表):`user_id`(用户ID,主键),`age`(年龄),`city`(城市),`注册时间`(注册时间)-`products`(产品表):`product_id`(产品ID,主键),`category`(产品类别),`price`(单价)-`order_items`(订单明细表):`order_item_id`(明细ID,主键),`order_id`(订单ID,外键),`product_id`(产品ID,外键),`quantity`(数量)1.查询2026年每月总销售额及订单数,按月份降序排列。2.查询年龄在20-30岁之间,且每月复购次数超过2次的用户列表(复购指同一用户在同月有多个订单)。3.查询每个城市中订单金额最高的用户及其订单金额,若金额相同则按用户ID升序排列。4.查询2026年已取消订单中,单价最高的3种产品及其总取消金额。5.查询每个用户的平均订单金额,并筛选出平均订单金额高于该用户所在城市平均订单金额的用户。二、Python数据分析题(共3题,每题10分,共30分)背景:某零售企业(行业:快消品,地域:北京)2026年销售数据存储在CSV文件中,字段包括:`date`(日期)、`store_id`(门店ID)、`product_id`(产品ID)、`sales`(销量)、`price`(单价)。1.编写Python代码读取CSV文件,计算每个门店的日销售总额,并绘制条形图展示前5个门店的销售额。2.使用Pandas处理数据,筛选出2026年销量最高的10个产品,并计算其销量占比。3.分析每个门店的客单价(总销售额/总销量),找出客单价最低的3个门店,并输出其门店ID和客单价。三、业务场景题(共3题,每题10分,共30分)背景:某生鲜电商平台(地域:上海)希望提升用户复购率,2026年数据显示部分用户活跃度下降。1.如果你是数据分析师,你会通过哪些指标衡量用户活跃度?并说明如何通过数据分析找出活跃度下降的原因。2.假设平台推出“满减优惠券”活动,你会如何设计数据监控方案来评估活动效果?3.若发现某类产品(如“水果”)的退货率较高,你会提出哪些改进建议,并说明数据支持逻辑。四、统计学与机器学习基础题(共2题,每题10分,共20分)1.假设某城市用户月均消费金额服从正态分布,样本均值为5000元,标准差为800元,请计算月均消费在4000-6000元之间的用户占比。2.解释交叉验证在模型评估中的作用,并说明在哪些情况下不宜使用K折交叉验证。五、综合分析题(1题,20分)背景:某汽车主机厂(地域:广东)2026年推出新款电动汽车,为评估市场表现,收集了以下数据:`region`(区域)、`month`(月份)、`sales`(销量)、`price`(售价)、`subsidy`(补贴金额)、`competitor_price`(竞品平均价格)。请分析以下问题:1.用相关性分析销量与售价、补贴、竞品价格的关系。2.若要预测下季度销量,你会选择哪些特征,并说明理由。3.提出至少3条针对不同区域市场的推广建议,并说明数据依据。答案与解析一、SQL查询题答案1.查询2026年每月总销售额及订单数,按月份降序排列。sqlSELECTDATE_FORMAT(order_time,'%Y-%m')ASmonth,SUM(total_amount)AStotal_sales,COUNT(order_id)ASorder_countFROMordersWHEREYEAR(order_time)=2026GROUPBYmonthORDERBYmonthDESC;解析:使用`DATE_FORMAT`提取年月,`SUM`计算销售额,`COUNT`统计订单数,按月份降序排列。2.查询年龄在20-30岁之间,且每月复购次数超过2次的用户列表。sqlSELECTuser_idFROMusersuJOIN(SELECTuser_id,COUNT(DISTINCTDATE_FORMAT(order_time,'%Y-%m'))ASrepurchase_monthsFROMordersWHEREuser_idIN(SELECTuser_idFROMusersWHEREageBETWEEN20AND30)GROUPBYuser_idHAVINGrepurchase_months>2)ASrepONu.user_id=rep.user_id;解析:子查询统计每个用户的月复购次数,外层筛选20-30岁用户,且复购月份>2。3.查询每个城市中订单金额最高的用户及其订单金额。sqlSELECTu.city,u.user_id,SUM(o.total_amount)AStotal_amountFROMusersuJOINordersoONu.user_id=o.user_idGROUPBYu.city,u.user_idORDERBYtotal_amountDESC,u.user_idASCLIMIT1PERCITY;解析:分组统计每个用户的总订单金额,按金额降序排列,`LIMIT1PERCITY`确保每个城市只取最高金额用户(需调整SQL版本支持)。4.查询2026年已取消订单中,单价最高的3种产品及其总取消金额。sqlSELECTduct_id,p.category,SUM(oi.quantityp.price)AStotal_cancelled_amountFROMordersoJOINorder_itemsoiONo.order_id=oi.order_idJOINproductspONduct_id=duct_idWHEREo.status='已取消'ANDYEAR(o.order_time)=2026GROUPBYduct_id,p.categoryORDERBYtotal_cancelled_amountDESCLIMIT3;解析:连接订单、明细、产品表,筛选取消订单,分组统计产品取消金额,按金额降序取前三。5.查询每个用户的平均订单金额,并筛选出高于城市平均金额的用户。sqlSELECTu.user_id,AVG(o.total_amount)ASavg_order_amountFROMusersuJOINordersoONu.user_id=o.user_idGROUPBYu.user_idHAVINGavg_order_amount>(SELECTAVG(total_amount)FROMordersWHEREuser_idIN(SELECTuser_idFROMusersWHEREcity=u.city));解析:外层计算用户平均订单金额,内层计算城市平均金额,筛选高于城市均值用户。二、Python数据分析题答案1.读取CSV并绘制条形图(前5门店销售额)。pythonimportpandasaspdimportmatplotlib.pyplotaspltdata=pd.read_csv('sales_data.csv')storesales=data.groupby('store_id')['sales'].sum().sort_values(ascending=False).head(5)storesales.plot(kind='bar')plt.title('Top5StoresbySales')plt.xlabel('StoreID')plt.ylabel('TotalSales')plt.show()解析:分组计算门店销售额,排序取前5,绘制条形图。2.筛选销量最高的10个产品及占比。pythonproduct_sales=data.groupby('product_id')['sales'].sum().sort_values(ascending=False).head(10)total_sales=product_sales.sum()product_sales_ratio=(product_sales/total_sales100).round(2)print(product_sales_ratio)解析:分组计算产品销量,排序取前10,计算占比。3.找出客单价最低的3个门店。pythonstore_avg_price=data.groupby('store_id')['sales'].sum()/data.groupby('store_id')['sales'].count()lowest_avg_price=store_avg_price.sort_values().head(3)print(lowest_avg_price)解析:分组计算门店总销售额和销量,计算客单价,排序取最低3个。三、业务场景题答案1.用户活跃度指标及下降原因分析。指标:日活跃用户(DAU)、月活跃用户(MAU)、会话时长、页面停留次数、复购率。原因分析:-通过用户分层(新/老用户)对比活跃度变化;-分析用户行为路径(流失节点);-结合用户反馈(如客服投诉)排查产品或服务问题。2.满减优惠券活动效果评估方案。-监控指标:参与率、优惠券使用率、客单价变化、活动期间GMV;-对比分析:与历史数据对比,排除季节性因素;-A/B测试:对比不同优惠券额度/门槛的效果。3.水果退货率高的改进建议。-数据支持:分析退货原因(质量问题、描述不符等);-建议:-优化商品描述(增加图片/视频);-加强供应商质检;-提供试吃/部分退款选项。四、统计学与机器学习基础题答案1.正态分布占比计算。-标准正态分布中,4000-6000元对应的Z值分别为-2.5和5,查表得占比约98.76%。2.交叉验证的作用及适用场景。作用:防止过拟合,评估模型泛化能力。不适用场景:-数据量过小(如<50);-时间序列数据(需按时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论