数据分析师面试要点及题目分析_第1页
数据分析师面试要点及题目分析_第2页
数据分析师面试要点及题目分析_第3页
数据分析师面试要点及题目分析_第4页
数据分析师面试要点及题目分析_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年数据分析师面试要点及题目分析一、行业与地域背景设定2026年数据分析师岗位竞争将更加激烈,企业对数据驱动决策能力的要求显著提升。面试重点考察候选人在零售(中国华东地区)、金融(美国纽约)、电商(东南亚)等行业的实战经验,结合SQL、Python、统计学及业务理解能力。以下题目覆盖技术实操、业务分析、数据可视化及问题解决能力。题型1:SQL数据库操作(共3题,每题10分)目标:考察数据提取、清洗及复杂查询能力。题目1(中国华东地区零售行业)题目:某超市华东分店2025年1-10月的销售数据存储在`sales`表中,表结构如下:-`order_id`(订单ID,INT)-`customer_id`(顾客ID,VARCHAR)-`product_id`(商品ID,VARCHAR)-`order_date`(订单日期,DATE)-`quantity`(数量,INT)-`unit_price`(单价,DECIMAL)-`region`(区域,VARCHAR)要求:1.查询华东地区2025年销售额最高的前5名商品,结果包含商品ID和总销售额。2.用`WITH`子句计算每个顾客的月消费总额,结果按顾客ID和月份排序。答案与解析1.sqlSELECTproduct_id,SUM(quantityunit_price)AStotal_salesFROMsalesWHEREregion='华东'ANDYEAR(order_date)=2025GROUPBYproduct_idORDERBYtotal_salesDESCLIMIT5;解析:筛选华东地区和2025年数据,计算每商品销售额并排序。2.sqlWITHmonthly_salesAS(SELECTcustomer_id,DATE_FORMAT(order_date,'%Y-%m')ASmonth,SUM(quantityunit_price)ASmonthly_totalFROMsalesWHEREregion='华东'ANDYEAR(order_date)=2025GROUPBYcustomer_id,month)SELECTcustomer_id,month,monthly_totalFROMmonthly_salesORDERBYcustomer_id,month;解析:用`WITH`存储中间结果,按月汇总顾客消费并按ID排序。题目2(美国纽约金融行业)题目:某银行交易表`transactions`结构:-`transaction_id`(交易ID,INT)-`account_id`(账户ID,VARCHAR)-`amount`(金额,DECIMAL)-`type`(交易类型,VARCHAR:'DEPOSIT'/'WITHDRAWAL')-`timestamp`(时间戳,DATETIME)要求:1.查询2025年纽约账户的日均存款金额,结果按账户ID排序。2.用子查询找出交易金额超过账户日均存款的异常交易,输出账户ID和异常金额。答案与解析1.sqlSELECTaccount_id,AVG(amount)ASavg_daily_depositFROMtransactionsWHEREtype='DEPOSIT'ANDYEAR(timestamp)=2025ANDMONTH(timestamp)=10GROUPBYaccount_idORDERBYaccount_id;解析:筛选存款并按月汇总,计算日均存款。2.sqlSELECTt1.account_id,t1.amountASanomaly_amountFROMtransactionst1WHEREt1.type='DEPOSIT'ANDt1.amount>(SELECTAVG(amount)FROMtransactionst2WHEREt2.account_id=t1.account_idANDt2.type='DEPOSIT'GROUPBYt2.account_id);解析:子查询计算每账户日均存款,对比筛选异常交易。题目3(东南亚电商行业)题目:电商订单表`orders`结构:-`order_id`(订单ID,INT)-`user_id`(用户ID,VARCHAR)-`product_category`(品类,VARCHAR)-`order_date`(日期,DATE)-`payment_method`(支付方式,VARCHAR)-`region`(区域,VARCHAR)要求:1.查询2025年东南亚地区各支付方式的订单占比,结果保留两位小数。2.用`JOIN`关联用户表`users`(字段:`user_id`、`registration_date`),统计2025年新注册用户的首单金额。答案与解析1.sqlSELECTpayment_method,ROUND(COUNT()100.0/(SELECTCOUNT()FROMordersWHEREregion='东南亚'ANDYEAR(order_date)=2025),2)ASpercentageFROMordersWHEREregion='东南亚'ANDYEAR(order_date)=2025GROUPBYpayment_method;解析:计算每支付方式订单数占比。2.sqlSELECTu.user_id,o.order_id,o.quantityo.unit_priceASfirst_order_amountFROMusersuJOINordersoONu.user_id=o.user_idWHEREu.registration_dateBETWEEN'2025-01-01'AND'2025-12-31'ANDo.order_date=(SELECTMIN(order_date)FROMorderso2WHEREo2.user_id=u.user_id);解析:关联用户表,用子查询找每用户首单日期,计算金额。题型2:Python数据分析与处理(共3题,每题10分)目标:考察Pandas、NumPy及数据清洗能力。题目1(中国华东地区零售行业)题目:给定以下Python数据:pythonimportpandasaspddata={'customer_id':['C001','C001','C002','C003'],'order_date':['2025-01-10','2025-02-15','2025-01-20','2025-03-05'],'sales':[120,250,300,180]}df=pd.DataFrame(data)要求:1.将`order_date`转换为日期格式并计算每月总销售额。2.用`groupby`统计每个顾客的平均订单金额。答案与解析1.pythondf['order_date']=pd.to_datetime(df['order_date'])monthly_sales=df.groupby(df['order_date'].dt.to_period('M')).sales.sum().reset_index()monthly_sales.columns=['month','total_sales']print(monthly_sales)解析:转换日期格式,按月汇总销售额。2.pythonavg_sales_per_customer=df.groupby('customer_id')['sales'].mean().reset_index()print(avg_sales_per_customer)解析:按顾客ID分组计算平均订单金额。题目2(美国纽约金融行业)题目:某银行账户余额数据:pythonimportnumpyasnpbalance_changes=np.array([100,-50,200,-30,90,-10])要求:1.用NumPy计算账户的月度净变化。2.用Pandas处理以下DataFrame:pythonaccounts=pd.DataFrame({'account_id':['A001','A002'],'balance':[1500,2300],'interest_rate':[0.03,0.04]})计算每个账户一年后的本息和(假设复利)。答案与解析1.pythonmonthly_net_change=np.cumsum(balance_changes)print(monthly_net_change)解析:使用`cumsum`计算累计净变化。2.pythonaccounts['final_balance']=accounts.apply(lambdarow:row['balance'](1+row['interest_rate'])12,axis=1)print(accounts)解析:用`apply`计算复利后的余额。题目3(东南亚电商行业)题目:给定用户行为数据:pythonimportpandasaspddata={'user_id':['U001','U002','U001','U003'],'action':['click','purchase','click','purchase'],'timestamp':['2025-10-0110:00','2025-10-0111:00','2025-10-0209:00','2025-10-0215:00']}df=pd.DataFrame(data)要求:1.用Pandas统计每个用户每日的活跃时长(按小时)。2.用`merge`合并以下两个DataFrame:pythonproducts=pd.DataFrame({'product_id':[1,2],'name':['Laptop','Phone']})orders=pd.DataFrame({'order_id':[101,102],'product_id':[1,2]})答案与解析1.pythondf['timestamp']=pd.to_datetime(df['timestamp'])daily_active_hours=df.groupby(['user_id',df['timestamp'].dt.date])['timestamp'].diff().dt.total_seconds()/3600daily_active_hours=daily_active_hours.fillna(0).groupby('user_id').sum().reset_index()daily_active_hours.columns=['user_id','active_hours']print(daily_active_hours)解析:计算时间差并汇总每日活跃时长。2.pythonmerged_df=pd.merge(orders,products,on='product_id')print(merged_df)解析:按`product_id`合并订单和商品信息。题型3:业务分析与问题解决(共3题,每题10分)目标:考察行业洞察及数据驱动决策能力。题目1(中国华东地区零售行业)题目:某超市发现2025年10月华东区生鲜品类销售额环比下降20%,但客流量持平。分析可能原因并提出改进建议。答案与解析1.可能原因:-竞争对手推出促销活动。-生鲜商品价格过高。-消费者偏好变化(如转向线上购买)。-店内陈列或促销策略不足。2.改进建议:-对比竞品价格,优化定价策略。-开展“买赠”或会员折扣活动。-引入线上预约线下自提服务。-加强商品陈列和可视化营销。题目2(美国纽约金融行业)题目:某银行发现年轻客户(25岁以下)的信用卡逾期率较去年上升15%。分析原因并提出解决方案。答案与解析1.可能原因:-年轻人收入不稳定。-信用卡使用教育不足。-竞争对手推出更灵活的还款选项。-借贷行为监测系统滞后。2.解决方案:-推出分期还款计划。-加强信用额度管理。-开展财务教育课程。-优化风险评估模型。题目3(东南亚电商行业)题目:某电商平台发现东南亚地区移动端订单转化率低于桌面端30%。分析原因并提出优化方案。答案与解析1.可能原因:-移动端页面加载速度慢。-结账流程复杂。-小屏幕操作不便。-移动端广告点击成本高。2.优化方案:-优化页面响应速度。-简化结账步骤(如一键支付)。-设计移动端适配界面。-优化移动端广告投放策略。题型4:数据可视化与报告(共1题,20分)目标:考察数据呈现能力。题目1(中国华东地区零售行业)题目:某超市2025年1-10月各品类销售额数据如下:|品类|销售额(万元)|||--||生鲜|120||日用品|95||服装|80||食品|65|要求:1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论