邮储银行2025年濮阳市数据分析师笔试题及答案_第1页
邮储银行2025年濮阳市数据分析师笔试题及答案_第2页
邮储银行2025年濮阳市数据分析师笔试题及答案_第3页
邮储银行2025年濮阳市数据分析师笔试题及答案_第4页
邮储银行2025年濮阳市数据分析师笔试题及答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

邮储银行2025年濮阳市数据分析师笔试题及答案一、基础理论题(共30分)1.(5分)简述描述统计中均值、中位数、众数的适用场景及三者在偏态分布中的关系。答案:均值适用于对称分布且无极端值的数据,反映数据集中趋势;中位数适用于偏态分布或存在异常值的数据,抗干扰性强;众数适用于分类数据或离散型数据,反映最常见值。在右偏分布中,均值>中位数>众数;左偏分布中,均值<中位数<众数;对称分布中三者近似相等。2.(5分)某银行信贷数据集包含字段:客户ID、贷款金额(万元)、期限(月)、利率(%)、逾期天数(天)。请设计至少4个反映信贷风险的衍生指标,并说明计算逻辑。答案:(1)逾期率=逾期客户数/总客户数(衡量整体风险水平);(2)平均逾期天数=Σ(逾期天数×对应客户数)/总逾期客户数(反映逾期严重程度);(3)高风险贷款占比=(贷款金额>100万且逾期天数>30天)的客户数/总客户数(识别大额长期逾期风险);(4)期限匹配度=(期限≤12个月且逾期天数≤15天)的客户数/短期贷款客户数(评估短期贷款资产质量)。3.(5分)写出SQL语句:从客户信息表(customer,字段:cust_id主键,age年龄,city城市,income月收入)和交易记录表(transaction,字段:trans_id主键,cust_id外键,trans_date交易日期,amount交易金额,trans_type交易类型)中,查询2024年濮阳市年龄25-40岁客户的月均交易金额(按客户ID分组),要求排除交易金额≤0的记录。答案:SELECTt.cust_id,AVG(t.amount)ASmonthly_avg_amountFROMcustomercJOINtransactiontONc.cust_id=t.cust_idWHEREc.city='濮阳市'ANDc.ageBETWEEN25AND40ANDt.trans_dateBETWEEN'2024-01-01'AND'2024-12-31'ANDt.amount>0GROUPBYt.cust_id;4.(5分)在Python中使用pandas处理数据时,若某数值型列存在5%的缺失值,且数据分布呈现右偏态,应选择何种方法填充?并说明理由。若该列是分类变量(如"职业"),又该如何处理?答案:数值型列右偏时,选择中位数填充。因右偏分布均值受极端值影响偏大,中位数更能代表集中趋势,避免高估数据。分类变量"职业"可采用众数填充(若缺失随机),或新增"未知"类别(若缺失可能隐含信息,如客户不愿透露职业可能与风险相关)。5.(10分)某支行2024年各季度储蓄存款余额(亿元)为:Q1=12.3,Q2=14.1,Q3=15.8,Q4=17.2。请用移动平均法(n=2)预测2025年Q1存款余额,并计算该时间序列的季节指数(假设无季节波动时趋势值为线性增长)。答案:移动平均预测:2024年Q3移动平均=(12.3+14.1)/2=13.2;Q4移动平均=(14.1+15.8)/2=14.95;2025Q1预测=(15.8+17.2)/2=16.5(亿元)。线性趋势拟合:设时间t=1(Q1)到4(Q4),y=at+b。计算得a=(17.2-12.3)/(4-1)=1.633,b=12.3-1.633×1=10.667。趋势值分别为t=1→12.3(实际=预测),t=2→14.0(实际14.1),t=3→15.6(实际15.8),t=4→17.3(实际17.2)。季节指数=实际值/趋势值,各季度指数分别为1.0(12.3/12.3)、1.007(14.1/14.0)、1.013(15.8/15.6)、0.994(17.2/17.3),平均季节指数≈1.003,说明无显著季节波动。二、数据分析实操题(共40分)(一)背景:邮储银行濮阳分行拟优化零售客户分层策略,现有客户数据如下(部分字段):cust_idageincome(万元/年)account_balance(万元)product_holding(持有产品数)churn(是否流失,1=是)001321822.530002453589.75000328125.211..................6.(10分)请设计客户分层的核心指标体系,至少包含3个维度,并说明各维度下的细分指标及分层逻辑(如高/中/低价值客户)。答案:核心维度及指标:(1)价值维度:资产规模(account_balance):高(>50万)、中(20-50万)、低(<20万);收入水平(income):高(>30万)、中(15-30万)、低(<15万);(2)活跃度维度:持有产品数(product_holding):活跃(≥4个)、中等(2-3个)、低效(≤1个);(3)稳定性维度:流失风险(churn预测值):高风险(概率>70%)、中风险(30%-70%)、低风险(<30%)。分层逻辑:综合价值(资产×0.4+收入×0.3)、活跃度(0.2)、稳定性(0.1)加权得分,前20%为高价值客户(需重点维护),中间50%为中价值客户(潜力挖掘),后30%为低价值客户(优化服务成本)。7.(15分)使用逻辑回归模型预测客户流失(churn),已完成数据清洗和特征工程,现有训练集混淆矩阵如下:预测流失(1)预测留存(0)实际流失(1)12030实际留存(0)50800请计算准确率、精确率、召回率、F1分数,并说明在银行客户流失预测场景中,应更关注精确率还是召回率?为什么?答案:准确率=(120+800)/(120+30+50+800)=920/1000=92%;精确率=120/(120+50)=120/170≈70.59%;召回率=120/(120+30)=120/150=80%;F1=2×(70.59%×80%)/(70.59%+80%)≈75.00%。银行场景应更关注召回率。因流失客户的挽回成本通常低于获取新客户成本,高召回率能尽可能识别出实际将流失的客户(减少漏判),避免重要客户流失;而精确率低可能导致误判部分留存客户,但误判成本相对较低(如发送挽回短信的成本)。8.(15分)某支行反映"年轻客户(25岁以下)信用卡激活率仅35%,远低于全行52%的平均水平"。请设计分析思路,包括数据获取方向、关键分析指标、可能原因假设及验证方法。答案:(1)数据获取:客户维度:年龄、职业、收入、办卡渠道(线上/线下)、办卡动机(活动吸引/功能需求);行为维度:办卡后登录APP次数、接收激活引导短信/电话记录、信用卡权益认知度;产品维度:年轻客户专属权益(如外卖券、视频会员)覆盖情况、激活流程复杂度(步骤数、是否需面签)。(2)关键指标:分渠道激活率(线上申请vs线下网点);激活时间差(办卡到激活的天数);权益领取率(领取过专属权益的客户激活率);流程中断点(APP激活页面跳出率)。(3)原因假设及验证:假设1:线上申请流程复杂→验证:对比线上/线下激活率,分析线上流程各步骤转化率(如身份验证→设置密码→激活成功),若某步骤转化率<60%则为断点。假设2:权益吸引力不足→验证:统计领取过"年轻客群权益包"的客户激活率(如A组)与未领取客户(B组),若A组激活率(如45%)仍低于全行平均,说明权益需优化。假设3:激活引导不足→验证:分析办卡后3天内接收激活提醒的客户激活率(如42%)vs未接收提醒的客户(28%),若差异显著(p<0.05),则需加强触达。三、业务应用与综合分析题(共30分)9.(10分)邮储银行濮阳分行计划2025年推广"乡村振兴主题信用卡",目标客群为濮阳市县域农户、农村个体工商户。请基于数据分析师视角,提出需重点分析的3个方面,并说明每个方面的核心分析内容。答案:(1)客群画像分析:核心内容:通过农户档案、农村信用体系数据,分析目标客群的年龄分布(如30-50岁为主)、收入结构(种植/养殖/加工收入占比)、资金需求周期(如春耕/秋收前需求高峰)、信用记录(历史贷款逾期率)。需识别高潜力子客群(如年经营收入>20万、信用良好的个体工商户)。(2)产品适配性分析:核心内容:对比现有信用卡产品与目标客群需求的匹配度,如额度需求(农户可能需要3-10万额度)、还款周期(是否支持按种植周期分期)、专属权益(如农资采购折扣、农产品运输优惠)。通过问卷调查或历史交易数据,分析客群对"满减活动""积分换农资"等权益的偏好度。(3)风险控制分析:核心内容:构建农户信用评分模型,纳入经营稳定性(土地承包年限、经营场所产权)、收入波动性(近3年经营收入标准差)、担保能力(是否有农房/农机抵押)等指标。分析县域地区的行业风险(如特色农业受天气影响的概率),设定差异化的额度审批规则(如种植户额度上限为年经营收入的40%)。10.(20分)以下是濮阳分行2024年1-12月个人消费贷款余额(亿元)数据:月份123456789101112余额8.28.58.99.49.810.210.510.811.211.511.812.1(1)判断该时间序列的趋势类型(线性/非线性),并计算2025年1月预测值(要求使用至少两种方法并取平均);(2)若发现10月数据因系统故障少统计0.5亿元(实际应为12.0),请说明修正后对预测结果的影响方向(无需计算具体值)。答案:(1)趋势类型判断:计算各月环比增长额分别为0.3、0.4、0.5、0.4、0.4、0.3、0.3、0.4、0.3、0.3、0.3(亿元),增长额基本稳定在0.3-0.5之间,无明显加速或减速,属于线性增长趋势。预测方法1:线性回归法。设月份t=1到12,余额y=at+b。计算得a=(12.1-8.2)/(12-1)=0.3545,b=8.2-0.3545×1=7.8455。2025年1月t=13,预测值=0.3545×13+7.8455≈12.45(亿元)。预测方法2:指数平滑法(α=0.6,初始值S1=y1=8.2)。计算各月平滑值:S2=0.6×8.5+0.4×8.2=8.38;S3=0.6×8.9+0.4×8.38=8.692;...最终S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论