版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年客户流失预警机制培训试题及答案第一部分:单项选择题(共20题,每题1.5分,共30分)1.在客户流失预警机制中,下列哪项指标最直接反映了客户在未来一段时间内停止使用服务或产品的概率?A.客户满意度(CSAT)B.净推荐值(NPS)C.流失风险评分D.客户终身价值(CLV)2.构建流失预警模型时,通常将历史数据划分为训练集和测试集。若采用时间序列切片法,下列哪种划分方式最符合业务逻辑?A.随机抽取80%数据作为训练集,20%作为测试集B.将前6个月的数据作为训练集,后1个月的数据作为测试集C.将数据按客户ID哈希值取模划分D.将数据按流失与非流失标签分层抽样划分3.在二分类流失预测模型(流失=1,留存=0)中,若模型预测某客户不会流失(预测值为0),但该客户实际发生了流失(真实值为1),这种情况被称为?A.真阳性(TruePositive)B.假阳性(FalsePositive)C.真阴性(TrueNegative)D.假阴性(FalseNegative)4.逻辑回归模型是流失预警中常用的基准模型,其Sigmoid函数的作用是将线性回归的结果映射到哪个区间?A.(B.[C.[D.[5.在电信行业中,下列哪个行为通常是客户流失的强预警信号?A.增加了增值业务订阅B.频繁拨打客服投诉电话C.提前缴纳下月账单D.参与了老带新活动6.评估流失预警模型性能时,如果业务成本中“挽留一个流失客户的收益”远高于“打扰一个留存客户的成本”,我们应更关注模型的哪个指标?A.特异度B.精确率C.召回率D.准确率7.生存分析中的Kaplan-Meier曲线主要用于描述什么?A.客户消费金额随时间的变化B.客户在不同时间点的生存概率(即留存概率)C.模型预测误差的分布D.不同特征变量之间的相关性8.在特征工程中,为了捕捉客户行为的趋势,通常需要计算“环比变化率”。若某客户本月消费额为,上月消费额为,则环比变化率的计算公式为?A.B.C.D.9.随机森林模型在处理客户流失预警问题时,相比单一决策树的主要优势是?A.训练速度更快B.模型解释性更强C.更不容易过拟合,且能评估特征重要性D.不需要任何数据预处理10.对于SaaS(软件即服务)企业,以下哪项数据通常被视为“沉默流失”的前兆?A.核心功能使用频率下降B.提交了功能改进建议C.增加了账号数量D.查阅了帮助文档11.在处理流失预警数据的缺失值时,若“最后一次投诉时间”字段缺失,通常合理的填充策略是?A.直接删除该行B.填充为0C.填充为当前时间D.填充为众数12.下列哪项技术主要用于解决流失预警模型中因“流失客户样本少”导致的数据不平衡问题?A.主成分分析(PCA)B.独热编码C.SMOTE(合成少数类过采样技术)D.标准化13.客户生命周期(CLC)中,处于哪个阶段的客户对流失预警机制的需求最为迫切?A.考察期B.形成期C.稳定期D.衰退期14.在构建预警规则时,设定“连续30天无登录行为”为高风险。这种基于固定阈值的规则主要缺点是?A.计算复杂B.无法适应不同客户群体的行为差异C.数据难以获取D.解释性差15.AUC-ROC曲线中,若AUC值为0.5,说明模型具备什么能力?A.完美的分类能力B.良好的分类能力C.与随机猜测无异D.比随机猜测还差16.电商领域常使用RFM模型进行客户分群。在流失预警视角下,最需要关注的维度是?A.R(最近一次消费时间)B.F(消费频率)C.M(消费金额)D.以上都是17.某模型预测流失的混淆矩阵显示:TP=50,FN=10,FP=100,TN=840。该模型的召回率是多少?A.33.3%B.83.3%C.50.0%D.90.0%18.在深度学习模型(如LSTM)应用于流失预警时,其主要优势在于能够处理?A.非结构化的文本数据(如客服通话录音转写)B.简单的表格数据C.缺失值过多的数据D.类别不平衡的数据19.2026年隐私计算趋势下,在进行跨企业(如银行与电商)联合建模进行流失预警时,应采用哪种技术以保护数据隐私?A.明文数据交换B.联邦学习C.简单的数据库拼接D.公开API接口查询20.流失预警机制的最终目的是什么?A.准确预测谁会离开B.计算模型准确率C.通过干预行动降低流失率,提升CLVD.清理无效客户数据第二部分:多项选择题(共15题,每题3分,共45分。多选、少选、错选均不得分)1.客户流失通常分为哪几种类型?A.自然流失B.竞争流失C.过失流失D.主动流失E.被动流失2.在构建流失预警模型前,进行数据探索性分析(EDA)的主要目的包括?A.发现数据中的异常值B.理解特征与流失标签的相关性C.确定模型的最优超参数D.检查数据分布是否平衡E.直接生成最终的预测结果3.下列哪些特征属于“客户态度类”特征,常用于提升预警模型的准确性?A.客服交互时的情感得分B.问卷满意度评分C.APP内的点赞/点踩行为D.客户的年龄和性别E.最近一次登录IP地址4.针对模型预测出的“高风险流失客户”,企业可以采取的干预措施包括?A.发送定向优惠券B.客服专员主动回访C.提升会员等级D.限制部分功能使用E.发送感谢信(非挽留类)5.评估流失预警模型时,若只关注准确率可能会带来哪些误导?A.掩盖模型对少数类(流失客户)的预测能力B.在样本极度不平衡时,模型预测全为“留存”也能获得高准确率C.无法体现业务的真实收益D.忽略了假阳性的成本E.准确率越高,业务效果一定越好6.特征选择在流失预警中非常重要,常用的特征选择方法有?A.过滤法——如卡方检验B.包裹法——如递归特征消除(RFE)C.嵌入法——如L1正则化D.聚类分析法E.人工随机挑选7.在B2B业务场景中,客户流失的预警信号与B2C相比,具有哪些特殊性?A.更关注关键决策人的变动B.更关注产品使用深度的下降C.更关注续费合同到期前的互动频率D.单个员工的个人情绪影响较小E.决策周期更长,预警窗口期更久8.下列关于模型过拟合的说法,正确的有?A.训练集表现很好,测试集表现很差B.模型过于复杂,捕捉了噪声C.增加数据量可以缓解过拟合D.使用正则化技术可以缓解过拟合E.过拟合的模型在实际业务中泛化能力强9.时间序列特征在流失预警中的作用主要体现在?A.捕捉客户行为的季节性波动B.识别长期趋势(如消费逐渐递减)C.忽略时间顺序,仅看总量D.预测具体的流失时间点E.计算滑动窗口统计量(如近7天平均登录次数)10.在部署流失预警系统后,需要进行模型监控,监控的主要指标包括?A.数据漂移——特征分布是否发生显著变化B.模型性能衰退——AUC或KS值是否下降C.预测结果的分布变化D.系统响应时间E.服务器CPU温度11.下列哪些算法属于集成学习方法,常用于提升流失预测的稳定性?A.XGBoostB.LightGBMC.CatBoostD.朴素贝叶斯E.K-近邻(KNN)12.造成数据质量问题的原因可能包括?A.系统升级导致字段丢失B.人为录入错误C.数据采集延迟D.跨系统数据口径不一致E.样本量过大13.在计算客户终身价值(CLV)时,通常需要考虑哪些因素?A.客户平均购买间隔B.平均客单价C.客户留存率D.获客成本(CAC)E.企业固定成本14.关于流失预警中的“静默流失”,以下描述正确的有?A.客户没有主动发起注销或停机操作B.客户不再产生核心业务价值C.这种流失在预付费业务中更难察觉D.预警模型主要依赖活跃度指标E.客户通常会明确表达不满15.2026年生成式AI在客户流失挽留中的应用场景包括?A.根据客户画像自动生成个性化的挽留邮件B.智能分析流失原因并生成报告C.代替客服人员进行全自动语音挽留D.预测竞争对手的动态E.自动修复导致客户体验不佳的系统Bug第三部分:判断题(共15题,每题1分,共15分)1.客户流失预警模型一旦训练完成,就可以永久使用,不需要重新训练。2.在流失预测中,提升树模型(GBDT)通常比线性模型有更好的预测效果,但解释性相对较差。3.如果一个客户的流失风险评分很高,企业应该立即对其进行强力营销干预。4.缺失值本身有时也包含信息,例如“未填写收入信息”可能对应特定的客户群体,因此不能随意删除。5.召回率越高,意味着模型找出的流失客户越多,流失漏损越小。6.标准化对于基于距离的算法(如KNN、SVM)很重要,但对于树模型(如随机森林)通常不是必须的。7.流失预警系统只需要关注已经流失的客户特征,不需要关注留存客户。8.混淆矩阵只能用于二分类问题的评估。9.在信贷业务中,违约风险预测和客户流失预警的建模思路是完全一致的。10.客户的投诉次数越多,流失风险一定越高。11.对于新注册的客户,由于缺乏历史行为数据,流失预警模型通常无法给出准确的评分(冷启动问题)。12.KS值(Kolmogorov-Smirnov)常用于评估模型区分流失与留存客户的能力,KS值越大,区分能力越强。13.业务部门在接到预警名单后,必须在当天内联系完所有客户,否则预警失效。14.通过A/B测试可以验证流失预警模型及配套干预措施的实际业务价值。15.所有变量的相关性越高,对模型预测越有帮助。第四部分:填空题(共15题,每题2分,共30分)1.在逻辑回归中,假设(x)是预测概率,则决策边界通常设定为(x2.某电商平台共有用户1000人,上月流失50人,本月新增100人,月底总用户数为1020人。则本月的客户流失率约为______%(保留一位小数)。3.在评估二分类模型时,F14.XGBoost算法在构建树时,使用了______目标函数,同时包含了损失函数和正则化项。5.在客户生命周期价值计算中,若月留存率为r,月均利润为M,折现率为d,则基本的CLV公式正比于。当r=0.96.数据预处理中,将类别型特征(如“城市”)转换为数值型特征,常用的技术是______编码。7.生存分析中,Cox比例风险模型主要用于研究各种covariates(协变量)对______时间的影响。8.在特征工程中,对于长尾分布的数据(如消费金额),通常对其进行______变换,使其分布更接近正态分布。9.在混淆矩阵中,TPR(TruePositiveRate)即召回率,等于。10.为了防止模型在训练集上表现过好但在测试集上表现差,除了正则化,还可以采用______交叉验证的方法。11.在流失预警的业务闭环中,通常将客户分为高风险、中风险、低风险三个等级。针对______风险等级的客户,通常采取“维持现状,观察”的策略。12.某SaaS产品发现,使用了“报表导出”功能的客户,其留存率是未使用客户的3倍。这种特征被称为______特征。13.在时间序列预测中,LSTM(长短期记忆网络)通过引入______门控机制来解决长序列训练中的梯度消失问题。14.衡量模型校准度的指标是______曲线,它反映了预测概率为p的样本中,实际正例的比例是否接近p。15.在2026年的合规背景下,欧盟的______法规对客户数据的处理和自动化决策提出了严格要求,预警机制需确保可解释性。第五部分:简答题(共5题,每题8分,共40分)1.请简述在构建客户流失预警模型时,为什么要进行特征离散化,以及它有哪些优点?2.列举至少三个评估客户流失预警模型性能的指标,并解释其业务含义。3.什么是“数据漂移”?在部署流失预警系统后,如何监控并处理数据漂移问题?4.某电信公司发现,虽然模型预测准确率很高,但业务部门反馈预测出的“高风险”名单中包含大量高价值且忠诚的客户(假阳性)。请分析可能的原因及改进方向。5.简述RFM模型在客户流失预警中的具体应用逻辑,特别是R值(Recency)的变化如何影响流失概率。第六部分:计算与分析题(共3题,每题15分,共45分)1.混淆矩阵与指标计算某银行构建了信用卡客户流失预警模型,在测试集上的预测结果如下:实际流失且被预测为流失的客户数(TP):80实际留存但被预测为流失的客户数(FP):50实际流失但被预测为留存的客户数(FN):20实际留存且被预测为留存的客户数(TN):850请计算:(1)模型的准确率。(2)模型的精确率。(3)模型的召回率。(4)模型的F1-Score。(5)假设挽留一个流失客户的平均收益为200元,而打扰一个留存客户的(发送挽留短信)的成本为2元。请计算该模型在当前阈值下应用的总预期收益(净收益)。2.逻辑回归概率计算已知某客户流失预警模型采用逻辑回归,其学习到的参数为:偏置项=−3,特征“最近登录天数”的权重=0.5现有一客户A,其最近登录天数为10天,月均投诉次数为2次。(1)写出逻辑回归的线性组合表达式z=++(2)写出Sigmoid函数公式σ(z)(3)若判定阈值为0.5,该客户是否会被预警为流失客户?3.客户终身价值(CLV)与挽留投入分析某视频平台采用订阅制,月费为30元。客户平均每月留存率为0.85(即每月有15%的客户流失)。平台的月折现率为设为0.01。获客成本(CAC)为60元。(1)请利用简化的CLV公式CL(2)假设模型预测某客户即将流失,若进行针对性的挽留促销(赠送一个月会员),促销成本为15元(机会成本),且该挽留动作有40%的概率成功让该客户继续留存一个周期(此时视为该月未流失,后续生命周期延续)。请计算该挽留动作的期望收益(EV),并判断是否值得进行挽留?第七部分:综合案例分析题(共2题,每题35分,共70分)1.案例:云服务提供商的流失预警体系优化背景:TechCloud是一家中小型企业云服务提供商,2025年底面临客户流失率上升的问题(年化流失率从25%升至35%)。公司现有数据包括:CRM基础信息(行业、规模)、计费系统数据(付费金额、欠费记录)、工单系统数据(投诉、咨询)、产品埋点数据(API调用频率、存储使用量)。现状:数据科学团队已经构建了一个基于随机森林的初步模型,测试集AUC达到0.82。然而,运营团队反馈,模型预测出的高风险客户名单中,有30%实际上是刚完成大额续约的“金牌客户”,导致运营人员不敢贸然进行干预,且浪费了跟进时间。问题:(1)请分析为什么模型会将“刚续约的金牌客户”误判为高风险?请从数据特征和模型训练两个角度提出可能的原因。(10分)(2)针对上述问题,请提出具体的特征工程优化方案。例如,如何构造特征来区分“正常活跃”与“续约后的平静期”?(10分)(3)为了提升模型的业务落地效果,请设计一套分层运营策略。针对模型评分Top5%的极高危客户、Top5%-20%的高危客户以及Top20%-50%的中危客户,分别应采取什么样的干预手段?(10分)(4)2026年公司计划引入NLP技术分析工单备注中的客户情绪。请简述如何将“负面情绪占比”这一非结构化特征融入到现有的数值型模型中。(5分)2.案例:零售银行信用卡业务流失预警实战背景:某零售银行拥有百万级信用卡持卡人。为了应对激烈的市场竞争,银行决定升级其流失预警系统。目前的数据仓库中存储了持卡人过去2年的交易流水、还款记录、网页浏览日志以及营销活动响应记录。业务痛点:之前的预警规则过于简单(如“连续3个月无交易即预警”),导致大量“沉睡但未流失”的客户被打扰,且未能及时发现“高频用卡但突然降额”的潜在流失客户。问题:(1)请基于提供的背景,设计一套全面的特征指标体系,需包含但不限于以下维度:交易活跃度特征(至少列举3个)信用与还款行为特征(至少列举3个)客户交互与偏好特征(至少列举3个)并说明这些特征为何能预测流失。(15分)(2)银行决定使用LightGBM算法进行建模。在模型训练阶段,发现“流失客户”仅占总样本的5%。请详细说明在建模流程中应采取哪些步骤来处理这种类别不平衡问题?请列举至少3种方法。(10分)(3)模型上线后,需要进行严格的离线和在线评估。请设计一套A/B测试方案来验证新模型及配套营销策略的有效性。说明如何划分实验组与对照组?需要观测哪些核心业务指标来证明项目成功?(10分)参考答案与解析第一部分:单项选择题1.C流失风险评分是直接量化流失概率的指标。2.B时间序列数据不能随机打乱,必须用过去预测未来,B选项符合时序逻辑。3.D实际为正(流失),预测为负(留存),即FalseNegative(假阴性/漏报)。4.BSigmoid函数输出范围严格为(0,1),通常表示概率。5.B频频投诉通常意味着极度不满,是强流失信号。6.C召回率关注的是尽可能找出所有真正的流失者,避免漏掉高价值挽回机会。7.BKaplan-Meier曲线用于估计生存函数,即随时间推移的留存率。8.B环比是与上一周期相比,分母应为上一期数值。9.C随机森林通过集成多棵树降低方差,抗过拟合能力强,且可输出特征重要性。10.A核心功能使用下降代表价值获取减少,是SaaS流失的最直接前兆。11.B若从未投诉,缺失值可视为0或特定标记,但在流失模型中,通常“无投诉”是好事,填充为0或单独类别均可,但B是常见数值填充策略(若特征是计数)。注:此处若指时间戳,填充为极早时间或特定常数更佳,但选项中B相对最合理(视作0次投诉)。12.CSMOTE是专门解决类别不平衡的过采样技术。13.D衰退期客户行为发生异常变化,是预警的重点关注对象。14.B固定阈值无法区分不同客户群体的正常行为模式(如VIP客户出差30天可能正常)。15.CAUC=0.5表示模型没有区分能力,等同于随机抛硬币。16.AR(Recency)最近一次消费时间是流失预警中最敏感的指标,R越大流失风险越高。17.B召回率=TP/(TP+FN)=50/(50+10)=50/60≈0.833。18.ALSTM/RNN擅长处理序列数据,但在2026年语境下,结合Transformer处理文本(情绪分析)也是深度学习在流失预警的一大优势。19.B联邦学习允许在不交换原始数据的前提下进行联合建模,保护隐私。20.C预警本身不是目的,通过干预降低流失、提升利润才是最终业务目标。第二部分:多项选择题1.ABCD自然流失(非意愿)、竞争流失(去竞对)、过失流失(违规)、被动流失(被动销户)。2.ABDEDA用于理解数据、发现异常、检查分布,不涉及确定超参数(C属于模型调优)或生成结果(E)。3.ABC态度类特征直接反映客户心理,DE属于人口统计学或行为轨迹数据。4.ABC优惠、回访、升级是常见挽留手段;D会加速流失;E通常用于维系,非针对高风险流失挽留。5.ABCD准确率在样本不平衡(如流失率1%)时具有欺骗性,且无法反映业务成本结构。6.ABC前三种均为标准的特征选择方法。7.ABCDEB2B决策链条长、涉及人员多、金额大,上述所有选项均为其特点。8.ABCD过拟合导致泛化差,增加数据、正则化、简化模型均可缓解。9.ABDE时间序列特征关注趋势、季节性、窗口统计,C是错误的,不能忽略顺序。10.ABCD需监控数据分布、模型效果、系统性能,E非核心业务指标。11.ABCXGBoost,LightGBM,CatBoost均为高性能集成树模型。12.ABCD系统升级、人为错误、延迟、口径不一致均为常见数据质量问题。13.ABCCLV主要与购买间隔、客单价、留存率(及折现)相关,CAC是成本,通常在计算CLV的净现值时考虑,但基本CLV模型关注收入流。14.ABCD静默流失指不主动销户但不再使用,E是主动流失特征。15.AB2026年GenAI用于个性化内容生成(邮件)和智能归因分析。C目前尚难完全代替人工进行复杂挽留,D超出了常规流失预警范畴,E属于运维范畴。第三部分:判断题1.错客户行为模式随时间变化(概念漂移),模型需定期重训。2.对提升树通常效果更好但属于黑盒模型,解释性弱于逻辑回归。3.错需结合客户价值(CLV)进行优先级排序,且避免过度打扰。4.对缺失模式本身就是信息。5.对召回率定义即为找出的正例占所有正例的比例。6.对树模型基于分裂准则,对数值缩放不敏感。7.错留存客户是负样本,模型必须同时学习两类样本的特征边界。8.错也可扩展到多分类(虽然流失常视为二分类)。9.错违约涉及信用风险,流失涉及商业选择,虽然建模技术相似,但业务逻辑和特征侧重不同。10.错投诉多但得到妥善解决可能提升粘性,需看投诉解决率。11.对冷启动问题普遍存在。12.对KS值是评估模型区分度的常用指标。13.错需根据风险等级和资源合理分配时间,且策略应多样化。14.对A/B测试是验证模型ROI的最佳方式。15.错高度相关性(多重共线性)对线性模型有害,对树模型影响小,但并非“越相关越好”。第四部分:填空题1.0Sigmoid函数中,当概率为0.5时,线性部分z为0。2.5.0%流失率=流失数/期初数。期初数=期末数+流失数新增数=1020+50100=970。流失率=50/970≈0.0515≈5.0%(注:此处按简单计算,若按期末分母则不同,通常为期初)。计算:50/((1020+50-100))=50/970≈5.15%。3.调和F1是Precision和Recall的调和平均数。4.正则化XGBoost的目标函数包含损失函数和正则化项(Omega)。5.450CLV=(0.9*100)/(1+0.10.9)=90/0.2=450。6.独热One-HotEncoding。7.生存Cox模型研究协变量对生存时间的影响。8.对数Log变换。9.FNRecall=TP/(TP+FN)。10.K折K-FoldCrossValidation。11.低低风险客户通常不进行主动干预。12.强相关/粘性使用了特定功能的客户留存率高,该特征为强相关特征。13.遗忘/输入/输出/细胞LSTM通过门控机制(遗忘门等)解决梯度消失。填“门控”或具体门名均可。14.校准/ReliabilityCalibrationCurve。15.通用数据保护条例(GDPR)或AIAct,但GDPR是经典数据隐私法规。第五部分:简答题1.答案要点:原因:连续型变量可能包含噪声,且非线性关系难以被线性模型捕捉;离散化可以引入非线性。优点:1.鲁棒性:对异常值不敏感。2.可解释性:业务人员更容易理解“年龄在20-30岁”比“年龄=25.4”。3.简化计算:稀疏矩阵处理更高效。4.交叉特征:离散化后更容易进行特征交叉。2.答案要点:AUC:衡量模型整体排序能力,即随机抽取一个流失客户和一个留存客户,模型给流失客户的评分更高的概率。不依赖阈值。召回率:衡量模型覆盖了多少真正的流失客户。业务上关注“漏网之鱼”的比例。精确率:衡量模型预测为流失的客户中,真正流失的比例。业务上关注“打击准确度”,避免打扰过多正常客户。KS值:衡量区分度,KS越大,模型将流失和留存分开的能力越强。3.答案要点:定义:数据漂移是指模型上线后,输入数据的统计分布(如均值、方差、特征分布)与训练时相比发生了显著变化。监控:使用PSI(PopulationStabilityIndex)监控各特征的分布变化;监控预测分数的分布变化。处理:1.当PSI超过阈值(如0.2)时触发警报。2.重新收集最新数据,评估是否需要重新训练模型。3.分析漂移原因(如业务变更、季节性、新产品上线),若特征失效,需重新构造或剔除该特征。4.答案要点:原因分析:1.特征混淆:金牌客户可能消费极高,但某些行为(如不使用基础功能、只使用高级功能)与普通流失客户行为相似,导致模型误判。2.样本不平衡:训练集中流失样本太少,模型倾向于将少数类(特殊行为)误判为流失。3.缺乏上下文特征:模型可能不知道客户“刚续约”这一关键信息。改进方向:1.增加特征:加入“合同到期时间”、“续约标识”、“会员等级”等强相关特征。2.分层建模:对高价值客户和普通客户分别建立模型。3.调整阈值:针对VIP客户提高预警阈值,要求更高的风险分才报警。5.答案要点:R值:最近一次消费时间间隔。逻辑:1.R值越大,表示客户最后一次购买/登录距离现在越久。2.在流失预警中,R值的增大通常意味着客户活跃度下降,与企业的连接变弱。3.R值是预测未来流失的最强单一指标之一。例如,若R值超过历史平均购买周期的2倍,流失风险急剧增加。4.在RFM分群中,R值低的客户属于“最近活跃"群,流失风险低;R值高的客户属于"流失"或"沉睡"群。第六部分:计算与分析题1.解:TP=80,FP=50,FN=20,TN=850Total=80+50+20+850=1000(1)准确率=(TP+TN)/Total=(80+850)/1000=930/1000=93.0%(2)精确率=TP/(TP+FP)=80/(80+50)=80/130≈61.5%(3)召回率=TP/(TP+FN)=80/(80+20)=80/100=80.0%(4)F1-Score=2(PrecRec)/(Prec+Rec)=2(0.6150.8)/(0.615+0.8)=0.984/1.415≈69.5%(5)期望收益:挽回收益:找出的80个流失客户中,假设完美干预(或基于模型概率),此处题目隐含基于TP/FP计算。实际上,预测为流失的样本数=TP+FP=130。其中真正的流失者(TP)=80人,每人收益200元,总收益=80*200=16000元。其中误伤的留存者(FP)=50人,每人成本2元,总成本=50*2=100元。净收益=16000100=15900元。2.解:(1)线性组合z:zz(2)Sigmoid概率:P≈P即流失概率约为98.8%。(3)判定:因为0.988>3.解:(1)CLV计算:MCL客户预期终身价值约为159.38元。(2)挽留期望收益:若不挽留,客户流失,未来价值为0(相对于当前CLV计算基准)。若挽留:成本:15元。收益:有40%概率成功。成功意味着客户“续命”一个月,并保留后续的CLV。简化计算:挽留后的期望CLV=0.4(CLV)+0.60=0.4*159.38=63.75元。期望净收益=期望CLV挽留成本=63.7515=48.75元。结论:因为期望净收益48.75元>0,值得进行挽留。第七部分:综合案例分析题1.参考答案:(1)误判原因分析:数据特征层面:“金牌客户”可能因为刚续约,处于“平静期”,近期(如续约后1个月内)没有新的购买行为或工单,导致“最近购买间隔”这一特征值变大,或者“活跃度”特征下降,在模型看来与流失客户特征高度相似。模型训练层面:训练数据中可能缺乏足够的“刚续约但活跃度低”的正样本(留存样本),导致模型学习到“活跃度低=流失”的强相关,而忽略了“续约状态”这一调节变量。(2)特征工程优化方案:构造业务状态特征:增加“合同到
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年电梯困人故障应急救援演练记录
- 产品质量题库及答案
- 2026语文中考试题及答案重庆
- 北京中考几何题目及答案
- 本土化实践与国际接轨的PBL培训
- 暴雨急救交通疏导与急救协同
- 智能终端在病房环境调控中的协同
- 智慧医院建设中的临床决策路径优化
- 晚期癌症患者呼吸困难的无创通气护理方案实施
- 早癌MDT诊疗中的伦理考量
- 2025年神农架林区公安局招聘辅警真题
- 胸痹患者中医护理评估与干预
- 2026年4月福建厦门市思明区部分单位联合招聘非在编人员4人笔试模拟试题及答案解析
- 江苏苏豪控股集团秋招面笔试题及答案
- 24J113-1 内隔墙-轻质条板(一)
- 律师事务所内部惩戒制度
- 高中英语课堂形成性评价与听力理解能力提升教学研究课题报告
- 校园校园环境智能监测系统方案
- (2025年)资阳市安岳县辅警考试公安基础知识考试真题库及参考答案
- 小学音乐中多元文化音乐元素的融合与创新教学课题报告教学研究课题报告
- 心脏再同步化治疗的精准医疗策略
评论
0/150
提交评论