版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
风控策略岗位高频面试题
1.请详细介绍一下你常用的风控指标(如FPD、SPD、Vintage、RollRate),并解释它们
之间的业务关联。
2.在最近的一份工作中,你负责的策略模块通过率和坏账率分别是多少?你是如何平衡这两
者的?
3.如果发现当天的进件通过率突然下跌了20%,你会如何进行归因分析?请列出排查步骤。
4.你是如何定义“坏客户”的?在不同业务场景下(如现金贷与消费分期),坏客户的定义有
什么区别?
5.请解释Vintage分析的逻辑,并说明为什么账龄分析在风控中如此重要?
6.什么是滚动率(RollRate)分析?如何利用滚动率矩阵来定义坏账确立期?
7.当模型分数(Score)与规则策略(Rule)发生冲突时,你会以哪个为准?为什么?
8.在没有历史表现数据的新产品冷启动阶段,你会如何制定风控策略?
9.如何评估一条新上的风控规则的有效性?你会关注哪些指标?
10.请解释IV(InformationValue)和WOE(WeightofEvidence)的概念,以及它们在策略
制定中的应用。
11.在反欺诈场景中,你如何识别团伙欺诈?常用的关联网络特征有哪些?
12.什么是PSI(PopulationStabilityIndex)?如果模型的PSI超过0.25,你通常会采取什么
措施?
13.请描述一下SwapSet(换手集)分析法,以及通过SwapSet进行策略调整的具体案例。
14.如何确定风控模型的Cut-off(截断点)?请描述具体的测算逻辑。
15.面对模型老化(Decay)的问题,作为策略人员,你会如何通过策略手段进行弥补?
16.请解释第一类错误(误杀)和第二类错误(漏放)在风控业务中的具体含义,由于成本不
同,你更倾向于控制哪一个?
17.什么是拒绝推断(RejectInference)?请列举几种常见的拒绝推断方法及其优缺点。
18.在贷中管理(AccountManagement)中,你如何制定提额和降额策略?依据是什么?
19.针对多头借贷(Multi-lending)用户,你会设计什么样的特征或规则进行拦截?
20.请介绍一下A/BTest在风控策略迭代中的具体操作流程,以及如何确定样本量?
21.如果老板要求在一个月内将放款规模提升30%,且坏账率不能显著上升,你会从哪些维度
入手?
22.什么是KS值?KS值高一定代表模型或策略效果好吗?为什么?
23.决策树算法(如XGBoost)输出的特征重要性,你是如何应用到规则挖掘中的?
24.请举例说明你是如何进行BadCase(坏样本)分析的?分析结果如何转化为策略?
25.针对高风险地区或特定高风险客群,你会采用“一刀切”策略还是差异化定价策略?依据是
什么?
26.什么是冠军/挑战者(Champion/Challenger)策略模式?请结合实际案例说明。
27.在特征工程中,你是如何处理缺失值和异常值的?这对策略规则的稳定性有什么影响?
28.请解释一下贷后催收策略中的分案逻辑(Segmentation),你会根据哪些维度对逾期客
户进行分层?
29.如何利用外部数据源(如征信报告、运营商数据、电商数据)构建有效的风控规则?
30.什么是“存量客户交叉销售(Cross-sell)”的风控策略?与新客风控有何不同?
31.在SQL中,如何计算用户最近3个月的平均消费金额?(考察窗口函数的使用场景)
32.当遇到数据样本极度不平衡(坏样本极少)的情况时,你在制定策略或建模时会如何处
理?
33.什么是设备指纹(DeviceFingerprint)?它在反欺诈策略中起到了什么作用?
34.如果你的策略误杀率(FalsePositiveRate)很高,你会如何向业务部门解释并优化?
35.请描述一下从原始数据到衍生变量(FeatureExtraction)的过程,你最得意的特征是什
么?
36.在这一轮经济下行周期中,你观察到客群表现有哪些变化?针对这些变化你做了哪些策略
调整?
37.如何通过决策引擎(DecisionEngine)实现复杂的策略流转(如并行、串行、分支)?
38.什么是LTV(LifeTimeValue)?风控策略如何辅助提升用户的LTV?
39.请解释一下ROC曲线和AUC值的含义,AUC为0.5意味着什么?
40.针对“黑中介”包装的虚假进件,你有哪些识别手段?
41.在制定授信额度策略时,你是采用基于规则的方法还是基于模型(如收入预测模型)的方
法?
42.什么是迁徙率?如何通过迁徙率预测未来的坏账水平?
43.假如上线了一个新策略,发现FPD30(首次逾期30天)指标恶化,但FPD7指标正常,可
能是什么原因?
44.如何利用知识图谱(KnowledgeGraph)技术辅助反欺诈策略?
45.请谈谈你对“隐私计算”在风控数据共享中应用的理解。
46.在处理高并发交易风控(如支付风控)时,策略的时效性(毫秒级)和准确性如何权衡?
47.如果外部征信数据突然断供(接口下线),你会启动什么样的B计划(备用策略)?
48.什么是“灰名单”管理?对于灰名单用户,通常采取什么样的差异化流程?
49.如何评估一个三方数据源的测试效果(DataTesting)?是否值得引入该数据源?
50.在贷后预警(EarlyWarning)系统中,你会监控哪些高敏感行为特征?
51.请解释一下“幸存者偏差”在风控样本分析中是如何体现的?
52.当业务方质疑你的风控策略太严导致客户流失时,你会拿什么数据去说服他们?
53.什么是规则的“命中率”和“触碰率”?这两个指标如何指导规则优化?
54.在Python中,pandas库的groupby和pivot_table在你的日常策略分析中是如何使用的?
55.针对不同渠道(如信息流广告、应用商店、线下地推)进来的流量,你的风控准入策略有
何不同?
56.请简述一下评分卡(Scorecard)开发的标准流程。
57.如何利用非结构化数据(如文本、地理位置轨迹)进行风险识别?
58.什么是“策略基线(Baseline)”?如何设立合理的基线?
59.面对“撸口子”大军(专业羊毛党),最有效的防御策略是什么?
60.在未来的一年中,你认为风控策略最大的挑战和机会在哪里(如LLM大模型在风控的应
用)?
风控策略岗位高频面试题解析
Q01.请详细介绍一下你常用的风控指标(如FPD、SPD、Vintage、RollRate),并解释
它们之间的业务关联。
❌不好的回答示例
“FPD是首次逾期,SPD是第二次逾期。Vintage是看账龄的,RollRate是滚动
率。它们都是用来监控资产质量的指标。我在以前的公司每天都会看报表,如果指
标高了就报警。”
類为什么这么回答不好
1.定义浅显:仅停留在缩写翻译,未解释具体的时间窗口(如FPD30vsFPD7)。
2.缺乏关联性:没有串联起这些指标之间的逻辑关系(如早期指标如何预测晚期指标)。
3.被动执行:只提到“看报表”,没有体现“通过指标指导业务调整”的主动性。
✅加分回答示例
“在风控策略中,我通常建立一个从早期预警到长期表现的完整指标体系:
1.FPD(FirstPaymentDefault)&SPD:这是早期风险指标。我通常重点关注FPD7和
FPD30,它们能最快反映近期进件(NewBooking)的质量。如果FPD骤升,通常意味
着欺诈攻击或渠道质量恶化。
2.VintageAnalysis:这是全生命周期指标。它解决了不同时期放款的账龄(MOB)不可
比问题。我主要用它来评估不同月份策略调整后的长期长期损益(LTV)表现,判断风控
措施是否在几个月后依然有效。
3.RollRate(滚动率):这是过程监控指标。它反映资产在不同逾期状态间的迁移(如M0到
M1,M1到M2)。它是计算坏账准备金(Provision)和定义坏账确立期(Write-off
point)的核心依据。
关联性逻辑:我会通过监测FPD来快速调整准入规则,防止风险敞口扩大;利用
RollRate来预测未来的Vintage曲线走势,从而向财务部门预估未来的坏账水
位。”
Q02.在最近的一份工作中,你负责的策略模块通过率和坏账率分别是多少?你是如何平衡
这两者的?
❌不好的回答示例
“通过率大概在20%左右,坏账率控制在3%。老板让我降坏账,我就收紧规则;老
板要量,我就放松规则。反正就是在这两者之间找平衡。”
類为什么这么回答不好
1.数据孤岛:脱离了产品类型谈数据(现金贷和分期产品的3%坏账率含义完全不同)。
2.缺乏方法论:简单粗暴的“收紧/放松”显得缺乏技术含量,未体现精细化运营(Swap
Set、分客群定价等)。
3.缺乏利润视角:风控的核心不是低坏账,而是利润最大化。
✅加分回答示例
“在我负责的XX现金贷产品中,综合通过率约为**25%,M3+坏账率控制在4.5%**
左右(年化)。
关于平衡,我遵循‘收益覆盖风险’(Risk-BasedPricing)的原则,而不是简单
的一刀切:
1.测算Break-evenPoint(盈亏平衡点):首先计算产品的件均收益,得出我们
能容忍的最大坏账率(例如5%)。
2.分层管理:
对于高风险低收益客群(坏账率>5%),坚决切断,降低坏账。
对于低风险客群,我不是简单提升通过率,而是通过提额或降价来提升转化率
和留存率,从而扩大规模。
对于临界客群(坏账率4%-5%),我会引入新的数据源或进行小流量A/B测
试,试图捞回其中的优质部分(GrayAreaStrategy)。
最终,我的目标是在坏账率不突破盈亏平衡线的前提下,最大化放款规模
(GMV)。”
Q03.如果发现当天的进件通过率突然下跌了20%,你会如何进行归因分析?请列出排查步
骤。
❌不好的回答示例
“我会先去看看系统有没有报错,然后问问技术有没有改代码。如果都没问题,那可
能是客户质量变差了,我会把最近被拒绝的客户拉出来看看。”
類为什么这么回答不好
1.缺乏结构化思维:排查步骤混乱,像无头苍蝇。
2.忽视上游:直接跳到策略层面,忽略了流量端和数据源端最常见的问题。
3.被动等待:依赖询问技术人员,缺乏自己动手查询数据验证的能力。
✅加分回答示例
“面对通过率骤降,我会按照‘漏斗-渠道-数据-策略’的顺序进行结构化排查:
1.渠道/流量端(最常见原因):
检查各渠道的进件占比是否有剧烈波动?(例如:高通过率的优质渠道突然停投,低
质量渠道涌入)。
Action:SELECTchannel,count(*)FROMtableGROUPBYchannel。
2.系统/数据源端:
检查三方数据接口是否超时或返回空值?(例如:某征信接口挂了,导致规则默认命
中‘缺失即拒绝’)。
检查HardRule(硬规则)的命中率分布,看是否有某一条规则命中率异常飙升。
3.策略部署端:
确认昨晚是否有新策略上线?是否有配置错误导致误杀?
4.客群画像端:
如果上述都没问题,对比今日拒绝用户与历史用户的特征分布(PSI分析),看是否遭
受了特定的欺诈攻击(如特定的IP段或设备集中申请)。”
Q04.你是如何定义“坏客户”的?在不同业务场景下(如现金贷与消费分期),坏客户的定
义有什么区别?
❌不好的回答示例
“坏客户就是不还钱的客户啊。一般逾期超过90天就算坏客户了,因为很难追回来
了。”
類为什么这么回答不好
1.定义单一:只关注了逾期天数,忽略了滚动率和业务形态。
2.缺乏场景感:没回答出“现金贷”与“消费分期”的区别。
✅加分回答示例
“坏客户的定义(Good/BadDefinition)是构建评分卡和策略的基石,通常基于滚
动率矩阵(RollRateMatrix)来确定状态翻转极低的时间点。
1.通用定义:通常使用FPD30(首期逾期30天)或M3+(逾期90天以上)作为坏客户标
记,此时回款率通常低于5%-10%。
2.场景差异:
短周期现金贷(PaydayLoan):周期短、利率高。我们可能定义FPD7甚至是S1
(逾期1天)为坏客户。因为这类客群一旦逾期,大概率是多头借贷暴雷,很难挽回。
大额消费分期(Installment):周期长、额度大。客户可能因为一时疏忽或资金周转
暂时逾期。我们会更宽容,通常定义**M3+甚至M6+**才为确定的坏客户,中间状态定
义为‘Indeterminate’(灰客户),在建模时通常剔除。”
Q05.请解释Vintage分析的逻辑,并说明为什么账龄分析在风控中如此重要?
❌不好的回答示例
“Vintage就是把每个月放款的客户分开看,看他们后来的坏账情况。画出来几条
线,如果不交叉就是好的。它能看出来哪个月放款质量差。”
類为什么这么回答不好
1.表述过于口语化:缺乏专业术语(Cohort,Maturity)。
2.逻辑缺失:没解释为什么要“分开看”(解决分母膨胀问题)。
3.深度不足:没提到Vintage如何用于预测未来。
✅加分回答示例
“Vintage分析(账龄分析)的核心逻辑是‘同期群(Cohort)’管理。它以放款月份
为横轴,账龄(MOB-MonthonBook)为纵轴,观察同一批次放款在不同生命
周期的累积违约率。
重要性体现在三点:
1.剔除规模增长的掩盖效应:如果我们只看整体坏账率(当期逾期/当前余额),在放款规
模快速扩张期,分母变大通过稀释分子,会制造‘资产质量很好’的假象。Vintage通过锁定
分母,揭示了真实的风险。
2.策略效果评估:通过对比不同放款月份的Vintage曲线(例如:5月上线新策略,对比5月
和4月的曲线),如果5月曲线明显下移,证明策略有效。
3.确定资产成熟期:观察曲线何时趋于平缓,可以定义产品的损益周期,辅助财务计算
LTV。”
Q06.什么是滚动率(RollRate)分析?如何利用滚动率矩阵来定义坏账确立期?
❌不好的回答示例
“滚动率就是看客户从不逾期变成逾期,或者从逾期10天变成20天的比例。如果滚
动率高,说明催收没做好。坏账确立期就是看什么时候客户肯定不还钱了。”
類为什么这么回答不好
1.描述不严谨:滚动率通常指逾期状态的层级跃迁(M0->M1,M1->M2)。
2.归因单一:滚动率高不一定是催收问题,也可能是进件质量(客群下沉)问题。
✅加分回答示例
“滚动率(RollRate)是指资产在相邻两个时间点(通常是月底)之间,从一个逾
期状态流转到下一个更严重逾期状态的比例。例如M1-M2RollRate=(T月M2余额)
/(T-1月M1余额)。
利用矩阵定义坏账确立期(Write-offPoint):
我们会构建一个转移概率矩阵。当观察到从某个状态(例如M3)流转到下一个状态
(M4)的概率接近95%-100%,且向下回滚(Cure,回到正常或轻度逾期)的概
率接近**0%**时,该状态(M3)即为坏账确立期。
这意味着,一旦客户到达M3状态,投入再多的催收成本也难以挽回,从财务角度应
及时核销(Write-off)以优化资产表。”
Q07.当模型分数(Score)与规则策略(Rule)发生冲突时,你会以哪个为准?为什么?
❌不好的回答示例
“我一般以模型为准,因为模型利用了更多数据,准确性更高。规则比较死板,容易
误杀。或者看哪个通过率低就用哪个。”
類为什么这么回答不好
1.盲目迷信模型:模型有滞后性,且对异常值(欺诈)敏感度不如规则。
2.缺乏风控分层思维:规则和模型的定位不同,不是简单的替代关系。
✅加分回答示例
“这不是简单的‘谁准听谁’的问题,而是取决于风险类型和冲突场景:
1.强规则优先原则(HardRules):如果是触碰了反欺诈底线(如命中黑名单、法院失信
执行人、多头借贷超限),必须以规则为准,直接拒绝。无论模型分多高,这类风险是模
型难以捕捉的结构性风险(One-voteVeto)。
2.模型主导原则(CreditRisk):如果是信用评估(如收入负债比略高,但历史还款极
好),此时规则可能判黑,但模型给出了高分。这种情况下,我倾向于信赖模型,或者进
入人工复审/灰名单。因为模型综合了数百个维度,能捕捉到客户的‘还款意愿’来弥补‘还款
能力’的瑕疵。
3.兜底逻辑:通常策略流程是:反欺诈规则(强拒绝)->准入规则(强拒绝)->信用模型
评分。模型是在规则筛选后的池子里进行排序。”
Q08.在没有历史表现数据的新产品冷启动阶段,你会如何制定风控策略?
❌不好的回答示例
“没有数据就很难做。我会先让业务跑一个月,有了数据再把坏人抓出来做规则。或
者直接照搬竞争对手的策略。”
類为什么这么回答不好
1.风险裸奔:让业务先跑一个月可能直接导致被黑产攻破,损失惨重。
2.缺乏专业度:完全依赖事后补救,没有事前防御(ExpertRules)的概念。
✅加分回答示例
“在冷启动(ColdStart)阶段,因为缺乏Y值(表现数据),我会采取‘专家规则
+防御性策略+小步快跑’的模式:
1.专家经验规则(HeuristicRules):借鉴同类型产品经验或行业通用标准。例如设置基
础的年龄限制(18-55)、地域限制(避开高风险区)、反欺诈名单(直接接入三方黑名
单)。
2.紧缩的额度与期限:采取‘Low&Grow’策略,初始只给极低额度(如500元)、短周期,
降低试错成本。
3.接入通用反欺诈分:使用征信局或大厂提供的通用分(GenericScore)作为替代模型,
设定严格的Cut-off。
4.灰度放量与快速迭代:每天限制进件量(如100单),人工逐单复审(如有条件),观察
FPD7指标。一旦积累了哪怕50-100个坏样本,立即进行BadCase分析,迭代第一版数
据驱动的规则。”
Q09.如何评估一条新上的风控规则的有效性?你会关注哪些指标?
❌不好的回答示例
“看它拦截了多少人啊。如果拦截的人多,说明规则很有用。还有就是看拦截的人里
面是不是坏人。”
類为什么这么回答不好
1.片面:拦截多不代表好,可能是误杀多。
2.逻辑悖论:被拦截的人没有放款,怎么知道他是“坏人”?(缺乏推断思维)。
✅加分回答示例
“评估新规则有效性,我主要关注三个维度的指标:
1.命中率(HitRate):规则触发的比例。太高可能误杀,太低可能无效。
2.BadRateinRejection(查准率/精确率):这是最难也是最关键的。由于被拒客户无表
现,我会通过以下方式评估:
关联分析:看命中该规则的客户,是否也命中了其他高风险规则或黑名单。
放行测试(A/BTest):抽取5%-10%的命中客户‘空跑’(只打标签不拒绝),观察后
期的逾期表现。如果这批人坏账率远高于大盘(如大盘3%,这批人20%),说明规则
非常精准。
3.Lift(提升度):该规则识别出的坏客户浓度相对于整体坏客户浓度的倍数。
综合评估:一个好的规则应该是命中率适中,且Lift值很高。”
Q10.请解释IV(InformationValue)和WOE(WeightofEvidence)的概念,以及它们在
策略制定中的应用。
❌不好的回答示例
“WOE是证据权重,IV是信息值。IV值越大,说明特征越好。一般IV大于0.02就有
用。我们在建模前都要算一下IV。”
類为什么这么回答不好
1.照本宣科:像背书,没有解释背后的数学逻辑(比率的对数)。
2.缺乏业务结合:没提到WOE的“单调性”在策略分箱中的作用。
✅加分回答示例
“WOE(WeightofEvidence)是对原始特征进行分箱编码的一种方法。它衡量了
某个分箱中‘好人’与‘坏人’分布的差异。
公式逻辑是:ln(%Good/%Bad)。如果WOE随箱体单调递增/递减,说明该特征
线性关系良好,适合入模。
IV(InformationValue)是WOE的加权和,用来衡量整个特征对好坏样本的区
分能力。
IV<0.02:无预测力,丢弃。
0.1<IV<0.3:中等预测力,策略常用。
IV>0.5:预测力极强,但需警惕未来函数或数据泄漏(如‘逾期天数’这个特征IV肯定高,
但不能用)。
在策略中的应用:
除了筛选入模特征,我会直接利用WOE的分箱边界来制定策略规则。例如,发
现‘多头借贷次数’在WOE分箱中,>5次那一箱的WOE值陡降,那么‘次数>5’就是一
个极佳的硬拒绝规则阈值。”
Q11.在反欺诈场景中,你如何识别团伙欺诈?常用的关联网络特征有哪些?
❌不好的回答示例
“团伙欺诈就是一伙人一起来骗贷。我会看他们的IP是不是一样的,或者设备是不是
一样的。如果一样就都拒绝。”
類为什么这么回答不好
1.手段初级:只提到简单的硬关联,现代黑产很容易绕过(使用IP代理、模拟器)。
2.缺乏深度:没提到图算法(Graph)或二度关联。
✅加分回答示例
“团伙欺诈通常具有‘资源共享’和‘时间聚集’的特征。我通常利用知识图谱
(KnowledgeGraph)构建关联网络进行识别:
1.强关联节点:设备ID(IDFA/IMEI)、WiFiMAC地址、GPS(小范围内聚集)、紧急联
系人(互相填写)。
2.核心特征逻辑:
连通图大小(Degree):一个设备关联了50个身份证,或者一个手机号被100个人作
为联系人。
黑节点距离(DistancetoRisk):申请人距离已知黑名单节点的步长。如果是1步关
联(直接联系人是黑名单),风险极高。
聚集度(ClusteringCoefficient):一群人在短时间内(如1小时内)使用同一IP段
或LBS坐标集中进件。
3.策略应用:一旦发现某个连通子图(Community)的坏账率异常,我会直接对该子图内的
所有节点(包括未逾期的)进行‘连坐’封禁。”
Q12.什么是PSI(PopulationStabilityIndex)?如果模型的PSI超过0.25,你通常会采取
什么措施?
❌不好的回答示例
“PSI是看稳定性的。超过0.25说明模型不稳定了,不能用了,需要重新建模。”
類为什么这么回答不好
1.结论武断:PSI高不代表模型一定失效,可能是客群变化(Shift),也可能是政策变化。
2.措施单一:重新建模成本很高,不是第一选择。
✅加分回答示例
“PSI(群体稳定性指标)衡量的是实际样本分布(Actual)与预期样本分布
(Expected/Baseline)的差异。
一般认为PSI>0.25表示分布发生了显著偏移。
应对措施四步走:
1.归因分析:首先看是哪个特征导致了PSI飙升?是全量客群变了,还是某个渠道的流量变
了?(例如:某渠道突然导入了大量年轻用户,导致‘年龄’特征PSI飙升)。
2.评估模型性能:检查KS或AUC值。
如果PSI高,但KS依然很高,说明模型在新的客群上依然有效(Robust),不需要重
训,可以调整Cut-off(阈值)来适应新客群。
如果PSI高,且KS显著下降,说明模型失效。
3.校准(Calibration):如果只是分数分布平移,可以通过逻辑回归的截距项调整进行校
准。
4.重构/迭代:只有在特征逻辑彻底改变时,才考虑重新训练模型。”
Q13.请描述一下SwapSet(换手集)分析法,以及通过SwapSet进行策略调整的具体案
例。
❌不好的回答示例
“SwapSet就是交换集合。比如新模型上线,看看新旧模型有什么不一样。把不一
样的人拿出来看看。”
類为什么这么回答不好
1.解释不清:没有讲清楚四象限逻辑(In/In,Out/Out,In/Out,Out/In)。
2.缺乏决策逻辑:没说清楚怎么利用这个分析做决策。
✅加分回答示例
“SwapSet分析是新旧模型/策略切换时的核心评估工具。我们将样本分为四类:
**Keep(In-In)**:旧策略通过,新策略也通过。
**Drop(Out-Out)**:旧策略拒绝,新策略也拒绝。
**Swap-In(Out-In)**:旧策略拒绝,新策略通过(捞回)。
**Swap-Out(In-Out)**:旧策略通过,新策略拒绝(剔除)。
实战案例:
假设我引入了一个新的多头分模型。
1.分析Swap-Out人群:我看这部分被新模型剔除的人,在历史数据中的坏账率是
否很高?如果是(比如坏账率10%),说明新模型有效‘排雷’。
2.分析Swap-In人群:这部分是增量。虽然旧策略拒了,但新模型觉得好。我会切
小流量(比如10%)放行这部分人,验证他们的实际表现。
通过计算Swap-Out坏账率vsSwap-In坏账率,如果前者远大于后者,且整体
通过率持平,即可证明新策略更优,可以全量替换。”
Q14.如何确定风控模型的Cut-off(截断点)?请描述具体的测算逻辑。
❌不好的回答示例
“一般看KS值最大的那个点作为Cut-off。或者老板说通过率要控制在20%,我就切
在20%那个分数线上。”
類为什么这么回答不好
1.KS误区:KS最大点只能说明区分度最大,不代表商业价值最大(可能拒绝太多好人)。
2.被动执行:只根据通过率切分,忽略了坏账容忍度。
✅加分回答示例
“确定Cut-off是一个平衡通过率(ApprovalRate)、坏账率(BadRate)和盈
利(Profitability)的过程。
我通常使用‘边际收益法’进行测算:
1.分箱统计:将分数按区间划分(如600-610,610-620...),计算每个区间的历
史坏账率。
2.盈亏平衡计算:根据产品的定价(APR)和资金成本,算出Break-evenBad
Rate(例如5%)。
3.定位截断点:找到那个边际坏账率(MarginalBadRate)接近5%的分数段。
如果切在KS最大点,可能会为了追求区分度而放弃了部分虽然风险稍高但依
然盈利的客户。
因此,我会在盈亏平衡点的基础上,留出一定的安全边际(Safety
Margin),选定最终的Cut-off。
同时,我会结合业务目标:如果是扩张期,可以适当下探Cut-off;如果是收缩
期,则上调。”
Q15.面对模型老化(Decay)的问题,作为策略人员,你会如何通过策略手段进行弥补?
❌不好的回答示例
“模型老化了就得赶紧让建模组重新训练模型啊。策略这边做不了什么,只能把分数
的阈值提高一点。”
類为什么这么回答不好
1.推卸责任:策略不仅仅是等待模型,策略的灵活性恰恰是弥补模型滞后的关键。
2.手段单一:只知道提阈值,容易误杀。
✅加分回答示例
“模型重训周期长,作为策略人员,在模型Decay期间,我会采取‘补丁策
略’(PatchingStrategy):
1.特征补丁:模型老化通常是因为某些特征失效。我会单独提取出最新的强特征(如最近一
周表现突出的多头变量),作为一条前置规则(Pre-screenRule)叠加在模型之上。
2.人群细分调整:模型可能在整体上区分度下降,但在某些细分客群(如老客)依然有效。
我会针对模型表现变差的特定子客群(如新渠道进来的年轻白户),单独收紧Cut-off或增
加人工审核,而对稳定客群保持不变。
3.降额策略:如果无法精准识别好坏,为了控制风险敞口,我会整体下调高风险分数段的授
信额度,通过降低风险暴露(Exposure)来对冲概率预测的不准。”
Q16.请解释第一类错误(误杀)和第二类错误(漏放)在风控业务中的具体含义,由于成
本不同,你更倾向于控制哪一个?
❌不好的回答示例
“第一类错误是把好人当坏人拒了,第二类错误是把坏人当好人放了。我觉得两个都
要控制,尽量让错误越少越好。如果非要选,我觉得漏放更严重,因为会产生坏
账。”
類为什么这么回答不好
1.缺乏成本量化:没有指出两者的成本不对称性(机会成本vs直接损失)。
2.缺乏业务动态视角:不同产品的风险偏好不同,选择也会不同。
✅加分回答示例
“在风控混淆矩阵中:
**TypeIError(FalsePositive,误杀):拒绝了本该还款的好客户。成本=损失的利息收
益+获客成本(CAC)**。
TypeIIError(FalseNegative,漏放):放过了会违约的坏客户。成本=本金损失+催
收成本-已收回款。
倾向性决策(Cost-SensitiveLearning):
通常情况下,TypeII(本金损失)的成本远高于TypeI(利息损失)。例如,放款
1万,误杀可能只损失1千元利息,但漏放可能损失1万本金。
因此,在高额低息产品中,我严格控制TypeII(宁可错杀一千,不可放过一个)。
但在小额高息(如PaydayLoan)产品中,由于高利率可以覆盖高风险,且获客成
本极高,我会适当容忍TypeII,以减少TypeI(误杀),追求规模效应。”
Q17.什么是拒绝推断(RejectInference)?请列举几种常见的拒绝推断方法及其优缺点。
❌不好的回答示例
“拒绝推断就是因为我们不知道被拒绝的人如果放款了会不会还钱,所以要推断一
下。方法大概就是把被拒的人当成坏人,或者把他们当成好人放进去建模。”
類为什么这么回答不好
1.方法论缺失:没有提到具体的统计学方法(如Parceling,FuzzyAugmentation)。
2.简单粗暴:直接“当成坏人”是极其偏差的做法。
✅加分回答示例
“拒绝推断旨在解决样本偏差(SampleBias)问题,因为建模通常只使用‘通过且
有表现’的样本,导致模型对低分段人群缺乏认知。
常见方法:
1.硬截断法(HardCut-off):不做推断。缺点:偏差最大,模型无法评估次优客群。
2.分配法(Parceling/SimpleExpansion):将拒绝样本按照分数区间,按比例分配‘好/
坏’标签(比例参考该区间的通过样本)。优点:保持了各分数段的坏账率结构;缺点:
人为假设了被拒人群与通过人群同质。
3.模糊扩充法(FuzzyAugmentation):用通过样本训练初步模型,给被拒样本打分(预
测违约概率P),然后将每个被拒样本拆分为‘P个坏人’和‘1-P个好人’带权入模。优点:利
用了概率信息,理论最科学;缺点:计算复杂,容易引入噪声。
策略实操:我也常使用‘旁路推断’,即定期随机抽取少量被拒样本进行放款(买单
测试),获取真实的Y值,这是最准确的‘推断’。”
Q18.在贷中管理(AccountManagement)中,你如何制定提额和降额策略?依据是什
么?
❌不好的回答示例
“如果客户还款好,就给他提额,鼓励他多借。如果客户逾期了,就给他降额或者冻
结。主要是看历史还款记录。”
類为什么这么回答不好
1.滞后性:仅看历史还款是“后视镜”开车,等逾期再降额往往来不及了。
2.维度单一:忽略了外部负债变化和利用率(Utilization)。
✅加分回答示例
“贷中策略的核心是‘动态风险定价’。
1.提额策略(Upsell):
触发条件:还款良好+额度利用率高(>70%)+外部多头稳定。
核心逻辑:不仅看他‘能不能还’,还要看他‘缺不缺钱’(饥渴度)。只有高利用率的优
质户提额才能带来GMV增量。
2.降额/冻结策略(Downsell/Freeze):
预警触发:不仅仅看本平台逾期。如果监控到外部多头借贷激增、征信查询次数飙升
或循环额度内只还最低还款额(MinimumPay),这都是资金链紧张的信号。
动作:在客户下一次提款前(Pre-drawdown),系统自动重跑准入规则,拦截高危提
款,或直接降低授信额度(Closelimittobalance)以降低风险敞口。”
Q19.针对多头借贷(Multi-lending)用户,你会设计什么样的特征或规则进行拦截?
❌不好的回答示例
“就看他借了多少家平台啊。比如借了10家以上就拒掉。还有看他最近申请了多少
次。”
類为什么这么回答不好
1.粗糙:没有区分“申请”和“放款”,没有区分“银行系”和“小贷系”。
2.缺乏时间切片:多头是一个动态累积的过程。
✅加分回答示例
“多头借贷是风险最高的特征之一,我会从三个维度设计规则:
1.时间切片的密度:不仅看总量,更看加速度。
近7天申请平台数>5(急借)。
近1个月申请数/近6个月申请数>0.5(近期突变)。
2.平台类型的穿透:
区分银行/持牌消金(资质较好)与P2P/小贷/网贷(资质差)。如果客户突然开始申请
大量714高炮或不知名小贷,说明优质额度已用光,风险极高。
3.注册与放款的差值:
近3个月申请平台数-近3个月放款平台数。如果差值很大,说明客户被广泛拒绝,
这比单纯的申请多更危险(又穷又急且被全行业嫌弃)。”
Q20.请介绍一下A/BTest在风控策略迭代中的具体操作流程,以及如何确定样本量?
❌不好的回答示例
“A/BTest就是把流量分成两半,一半走老策略,一半走新策略。跑一段时间看看哪
边坏账低。样本量的话,大概几千个就够了吧。”
類为什么这么回答不好
1.流程不规范:忽略了正交性(Orthogonality)和随机性。
2.样本量拍脑袋:没有统计功效(PowerAnalysis)的概念。
✅加分回答示例
“风控A/BTest流程严谨性至关重要:
1.实验设计:
流量切分:通常使用Hash(UserID)取模,确保同一用户始终落在同一组(一致性)。
正交性:确保风控实验不被UI/产品实验干扰。
对照组(Control):当前冠军策略。实验组(Test):挑战者策略。
2.确定样本量:
使用统计功效分析(PowerAnalysis)公式。输入参数包括:目前的基准坏账率
(Baselinep)、预期的最小提升(MDE,e.g.,降低0.5%)、置信度(95%)、统计
功效(80%)。
公式逻辑:坏账率越低(稀疏事件),需要的样本量越大,通常需要几万甚至十万量
级才能得出显著性结论。
3.监控与回溯:
上线初期看FPD7的显著性检验(t-test)。如果p-value<0.05,且收益符合预期,才
考虑全量推全(Scaleup)。”
Q21.如果老板要求在一个月内将放款规模提升30%,且坏账率不能显著上升,你会从哪些
维度入手?
❌不好的回答示例
“这很难啊。要量肯定会牺牲坏账的。如果非要做,我就把那些原来被拒的稍微好一
点的人放进来,比如把分降一点点。”
類为什么这么回答不好
1.缺乏策略组合:只想到“降门槛”(捞回),没想到“提额度”或“提转化”。
2.视野狭窄:只盯着风控侧,没有联动运营侧。
✅加分回答示例
“要在保风险的前提下冲规模,必须挖掘存量潜力和转化漏斗,而不是盲目下沉:
1.提额策略(针对存量优质客):这是最快最安全的手段。筛选出用信记录好、负债低的
WhiteList,主动提额30%-50%。优质客群的额度弹性大,坏账风险低。
2.捞回策略(针对灰区客群):分析最近被‘误杀’的边缘客群(SwapSet分析)。例如某些
因为无征信被拒,但有公积金数据的客户,通过引入新数据源进行精准捞回。
3.流程优化(提升转化率):检查风控环节的断点(Drop-off)。例如,是不是活体识别太
难通过?是不是需要填写的资料太多?简化低风险客户的认证流程,提升漏斗转化率
(ConversionRate),在不降低风控标准的情况下增加进件基数。”
Q22.什么是KS值?KS值高一定代表模型或策略效果好吗?为什么?
❌不好的回答示例
“KS值是衡量模型区分能力的,越大越好。一般KS大于0.3就不错,大于0.5就很
好。如果KS高,说明模型把好坏人分得很清楚。”
類为什么这么回答不好
1.知其然不知其所以然:没提到KS只关注排序(Ranking),不关注概率准确性。
2.忽略业务实际:KS过高(>0.6)往往意味着数据泄漏或过拟合。
✅加分回答示例
“KS(Kolmogorov-Smirnov)**衡量的是好坏样本累积分布函数(CDF)之间
的最大差值。它反映了模型对好坏样本的**排序能力。
KS高不一定代表效果好,原因如下:
1.异常高值警报:在信贷风控中,KS通常在0.3-0.5之间。如果KS>0.6,大概率发生了数
据泄漏(DataLeakage)(例如用到了贷后变量)或者过拟合,模型在OOT(跨时间验
证)中会崩盘。
2.分布集中问题:KS只看最大差值点。如果KS最大点发生在极低分段(比如只对极差的
10%人群区分度极高,对中间人群区分度差),这对于需要精细化运营的策略来说价值有
限。
3.忽略了校准度:KS高只代表排序对,但如果模型预测的PD(违约概率)偏离真实值很
大,会影响风险定价和拨备计算。”
Q23.决策树算法(如XGBoost)输出的特征重要性,你是如何应用到规则挖掘中的?
❌不好的回答示例
“我就看FeatureImportance排名前几的特征。比如排名第一的是‘历史逾期次数’,
我就把它拿出来单独写一条规则,比如逾期次数大于3就拒绝。”
類为什么这么回答不好
1.线性思维:直接把重要性等同于规则阈值,忽略了树模型的非线性切分。
2.缺乏验证:没有结合单变量分析(UnivariateAnalysis)。
✅加分回答示例
“XGBoost的特征重要性(Gain/Cover/Weight)为我们提供了挖掘线索,但不能
直接用。我的转化步骤是:
1.筛选头部特征:提取ImportanceTop20的特征,这些是“强变量”。
2.单调性与阈值分析:针对强特征(如‘近3个月查询次数’),画出其BadRate趋势图。找
到坏账率陡增的那个拐点(比如>8次,坏账率从3%跳升到10%)。
3.交互特征挖掘:决策树的优势在于交叉。我会打印具体的树结构(TreePlot),观察根
节点以下的路径。例如发现:有房产=NoAND近3月查询>10的叶子节点坏账率极
高。那么[无房&查询>10]就是一个强有力的组合策略规则。”
Q24.请举例说明你是如何进行BadCase(坏样本)分析的?分析结果如何转化为策略?
❌不好的回答示例
“BadCase分析就是把逾期的客户拉出来,一条一条看他们的资料。看看有没有什
么共同点,比如是不是都填了同一个公司电话。然后把这个电话封掉。”
類为什么这么回答不好
1.效率低:人肉看Case只适合初期,量大时不可行。
2.缺乏对比:只看坏人,不看好人是否有同样特征(FalsePositive风险)。
✅加分回答示例
“BadCase分析是我日常工作的核心闭环:
1.样本锁定:锁定FPDP(首期即逾期)的极坏客户,这类往往是欺诈或严重信用问题。
2.特征聚合(Profiling):
共性分析:统计这批坏人的Top特征分布。例如,发现30%的坏样本IP地址都归属于某
三线城市的同一个C段。
对比分析(LiftAnalysis):计算该特征在坏样本中的占比vs在大盘中的占比。如果
IP聚集在坏样本中占比30%,大盘仅1%,Lift高达30倍。
3.策略转化:
临时止血:直接将该IP段加入黑名单。
规则泛化:提炼逻辑,由点及面。例如从‘某特定IP段’泛化为一条规则:单一IP段在24
小时内申请人数>N且设备指纹重合度<M,部署为反团伙欺诈规则。”
Q25.针对高风险地区或特定高风险客群,你会采用“一刀切”策略还是差异化定价策略?依
据是什么?
❌不好的回答示例
“我觉得要看情况。如果风险太高就一刀切,不让进。如果风险还行,就提高利率,
覆盖风险。”
類为什么这么回答不好
1.废话文学:“看情况”是正确的废话,没有给出具体的决策边界。
2.忽略合规与公平性:地域歧视(Redlining)在某些监管下是敏感的。
✅加分回答示例
“这取决于风险的可控性和定价的上限(Cap)。
1.一刀切(Cut-off)场景:
欺诈风险:对于福建某些著名的欺诈村或高危行业(如钢贸),历史上坏账率高达
50%以上。这种风险是结构性的,无法通过提价覆盖(因为提价会导致逆向选择,来
的全是骗子),必须一刀切。
监管红线:如学生贷、涉黑涉赌地区,合规要求必须切。
2.差异化定价(RiskPricing)场景:
信用风险:对于某些高风险地区(如东北某些老工业区),虽然整体信用差,但其中
有体制内稳定工作的优质客群。一刀切会错失机会。
策略:我会使用决策树分流。Region=HighRisk的分支下,进入更严格的审批流
程(加查社保/公积金),并适当上浮利率(在36%合规线内)。如果经过强校验依然
优质,则放行。这比简单的一刀切更精细。”
Q26.什么是冠军/挑战者(Champion/Challenger)策略模式?请结合实际案例说明。
❌不好的回答示例
“冠军就是现在的策略,挑战者就是新的。两个一起跑,谁好用谁。和A/BTest差不
多。”
類为什么这么回答不好
1.混淆概念:虽然和A/BTest有关,但Champion/Challenger更侧重于全流程的策略包竞
争,而不仅仅是单一规则测试。
2.缺乏管理视角:没提到流量分配的比例控制。
✅加分回答示例
“Champion/Challenger是策略管理的常态机制。
Champion:当前正在运行的主流策略(占80%-90%流量),性能稳定。
Challenger:旨在挑战冠军的新策略包(占10%-20%流量),通常包含新的模型或更激
进的规则。
案例:
原策略(Champion)对无信用卡用户一律给予3000元额度。
我觉得这部分人里有潜力股,设计了挑战者策略(Challenger):引入‘电商消费数
据’,对消费活跃用户给予5000元额度。
运行结果:三个月后,Challenger组的坏账率持平,但人均借款金额(Ticket
Size)提升了40%,整体收益显著优于Champion。
决策:将Challenger晋升为新的Champion,全量切换,并设计下一代
Challenger。”
Q27.在特征工程中,你是如何处理缺失值和异常值的?这对策略规则的稳定性有什么影
响?
❌不好的回答示例
“缺失值我就填0或者平均值。异常值如果是太大的数,我就把它删掉。不然会影响
模型。”
類为什么这么回答不好
1.业务逻辑错误:在风控中,缺失往往代表着风险(如无征信记录),填平均值会掩盖风
险。
2.简单删除:异常值可能是最高危的欺诈信号,删了就是掩耳盗铃。
✅加分回答示例
“在风控策略中,处理缺失和异常值必须基于业务含义,而不是纯数学处理:
1.缺失值(MissingValue):
信息量:缺失本身就是一种信息。例如‘历史逾期次数’缺失,通常意味着他是白户(无
征信)。我会单独作为一个类别(Category)入模,或者在规则中专门针对Variable
=Null制定准入策略(通常白户风险更高)。
切忌:千万不能盲目填充平均值/中位数,这会将高风险的白户伪装成普通人。
2.异常值(Outliers):
盖帽法(Capping/Flooring):对于信用模型,为了稳定性,我会对极端值进行盖帽
(如P99分位处理),防止模型系数偏离。
单独规则:对于策略,异常值往往是欺诈信号(如用户年龄=100岁,或年收入=1个
亿)。我不会删除,而是针对这些Outliers建立硬拒绝规则。”
Q28.请解释一下贷后催收策略中的分案逻辑(Segmentation),你会根据哪些维度对逾期
客户进行分层?
❌不好的回答示例
“逾期了就分给催收员去催呗。一般按逾期天数分,M1给一组人,M2给另一组人。
或者按欠款金额分,钱多的重点催。”
類为什么这么回答不好
1.维度单一:只看天数和金额,是最原始的催收方式。
2.缺乏模型思维:没有提到评分卡(C-Score)。
✅加分回答示例
“催收资源的分配直接影响回款率。我通常基于C-Score(催收评分卡)**结合**账
龄进行分案:
1.维度:
还款意愿vs还款能力。
历史触达有效性:他以前是接电话就还,还是施压才还?
2.分层策略(RiskSegmentation):
自愈组(Self-Cure):评分高、金额小、历史习惯性晚两天还。策略:不浪费人力,
仅发短信/IVR提醒,静置3-5天。
高风险组:评分低、失联倾向。策略:第一时间(FPD1)人工介入,高频施压。
VIP组:大额优质老客,一时周转不开。策略:安排高级催收员(Tonegentle),协商
展期或分期,避免破坏客户关系。”
Q29.如何利用外部数据源(如征信报告、运营商数据、电商数据)构建有效的风控规则?
❌不好的回答示例
“征信报告看有没有逾期,运营商看有没有打给催收电话,电商看买不买东西。把这
些指标拿出来做个规则就行了。”
類为什么这么回答不好
1.缺乏衍生思维:只用了原始字段,没有挖掘深层特征。
2.缺乏验证逻辑:没提到如何评估数据源的覆盖率和有效性。
✅加分回答示例
“构建规则的核心在于特征衍生(FeatureEngineering):
1.征信报告:不仅看当前逾期,更看‘饥渴度’。衍生特征:近1个月查询机构数/近6个月
查询机构数。如果比例极高,说明近期资金链断裂急需借钱,这是强拒绝规则。
2.运营商数据:不仅看通话记录,更看‘社交圈风险’。衍生特征:互通电话号码中在黑名单
库的占比。如果通过率高但黑名单占比高,说明是‘近墨者黑’。
3.电商数据:主要用于还款能力评估。衍生特征:收货地址变更频率(稳定性)、月均
消费金额/申报收入(收入验证)。
构建流程:先做离线回溯(Back-testing),计算各衍生变量的IV值和KS值,挑选
高区分度变量转化为规则,并在灰度期间监控HitRate。”
Q30.什么是“存量客户交叉销售(Cross-sell)”的风控策略?与新客风控有何不同?
❌不好的回答示例
“就是给老客户推新产品。因为我们已经有他的数据了,所以风控可以松一点,让他
容易通过。”
類为什么这么回答不好
1.盲目乐观:老客户也可能变坏(多头爆发),盲目放松会招致存量雷暴。
2.逻辑不清:没点出“行为数据”这一核心优势。
✅加分回答示例
“交叉销售(Cross-sell)是指向存量借贷客户推荐其他产品(如分期用户推现金
贷)。
策略核心差异:
1.数据优势:新客风控主要靠外部数据(征信),Cross-sell主要靠内部行为数据
(BehaviorData)。
我们可以利用:历史还款及时性、APP登录频率、浏览轨迹、客服交互记录。
2.白名单机制(Pre-approval):
不同于新客的“申请-审批”流,Cross-sell通常是“预授信”模式。我们会提前跑批,筛选
出优质老客,直接展示额度。
3.动态监控:
如果老客近期出现了外部多头借贷激增(虽然本平台还款正常),这往往是‘借新还
旧’的信号。Cross-sell策略必须包含实时的外部风险扫描,防止接盘。”
Q31.在SQL中,如何计算用户最近3个月的平均消费金额?(考察窗口函数的使用场景)
❌不好的回答示例
“就用Selectavg(amount)fromtablegroupbyuser_id,然后加个wheretime
<3months。这样就能算出来了。”
類为什么这么回答不好
1.逻辑漏洞:GROUPBY只能算出聚合后的总数,无法处理滑动窗口(例如每个用户每一
笔交易时的前3个月均值)。
2.缺乏技术深度:面试官想考的是WindowFunctions。
✅加分回答示例
“在风控特征提取中,我们经常需要计算滑动窗口特征。这需要使用SQL窗口函数
AVG()OVER()。
假设表名为transactions,包含user_id,txn_time,amount。
SELECT
user_id,
txn_time,
amount,
--
计算该用户在当前交易时间点往前推90天内的平均交易额
AVG(amount)
OVER
(
PARTITION
BY
user_id
ORDER
BY
txn_time
--
核心逻辑:指定时间范围(秒级转换或天数)
RANGE
BETWEEN
INTERVAL
'3'
MONTH
PRECEDING
AND
CURRENT
ROW
)
as
avg_3m_amount
FROM
transactions;
*(注:具体Syntax视Hive/MySQL/PostgreSQL略有不同,重点是展示Partition
By和RangeFrame的概念)*。”
Q32.当遇到数据样本极度不平衡(坏样本极少)的情况时,你在制定策略或建模时会如何
处理?
❌不好的回答示例
“坏样本少是好事啊,说明风控做得好。建模的时候就复制几遍坏样本,让他们变多
一点,这样模型就能学到了。”
類为什么这么回答不好
1.对过采样理解浅显:简单的复制(Up-sampling)容易导致过拟合。
2.忽略算法层面的调整:除了采样,还有权重设置等方法。
✅加分回答示例
“样本不平衡(ImbalancedData)是风控常态(坏账率通常<5%)。处理策略如
下:
1.采样层面:
欠采样(Down-sampling):随机减少好样本数量,使好坏比达到10:1或5:1。这能
加快训练速度。
SMOTE算法:合成少数类过采样技术。不是简单复制,而是通过插值生成新的坏样
本,增加样本丰富度。
2.算法层面:
Scale_pos_weight:在XGBoost/LightGBM中设置正样本权重。权重=好样本数/
坏样本数,让模型对坏样本的误判惩罚更大。
3.评估层面:
放弃Accuracy(准确率),因为它会失真。重点关注AUC、Recall(召回率)以及PR
曲线(Precision-RecallCurve)。”
Q33.什么是设备指纹(DeviceFingerprint)?它在反欺诈策略中起到了什么作用?
❌不好的回答示例
“设备指纹就是手机的ID,像IMEI或者MAC地址。用来判断是不是同一个手机申请
的。如果一个手机申请好几次就拒绝。”
類为什么这么回答不好
1.概念过时:IMEI/MAC很容易被安卓模拟器篡改,真正的设备指纹要复杂得多。
2.缺乏对抗意识:没提到设备指纹在识别“模拟器”、“越狱”、“改机工具”方面的作用。
✅加分回答示例
“设备指纹是利用软硬件的多维特征(屏幕分辨率、电池电量、传感器偏差、字体列
表、系统启动时间等)生成的唯一设备ID。它的核心价值在于对抗篡改。
在策略中的作用:
1.识别设备伪造:黑产常使用模拟器或改机软件(008神器)。设备指纹能识别出这些环境
异常(如检测到Hook注入、Root权限),直接作为HardReject规则。
2.跨APP关联:即便用户卸载重装、甚至刷机,优秀的设备指纹依然能通过不变的硬件底
层特征锁定该设备,识别出‘设备黑名单’的反复攻击。
3.判断借贷意愿:分析设备App列表(Applist)。如果设备上安装了50个借贷APP,设备指
纹标签为‘多头借贷设备’,策略需重点防范。”
Q34.如果你的策略误杀率(FalsePositiveRate)很高,你会如何向业务部门解释并优
化?
❌不好的回答示例
“风控就是要严一点嘛,误杀是难免的。我会跟他们说,为了不产生坏账,只能牺牲
一点通过率。优化的话,就稍微放宽一点规则。”
類为什么这么回答不好
1.沟通硬伤:态度傲慢,容易引发业务部门对立。
2.缺乏数据支持:没有量化误杀带来的损失vs避免的风险。
✅加分回答示例
“沟通的核心是‘算账’(Trade-offAnalysis)。
1.解释逻辑:‘目前的策略虽然误杀了一些客户,但我们拦截的高风险客户如果放进来,预
计会带来X万元的坏账损失,而误杀带来的利润损失仅为Y万元(X>>Y)。这是为了保
住公司的整体盈利。’
2.优化方案:
分层捞回:我不建议全盘放松。但我会将误杀人群中分数相对较高的那部分(Top
20%),通过人工复审或降额的方式进行捞回测试。
增加摩擦成本:对这部分疑似误杀客户,增加一步‘活体识别’或‘补充银行流水’。骗子
通常会嫌麻烦流失,而真实且有需求的客户会留下。这是一种自然筛选。”
Q35.请描述一下从原始数据到衍生变量(FeatureExtraction)的过程,你最得意的特征是
什么?
❌不好的回答示例
“就是把数据库里的字段拿出来用。比如把年龄拿出来,把性别拿出来。我最得意的
特征是‘收入’,因为收入高的人还款能力强。”
類为什么这么回答不好
1.过于简单:没有体现特征工程的艺术(聚合、比率、时间切片)。
2.各种错误:风控中“收入”往往是用户自填的,不可信;且“性别”通常区分度不高。
✅加分回答示例
“特征衍生遵循RFM(Recency,Frequency,Monetary)逻辑。
比如针对‘通话记录’原始数据:
1.清洗:剔除短号、特服号。
2.聚合:计算近1/3/6个月的通话次数、时长。
3.比率:夜间通话占比(风险偏好)、与联系人通话占比(真实性)。
我最得意的特征:
在反欺诈场景中,我构建过‘通讯录熵值(EntropyofContacts)’。
逻辑:正常人的通讯录有家人、朋友、同事,姓氏分布是离散的。黑产养的号,通讯录
往往是随机生成或批量导入的,姓氏分布极度集中或极度均匀。
效果:该特征在识别‘养号党’时IV值高达0.4,且不依赖黑名单库。”
Q36.在这一轮经济下行周期中,你观察到客群表现有哪些变化?针对这些变化你做了哪些
策略调整?
❌不好的回答示例
“经济不好,大家都没钱还了,坏账变高了。我就把通过率收紧了,只放给那些以前
还款好的人。”
類为什么这么回答不好
1.观察不细致:没指出具体是哪类人变坏了(共债客?小微企业主?)。
2.策略粗糙:简单的收紧可能导致业务规模腰斩。
✅加分回答示例
“在下行周期,我观察到显著的‘资产分化’和‘共债风险爆发’:
1.客群变化:
负债率攀升:原本的优质客(如小白领)因为降薪或失业,开始以贷养贷,DTI
(Debt-to-Income)激增。
首逾指标恶化:FPD7普遍上涨,说明还款能力是瞬间丧失的。
2.策略调整:
收紧多头阈值:对‘多头借贷’的容忍度大幅降低。以前允许借5家,现在超过3家即拒,
防止击鼓传花到我们手里爆炸。
强化收入/负债核查:增加对公积金/社保状态的校验,剔除失业人群。
缩短账期:推广短周期产品(如3期/6期),快速周转,减少对未来长周期经济不确定
的暴露。”
Q37.如何通过决策引擎(DecisionEngine)实现复杂的策略流转(如并行、串行、分
支)?
❌不好的回答示例
“我们就用代码写if-else。先跑A规则,再跑B规则。如果规则太多,代码就很难维
护。”
類为什么这么回答不好
1.工程思维:硬编码(HardCode)是风控大忌,无法快速迭代。
2.缺乏工具认知:不了解专业的决策引擎(如Drools,FICOBlaze,阿里云等)。
✅加分回答示例
“现代风控依赖可视化决策引擎配置策略流:
1.串行(Sequential):用于漏斗筛选,节省成本。
Step1:内部黑名单(免费,快速)。
Step2:外部黑名单(收费,次之)。
Step3:信用模型(耗时)。
逻辑:Step1命中了直接拒绝,无需调用Step2,节省数据成本。
2.并行(Parallel):用于综合评估。
同时调用人脸识别、设备指纹、多头数据。任何一个模块超时不影响其他模块,最终
在汇聚节点(AggregationNode)统一下结论。
3.分支(Champion/Challenger):
在流转中设置Split节点,按Hash值将10%流量导入新策略分支,实现无感知的A/B
Test。”
Q38.什么是LTV(LifeTimeValue)?风控策略如何辅助提升用户的LTV?
❌不好的回答示例
“LTV就是用户一辈子能给我们赚多少钱。风控只要让他不变成坏账,就是提升LTV
了。”
類为什么这么回答不好
1.被动:认为风控只是守门员,不懂风控的“运营属性”。
2.计算简单:LTV不仅是利息,还包括复贷率。
✅加分回答示例
“LTV=(件均金额×利率-资金成本-坏账损失-运营成本)×复贷次数。
风控策略通过以下方式主动提升LTV:
1.差异化定价:对低风险用户给予更低利率。虽然单次利润降低,但能显著提升留存率和复
贷次数,总LTV反而增加。
2.额度管理(LimitAssignment):
初始给低额度测试风险。
随着还款表现积累,主动提额。这不仅满足用户需求,更增加了用户的转移成本
(SwitchingCost),绑定用户长期借款。
3.精准营销拦截:在营销发短信前,风控先跑一遍离线策略,剔除那些‘肯定会拒’的人,节
省营销费用(降低分母成本),间接提升整体ROI。”
Q39.请解释一下ROC曲线和AUC值的含义,AUC为0.5意味着什么?
❌不好的回答示例
“ROC曲线是画出来的线,AUC是线下面的面积。AUC0.5就是瞎猜,模型没用。
AUC越高越好。”
類为什么这么回答不好
1.定义不准:没说清楚横纵坐标是什么(TPRvsFPR)。
2.缺乏直观理解:没解释AUC作为一个“概率值”的物理含义。
✅加分回答示例
“ROC曲线描述了在不同阈值(Cut-off)下,TPR(真阳性率/召回率)与FPR(假
阳性率/误抓率)之间的权衡关系。
AUC(AreaUnderCurve)是ROC曲线下的面积:
AUC=0.5:意味着模型效果等同于随机抛硬币。无论你怎么设阈值,模型都无法区分好
坏人。
AUC的物理含义:随机抽取一个坏样本和一个好样本,模型给坏样本打分高于好样本的
概率。如果AUC=0.8,说明模型有80%的把握把坏人排在好人前面。
应用:在风控中,AUC>0.7可用,>0.8优秀。但如果AUC>0.95,我会首先怀疑特
征里是不是混入了因果倒置的变量(数据泄漏)。”
Q40.针对“黑中介”包装的虚假进件,你有哪些识别手段?
❌不好的回答示例
“黑中介就是帮人造假的。我会看资料是不是假的,比如P图。或者打电话问问本人
是不是自愿借款。”
類为什么这么回答不好
1.手段落后:现在黑中介P图技术很高,肉眼很难看穿。本人配合度高,电话回访无效。
2.缺乏数据对抗:没提到聚类或行为特征。
✅加分回答示例
“识别黑中介包装(FraudRing),核心是寻找‘批量化’和‘模板化’的痕迹:
1.LBS聚集性:黑中介往往把客户集中在某个酒店或办公室统一操作。监控GPS/WiFi
BSSID的聚集度。
2.填写行为特征(BehavioralBiometrics):
输入速度:真实用户填身份证是一段一段填的,黑中介往往是粘贴复制,输入间隔极
短。
修改
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物标志物在降糖药心肾获益评估中的应用
- 生物材料编程调控成骨分化的策略
- 生物支架引导的组织再生策略
- 生物打印技术在脊髓损伤修复中的递药系统
- 生物化学虚拟仿真与代谢通路分析
- 生物制品稳定性试验冷链验证要点
- 生物制剂失应答的炎症性肠病发病机制新认识
- 生物制剂临床试验中中心效应控制方法
- 网络安全防御与渗透测试的保密协议
- 制造业生产经理面试要点解析及答案
- 劳动合同涨工资协议
- 汽车底盘故障诊断与排除课件 学习任务四 汽车行驶跑偏故障与排除
- GB/T 18948-2025汽车冷却系统用橡胶软管和纯胶管规范
- 国际投资学的试题及答案
- 人教版(2024)八年级上册地理第一章 单元测试卷(含答案)
- 2025年北京工程造价定额与计价规范解析
- 林业和草原局护林员招聘考试《森林资源管护》题库(答案+解析)
- 中华人民共和国职业分类大典是(专业职业分类明细)
- 电子票据管理办法医院
- 电子承兑支付管理办法
- 学堂在线 知识产权法 章节测试答案
评论
0/150
提交评论