版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
互联网金融风控专员高频面试题
【精选近三年60道高频面试题】
【题目来源:学员面试分享复盘及网络真题整理】
【注:每道题含高分回答示例+避坑指南】
1.请简单阐述一下你理解的互联网金融风控全流程(贷前、贷中、贷后)分别包含哪些核心
动作?(极高频|重点准备)
2.在没有征信报告或征信白户的情况下,你主要通过哪些维度来评估用户的还款能力?
(常问|需深度思考)
3.请解释一下FPD(FirstPaymentDefault)和SPD(SecondPaymentDefault)的区别,
FPD过高通常说明什么问题?(基本必考|底层核心原理)
4.遇到一个多头借贷(Multi-lending)严重的申请人,但在我们平台历史表现良好,你会如
何决策?请说明逻辑。(需深度思考|考察实操)
5.你是如何进行电话核查(电核)的?如果在电核中发现用户回答犹豫,你会追问哪些问题
来验证真伪?(极高频|考察实操)
6.请解释Vintage分析(账龄分析)的作用,并说明它与滚动率(RollRate)分析的区别。
(重点准备|底层核心原理)
7.面对一份经过PS处理的银行流水或工作证明,你通常会通过哪些细节发现破绽?(常问|
考察细心)
8.如果某渠道进件的逾期率突然飙升,作为风控专员,你会按照什么思路进行排查?(需
深度思考|生产环境故障排查)
9.什么是设备指纹?在反欺诈中,我们主要关注设备的哪些异常特征(如Root、模拟器
等)?(重点准备|技术视野)
10.你在过往工作中遇到的最狡猾的欺诈手段是什么?你是如何发现并拦截的?(反复验证|
项目实战复盘)
11.如何区分“还款意愿差”和“还款能力差”的客户?在审核阶段有哪些指标可以辅助判断?
(常问|需深度思考)
12.常用的人行征信报告中,你最关注哪几个字段?出现“呆账”或“止付”状态你会怎么处理?
(基本必考|考察实操)
13.针对“团伙欺诈”(GangFraud),在数据层面通常会有哪些表现特征?(重点准备|生产
环境故障排查)
14.请解释一下什么是GBDT或逻辑回归(LR)模型,作为风控专员你如何利用模型评分
(Score)辅助人工审核?(常问|技术视野)
15.如果让你设计一条针对“大学生骗贷”的拒绝规则,你会选取哪些特征?(需深度思考|考
察实操)
16.什么是“勾稽关系”?在审核企业贷或经营性贷款时,如何利用财务报表数据的勾稽关系验
真?(重点准备|考察实操)
17.当第三方数据源(如某大数据征信接口)突然中断,积压了大量待审订单,你会如何处理
以平衡风险与效率?(常问|考察抗压)
18.你熟悉哪些第三方风控数据服务商(如同盾、百融等)?通常使用它们提供的哪些产品?
(学员真题|行业认知)
19.简述一下ROC曲线和KS值在风控模型评估中的含义,KS值多少被认为模型效果较好?
(常问|底层核心原理)
20.用户通讯录数据中,如果发现短时间内新增大量联系人,或者联系人中命中黑名单比例较
高,你如何解读?(极高频|考察实操)
21.什么是关联网络(KnowledgeGraph)?如何利用一度关联和二度关联发现潜在风险?
(重点准备|技术视野)
22.在处理高风险职业(如钢贸、KTV从业者等)的进件时,你的审核侧重点是什么?(常
问|考察实操)
23.如果发现某个地区的申请通过率异常偏低,排查后发现是由于某条规则误杀,你会怎么
做?(需深度思考|生产环境故障排查)
24.你如何看待“首逾率”这个指标?影响首逾率的核心因素通常有哪些?(重点准备|底层核
心原理)
25.在进行人工信审时,如何通过用户的IP地址和GPS位置信息发现异常?(基本必考|考察
细心)
26.请复盘一次你参与过的风控策略迭代过程,为什么要调整?调整后的效果如何评估?
(反复验证|项目实战复盘)
27.什么是“撸口子”大军?针对这种专业羊毛党,有哪些有效的防御手段?(常问|行业认
知)
28.假设系统风控漏过了一个明显的欺诈用户,导致产生坏账,你会如何进行Case复盘和归
因?(重点准备|生产环境故障排查)
29.在贷后监控中,你发现用户出现了哪些行为时,会建议立即启动提前催收(Pre-
collection)?(常问|考察实操)
30.谈谈你对“隐私计算”或“联邦学习”在金融风控中应用的理解(如果不了解,谈谈数据合规
的重要性)。(常问|技术视野)
31.如何识别“中介代办”包装的客户?他们在填写资料时通常有哪些惯用手法?(学员真题|
考察实操)
32.当业务部门为了冲业绩要求放宽风控标准,而风险部门监测到逾期率在上升,你如何沟通
和平衡?(极高频|考察软实力)
33.请解释什么是“存量客户管理”?对于复借的老客户,审核策略与新客户有何不同?(重点
准备|业务理解)
34.你使用过SQL提取数据吗?请口述一下如何查询某段时间内逾期超过3天的用户名单。
(基本必考|考察实操)
35.面对电商类数据的风控(如花呗、京东白条模式),与传统现金贷风控的最大区别是什
么?(需深度思考|行业认知)
36.如果发现一批用户的设备安装列表中包含了大量的借贷APP(共债风险),你的容忍度
阈值是多少?为什么?(常问|需深度思考)
37.什么是“验证码攻击”或“短信轰炸”?这在风控层面意味着什么风险?(常问|生产环境故障
排查)
38.如何通过用户的社交行为数据(如通话时长、短信关键词)判断其是否有赌博或不良嗜
好?(重点准备|考察实操)
39.在只有身份证和手机号的情况下,如何通过公开渠道(OSINT)进行背景调查?(网友
分享|考察实操)
40.什么是“冠军挑战者”(Champion-Challenger)策略?在风控规则上线前如何进行AB
Test?(重点准备|底层核心原理)
41.请列举3个你认为最有效的反欺诈强规则(Hit&RunRules)。(基本必考|考察实操)
42.遇到用户投诉说“我没有申请贷款,是别人盗用我的信息”,你如何核实是否为本人操作?
(极高频|生产环境故障排查)
43.什么是“信用评分卡”中的IV(InformationValue)值?它用来衡量什么?(常问|底层核心
原理)
44.在审核小微企业贷款时,如何验证其实际经营场所的真实性(除了上门考察外)?(学
员真题|考察实操)
45.如果你的上级质疑你的拒单率过高,你会拿出哪些数据报告来证明你的判断是正确的?
(需深度思考|考察抗压)
46.什么是“套现”行为?在信用卡或消费分期场景中,有哪些典型的套现特征?(重点准备|
行业认知)
47.针对夜间(例如凌晨2-4点)提交的贷款申请,风控策略通常会做怎样的特殊处理?(常
问|考察细心)
48.如何看待最近监管对利率上限的调整(如24%红线)对风控策略的影响?(需深度思考|
技术视野)
49.什么是“合成身份欺诈”(SyntheticIdentityFraud)?它与传统的身份盗用有什么区别?
(难点|需深度思考)
50.在处理“白户”时,如果引入运营商数据进行建模,你认为最有价值的运营商特征是什么?
(常问|考察实操)
51.假如发现某用户在申请时频繁修改联系人或公司地址,这触发了什么风险逻辑?(基本
必考|考察细心)
52.你如何理解“风险定价”?对于高风险但未触碰底线的客户,如何通过额度和利率来对冲风
险?(重点准备|底层核心原理)
53.在过往项目中,你是否推动过流程自动化?具体是用什么工具或逻辑替代了人工审核?
(反复验证|项目实战复盘)
54.什么是“黑产”?近期黑产攻击有哪些新趋势(如AI换脸等)?(常问|技术视野)
55.如果一个用户的历史还款记录很好,但近期频繁查询征信(硬查询),你会如何判定?
(基本必考|考察实操)
56.请描述一下如何通过“活体检测”技术防御照片攻击或视频攻击?(常问|技术视野)
57.在贷后催收阶段,M1、M2、M3分别代表什么含义?哪个阶段回款率断崖式下跌?(重
点准备|行业认知)
58.如果让你重新构建一套简单的风控规则引擎,你会包含哪几个核心模块?(需深度思考|
项目实战复盘)
59.面对海量的非结构化数据(如用户备注、聊天记录),如何提取有效信息用于风控?
(难点|技术视野)
60.我问完了,你有什么想问我的吗?(面试收尾)
【互联网金融风控专员】高频面试题深度解答
Q1:请简单阐述一下你理解的互联网金融风控全流程(贷前、贷中、贷后)分
别包含哪些核心动作?
❌不好的回答示例:
我认为风控流程主要就是分三个阶段。贷前就是看客户的资料是不是真的,打打电
话核实一下,然后决定借不借。贷中就是看看他有没有按时还钱,如果没还就发短
信提醒一下。贷后主要就是催收了,如果逾期了就打电话催他把钱还上。我觉得最
重要的就是贷前审核,把好关后面就没事了。这个流程在我们之前的公司也是这样
走的,基本上大同小异,我也都实际操作过,没什么太复杂的地方,核心就是防骗
和催钱。
为什么这么回答不好:
1.缺乏专业术语与颗粒度:回答过于通俗口语化,缺失了“准入”、“反欺诈”、“授信”、“预
警”等核心风控术语,显得不够专业。
2.遗漏关键环节:贷中不仅仅是看有没有还钱,更重要的是“风险预警”和“额度管理”;贷前
也未区分“反欺诈”与“信用评估”两个平行维度。
3.认知过于片面:认为“把好关后面就没事了”是典型的初级思维,忽视了全生命周期风险管
理(CLM)中动态监控的重要性。
高分回答示例:
在我看来,互联网金融的风控是一个贯穿用户全生命周期的闭环管理系统,各个环
节的数据和策略是互通的。具体流程如下:
1.贷前环节(准入与授信):这是“防病”的阶段。
反欺诈(Anti-Fraud):利用设备指纹、IP关联、黑名单库进行排查,拦截非本人申
请、团伙欺诈或机器攻击。例如,通过同盾或百融的数据校验用户是否在行业黑名单
中。
信用评估(CreditScoring):基于征信数据、运营商数据、电商数据等构建评分卡
(A卡),测算用户的偿债能力和意愿。
人工信审与电核:对系统判定的灰名单用户进行电话核实,验证信息真实性及借款用
途。最终输出决策结果:通过、拒绝或人工复审,并确定授信额度和利率。
2.贷中环节(监控与预警):这是“治未病”的阶段。
动态监测:定期跑批扫描存量客户,监测是否有新增逾期、多头借贷激增或法院执行
记录。
行为评分(B卡):根据用户的还款行为和APP活跃度更新评分。
策略调整:针对风险上升的用户进行降额或冻结;针对优质用户进行提额营销,提升
资金利用率。
3.贷后环节(催收与处置):这是“治病救人”的阶段。
分级催收:根据逾期时长(M1/M2/M3+)制定不同的催收策略(短信、IVR、人工、
委外)。
失联修复:利用关联网络修复触达方式。
不良资产处置:针对坏账进行核销或打包转让。同时,贷后的逾期数据必须反哺到贷
前模型中,用于优化迭代风控规则。
Q2:在没有征信报告或征信白户的情况下,你主要通过哪些维度来评估用户的
还款能力?
❌不好的回答示例:
如果是白户的话,确实比较难办。通常我会让他提供更多的工作证明或者银行流
水,如果都没有,那就看他的支付宝芝麻分。如果芝麻分也不高,我就让他填几个
联系人,打过去问问情况。实在不行就看看他手机号用了多久。要是这些资料都不
全,或者我觉得不靠谱,为了安全起见,我通常就会直接拒掉,毕竟白户的风险太
大了,我们不能为了放贷而冒险,宁可错杀也不能放过一个坏人。
为什么这么回答不好:
1.缺乏大数据思维:仅仅依赖传统的“流水”和“证明”,忽视了互联网金融核心的“替代性数
据”(AlternativeData)价值。
2.逻辑单一且消极:解决问题的思路偏向于“拒绝”而非“挖掘价值”,这在追求用户增长的互
金公司是不合格的。
3.风控手段匮乏:未提及运营商数据、设备数据、APP安装列表等高价值维度的交叉验证
方法。
高分回答示例:
针对征信白户(ThinFile),核心逻辑是寻找“替代性数据”来进行侧写画像,通
过“弱变量”的组合来形成“强特征”。具体我会关注以下四个维度:
1.运营商数据(最核心的替代数据):
稳定性:手机号在网时长是否超过6个月,是否有频繁停机记录。长期稳定的号码意
味着用户的社会关系稳定,违约成本较高。
话费消费:月均话费能否反映其经济水平。
社交圈层:互通电话的号码中,是否有大量催收电话或黑名单用户(近朱者赤,近墨
者黑)。
2.设备与行为数据(Device&Behavior):
通过设备指纹判断手机型号和价位,高端机型用户通常具备一定的经济基础。
分析APP安装列表:是否有赌博、多头借贷APP?或者是否有理财、商旅类APP(正
面标签)。
夜间活跃度:如果用户经常在凌晨2-4点活跃申请,可能存在职业风险或赌博倾向。
3.电商与支付数据:
授权获取淘宝/京东的收货地址。如果收货地址长期固定且多为一二线城市住宅区,侧
面印证居住稳定。
分析消费结构:是购买耐用品、奢侈品,还是虚拟充值?是否有大额且稳定的消费流
水。
4.自有数据交叉验证:
利用IP地址定位与填写的居住地址、工作地址是否一致(LBS校验)。
在电核环节,通过询问其工作内容的细节、发薪日、通勤路线等非标准化问题,判断
其是否有稳定的收入来源,以此来弥补征信报告的缺失。
Q3:请解释一下FPD(FirstPaymentDefault)和SPD(SecondPayment
Default)的区别,FPD过高通常说明什么问题?
❌不好的回答示例:
FPD就是第一期没还钱,SPD就是第二期没还钱。这两个指标都是看逾期的。如果
FPD过高,那就是说明最近进来的客户质量太差了,或者催收那边没催回来。通常
如果FPD高了,我们就会觉得是这批人没钱还,或者是忘了还。这种情况下,我会
建议暂停放款,先把逾期的人处理完再说。反正这两个都是坏账的指标,越低越
好,高了肯定就是风控没做好或者运气不好遇到了赖账的。
为什么这么回答不好:
1.定义解释浮于表面:没有点出两个指标背后代表的“风险性质”差异(欺诈vs信用)。
2.归因错误:将FPD高单纯归结为“没钱还”或“催收问题”,严重忽视了FPD是“欺诈风险”核心
风向标这一事实。
3.缺乏分析深度:没有提出针对性的排查思路(如渠道攻击、规则漏洞),显得缺乏数据敏
感度。
高分回答示例:
FPD(FirstPaymentDefault)指首次还款逾期,SPD(SecondPayment
Default)指第二次还款逾期。这两个指标在风控中分别指向不同的风险类型,不能
混为一谈。
1.指标含义与区别:
FPD(首逾):用户借了钱,第一期就没还。这通常是欺诈风险(FraudRisk)的最
直接体现。如果用户第一期都不还,大概率他从一开始就没打算还,属于主观恶意
的“骗贷”行为。
SPD(二逾):用户还了第一期,但第二期逾期了。这更多反映的是用户的信用风险
(CreditRisk)或还款能力(AbilitytoPay)出现了波动,比如突然失业、资金链断
裂,或者属于“以贷养贷”无法维持了。
2.FPD过高的深度分析:
如果FPD出现异常飙升,通常说明风控体系的“准入防线”被击穿,具体可能存在
以下问题:
遭受团伙欺诈攻击:黑产发现风控漏洞,批量组织虚假用户进件撸口子。
渠道质量恶化:某个特定引流渠道(如某短信流、某贷超)混入了大量劣质或欺诈流
量,需要立即对该渠道进行Vintage分析并止损。
风控规则失效:最近上线的策略调整(如放宽准入)出现了Bug,或者反欺诈模型
(如Score卡)的区分度下降(PSI漂移)。
3.应对措施:
一旦FPD报警,我会立即回溯坏样本,检查共性特征(如集中在某地区、某设
备、某时间段),并紧急回滚相关策略或关停异常渠道,而不是简单地归咎于催
收不力。
Q4:遇到一个多头借贷(Multi-lending)严重的申请人,但在我们平台历史表
现良好,你会如何决策?请说明逻辑。
❌不好的回答示例:
既然他在我们平台历史表现好,说明他是个老客户,也是好客户。多头借贷现在很
普遍,很多年轻人都这样。我觉得只要他每次都还我们就行,别人的钱还不可那是
别人的事。为了维护客户关系,我还是会给他过的,但是可能会稍微降一点额度。
毕竟老客户流失了很可惜,而且他都还了那么多次了,说明他有还款意愿,我不觉
得会有太大的风险,直接拒了有点不近人情。
为什么这么回答不好:
1.侥幸心理严重:完全忽视了“共债爆发”的系统性风险,认为“别人的钱不还与我无关”,这
是风控大忌。
2.逻辑缺乏辩证:没有分析多头借贷的“性质”(是资金周转还是拆东墙补西墙),决策过于
感性。
3.缺乏具体的量化分析:没有提到DTI(负债收入比)、多头增长速度等关键判断指标。
高分回答示例:
这是一个非常典型的“存量客户维护”与“共债风险控制”博弈的场景。对于此类客户,
我不会简单地“秒拒”或“秒过”,而是采取“审慎通过+风险定价+额度压降”的综合
策略,具体逻辑如下:
1.区分“多头”的性质与趋势:
我首先会看他多头借贷的增速。如果是在短时间内(如1个月内)疯狂申请了几十家平
台,说明他资金链极度紧张,正在“爆发期”,即使历史表现好也必须坚决拒绝,因为他
可能正在筹集资金跑路。
如果是长期维持在一定数量的多头,且每月都在正常周转,说明这是他的生活方式
(以贷养贷维持平衡)。
2.评估负债收入比(DTI):
结合他的收入水平(通过大数据推算),测算其总负债是否已超过警戒线。在我们平
台的历史表现好,可能只是因为我们额度低或者催收紧,他选择“优先偿还我们”,但这
不代表他没有系统性崩盘的风险。
3.制定差异化策略:
额度管理:必须降额。例如从1万降至3000,降低由于他突然崩盘带来的坏账损失
(ExposureatDefault)。
期限调整:缩短借款周期,避免长周期带来的不确定性,让他快速周转,便于我们高
频监控。
贷中高频监控:将其列入“高危关注名单”,一旦发现新增逾期或负面舆情,立即触发
提前清收机制。
总结:历史表现仅代表过去,多头严重代表未来风险极高。我的决策核心是“降额
留存,测试风底”,在控制最大回撤的前提下保留该客户。
Q5:你是如何进行电话核查(电核)的?如果在电核中发现用户回答犹豫,你
会追问哪些问题来验证真伪?
❌不好的回答示例:
电核就是按照申请表上的电话打过去,问问他是不是本人,是不是在这个公司上
班。如果他回答犹豫,我就觉得他可能有问题,或者是骗子。我会问他“你真的在这
里上班吗?”或者“你是不是在骗我?”如果他还是支支吾吾,我就直接挂了拒单。我
觉得电核就是要凶一点,给他们压力,这样他们就不敢撒谎了。主要就是核对身份
证号和名字,其他的也问不出什么来。
为什么这么回答不好:
1.提问方式低效:问“是不是骗我”这种封闭式问题毫无意义,骗子肯定回答“不是”。
2.缺乏验证技巧:没有利用“反向验证”或“细节追问”等专业手段,容易被经过培训的黑产蒙
混过关。
3.职业素养缺失:认为电核就是“凶一点”,忽视了服务态度和沟通技巧,可能引发客诉。
高分回答示例:
电核是最后一道人工防线,主要用于识破中介包装和身份冒用。我的电核策略从不
照本宣科,而是采用“交叉验证+压力测试+场景还原”的方法。
1.常规核实与异常捕捉:
首先核实基本信息(姓名、单位、职位)。在对话过程中,我会高度敏感于用户的语
气、背景音和反应速度。如果用户回答犹豫、有翻纸的声音(看剧本),或者背景有
其他人提示的声音,我会立即进入“反欺诈追问模式”。
2.针对“回答犹豫”的追问策略(TrapQuestions):
细节挖掘法(针对工作包装):“我看您在XX公司做销售,你们公司附近的地铁站是
哪一个?几号口出来最近?”或者“你们公司一般几号发工资?是打卡还是发现金?扣税
大概多少?”——中介通常只包装公司名,不会背诵地图细节和税务细节。
错误诱导法(反向验证):故意说错信息看对方反应。例如:“张先生,我看资料上您
是属猪的对吧?”(其实身份证是属猴的)。如果是本人,会立刻反驳;如果是冒用者
或剧本不够细,可能会顺着说“对对”。
家庭/隐私关联法:“您紧急联系人填的是王某某,他是您什么人?昨天你们通过电话
吗?”
3.综合研判:
如果用户对非敏感信息(如生肖、通勤路线)都要思考很久,基本判定为虚假进件。
我会直接拒绝,并标记为“中介包装”或“身份存疑”,加入灰名单。
Q6:请解释Vintage分析(账龄分析)的作用,并说明它与滚动率(Roll
Rate)分析的区别。
❌不好的回答示例:
Vintage分析就是看每个月放款的质量怎么样的图表。比如1月份放的款,到现在有
多少逾期了。滚动率分析也是看逾期的,看有多少人从M1变成了M2。这两个其实
差不多,都是用来监控风险的。我们在周报里都会放这两个图。Vintage主要看趋
势,滚动率主要看现在的状况。我觉得Vintage更重要一点,因为老板经常问这个
月放款质量好不好。
为什么这么回答不好:
1.定义模糊:没有准确描述Vintage的“账龄”概念和RollRate的“迁徙”概念。
2.逻辑混淆:虽然知道大致用途,但无法清晰界定两者的核心应用场景区别(策略评估vs
催收/拨备)。
3.缺乏深度:没有提到Vintage的“成熟期”概念,也没有提到RollRate对计算坏账准备金的
意义。
高分回答示例:
Vintage和RollRate是风控分析中两把不同维度的尺子,缺一不可。
1.Vintage分析(账龄分析):
定义:以放款月份(Cohort)为维度,观测不同时期的放款资产在经过同样长的时间
(账龄/MOB)后的坏账表现。
作用:它是评估风控策略质量的核心工具。通过对比不同月份的Vintage曲线,我们可
以直观地看到“1月份的策略”和“2月份的策略”哪个更好。如果曲线整体上移,说明新放
款的资产质量在恶化,必须收紧准入。
核心关注:曲线的起势(早期逾期)和稳定后的平台期(最终坏账率)。
2.滚动率分析(RollRate/MigrationAnalysis):
定义:观测同一个资产池在不同逾期状态之间的转化比例。例如,上个月处于M0(正
常)的用户,有多少这个月变成了M1(逾期1-30天);M1有多少恶化成了M2。
作用:
评估催收能力:M1到M2的转化率飙升,说明初级催收团队效率下降。
预测坏账与拨备:利用滚动率可以推算未来的坏账规模,财务部门据此计提坏账准
备金。
3.核心区别总结:
维度不同:Vintage是横向切片(按放款时间),看的是“源头活水”的质量;Roll
Rate是纵向切片(按逾期状态),看的是“存量水池”的变化。
归因不同:Vintage变坏通常找策略部(准入没做好);RollRate变坏通常找催收部
(钱没追回来)。
Q7:面对一份经过PS处理的银行流水或工作证明,你通常会通过哪些细节发现
破绽?
❌不好的回答示例:
我看PS主要就是看字体。如果字体不一样,肯定就是假的。还有就是看有没有盖
章,章如果是歪的或者颜色太鲜艳也不对。有时候我看那个数字,如果对不上也是
假的。比如说收入很高但是交税很少。反正多看几个真的,假的就能看出来了。现
在的PS技术很高,有时候也看不出来,我就直接打给银行问流水是真的假的,这样
最保险。
为什么这么回答不好:
1.观察点过于粗糙:仅凭字体和章的颜色很难识别专业级PS,缺乏技术流的观察手段。
2.操作可行性低:提到“打电话给银行问流水”,在实际操作中,银行由于隐私保护通常不会
在电话里配合第三方核实个人流水,这显示出候选人缺乏实操常识。
3.缺乏逻辑校验:未强调数据内部的逻辑勾稽关系(数学校验)。
高分回答示例:
识别PS材料需要结合“视觉侦查”与“逻辑校验”双重手段,很多看似完美的PS文件往
往死在细节上:
1.视觉与文件属性层面(Forensics):
EXIF信息:查看电子文档的属性,如果创建程序显示为Photoshop或修改时间晚于生
成时间,直接存疑。
噪点与边缘:放大查看文字边缘。真实扫描件的噪点是均匀分布的,而PS篡改过的区
域(如修改金额)往往噪点分布异常,或者文字边缘过于平滑/锯齿感不同。
底纹与公章:真实的公章盖在字上,墨迹会有渗透感(章在字上或字在章上)。PS的
章通常是图层叠加,颜色过于均匀,且没有透底效果。
2.内容逻辑校验层面(LogicCheck):
结息倒推:这是最致命的杀手锏。银行流水每季度会有结息(InterestSettlement)。
我会根据结息金额倒推其日均存款,如果显示的余额很大但结息只有几毛钱,必假无
疑。
流水号连续性:真实的银行流水号往往是连续或有规律的,如果出现断层或乱序,说
明被拼接过。
发生额与余额计算:随机抽取几行,手动计算“上期余额+收入-支出”是否等于“本期
余额”。很多粗糙的PS只改了余额,却忘了修正计算公式,导致数学逻辑崩塌。
Q8:如果某渠道进件的逾期率突然飙升,作为风控专员,你会按照什么思路进
行排查?
❌不好的回答示例:
如果逾期率高了,我首先会把这个渠道停掉,不能让损失扩大。然后我去问问渠道
经理,是不是他们最近换了广告素材,吸引来的都是烂客户。接着我会看看这批逾
期的人有什么特点,比如是不是都是男的,或者都是某个地方的人。如果发现了特
点,我就把这些特点加到黑名单里。最后写个报告给领导,说这个渠道质量不行,
建议以后少接。
为什么这么回答不好:
1.排查不够深入:直接问渠道经理是比较被动的做法,数据分析应该走在沟通之前。
2.缺乏结构化思维:排查过程没有逻辑分层(数据层-特征层-策略层),显得杂乱。
3.手段单一:简单的“加黑名单”和“停渠道”治标不治本,没有深入分析是欺诈攻击还是信用
下沉。
高分回答示例:
面对渠道逾期率飙升(RiskSpike),必须迅速进行“止损-归因-优化”三步走,我
的排查思路如下:
1.宏观止损与切片分析(Slicing):
首先判断是FPD(首逾)**飙升还是**Vintage恶化。如果是FPD飙升,说明遭受了攻
击,需立即暂停该渠道进件。
进行多维度的切片分析:是特定时间段(如夜间)进件差?是特定地域集中逾期?还
是特定产品线的问题?排除全盘恶化的可能性,定位到具体的“毒变节点”。
2.微观特征归因(DeepDive):
PSI(群体稳定性指标)检查:对比该渠道近期进件人群与历史正常人群的画像分
布。是否年轻用户占比突然增高?是否有大量“白户”涌入?如果PSI值大幅波动,说明
渠道流量性质变了(例如贷超把我们的位置从位置5调到了位置1,导致客群下沉)。
反欺诈排查:检查是否存在团伙特征,如设备指纹关联度高、IP段集中、填写资料的
雷同度高。这往往意味着遭遇了“中介撸口子”或黑产攻击。
3.策略与规则复盘:
检查近期是否有规则变更。是否因为我们最近为了冲量放松了某些准入规则(如放宽
了年龄或芝麻分限制),导致该渠道的劣质客户趁虚而入。
结论:基于分析结果,如果是欺诈攻击,则上线新的反欺诈规则并清洗存量;如果
是流量下沉,则收紧该渠道的评分卡阈值(Cut-off),进行差异化定价或限流。
Q9:什么是设备指纹?在反欺诈中,我们主要关注设备的哪些异常特征(如
Root、模拟器等)?
❌不好的回答示例:
设备指纹就是手机的身份证,比如IMEI号或者MAC地址。我们通过这个来识别是不
是同一个手机申请的。在反欺诈里,如果手机Root了,或者用了模拟器,那肯定是
有问题的。因为正常人不会Root手机,只有黑产才会。如果发现这种特征,我们就
直接认为是欺诈,把这个设备拉黑。还有就是看电量,如果电量一直不动,也可能
是模拟器。
为什么这么回答不好:
1.定义过时:IMEI和MAC很容易被篡改,现代设备指纹(DeviceFingerprinting)技术远比
这复杂,包含被动指纹和主动探测。
2.逻辑绝对化:认为“正常人不会Root”过于武断,部分技术极客也会Root,需要结合其他维
度判断,而不是直接拉黑。
3.缺乏技术深度:未提及更深层的Hook框架、多开分身等高频攻击手段。
高分回答示例:
设备指纹是现代反欺诈的基石,它通过采集终端设备的硬件信息(如IMEI、
IDFA)、软件信息(OS版本、内核)、网络信息及用户行为习惯,生成一个全球
唯一的设备ID,用于跨应用、跨时间的追踪。
在反欺诈实战中,我重点关注以下异常特征:
1.环境篡改与虚拟化特征:
模拟器检测:检查是否有Qemu、Genymotion等模拟器特征文件,或者传感器数据
(加速度计、陀螺仪)是否长期静止或数据异常平滑。
Root/越狱与Hook框架:检测是否安装了Xposed、Frida等Hook工具。黑产常利用这
些工具篡改GPS位置、伪造通讯录或劫持APP数据。
2.设备农场(DeviceFarm)特征:
参数异常:如电量长期维持在100%(一直插着电)、屏幕亮度恒定、从不息屏。
应用列表异常:设备极为“干净”,除了借贷APP外几乎没有常用社交或生活APP(刚
刷机准备作案)。
3.多头与关联风险:
设备冲突:同一个设备指纹在短时间内登录了数十个不同的账号(一机多号),或者
短时间内频繁切换IP地址但设备ID不变,这是典型的团伙作业特征。
Q10:你在过往工作中遇到的最狡猾的欺诈手段是什么?你是如何发现并拦截
的?
❌不好的回答示例:
我遇到过一个最狡猾的,就是他拿别人的身份证来贷款,但是照片看起来很像。他
背下了那个人的所有信息,电话也能打通。我们一开始都没发现,后来是因为他填
的联系人里有一个是我们公司的黑名单用户,系统报警了,我们才发现的。然后我
就仔细看他的照片,发现耳朵长得不一样,才把他拒了。这说明黑名单真的很重
要,不然就让他骗过去了。
为什么这么回答不好:
1.案例过于简单:这只是普通的“冒名顶替”,算不上“最狡猾”,无法体现候选人的眼界。
2.发现过程被动:完全依赖系统黑名单报警,而非主动挖掘分析。
3.缺乏复盘机制:只讲了单点拦截,没有讲如何将此案例转化为通用的防御规则。
高分回答示例:
我曾遇到过一起精心策划的“合成身份欺诈(SyntheticIdentityFraud)”加“养
号攻击”。
1.案情描述:
一批用户资料极其完美:征信良好、手机实名使用超过2年、有正常的电商消费
记录。初审和机审全部通过。但在放款前的最后复核中,我注意到这批用户
的“填写耗时”存在异常——他们输入身份证号和银行卡号的速度极快,且没有任
何修改停顿,就像是电脑脚本粘贴的一样,但系统判定为人工操作。
2.深度挖掘(侦查):
我提取了这批用户的埋点数据,发现他们的陀螺仪数据(手持抖动)**高度相
似,且所有设备的**充电状态在申请时都是“充电中”。进一步关联分析发现,这
十几名申请人的收货地址虽然不同,但经纬度坐标(GPS)在申请那一刻竟然全
部重合在某偏远工业区的一个点上。
3.真相与处置:
这是一起利用“群控真机”进行的团伙攻击。黑产养了一批真实的手机卡和账号,
平时模拟正常行为,养兵千日用兵一时。
拦截:紧急人工冻结这批订单。
规则沉淀:我牵头复盘,上线了两个新规则:一是引入“GPS聚类”规则,对同一坐标
密集申请触发预警;二是增加了“输入行为生物探针”,监测输入节奏和按压面积,识
别机器脚本。这次事件为公司挽回了近百万的潜在损失。
Q11:如何区分“还款意愿差”和“还款能力差”的客户?在审核阶段有哪些指标可
以辅助判断?
❌不好的回答示例:
还款意愿差就是不想还,还款能力差就是没钱还。审核的时候,看收入证明能看出
来能力。如果他收入很高但还是逾期过,那就是意愿差。如果收入很低,欠了很多
钱,那就是能力差。还有看他电话接不接,如果逾期了电话不接,肯定是意愿差。
审核阶段主要就是看征信上的逾期记录,如果有连三累六的,基本都是意愿有问
题,直接拒就行了。
为什么这么回答不好:
1.定义过于直白:没有深入到数据特征层面,分析不够细腻。
2.指标单一:仅依赖收入证明和征信,忽视了行为数据(如APP使用习惯、多头借贷速
度)。
3.逻辑漏洞:收入高且逾期不一定是意愿差,可能是流动性危机;“连三累六”也不完全等同
于意愿问题,需结合具体场景。
高分回答示例:
区分“意愿(Willingness)”与“能力(Ability)”是精准风控的核心,我在审核阶段
主要通过以下多维指标进行交叉画像:
1.识别“还款能力差”的指标(侧重于偿债基础):
DTI(负债收入比):这是硬指标。如果用户多头借贷严重,月还款额超过其预估收
入的70%,即便他想还,客观上也还不上。
资产变动:查看其电商消费降级(从买大牌变买平替),或频繁查询小额贷(借几百
块周转),说明资金链枯竭。
职业稳定性:所在行业是否处于下行期(如教培、房地产),社保公积金是否断缴。
2.识别“还款意愿差”的指标(侧重于道德风险):
历史小额违约:征信上有几十块钱的水电费或信用卡年费长期拖欠。这种人通常不重
视信用,属于典型的“赖”,意愿分极低。
催收历史表现:在过往的贷后记录中,是否经常需要催收员“挤牙膏”式还款?是否经
常失联?
反欺诈特征:申请时填写虚假联系人、伪造工作信息。这种从一开始就欺骗的行为,
直接映射为未来的还款意愿极差。
3.综合判断:
高能低愿:收入高、资产多,但老赖。策略:严控准入,或要求强抵押。
低能高愿:收入低,但历史清白、生活节俭。策略:给予小额度(LowLimit),作为
次级优质客户培养。
Q12:常用的人行征信报告中,你最关注哪几个字段?出现“呆账”或“止付”状态
你会怎么处理?
❌不好的回答示例:
征信报告我主要看逾期记录,有没有那个“1234567”的数字。如果有呆账或者止
付,那我肯定直接拒了,因为这说明他已经彻底烂了。还要看查询记录,如果查询
太多也不行。房贷车贷我也看一眼,但是主要还是看信用卡有没有还清。反正只要
有呆账、止付、冻结这些字眼,不用想,直接秒拒,这种客户风险无穷大。
为什么这么回答不好:
1.分析缺乏层次:只说了拒,没解释为什么(例如呆账不仅是逾期,更是坏账核销)。
2.遗漏关键细节:除了状态,还要看发生的时间(多久之前的呆账?)和金额。
3.处理方式僵化:虽然大概率是拒,但未提及“特殊情况核实”(如被冒名导致的呆账),缺
乏专业的严谨性。
高分回答示例:
人行征信(PBCReport)是风控的黄金数据源。在审核中,我采用“由面到点”的阅
读策略,重点关注以下核心字段:
1.关键字段解读:
信贷记录摘要:关注“未结清贷款余额”和“信用卡已用额度/平均使用额度”。这是计算
DTI和判断用户是否处于高负债状态的基础。
查询记录(HardInquiry):重点看近1个月和近3个月的“贷款审批”与“信用卡审批”查
询次数。如果短期内激增(如近1个月查询>10次),说明用户急需用钱,存在多头借
贷风险。
特殊交易信息:这里是风险的“核按钮”。
2.针对“呆账”与“止付”的处理策略:
呆账(BadDebt):这是征信中最严重的状态,意味着银行已经放弃催收并进行核
销。
决策:原则上一票否决。无论金额大小,出现呆账代表该用户已完全丧失信用底
线。
止付(PaymentStopped):需要区分原因。
如果是“欺诈止付”或银行主动风控止付,说明该卡涉及洗钱或高危交易,坚决拒
绝。
如果是用户主动申请的“挂失止付”或“保护性止付”,通过电话核实和辅助证明(如银
行解冻流水),可以酌情考虑,不搞一刀切。
3.其他关注点:
对外担保:很多人忽视这点。如果用户有巨额对外担保,这属于隐性负债,一旦被担
保人暴雷,用户将承担连带责任,必须计入负债率测算。
Q13:针对“团伙欺诈”(GangFraud),在数据层面通常会有哪些表现特征?
❌不好的回答示例:
团伙欺诈就是一群人一起来骗钱。数据上肯定有很多相似的地方。比如他们可能在
同一个地方申请,或者用同一个WiFi。还有就是填写的公司可能是一样的,或者联
系人都是互相填的。这种一般都能看出来,因为太明显了。如果系统发现好几个人
资料差不多,那就是团伙。我们要把他们关联起来,一起拒掉。
为什么这么回答不好:
1.描述过于泛泛:缺乏技术层面的具体指标(如“IP网段”、“二度关联”)。
2.缺乏时空概念:未提及团伙作案在“时间序列”上的集中性特征。
3.术语缺失:没有使用“关联网络”、“聚类分析”等风控专业词汇。
高分回答示例:
团伙欺诈(OrganizedFraud)通常由黑产中介主导,具备高度的组织化和模版化
特征。在数据层面,其“异常模式”主要体现在以下三个维度的高度一致性
(Consistency)与聚集性(Clustering):
1.设备与网络环境聚集:
IP地址:多个账户来自同一个C段IP(局域网),或者短时间内IP频繁跳变但归属地
逻辑混乱(使用代理池)。
设备指纹:出现“设备复用”情况,或者所有设备的电量、屏幕分辨率、系统版本号惊
人一致(模拟器或批量的廉价二手机)。
GPS围栏:申请地点物理距离极近,集中在某个写字楼、酒店或村落。
2.行为轨迹趋同(BehavioralPattern):
时间序列:“并在进件”。例如在周二凌晨1点到3点,突然密集涌入50单申请,且填写
资料的耗时、点击顺序、页面停留时间几乎完全一样(脚本自动化操作)。
输入特征:粘贴操作频繁,或者在不同输入框之间的切换间隔固定。
3.社会关系纠缠(GraphRelation):
强关联:申请人A、B、C互为紧急联系人,或者共用同一个公司电话、家庭住址。
共性黑名单:某个联系人节点在黑名单库中,而这个节点连接了数十个申请人(黑中
介电话)。
应对:必须构建知识图谱(KnowledgeGraph),通过社区发现算法
(CommunityDetection)识别出这些异常聚集的团伙,进行批量封杀。
Q14:请解释一下什么是GBDT或逻辑回归(LR)模型,作为风控专员你如何
利用模型评分(Score)辅助人工审核?
❌不好的回答示例:
LR就是逻辑回归,是一种算法。GBDT是更高级的算法。模型评分就是系统给客户
打个分,比如600分。分数越高越好。我在审核的时候,主要看这个分。如果分数
很高,我就看得快一点,大概率通过。如果分数低,比如低于400分,我就看得仔
细点,或者直接拒了。我也不会算这些公式,反正系统给出来多少分我就信多少
分,这是策略部的事。
为什么这么回答不好:
1.技术理解浅薄:完全没有解释清楚两种模型的本质区别(线性vs非线性,可解释性强vs
弱)。
2.应用策略粗暴:仅仅是“看得快一点”或“拒了”,没有体现分数在“差异化审批”流程中的精细
化运作。
3.缺乏职业好奇心:认为“这是策略部的事”,把自己定位为流水线工人,缺乏对工具原理的
探究。
高分回答示例:
虽然我主要负责信审/风控运营,但我对底层模型有基本的理解,因为这决定了我对
系统决策的信任度和干预边界。
1.模型原理解析:
LR(逻辑回归):传统的风控模型“老兵”。它的优势是可解释性强,每个变量的权重
(如收入多少加几分,逾期几次扣几分)清晰可见。如果不通过,我可以明确告诉客
户是因为“负债太高”。
GBDT(梯度提升树):更强大的机器学习模型,由多棵决策树组成。它能捕捉变量
间复杂的非线性关系(如:年轻+高频消费+夜间活跃=高风险),预测准确率通常比
LR更高,但“黑盒”属性较强,难以直观解释具体拒单原因。
2.利用Score分辅助人审的策略:
我不会盲目迷信分数,而是将其作为分层审批(TieredApproval)的导航仪:
高分段(免审区):对于模型评分极高(如前10%)的用户,我建议走全自动审批,
人审只做“反欺诈抽检”,避免浪费人力。
低分段(自动拒单区):触碰底线的低分用户,直接系统拒绝,人审无需介入。
灰名单/临界分段(人审核心区):这是我的主战场。对于分数卡在通过线边缘的用
户,往往是模型“拿不准”的(例如信用历史短但收入高)。我会重点人工排查其非结构
化数据(如电话回访的语气、备注信息),寻找模型无法捕捉的“软信息”来进行捞回或
剔除,从而弥补模型的盲区。
Q15:如果让你设计一条针对“大学生骗贷”的拒绝规则,你会选取哪些特征?
❌不好的回答示例:
现在监管不让给大学生放贷,所以要严查。我会看年龄,如果小于22岁,就要小
心。然后看填的工作单位,如果写的是学校,或者住址是学校宿舍,直接拒。还有
看联系人,如果都是同学或者爸妈,那也可能是学生。如果他没有社保公积金,也
可能是学生。反正只要有一点像学生的,为了合规,我都建议拒绝。
为什么这么回答不好:
1.规则过于简单粗暴:单纯卡年龄(<22岁)会误杀大量早工作的蓝领人群。
2.特征维度单一:仅靠填写的地址很容易被绕过(学生可以随便填一个公司地址)。
3.缺乏隐性特征挖掘:没有利用APP列表、位置行为等难以伪造的数据。
高分回答示例:
针对大学生群体的合规性风控,重点在于识别“伪装成社会人的学生”。由于他们通
常会购买假的工作证明,单纯看资料审核是无效的。我会设计一套组合特征规则:
1.硬性门槛(HardRules):
年龄限制:18-22岁人群进入高风险人工复审队列。
学信网校验:强制接入学信网接口,这是最直接的判别标准(虽然有成本且有时效延
迟)。
2.地理位置特征(LBSGeofencing):
夜间驻留点:抓取用户过去1个月的夜间(22:00-06:00)设备停留位置。如果高频命
中全国高校校区、宿舍楼的地理围栏(POI),无论他工作证明填什么,大概率是学
生。
职住距离:如果填写的公司地址与常驻地距离超过30公里且无通勤轨迹,判定为挂靠
公司。
3.行为与APP特征:
APP列表:安装了“课程表”、“校园网”、“考研帮”、“四六级”等强特征APP。
联系人结构:通讯录中存在大量备注为“辅导员”、“室友”、“学长/学姐”、“宿管”的关键
词。
电商收货地址:历史收货地址中含有“xx大学”、“xx校区”、“xx宿舍”等关键词。
通过以上“位置+APP+关键词”的组合规则,可以精准命中那些试图隐瞒身份的在校
大学生。
Q16:什么是“勾稽关系”?在审核企业贷或经营性贷款时,如何利用财务报表数
据的勾稽关系验真?
❌不好的回答示例:
勾稽关系就是看数据能不能对得上。审核企业贷的时候,要看他的财报。比如资产
负债表要平衡,资产等于负债加所有者权益。还有看利润表,赚了多少钱。如果他
说的销售额很大,但是银行流水很少,那就是对不上的,这就是勾稽关系不对。还
有看水电费,如果工厂没用电,肯定没生产。反正就是看各个数据之间有没有矛盾
的地方。
为什么这么回答不好:
1.解释过于教科书:只背诵了会计等式,没有结合信贷实战场景。
2.缺乏具体案例:提到的“流水vs销售”和“电费”是常识,缺乏深入的财务交叉验证逻辑(如
税票)。
3.未提及逻辑闭环:没有说明当勾稽关系出现异常时,如何去伪存真。
高分回答示例:
“勾稽关系”是指财务报表内部及表外数据之间存在的逻辑对应关系。在小微企业信
审中,报表往往是修饰过的,“三表交叉验证”(逻辑勾稽)是识破假账的核心手
段。
我主要关注以下三组核心勾稽关系:
1.“税”与“表”的勾稽(硬碰硬):
增值税发票vs营业收入:查看企业的开票金额(金税数据)。如果利润表上的营业
收入远大于纳税申报表上的销售额,且企业无法提供合理的免税证明或未开票收入流
水,说明他在虚增收入骗贷。
2.“电/水”与“产”的勾稽(物理验证):
对于生产型企业,我会计算“电费产值比”。例如,行业平均每用1度电产出100元产
品。如果该企业申报产值1000万,但电费单只有2000元,严重偏离行业均值,说明其
生产数据造假。
3.“流”与“销”的勾稽(资金闭环):
银行流水贷方发生额vs销售收入:企业的销售回款应该体现在对公账户流水中。如
果企业主声称年入500万,但对公+个人卡流水的有效入账只有100万,或者大量流水
是“个人转个人”(疑似过桥资金刷流水),则勾稽失败。
总结:真实的经营数据是一个有机的整体,牵一发而动全身。我的任务就是寻找那
些“算不平”的账,那里往往藏着风险。
Q17:当第三方数据源(如某大数据征信接口)突然中断,积压了大量待审订
单,你会如何处理以平衡风险与效率?
❌不好的回答示例:
如果数据断了,那肯定审核不了了,只能等。我会先跟技术部说,让他们赶紧修。
然后跟客服说,让他们安抚一下客户,说系统升级。如果积压太多了,我就看看能
不能人工先审一部分简单的。或者就暂停进件,不让新客户提交了。毕竟没有数据
我们不敢随便放款,风险太大了,宁可慢一点也不能乱放。
为什么这么回答不好:
1.被动等待:完全依赖技术修复,缺乏风控运营的“降级方案”思维。
2.缺乏分层处理:不仅没有解决积压,还通过暂停进件伤害了用户体验和业务增长。
3.未提及备用源:专业的风控体系应该有主备接口切换机制。
高分回答示例:
这是风控运营中典型的“突发事故”。我的处理原则是“分级分流,降级运行”,在控
制风险底线的前提下尽可能消化堆积。
1.立即启动BCP(业务连续性计划):
切换路由(Switching):如果有备用数据源(例如百融挂了,切同盾),立即通知
策略技术团队切换接口调用。虽然成本可能不同,但业务不能停。
2.实施降级策略(DegradationStrategy):
优质老客“直通”:对于复借多次、历史表现极佳的白名单用户,暂时豁免该缺失数据
的校验,或者利用内部历史数据替代,快速放行,释放审批压力。
新客/灰名单“挂起”或“转人审”:对于必须依赖该数据进行反欺诈判定的高风险新客,
暂时挂起(Pending),通过短信告知用户“正在审核中”,避免直接拒单流失。
3.人工介入与事后回补:
如果中断时间较长,启动紧急人工审核模式,侧重电核与交叉验证。
事后跑批(Post-loanCheck):待接口恢复后,立即对这批降级通过的存量用户进
行“离线跑批”。如果发现有漏网的黑名单用户,立即进行冻结额度或提前介入管理。
Q18:你熟悉哪些第三方风控数据服务商(如同盾、百融等)?通常使用它们提
供的哪些产品?
❌不好的回答示例:
我知道同盾、百融,还有鹏元。我们以前公司好像用的是同盾。主要就是查黑名
单,看看是不是在别的平台欠钱了。还用过他们的分,好像叫信用分吧。其他的就
不太清楚了,因为具体的接入是技术和策略那边定的,我只负责看报告里的结果。
反正这些公司都差不多,都是提供大数据的。
为什么这么回答不好:
1.认知浅薄:只知道黑名单,对各家厂商的特色产品(如设备指纹、多头借贷、运营商画
像)一无所知。
2.缺乏实操细节:没有具体说出产品名称(如“借贷意向”、“特殊名单”),显得经验不足。
3.推卸责任:说“接入是策略定的”,暴露了自己作为执行层缺乏对工具的主动了解。
高分回答示例:
在过往工作中,我深度接触过主流的几家头部数据服务商,了解它们各自的优势产
品,并将其应用在风控的不同环节:
1.同盾科技(Tongdun):反欺诈专家
核心应用:我最常用的是他们的“设备指纹”和“复杂网络(关联分析)”。在贷前环
节,利用其设备指纹识别模拟器和多开工具非常精准;同时利用其黑名单库拦截失信
被执行人。
2.百融云创(Bairong):多头与评分
核心应用:主要使用其“多头借贷”数据(借贷意向查询)。百融覆盖的非银借贷机构
很广,能有效查出用户在其他P2P或消金公司的申请记录。另外,也参考其“策略评
分”作为辅助模型分。
3.聚信立/魔蝎(运营商数据):
虽然现在爬虫受限,但在合规前提下,我们曾利用其运营商报告进行“联系人验
真”和“消费档次评估”。
4.中国互金协会(NFCS)/百行征信:
用于查询“共享债务”信息,这是防止共债风险的权威数据源。
总结:没有一家数据是完美的,我的策略是“多源交叉”——用同盾防欺诈,用百融
看多头,用人行/百行看负债,构建全视角的客户画像。
Q19:简述一下ROC曲线和KS值在风控模型评估中的含义,KS值多少被认为模
型效果较好?
❌不好的回答示例:
ROC曲线就是一条线,越凸越好。KS值是看模型准不准的。一般KS值越大越好,
说明模型区分能力强。如果KS是0.2,那就是不及格。如果KS是0.6,那就是很
好。我们一般要求KS达到0.5以上。如果太低了,就要重新建模。具体的计算公式
我忘了,但是我看报表的时候主要就看这个KS值。
为什么这么回答不好:
1.数值标准错误:KS>0.5在工业界通常意味着“过拟合”或利用了未来变量,候选人盲目追求
高分,缺乏实战常识。
2.解释苍白:没有解释ROC的横纵坐标(TPR/FPR)和KS的物理含义(最大差值)。
3.缺乏业务视角:没有说明这两个指标如何指导业务决策(如通过率设定)。
高分回答示例:
ROC和KS是评估模型区分能力(Discrimination)的两个核心指标。
1.ROC曲线(受试者工作特征曲线):
它的横轴是FPR(假正率,把坏人错判为好人的概率),纵轴是TPR(真正率,把坏
人抓出来的概率)。ROC曲线下面积(AUC)越大(越接近1),说明模型排序能力
越强。
2.KS值(Kolmogorov-Smirnov):
含义:KS值是好人分布累计曲线和坏人分布累计曲线之间的最大垂直距离。简单说,
就是模型把好人和坏人拉开的能力。
数值评估标准(实战经验):
KS<0.2:模型几乎无区分能力,类似于瞎猜(RandomGuess),必须重构。
KS0.2-0.3:模型可用,但效果一般。
KS0.3-0.5:这是最理想的区间。模型区分度优秀,且具有较好的泛化能力。
KS>0.5/0.6:极度警惕!这通常不是模型太好了,而是发生了“过拟合
(Overfitting)”或者“数据泄漏(DataLeakage)”(例如把贷后的Y变量当做了X
变量入模)。此时必须停用检查。
总结:我追求的不是极高的KS,而是稳定且真实的KS(0.35-0.45之间),这样
的模型在上线后才不会崩塌。
Q20:用户通讯录数据中,如果发现短时间内新增大量联系人,或者联系人中命
中黑名单比例较高,你如何解读?
❌不好的回答示例:
如果通讯录突然多了很多人,那肯定是买的假通讯录,为了骗贷。如果联系人里黑
名单多,说明他朋友圈都很乱,近朱者赤近墨者黑嘛,这种人风险肯定高。我会直
接拒掉。现在的APP都能读取通讯录,我们一看就能看出来。这种操作太明显了,
肯定是想掩盖什么。
为什么这么回答不好:
1.归因单一:未考虑到“换新手机导入”或“参加商务活动”等正常场景。
2.缺乏数据验证:没有提到结合通话记录来验证这些新增联系人是否为“僵尸联系人”。
3.处理粗糙:只是简单说“拒掉”,没有挖掘背后的欺诈逻辑(如养号)。
高分回答示例:
通讯录是社交网络分析(SNA)的重要载体,针对这两种异常情况,我的解读逻辑
如下:
1.短时间内新增大量联系人(突变):
风险假设:极大概率是“白户包装”或“养号”。黑产为了让新买的手机号看起来像正常
人,会利用软件批量导入几百个虚假联系人。
验证手段:
静默检测:检查这些新增号码是否有通话记录?如果只有号码没有通话,或者通话
时长均为0/1秒,确认为伪造数据。
命名规则:如果新增联系人名称呈现“名字1、名字2”等规律性排列,或缺乏亲密称
呼(如爸爸、老婆),则为机器生成。
2.黑名单命中率高(染黑度):
风险假设:“近墨者黑”理论。如果其通讯录中超过10%-20%的人是已知的网贷逾期用
户或黑中介,说明该用户处于高负债圈层,或者已经加入了“撸口子群”,不仅还款能力
存疑,还极易受到教唆拒还。
决策:计算“黑名单占比阈值”。如果是轻度染黑,结合其他维度综合判定;如果是重
度染黑(如命中多个确定的黑中介号码),直接触发反欺诈规则拒绝。
Q21:什么是关联网络(KnowledgeGraph)?如何利用一度关联和二度关联
发现潜在风险?
❌不好的回答示例:
关联网络就是把所有用户连成一张网。一度关联就是你的直接联系人,二度关联就
是你联系人的联系人。如果有风险,我们就能顺藤摸瓜找到。比如A是骗子,B认识
A,那B可能也是骗子。C认识B,那C也有嫌疑。我们在系统里主要就是看这个
图,如果红点多了,说明这个圈子不干净,直接把这群人拒掉就行了。这个技术挺
复杂的,主要是技术部在做,我主要看结果。
为什么这么回答不好:
1.解释过于浅显:只用“顺藤摸瓜”来形容,缺乏对图计算(GraphComputing)底层逻辑的
专业表述(如节点、边、权重)。
2.逻辑绝对化:简单认为“B认识A,B就是骗子”是典型的误杀思维,忽视了弱关联和强关联
的区别。
3.缺乏实战场景:没有具体说明如何利用网络密度(Density)或中心性(Centrality)来识
别团伙。
高分回答示例:
关联网络(KnowledgeGraph)是基于图数据库(如Neo4j)构建的复杂网络,通
过“节点”(用户、设备、手机号)和“边”(通话、共用WiFi、担保)来描绘实体间
的关系。在反欺诈中,它是识别团伙欺诈的核武器。
1.一度关联(DirectConnection)的应用:
定义:目标用户直接连接的节点。例如,用户A的紧急联系人是B,或者A与B共用了
同一个设备ID。
实战策略(黑名单传导):如果A是已确认的黑名单用户(欺诈分子),那么与其有
强一度关联的B,即便信用资质看起来很好,也极大概率是同伙或被盗用者。我们会设
置规则:“直接关联黑名单人数>1,拒绝”。
2.二度关联(IndirectConnection)的深挖:
定义:朋友的朋友。例如,用户A和用户C互不认识,但他们都联系过同一个中介号
码B(中间节点)。
实战策略(中介识别):单看A和C可能都很正常。但通过二度关联分析,发现成百
上千个互不相干的申请人都连接到了同一个节点B(该节点可能是中介、假公司电话或
黑产养号池)。
聚类分析(Clustering):利用Louvain等算法,找出网络中紧密连接的社区
(Community)。如果一个社区内的二度关联密度极高且坏账率高,我们会直接封锁
整个社区的进件,防止团伙攻击。
Q22:在处理高风险职业(如钢贸、KTV从业者等)的进件时,你的审核侧重点
是什么?
❌不好的回答示例:
对于这种高风险职业,我一般都很谨慎。钢贸行业波动大,容易破产;KTV这种娱
乐场所的人员流动性太大了,今天在这明天就走了,找不到人。审核的时候,我会
让他们多提供点资产证明,比如房子车子。如果没有资产,我就把额度压得很低,
或者直接拒了。反正公司规定了高风险职业要严审,我就按规定来,宁可不放也不
能出坏账。
为什么这么回答不好:
1.刻板印象严重:仅凭行业标签进行“有罪推定”,没有针对该行业的具体风险点(如现金流
结构)进行深度分析。
2.缺乏差异化策略:除了“压额度”和“拒单”,没有提出有效的验真手段(如针对钢贸看库存
周转,针对KTV看工资流水特征)。
3.忽视行业周期:未提及宏观经济对特定行业(如钢贸)的周期性影响。
高分回答示例:
针对高风险职业,我的核心逻辑不是“一刀切拒绝”,而是“穿透行业表象,核实还款
来源的稳定性”。不同行业的风险点截然不同,需分类施策:
1.钢贸/建材类(强周期性行业):
核心风险:资金链断裂和库存积压。该行业对宏观经济极度敏感,且常涉及民间借
贷。
审核侧重:我会重点核查其“上下游贸易背景”。查看其银行流水中是否有真实的货款
往来,而非单纯的转账。同时查询企业征信,看是否有大额的未决诉讼或被执行记
录。如果此时处于行业下行期(如房地产低迷),我会大幅收紧准入标准。
2.娱乐/服务业(高流动性行业):
核心风险:收入不稳定、联系人圈子复杂、失联率高。
审核侧重:侧重于“本地化稳定性”验证。
居住稳定:是否有本地房产或长期租房合同?(增加违约成本)。
流水特征:KTV等从业者往往收入由“底薪+小费”构成,现金流多。我会要求提供微
信/支付宝的月度账单,看是否有规律性的夜间收入入账,以此剔除无业游民包装。
增信措施:对于此类客户,建议必须要求提供直系亲属作为第二联系人,并进行严格
的电核验证。
Q23:如果发现某个地区的申请通过率异常偏低,排查后发现是由于某条规则误
杀,你会怎么做?
❌不好的回答示例:
如果发现是规则误杀,那肯定是规则有问题。我会马上把这条规则停掉,然后把被
误杀的客户捞回来重新审一遍。比如某个省份被拉黑了,但是那里其实有很多好客
户。我会跟策略部说,让他们赶紧改代码。然后我自己也会手动把那些申请再看一
遍,没问题的就放款。这种事情要快处理,不然会影响业绩,领导会不高兴的。
为什么这么回答不好:
1.操作草率:直接“停掉规则”风险极大,可能导致真正的欺诈流量涌入,缺乏“灰度发
布”或“AB测试”的稳健思维。
2.流程不规范:没有提及回溯测试(Back-testing)来验证误杀的具体影响范围。
3.忽视根本原因:未分析为什么该地区会被误杀(是欺诈特征与正常特征重叠?还是数据源
污染?)。
高分回答示例:
面对规则误杀(FalsePositive)导致的区域通过率异常,必须遵循“止损-验证-修
复-回溯”的严谨流程,不能简单地“一关了之”。
1.原因定位与影响评估(Diagnosis):
首先确认该规则触发的逻辑。例如,是因为该地区某IP段被污染导致误伤全区,还是
因为当地特有的消费习惯(如集中夜间申请)触发了异常行为规则?
抽取被拒绝的样本进行人工复核,确认是否均为优质客户,计算误杀率(TypeI
Error)。
2.策略修复与灰度测试(Fix&Test):
优化而非停用:如果规则本身有价值,我不建议直接下线,而是调整阈值或增加白名
单豁免。例如,将“命中1次即拒”调整为“命中且无社保记录才拒”。
离线回溯(Back-testing):利用历史数据跑一遍新规则,看通过率能回升多少,同
时坏账率(BadRate)是否在可控范围内。
3.线上执行与捞回(Deployment&Recall):
小流量上线:先对该地区10%的流量应用新策略,观察24小时,确认无风险后全量放
开。
存量捞回:对于确认为误杀的近期订单,发送短信邀请客户“重新激活”或由人工后台
主动触发重审流程,挽回流失的优质资产。
Q24:你如何看待“首逾率”这个指标?影响首逾率的核心因素通常有哪些?
❌不好的回答示例:
首逾率就是第一期不还钱的比例。这个指标很重要,如果高了说明风控没做好。影
响因素嘛,主要就是客户质量不行,或者催收没催好。还有就是可能是骗子多了。
我觉得如果首逾率高,就要把进件关了,好好查查。这个指标一般控制在1%以内比
较好。反正首逾率越低越好,说明我们选的人都是讲信用的。
为什么这么回答不好:
1.归因笼统:将责任推
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川华新现代职业学院单招职业技能测试题库带答案详解(达标题)
- 2026年嘉兴南湖学院单招综合素质考试题库及答案详解(易错题)
- 2026年四川信息职业技术学院单招职业适应性考试题库及答案详解(夺冠系列)
- 2026年吉林交通职业技术学院单招职业技能测试题库及答案详解(夺冠系列)
- 数据库设计流程及注意要点指南
- 企业如何应对玩具铅超标问题
- 中医护理食疗原则
- 儿科疼痛管理护理技巧
- 致敬她力量:妇女节主题班会
- 中耳炎的并发症处理策略
- 【新教材】人教PEP版(2024)四年级下册英语 Unit 1 Class rules A Lets talk 教案
- 2026年非煤矿山三级安全教育培训考核试题(及答案)
- 2026年春季小学科学人教鄂教版(2024)二年级下册教学计划含进度表
- 2026年包头职业技术学院单招职业技能测试题库附答案详解(考试直接用)
- 中国文化史复习资料
- 1.追寻文明的足迹
- 项目管理奖罚细则
- 组织生活会工作流程(附流程图)
- SimMarketing营销模拟实验室操作篇
- 气排球比赛计分表
- 汽车式起重机常见事故原因分析及预防
评论
0/150
提交评论