风控算法工程师考试试卷及答案_第1页
风控算法工程师考试试卷及答案_第2页
风控算法工程师考试试卷及答案_第3页
风控算法工程师考试试卷及答案_第4页
风控算法工程师考试试卷及答案_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

风控算法工程师考试试卷及答案试题部分一、填空题(共10题,每题1分)1.风控异常检测中,基于距离的算法是______2.混淆矩阵中,实际负样本被预测为正的数量称为______3.模型AUC值越接近______,区分正负样本能力越强4.卡方检验适用于______类型特征的选择5.类别不平衡处理方法中,SMOTE属于______采样6.ID3决策树的分裂准则是______7.实时风控推理常用部署框架是______8.信用评分卡中,申请场景对应______卡9.基于密度的异常检测算法是______10.时间序列特征工程的常用方法是滑动窗口和______二、单项选择题(共10题,每题2分)1.以下哪个指标不适合评估类别不平衡的风控模型?A.准确率B.召回率C.F1值D.AUC2.属于集成学习的算法是?A.SVMB.RandomForestC.K-MeansD.LDA3.用户历史逾期天数属于______特征?A.数值型B.类别型C.文本型D.时间型4.可缓解模型过拟合的方法是?A.增加训练样本B.提高正则化系数C.减少特征数量D.以上都是5.信用评分卡A卡的应用场景是?A.贷前审批B.贷中监控C.贷后催收D.资产处置6.LOF算法的核心是计算样本的?A.距离均值B.局部密度因子C.聚类中心距离D.信息熵7.风控常用的特征工程方法不包括?A.独热编码B.标准化C.归一化D.随机生成8.CART决策树的分裂准则是?A.信息增益B.增益率C.基尼系数D.信息熵9.实时推理框架不包括?A.TensorFlowServingB.PyTorchServingC.Scikit-learnD.Triton10.属于欺诈特征的是?A.手机号注册时长B.设备ID唯一性C.年龄D.收入水平三、多项选择题(共10题,每题2分)1.风控模型评估指标包括?A.AUCB.F1值C.召回率D.精确率2.类别不平衡处理方法有?A.SMOTEB.欠采样C.加权损失D.集成学习3.集成学习的方法包括?A.BaggingB.BoostingC.StackingD.随机森林4.异常检测算法有?A.LOFB.IsolationForestC.KNND.One-ClassSVM5.特征选择方法有?A.过滤法B.包裹法C.嵌入法D.正则化6.贷前风控核心环节是?A.信息验证B.信用评分C.欺诈检测D.贷后催收7.数值型特征包括?A.近30天交易笔数B.逾期天数C.月收入D.婚姻状况8.正则化方法有?A.L1正则化B.L2正则化C.弹性网D.早停9.时间序列特征包括?A.近7天登录频率B.交易间隔天数C.月均消费趋势D.设备型号10.欺诈检测特征维度包括?A.设备维度B.行为维度C.关系维度D.信用维度四、判断题(共10题,每题2分)1.AUC=0.5表示模型完全随机。()2.类别不平衡时准确率越高模型越好。()3.RandomForest属于Bagging算法。()4.独热编码适用于所有类别特征。()5.A卡用于贷中监控。()6.LOF可用于异常检测。()7.增加正则化强度缓解过拟合。()8.特征工程对模型效果影响不大。()9.实时风控需低延迟。()10.所有特征都需标准化。()五、简答题(共4题,每题5分)1.简述风控类别不平衡的影响及解决方法。2.简述AUC的含义及风控中的作用。3.简述信用评分卡A卡的设计流程。4.简述IsolationForest的核心思想。六、讨论题(共2题,每题5分)1.讨论实时与离线风控推理的差异及优化策略。2.讨论风控模型可解释性的重要性及常用方法。答案部分一、填空题答案1.KNN2.假阳性数(FP)3.14.离散5.过6.信息增益7.TensorFlowServing(或PyTorchServing)8.A9.LOF10.差分二、单项选择题答案1.A2.B3.A4.D5.A6.B7.D8.C9.C10.B三、多项选择题答案1.ABCD2.ABCD3.ABCD4.ABCD5.ABCD6.ABC7.ABC8.ABC9.ABC10.ABCD四、判断题答案1.√2.×3.√4.×5.×6.√7.√8.×9.√10.×五、简答题答案1.类别不平衡影响及解决方法:影响:模型偏向多数类(如正常用户),少数类(如欺诈)预测准确率低。解决方法:①欠采样(减少多数类样本);②过采样(SMOTE生成合成少数类);③加权损失(给少数类更高权重);④集成学习(XGBoost带权重);⑤特征工程(提取少数类专属特征)。2.AUC的含义及作用:AUC是ROC曲线下面积(0-1),AUC=1表示完美区分,0.5表示随机。风控中正负样本不平衡,准确率易误导,AUC优势:①衡量区分能力;②不依赖阈值;③反映不同阈值下的综合表现,适合平衡误拒/误放。3.A卡设计流程:①数据准备(申请信息、征信、历史行为);②特征工程(清洗、WOE编码、选择);③模型训练(逻辑回归,可解释性强);④评估(AUC、KS、PSI);⑤评分转换(转化为0-1000分数,设cutoff);⑥验证(样本外、跨时间验证)。4.IsolationForest核心思想:无监督异常检测,通过随机森林(孤立树)孤立异常样本:正常样本分布集中,需多次切分;异常样本稀疏离群,少量切分即可孤立。计算样本平均孤立路径长度,长度越短越可能异常,适合欺诈检测。六、讨论题答案1.实时与离线推理差异及优化:差异:实时需毫秒级延迟(单样本/小批量),离线无严格延迟(批量大规模数据)。优化:实时端:①模型轻量化(剪枝、量化);②用TensorFlowServing部署;③特征缓存。离线端:①Spark分布式计算;②批量推理。平衡:高风险用户用轻量模型,低风险用全量模型。2.可解释性重要性及方法:重要性:①监管合规(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论