金融风控特征工程建模规范_第1页
金融风控特征工程建模规范_第2页
金融风控特征工程建模规范_第3页
金融风控特征工程建模规范_第4页
金融风控特征工程建模规范_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融风控特征工程建模规范一、总则规范(一)适用范围。本规范适用于金融机构内部所有涉及金融风控特征工程建模的业务场景,包括但不限于信用评估、反欺诈、市场风险等领域,确保建模过程标准化、规范化、可追溯。1.金融风控特征工程建模必须基于业务实质,严禁为建模而建模,确保特征选取与风险逻辑强相关。2.所有建模活动需经业务部门、风控部门、技术部门联合审核,重大模型变更需上报总行风险管理委员会审批。3.特征工程建模结果需定期(原则上每季度)进行效果评估,模型性能下降超过15%的必须重新建模或调整参数。(二)基本原则。金融风控特征工程建模必须遵循以下原则1.数据质量优先。所有输入数据必须经过清洗、验证、标准化流程,异常值处理需有业务逻辑支撑。2.多源融合。特征工程应整合内外部数据资源,包括交易数据、征信数据、行为数据等,形成互补性特征体系。3.动态迭代。特征工程不是一次性工作,需建立持续优化机制,根据业务变化及时更新特征库。4.隐私合规。所有特征工程活动必须符合《个人信息保护法》要求,敏感信息脱敏处理比例不低于30%。二、组织与职责(一)权责划定。各单位主要负责人是第一责任人,分管技术负责人是直接责任人,风控部门负责业务需求与效果验证,技术部门负责模型开发与维护,数据部门负责数据支持。(二)协作机制。特征工程建模实行"三会两审"制度1.每周召开跨部门需求评审会,明确建模目标与业务指标。2.每月进行模型效果评审会,评估特征有效性。3.每季度开展模型应用评审会,检查业务落地情况。4.模型开发前需通过技术评审,模型上线前需通过风控评审。(三)人员资质。参与特征工程建模人员必须具备以下条件1.风控建模人员需通过金融风险管理师认证或同等资质认证。2.数据工程师需具备数据治理相关经验,熟悉SQL、Python等工具。3.所有建模人员需接受年度合规培训,考核合格后方可参与敏感模型开发。三、数据治理规范(一)数据源管理。金融风控特征工程建模必须依托经过认证的数据源1.一级数据源:银行内部交易系统、征信系统等核心业务系统。2.二级数据源:第三方数据商提供的经核验的合规数据。3.数据接入必须经过"接入申请-技术评估-业务确认-上线验证"四步流程,有效期不足6个月的数据禁止使用。(二)数据质量标准。所有建模数据必须满足以下质量要求1.完整性:关键特征缺失率不超过5%,异常值比例不超过3%。2.一致性:相同业务场景数据口径必须统一,跨系统数据需进行标准化处理。3.准确性:核心指标误差率不超过2%,需定期开展数据抽样复核。4.时效性:实时特征更新频率不低于每小时,T+1特征更新时间不晚于次日凌晨3点。(三)数据脱敏要求。涉及个人信息的特征工程必须执行以下脱敏措施1.直接敏感信息:身份证号、手机号等必须完全脱敏,脱敏规则需经合规部门备案。2.间接敏感信息:需采用K-匿名、差分隐私等技术,隐私预算分配比例不低于特征总数的20%。3.脱敏数据需建立版本管理机制,每次模型变更必须更新脱敏规则。四、特征工程流程(一)需求分析。特征工程建模必须基于明确的业务需求,需完成以下工作1.编制《特征需求说明书》,包含业务目标、风险场景、关键指标等要素。2.建立"业务专家-技术专家"双评审机制,确保需求合理性。3.需求文档需经业务部门负责人、风控部门负责人双重签字确认。(二)特征开发。特征开发过程必须遵循"四步法"流程1.原型开发:基于历史数据构建基础特征原型,完成度需达到80%以上。2.评审优化:组织技术、风控、业务三方对原型进行评审,重点评估特征有效性。3.A/B测试:新特征上线前需开展A/B测试,样本量不低于总流水的30%。4.成果归档:建立《特征开发档案》,包含开发过程记录、测试报告、上线说明等。(三)特征评估。特征有效性评估需满足以下要求1.效果评估:采用ROC曲线、KS值等指标,新特征提升度需超过2个百分点。2.稳定性评估:连续三个月跟踪特征表现,波动率不超过8%。3.滥用监控:建立特征使用监控机制,异常调用需触发预警。五、模型开发规范(一)模型选型。金融风控特征工程建模必须基于业务场景选择适配模型1.信用评估:优先采用逻辑回归、XGBoost等解释性强模型。2.反欺诈:可使用图神经网络、异常检测算法等复杂模型。3.模型选择需经技术委员会论证,重大模型变更需重新论证。(二)参数调优。模型参数必须通过科学方法确定,禁止随意调整1.必须采用交叉验证法,折数不低于10折。2.关键参数调整需记录实验日志,包括调整前后的性能对比。3.严禁使用外部工具自动调参,所有参数设置需经技术专家审核。(三)模型验证。模型验证必须包含以下内容1.基准测试:新模型性能提升需超过基准模型5个百分点。2.偏差分析:不同客群模型表现偏差率不超过10%。3.模型文档:建立《模型验证报告》,包含验证过程、结果分析、风险提示等。六、模型运维管理(一)版本控制。所有模型必须建立版本管理机制1.实行"主版本-次版本"编号体系,主版本号变更需经技术委员会审批。2.建立模型变更日志,记录每次变更的详细情况。3.重要模型变更需进行历史数据回测,回测数据量不低于总数据的50%。(二)性能监控。模型上线后必须实施实时监控1.关键指标监控:包括准确率、召回率、KS值等,异常波动需触发告警。2.业务影响监控:模型变更对业务指标的影响需控制在±5%范围内。3.建立自动重训机制,性能下降超过阈值时自动触发重训流程。(三)模型审计。模型运维需接受定期审计1.审计周期:每季度开展一次全面审计,重大模型每月审计。2.审计内容:包括模型表现、参数设置、数据使用等。3.审计结果需形成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论