




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
FinanceAI&OpenFinancialPlatform,MercyWangPh.DIEEEFellowUCBerkeleyChairofCVTsinghuaChairofAI深圳前海弘犀智能科技有限公司创始人董事长,中国银行业痛点,M01如何高效开展金融产品的宣传MOR02小微企业客户获客成本高M03个人客户精准低成本营销M04运营有形网点成本高效益低,AR01获取高收益资产越来越难AR03实现小额高频的普惠信贷业务A02农业金融的低效益与高风险C01如何高效吸收低成本资金C02为大众提供高效低价的财富管理服务,O01繁琐的支付与转账服务MOR02小微企业客户经营成本高O03个人金融服务的客服与消费者教育O04供应链金融中对信息流和物流的可靠追踪O05机构结算与清算领域的流程、时滞及成本O06信贷业务流程的繁琐耗时O07海量业务资料的有效管理,T01科技系统软硬件投资巨大且扩展性差T02科技研发与创新效率低,AR01获取高收益资产越来越难MOR02小微企业客户获客与经营成本高AR03实现小额高频的普惠信贷业务R04个人金融服务中的反欺诈R05针对中小企业信贷的传统风控手段乏力R06合规管理、反洗钱与客户评估,深刻洞察金融行业业务痛点,开放的技术平台与解决方案让客户盈利是我们终身使命,实现小额高频的普惠信贷业务,小微企业客户获客成本高,个人金融服务中的反欺诈,针对中小企业信贷的传统风控手段乏力,小额:额度在1万500万之间高频:获客便捷,自动化审批、流程简便,随借随还。普惠信贷:不同客户切分不同额度、期限、利率,同时是信用贷款,供应链金融中对信息流和物流的可靠追踪,痛中之痛,小微企业:特征,无抵押、无财报,白户,征信数据验证困难获客成本高:信息不对称让信息中介成为高利行业,财务数据,经营信息获取难。,个人金融服务:个人消费贷款、个人经营贷,场景化问题,身份核验问题,团伙欺诈问题,包装欺诈问题。反欺诈:正向反欺诈、逆向反欺诈,传统风控:建模能力、算法、样本、验证、Y数据,数据收集与验真、人才ML风控:AI技术,数据处理,样本处理,组合算法,调参,人才,供应链金融:骗贷、资金挪用,应付账款、仓单质押真实性,外生风险,内生风险、主体风险、机会主义风险,上下游在资金、还款、信用、应收账款账户的控制信息流与物流可靠追踪:区块链技术性能问题,垂直行业认识上,数据应用:历史交易数据、外部数据积累和挖掘,动态数据的监控,交易真实性,质押物监控.,信贷业务流程的繁琐耗时,业务流程:触达客户、申请、反欺诈、面签、审批、尽调、放款、核算、贷后服务、监控、催收、保全、处置、ABS等繁琐耗时:贷前、贷中、贷后节点数,风控模型参与度,反欺诈参与度,自动化流程、O2O流程,操作风险,进度工具智能化,道德风险等等,这些痛点需要解决传统银行中的那些问题,银行贷前能力,银行应该具备TotalAbility,贷前:精准获客能力,贷前:KYC,贷前:反欺诈能力,银行贷中能力,贷中:便捷开户,贷中:便捷放款,银行贷后能力,贷前:信用风控建模,贷后:D0低成本催收,贷后:失联修复,贷后:贷后预警,银行运营能力,信贷流程优化,产品设计,ROA沙箱,低成本贷前、中、后运营能力,边缘计算用于数据隐私保护与安全,银联数据边缘计算建模,信用中国边缘计算建模,美团边缘计算建模,其他场景边缘计算建模,第三方数边缘计算建模,银行历史数据边缘计算建模,银行方集成计算建模,技术平台支撑能力,T01机器学习平台T02OCRT032D人脸识别T043D人脸支付T05NLPT06类脑学习T07边缘计算T08图计算T09RPAT010大数据分析T011DW高效T012交易安全T013产品工厂T014开放银行T015数据安全与隐私保护技术,在传统审核资料的基础上,增加多渠道多维度的海量数据,构建风险模型,网上消费,第三方数据,社交关系,其它,网络行为,信贷数据,征信报告,申请资料,第三方数据,信用行为,交叉匹配,网络黑名单,搜索引擎,各类认证,某知名机构风险评分,Y=f(X1,X2,Xn)f?必须要有Y,X,处理数据01,数据观察02,样本选择03,补充样本04,模型评估08,模型调参07,特征工程06,单变量分析05,好坏样本4:1,1、缺失值处理2、同质化处理(拍脑袋90%作为临界值进行删除)3、特征赛选(过滤式、包裹式和嵌入式,FICO监督数据分箱、区分度评分、拟合与尺度化、IV值、皮尔森、卡分分箱等、挑战者),最终模型09,最大难点风控建模传统建模,最大难点风控建模人才分类建议(以某家银行建议为例),数据收集01,申请数据征信报告支付数据,税务数据电信数据电力数据ERP数据财务数据,第三方介入数据,点击模型数据交互场景数据,数据分类器算法设计02,1、SVM+SKM+类脑计算初选2、Adaboost+RandomForest进行预测分类误差3、GAN网络自动模拟数据分类器4、类脑因果学习分类器算法AUC标定值,DL数据观察03,1、randomforestTree自动弱分类好坏样本标注2、数据缺失扫描3、样本分布计算4、GAN重建样本数据,样本选择04,1、GAN对抗大量样本比对学习2、对抗补偿函数选择3、学习历史数据补充(人工监督,局域学习数据)4、少量样本逻辑规则(类脑逻辑)5、GAN生成样本与正式样本分类(建模数据集、测试数据集、自比对数据集),补充样本05,1、根据标注量按照4:1样本补充,2、样本量监测,最大难点风控建模无监督学习建模,单变量分析06,1、核心变量分析,参照FICO五类变量进行点单变量统计分析2、然后其他数据单变量统计分析3、输出是否正态分布,长尾右偏分布、离散分布,使用SKM建立正态分布特征核4、组合衍生变量单变量统计分析,DL特征工程07,1、系统数据扫描2、缺失值处理:删除缺失值、统计量填充、特殊值填充、保留缺失值(预设缺失阀值90%)3、根据经验考虑缺失值是否补充判断4、ETL过程级大数据处理过程5、同质化数据处理(深度学习同质化数据区分度切片)6、无监督数据分箱(等距、等频和逻辑规则Police数据分箱)+卡分分箱7、IV值特征筛选-皮尔森关系数特征赛选-挑战者-Ensemblelearning-SKM+SVM+Ensemblelearning+RandomForest+autoencoder(无标注特征),模型调参08,1、GBM模型调参2、DNN学习GBM的min_samples_split、min_samples_leaf的权重,ResNet学习max_depth的深度,Loss函数定义权重回归。3、ResNet对梯度回升逆运算,GAN对抗进行逆操作预测,,最大难点风控建模无监督学习建模,最大难点风控建模无监督学习建模,模型评估09,1、传统Gini=2*AUC-1设计预判值做线性相互计算2、使用KS值进行预测计算进行模型区分度设定预设值计算3、互相关函数进行模型区分度(非线性)4、SKM验证GINI与KS值偏差度,GINI:60%:过高,需要谨慎的验证模型KS:75%:过高,需要谨慎的验证模型,我通过SKM算法计算到模型在训练集上的Gini系数达到了0.56左右,K-S值也达到了0.44左右,对于信用评估模型来说,效果算是非常好的。另外从图中可以看到,模型在训练集上的稳定性非常好,5折交叉验证的曲线非常接近。,最大难点风控建模无监督学习建模,接下来验证模型在测试集上的表现,验证其泛化能力,最大难点风控建模无监督学习建模,最终模型10,1、全样本数据对模型重新拟合2、好坏样本区分度多算法测算:闵可夫斯基距离、.欧氏距离、标准化欧氏距离、曼哈顿距离、切比雪夫距离、马氏距离、夹角相似距离、汉明距离、杰卡德距离&杰卡德相似系数、互相关&相关距离、信息熵类脑.编辑距离、SKM距离自动学习,AUC指的是ROC曲线包围形成的面积,而ROC曲线是由不同的TPR和FPR值形成的曲线。对于一个确定的模型,TPR和FPR都是阈值的函数,当我们学习到一个阈值之后,TPR和FPR随之确定。因此,如何学习阀值阈值才能达到最经济的结果,就是一个非常重要的问题共线性检查、模型稳定性校验、严格的缺失值处理GBM算法还是Adaboost+RandomForest对模型很重要。,建议的传统模型,多方面数据的综合及独立应用征信数据,工行数据(穿透各个产品,如,信用卡,储蓄,按揭),第三方数据(电信,电力,会员,住址,教育,职称,等)分类(Segmentation)结合工行高管经验和统计分析,寻找最佳分类(人群特性,数据特征,或产品需要等)以便获得最准确的风险预估设计更好的衍生变量通过业务知识,建模经验和数学计算,构造大量更强更好衍生变量比如,i)原生变量信用额度和借贷金额虽对风险有一点预估能力,但是它俩的比率(信用额度使用率,指百分之几的信用额度已经用掉了;ii)借贷额增长速度(以今天的借贷额和六个月前的借贷额的比例。评估多种回归模型采用不同的变量输入方式(stepwise,forwardand、和backward)及对各种统计参数调整密切跟踪快速迭代定期检测模型表现。发现问题立即调整和重新建立模型,建议的实施路径,A)银行需求的理解1)对产品的认识2)对目标人群的了解(银行提出要求)3)对风控价格/成本的要求(风险承受度及利润目标)4)工行可以提供的数据B)建模的步骤,数据收集及整理,2.数据分析,3.模型建立,4.模型评估及选择,5.模型应用及落地,6.模型表现跟踪及反馈,7.模型调整优化及迭代,“双轨模型互补增强”:同时建立两套模型(传统模型vs机器学习模型)。以传统模型为主导-风险因子清晰客户容易理解以机器学习模型为“挑战者”-识别传统模型的漏洞和偏差两者并用行业领先,预测准确性客户需求,模型输出的计算对接审批系统及自动化,定期报告专人分析,采集梳理及质量检测,初步量化分析,调整模型参数重新建立模型,前端,中台,运营,后台,智能获客平台C01DSP平台C02DMP平台C03嵌入式智能获客平台C04金融超市C05儿童金融端,综合产品与风控方案平台M01身份验证平台M02征信解析平台M03反欺诈M04产品平台M05场景平台M06风控模型M07穿透资产工具,运营平台O01自动化审批O02智能尽调工具O03押品与保全O04智能催收O05贷后预警O06沙箱平台,F01开放银行平台,综合服务平台(助贷、融担、信保、催收服务管理与标准),技术平台,T
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年遥控器行业当前市场规模及未来五到十年发展趋势报告
- 支气管哮喘课件
- 擦皮鞋劳动课件
- 操作基础知识培训总结课件
- 2025年消费者权益保护知识试题附答案
- 2025年健康管理师之健康管理师三级高分通关题型题库附解析答案
- 2025年道路旅客运输驾驶员职业技能资格知识考试题与答案
- 2024年高等教育自学考试电子商务概论试题(含答案)
- 2024年公路水运交通工程试验检测师专业技能知识试题与答案
- 2024下半年玉林市玉州区事业单位招聘考试《综合基础知识》试题(附答案)
- 我心中的英雄:学生心目中的榜样
- 电竞赞助合同协议
- 委托代购协议合同协议
- 2024年下半年广西现代物流集团社会招聘校园公开招聘109人笔试参考题库附带答案详解
- 顶管施工事故应急预案Z
- JJF 2145-2024场所监测用固定式X、γ辐射剂量率监测仪校准规范
- 智研咨询发布:2025年中国脑机接口行业市场现状、发展概况、未来前景分析报告
- 2025年上半年广西北海市随军家属定向安置招考25人重点基础提升(共500题)附带答案详解-1
- 2025年标准房产中介服务合同范例
- 记背手册02:北京高考古诗文背诵与默写篇目(打印版)-备战2025年高考语文一轮复习考点帮(北京专用)
- 2025年中医推拿人员劳动合同范文
评论
0/150
提交评论