DataFun金融风控领域的大模型落地实践_第1页
DataFun金融风控领域的大模型落地实践_第2页
DataFun金融风控领域的大模型落地实践_第3页
DataFun金融风控领域的大模型落地实践_第4页
DataFun金融风控领域的大模型落地实践_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

演讲嘉宾:黄泓

1

背景

2

整体思路

3

案例

4

总结展望CONTENTSAkul

aku是一家主某省市场的互联网金融服务提供者,

服务内容包括

网上购物和分期付款,

现金贷,

保险等等。主要的应用场景包括金融风控,

电商智能客服以及电商推荐等等

无论

是在用户审核,

信用评估和反欺诈识别等环节,

单纯手工操作和业务规

则判断无法高效准确地处理大量的用户请求,

拦截各种黑产攻击总体目标:

构建基于各种技术手段的敏捷高效的智能风控系统,

应对各

种威胁,

不断提升用户体验Akul

aku

的业务涉及授信申请,

登录校验,

下单校验,

催收,

售后客服回访等多个业务环节

1

图像

KYC人脸核身

2

文本

:智能客服

3

语音

:客服质检

4

设备

:设备环境校验具体应用场景利用大模型,

我们期望进一步提高智能风控系统在前面说的各个业务环节

和各种数据形态上的效能

具体会通过构建一个智能体系统实现智能体系统构成[1]包括各种业务决策的知识,

通常固定在智能体的链的定义中业务数据和各种元数据,

存储在一种或者几种外部数据库中各种专用的业务模型和业务逻辑

包括各种图像模型,

NLP模型

等等

1

规划模块(

Planning)

2

存储模块(

Memory)

3

工具模块(Tools)引用:

[1]

hub.io/posts/2023-06-23-agent/总体思路利用大模型理解指令的能力和在对应语言承载的通识和泛化能

力,

增强特定环节的专用模型逐步将业务知识和决策是写死在固定的智能体链(

chain)

中,

构造对应的智能体角色,

如“数据分析师”,

“欺诈调查员”等

1

针对Tools的强化

2

针对Planning和

Memory的强化落地角度LLM

Agent1基于标注数据,

生成若干候选PromptAgent3LLMAgent2对生成的候选prompt进行打分排序基于选定prompt生成数据输入:

1)

人工的少量种子标注数据(2)

大量未标注数据输出:

NLP模型步骤针对Tools

的强化:

NLP模型优化

1

场景

客服对话历史(文本)

->用户是否需要特殊干预?Sample1:xxxxxxxxxxSample2:xxxxxxxxxxxxPrompt1:xxxxxxxxxxPrompt2:xxxxxxxxxxxx

3

效果人工标注量:

减少90%模型交付时间:

减少80%模型效果:

提升20%Prompt1:Youareahelpful

assistant,andyouareanexpertincustomerservice

…Prompt1is

moreappropriatefortherequirements.步骤2:

Prompt筛选与数据生成线上推理模型基于生成的数据

训练判别模型步骤1:

Prompt生成步骤3:

模型生成2针对Tools

的强化:

图像反欺诈模型优化判断人脸核身的图片是否包含恶意攻击[2]难点:

攻击者会不断变换攻击手段,

基于历史数据训练的模型

2

步骤[3]

3

效果人工标注量:

减少95%模型交付时间:

减少90%模型效果:

提升5%难以适应人工的少量种子标注图片

大量未标注数据多模态大模型(如mini-GPT4)

基于标注数据,

成描述Prompt

1

场景输入:

1)(2)基于选定prompt

筛选数据会人工迭代校验

多轮步骤2:

数据筛选线上推理模型输出:

图像欺诈判别模型判别模型基于生成的数据

训练判别模型类级别:

“Thisisaspoofface”步骤1:

Prompt生成样例级别:

“xxxxxxx”CLIP步骤3:

模型生成

VIT

•大模型承载的通识

用于生成训练数据•大模型的指令理解能力

:领域专家可以通过自然语言引导大模型,注入领域理解引用:[2]ZhangY,YinZ

F,

LiY,etal.Celeb

a-spoof:

Large-scalefaceanti-spoofingdatasetwithrichannotations[C]/puterVision–ECCV2020:16thEuropeanConference,Glasgow,UK,August

23–28,

2020,Proceedings,PartXII16.SpringerInternational

Publishing,2020:

70-85.[3]FangH,LiuA,JiangN,et

al.VL-FAS:

Domain

GeneralizationviaVision-Language

Model

For

Face

Anti-Spoofing[C]//ICASSP2024-2024IEEEInternationalConferenceonAcoustics,Speechand

Signal

Processing(ICASSP).

IEEE,2024:4770-4774.针对Tools

的强化:•

大量的标注工作量•领域理解难以注入数据

2

利用的大模型能力

1

针对的矛盾领域

模型人工针对Planning和Memory的强化:

欺诈调查助手用户11的授信申请资料x年龄:xxxxx职业:xxxx基于调查库表的简单查询与用户1关联紧密的u

id有

哪些?具体有哪些联系?关联u

id有:5,

7,

9这些u

id授信申请时共用同

一设备75938sx

1

场景

2

构造监管对消费分期的利率

上限要求是多少?年化利率不得高于xx%欺诈案件调查的copilot,

在对话中回答欺诈调查相关问题基于业务知识的一般问答针对关联团伙的查询意图识别参数解析知识图谱业务数据库领域文档

1

场景

针对日常的数据分析场景,

搭建数据分析的智能助手

2

构造针对Planning和Memory的强化:

数据分析助手针对Planning和Memory的强化:

数据分析助手

2

构造(1)

RAG

:基于提问,

检索数据血缘和业务信

息等(2)SQL生成与校验:生成SQL并校验,

根据错误信息迭代SQL(3)外部反馈

:(人类

用户或者其他agent)

1

场景

Text2sql

Agent的构造

2

利用的大模型能力•

文本生成和理解的能力•工具调用的能力

为了可靠性,

尽量做成固定的chain,

随着演进逐步放开•控制推理的复杂度

,业务流程尽量放在外部存储针对Planning和Memory的强化

1

针对的矛盾

3

主要应用形式Copilot=>逐步抽象和固化业务流程数据分析开发代码个案排查人工大量重复的工作

1

对员工个人以及模型构

建的提效

2

逐步将更多的业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论