金融业大模型应用指南_第1页
金融业大模型应用指南_第2页
金融业大模型应用指南_第3页
金融业大模型应用指南_第4页
金融业大模型应用指南_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融业大模型应用指南3.

金融业大模型应

用指南2.

金融机构拥抱

AI

的正确姿势4.

Chat

BI

在金融行业的应用1.

人工智能简史目录CHAPTER

1人工智能简史从AI历史看算法、算力与数据对行业的影响神经网络一种基于神经网络及网络间连接机制与学习方法的智能模拟方法,把人的智能归结为人脑高层活动的结果,强调智能活动是由简单的单元通过复杂的相互连接后并行运行的结果。遗传算法与强化学习一种基于“感知-行动”的行为智能模拟方法。认为行为是有机体适应环境变化的各种身体反应的组合,它的理论目标在于预见和控制行为。规则与决策树一种基于逻辑推理的智能模拟方法,认为人工智能源于数学逻辑,认为人类认知和思维的基本单元

是符号。人工智能三个主要流派连接主义符号主义行为主义符号逻辑与专家系统时期统计学习与算力萌芽期深度学习与数据爆发期

算法架构革命期

算力军备竞赛与数据瓶颈期算法主导的"纸上谈兵"阶段算力撬动算法边界数据定义AI天花板Transformer重塑游戏规则回归数据本质人工智能发展简史:算法、算力、数据交相辉映1950s——1980s

1990s——2000s

2010s——2016第三次AI黄金时代第一次AI黄金时代

第一次AI低谷

第二次AI黄金时代2021——第二次AI低谷2017—20201997深蓝击败卡斯帕罗夫1956达特茅斯会议1970s早期专家系统1966Perceptrons2017Transformer1956感知器模型2024DeepSeek2010ImageNet1945图灵-ACE2015AlphaGo1986反向传播2022ChatGPT2012AlexNet1995SVMs2020GPT32019GPT22014GAN2018GPT1998N1989UAT•K近邻(K

Nearest

Neighbor,

KNN)•

朴素贝叶斯(Naïve

Bayesian)•

决策树(DecisionTree)•

线性回归(Linear

Regression)•Logistic回归(LogisticRegression)•

支持向量机(SupportVector

Machine,SVM)•

神经网络(ArtificialNeural

Networks,ANN)•

隐夫(HiddenMarkov

Model,

HMM)•

遗传算法(GeneticAlgorithm)第三层的一些神经元负责感受黑夜里的黄

色烛光、鸡蛋黄、高光。主流机器学习算法2012年多伦多大学的Krizhevsky等人构造了一个超大型卷积神经网络,有9层,共65万个神经元,6千万个参数。第五层的一些神经元可以识别出花、圆形屋顶、键盘、鸟、黑眼圈动物。第二层的一些神经元可以识别更加细化的纹理,比如布纹、刻度、叶纹。第四层的一些神经元负责识别萌狗的脸、七星瓢虫和一堆圆形物体的存在。最终输出是1000个类的图片,比如小虫、美洲豹、救生船等等第一层神经元主要负责识别颜色和简单纹理。这时候,我们不得不提到和ImageNet

2007项目启动每类收集1000,共2.2w类,每小时10美元,预计花19年

2007Game

ChangerAmazon

MechanicalTurk众包数据标注2006思维萌芽学界卷算法,想找更好的数据,能反映真实的世界

偶遇WordNetAlex2012AlexNetKrizhevsky提出的首个应用于图像分类的深层卷积神经网络ILSVRC1000个类别,140万训练算法前两年都是支持向量机167个国家5万名标注者手工标注3次验证发布10亿底图1500万张2010

2009数据标注的故事CHAPTER

2金融机构拥抱AI的正确姿势2025年春节后……几乎所有的科技老总都接到领导k在哪里?AI热潮下的冷思考-FOMO心态与金融行业痛点FOMO——恐惧错失(Fear

of

Missing

Out)导致重复造轮子、忽视业务本质、技术债务堆积只看别人不看自己过于关注在行业里的地位和发声,不考虑解决实际问题需精准定位业务需求,选择合适的结合点。人无我有人有我优不管有没有用,先得有解不解决问题先不说,新闻稿先发照猫画虎脱离实际看到他行案例或者供应商方案,直接复制到本地,不考虑适用性未充分评估可能导致资源浪费。只仰望星空不脚踏实地管理层关注快速创新迭代基层疲于提升基础数据质量和完成手工报表银行拥抱AI误区-为AI而AI金融机构拥抱新技术误区缺少高质量数据元数据缺失、数据治理不深入可解释性要求高为什么批?为什么拒?规则明确的if

then

else评分卡,贷前准入流程自动化/智能化流水线、

RPA模式识别和洞察反欺诈、反洗钱、信用评估、精准营销交互模式变革对话式交互学习成本降到最低自主决策的Agent无人驾驶、机器人AI不擅长/不适合不是所有事情都适合用AI来解决AI擅长/适合2341231人工智能三大支柱,又回到了数据为代算法——平民化开源工具链爆发Hugging

Face开源库覆盖90%主流模型,开发者可1小时部署行业微调大模型即插即用阿里云、AWS等提供API调用服务,企业无需自研基础算法算力——多元化异构计算崛起国产昇腾芯片+寒武纪思元组合方案,性能达A100的80%云端弹性供给各类云平台按Token付费行业knowhow数据垄断特斯拉累计2.5亿英里自动驾驶数据,超第二名10倍经验与知识可传承数据-

信息-

知识-

智慧,大模型是知识沉淀的最佳载体大支柱数据——孤岛化技术能力•产品本身的灵活性、稳定性•性能、用户友好度人才体系•数据人才/AI人才培养与评估•数据文化/AI文化建设数据体系/知识体系•

自顶向下、分层设计的数据架构•完整的指标体系,完善的管理流程数据治理

跨层取数问题指标体系

数据架构指标口径不一致数据意识与文化数据标准问题水面之上

可见的冰山一角水面之下不可见的深层次支撑面对AI,除了随波逐流,

我们能沉淀什么?——构建金融行业"冰面下的底层能力"智能投顾知识库对话机器人智慧审计ChatBIAI需要的不仅仅是数据,最终希望沉淀的是经验、知识

知识反向指导数据收集BI工具

数据是“点”,信息是“线”原始、未加工的符号或记录,无上下文和意义人

信息是客观事实,经验是主观总结整理、归类、分析后,赋予意义和目的用户浏览基金3分钟,未下单用户对基金有兴趣用户连续转账3笔4999反复实践获得的技能或认知用户交风险经验

=个体隐性认知知识

=显性、可复用体系此类用户有可能被

电诈或盗号此类用户推送优惠

券后转化率提升建立模型自动触发促销AI建立模型自动阻断……规律或理论…………要用AI解决的业务问题究竟是什么?一定要AI吗?别的技

术行不行?人工智能应用灵魂六问合规上,安全上,体验上有没有风险?我们选择哪一种技术栈?我们的数据数量和质量能否支撑?4W2HHow

much?With

What?What

if?ROI是多少?划算吗?Why?What?How?CHAPTER

3金融业大模型应用指南主要内容监管文件行业标准、规范工商数据&其他公开数据公网版DeepSeekor其他AI产品防火墙针对大量的监管合规要求,批量、快速的审核合同文本、协议条款、用户授权文本等,辅助人工审核,大幅提升审核效率,如江苏银行合同质检场景应用。实时分析社交媒体与新闻,识别潜在风险(如客户投诉趋势预测、企业客户舆情风险

预警等)整合财报与舆情数据,DeepSeek自动生成

初步分析框架,显著提升报告编制效率应用场景-

内容采集与生成:内外AI分离,合规前提下保持数据实时性互联网/公有云金融机构内网其他银行采购数据,如公安司法、风险多头客观数据:交、客户数据尽调报告生成合规审查舆情监控私有云版DeepSeekor其他AI产品流程数据:流程规范、制度等主观数据:业务知识、经验等合规审查智能化自动化尽调报告舆情监控防火墙如何实现?模型蒸馏CHAPTER

4ChatBI在金融行业的应用模糊的预测vs精确的传递ChatBI≠AI,而是AI的一种企业级应用ChatBI是另一类ANI应用,和GenAI“生成”内容不同,希望把“准确的”数据带给用户分别解决特定领域问题,并不等价1就是12就是2人类反馈强化学习RLHF

不一定最正确预测Predict

nexttoken

可能正确无幻觉Chat

BI

是一个偏正短语,核心还是BI,

而非Chat人类最喜欢的答案已存在的特定指标精准•

切词后指标和维度可识别•

结果不对可以直接调整指标或维度•

也可继续通过多轮问答追问•

先匹配规则模型,毫秒级返回;•

少量请求通过大模型,返回DSL,复用BI能力•

仅需7B“小模型”,性能足够,成本可控•

大模型本身的推理耗时较长•

大模型生成的SQL,未优化,容慢查询模型尺寸越大,效果越好,但成本越高•

上海地区销售明星卖出的最高三款理财平均利率是多少?•

就算某次写对了,不能保证次次写对……

而我们为什么选择NL2DSL的路线?•

结果以可视化方式展示,指标、维度、表清晰可见•

继承权限控制,通过封装接口访问数据库•出来的结果需要懂业务+懂SQL的人员验证准确性•SQL注入、死锁、权限控制NL2DSL+规则模型不完全依赖大模型,性能优,成本低

完全依赖大模型,性能差,成本高

直接操作数据库,存在安全风险

人员要求高,懂业务+懂SQL由BI通过封装接口访问数据库,

安全可控

业务人员可理解,不需要懂SQL

复杂问法可识别,可调整

复杂问法转换困难NL2SQLu

“找个数好麻烦,得多个看板来回找,要不就筛选条件一堆”u

“出差在外想着急要找个数,开电脑是真不方便”u

“提个取数需求,等了好几天,我都忘了当时怎么思考的了”u

“我记得有个看板里面有我要的数,在哪来着?”u

“我没有分析思路,不知道怎么用好BI”u

“我只想做个汇报,怎么能快速制作一个看板”u

“需求一直堆积,人力不够,加班加点做不过来”u

“筛选条件做少了不够用,完整收集需求又太困难”u

“已经给业务买了账号,他们还是不肯学不肯用”u

“有的看板生命短,业务看两次就不看了,早知

道当初不固化了”u

“领导开会找不到数,总是开会拉上我们临时给写SQL”银行数据分析下沉现状与面临痛点:需求多、难找数、有门槛、没思路“BI是好工具,但我确实太忙了,没那么多精力,只想简单找个数,做个汇报,怎么办?”“看板做到头了,取数需求还茫茫多,业务不愿意学BI,

IT又要降本增效,怎么办?”业务说:IT说:提升数据管理效率历史沉淀的报表、指标、看板,通过对话快速检索简化复杂看板使用直接对着看板问数,无需选择筛选条件等复杂操作零门槛直接上手0上手门槛,对话式问数秒出答案,打开收集随时随地都能问秒出答案,告别等待秒出答案,不再经历漫长等待,保证业务思考连贯性分析思路启发用户可将对话作为入口,按步骤自助完成分析闭环快速制作仪表板选择性保留答案,一键自动生成仪表板,可二次编辑、协作3大场景如何解决四大痛点需求多高频查看,低频分析,基层容错率高没思路复杂业务问题应该从什么视角分析?有门槛学习新工具带来心理负担难找数100个指标里只想看2个全局资产检索——找数不求人业务自助取数——送数下基层业务自助分析——分析如有神大量真实需求,以用促建•一线众多用户最真实的使用反馈•

自然沉淀形成具有优先顺序的数据需求清单•抓住主要矛盾,解决20%的数据问题,满足80%的需求基层容错率高•

错一次两次可以接受•结合产品特性,可以方便的修改为自己想要的数据为什么选择“送数下基层”?•基层需要的数据不多,但是频率很高•在大量报表和看板中只占一小部分•只希望快速确认,不需要深入分析查数频率高,分析诉求低.-

数据BP、数据工程师领导业务销售、客户经理售后客服财务分析师投资分析师不如写SQL快频次高高频查看数据情况关联业务价值数据跟业务价值或目标有直接关联性指标聚焦场景涉及指标范围比较集中,不会大量发散,数据链路短化固定时间需要关注数据的变化趋势重分析侧重数据分析,查看数据相对频率很低无业务目的数据跟业务目标关联很弱或者暂不明确链路复杂数据链路特别长、涉及相关维度较多容数据稳定在很长时间数据都不太会出现变化员工查数频率低

员工看数频率高员工人数少o

.员工人数多

BI覆盖

BI不为什么基层作为首批目标用户?「问数」场景特征总结企业各职能员工的数据需求低

员工

平高这个月排名第一的分行是哪家监管要一个数,你帮我查一下为什么存款还是起不来我这个月的业绩是多少我上个月的排名是多少高

员工数据分析诉求低商业分析师不如拖个看板快●项目经理运营/归因型(诊断性分析)拆解指标,建立体系,找到根因预测型(预测性分析)利用体系,以小见大,见微知著统计型(描述性分析)展现数据,了解现状,发现问题决策型(处方性分析)直面问题,督办改进,

完成闭环BI分析可分为4个层次统计型、归因型、预测型、决策型BI分析4层次业务黑话•

笨办法:做配置表模糊匹配•

针对所输入的问题进行提前阅读,模糊字段会触发联想,匹配字段枚举值•

若干次优解作为推荐问题备选,模糊语义场景下对齐提问意图统计型-

Fine

Chat

BI送数到基层划定范围•

基于主题下的模型数据进行问答,提问中可以方便地进行主题和模型的切换预测型决策型归因型统计型纯基于大模型的技术架构规则模型+大模型BadCases的修正主要依赖训练,而训练存在对于

BadCases调整响应速度快幻觉的现象难以规避,在简单问题都有可能会出错,比如去年识别为23年可以在规则模型中沉淀“问法”,在大模型幻觉现象的重灾区做映射,提升精度大模型对问题的响应速度不确定,一般是秒级语义明晰问题毫秒级响应用量扩大后对模型的大小会有更高的需求规则模型是以CPU为单位计算的消费级–问答取数技术逻辑决策型统计型统计分析

数据解释

下钻分析归因型分析:维度归因预测型归因型归因型分析:维度归因,

自动生成报告预测型决策型统计型归因型第二维度:间接影响申请总量

-6%转化率40%通过率

1%转化率76%户均额度

0.5%户均额度xxx万户均额度使用率

-2%使用率XX%第三维度:渠道/产品/客群线上申请总量

-9%XX万线下申请总量

-1%XX万A产品通过率

1%通过率YY%B产品通过率

-1%通过率YY%A客群户均额度0%XXX万B客群户均额度

1%YYY万户均交

-1%XXX笔笔均交

-5%YYY万归因分析结果通过归因分析,发现线上申请总量过低、笔均交低,需要分析具体线上各渠道申请变化情况,是否有渠道终止合作等;以及笔均交变化情况,是否有渠道或产品设置了交下一步:分析思路配置,

分析经验沉淀KPI

第一维度:直接影响卡数量

同比-5%透支余额

同比-10%户均余额

同比-5%户均额度使用率YY%户均额度XXX万户均额度XXX万申请总量XX万卡量增长YY%通过率YY%风管指标价值树

3.13.7

研发管理险理分层催收

Vintage分析营销

审批

授信

交易对账还款促动支促分期预警促活失效持有/复购赎回/支取沉睡潜在客户新客户成熟客户衰弱用户失活用户流失用户户营分层/分类/分群

AU

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论