版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DeepSeek如何重塑大数据:数势科技SwiftAgent的创新分享岑润哲/数势科技数据智能产品总经理DataFunTalk
#
2025引言:
DeepSeek的出现对于大数据领域的核心影响突破创新:数势科技SwiftAgent与DeepSeek-R1结合后的核心能力案例分享:金融行业数据智能应用思路分享规划展望:对数据应用产品与DeepSeek协同的未来展望01引言:
DeepSeek的出现对于大数
据领域的核心影响DeepSeek
V3/R1的到来,
对于大数据分析和应用领域,
是“天然的利好”具身智能未来10年生成式人工智能领域有望长出科技巨头的10大关键产业机会*营销娱乐社交游戏精确要求高数据分析办公A
I
医疗问答搜索A
I编程A
I教育专家服务基于原工作流的
Copilot基于新范式的
Autopilot对于大数据处理和分析场景而言,
DeepSeek
V3/R1带来四个方面的核心改变DeepSeek代码能力的
增强,对于前期数据
清洗与ETL过程极大利
好,如自动识别并处DeepSeek
R1的推理
和数学能力增强,大
大提升数据分析报告
的深度、逻辑性和准DeepSeek的代码能
力增强,可以支持
直接端到端提供交
互式仪表盘和动态DeepSeek
R1的推
理能力可以加速企
业级指标语义的构
建效率;
同时可以提升“人类语言”和
“数据语言”的连接
效率理数据中的缺失值和
重复项数据清洗语义理解数据可视化深度报告图表能力
确性Accuracy
Rewards的好处确保数据结论准确:
在数据分析报告生成中,数据的准
确性至关重要。
DeepSeek-R1-Zero
的accuracy
激励
最终使得R1在处理数据和生成报告内容时,以正确回答
问题为目标进行训练。
比如在分析销售数据时,模型可
以准确计算出销售额环比增长率等关键指标,避免出现
数据错误,从而为报告提供可靠的数据基础和结论依据。Format
Rewards的好处条理化推理过程:
format
激励要求模型将思维过程封
装在思维链内,在生成数据分析报告时,这有助于将复
杂的分析过程清晰地呈现出来。
比如在进行多因素分析
时,模型可以将每个因素的分析思路和计算过程有条理
地展示,便于读者了解分析的步骤和依据,增强报告的
说服力。DeepSeek-R1-Zero
RL训练过程中的准确度和格式激励,
天然利好深度数据分析报告场景Test-Timepute实现从What到How的跃迁multi-agent
multi-agent
interaction
interactionETLAgent:MetricAgent:解决数据清洗的问题解决业务语义构建与提取的问题multi-agent
interaction
Insight
Agent:
Report
Agent:解决数据到洞见的问题
解决洞见到结论/建议的问题DeepSeek
V3/R1的到来,
会让未来每一个企业拥有四个大数据应用相关的“数字员工”Insight
B(Attribution
Analysis)Insight
C(Rank
Analysis)Dataset
C(Multi
Metric/MultiDim)Dataset
B(Single
Metric/MultiDim)厂厂Data
Model
MetricDatasetInsightDataset
A(SingleMetric/Time-Series)Dataset
D(MultiModel/Multi
Metric/MultiDim)Data
SourceInsight
A(Trend
Analysis)ReportData
Source
DData
Source
AData
Source
CData
Source
BData
Source
EData
Model
AData
Model
BReport
AReport
CReport
BMetric
DMetric
AMetric
CMetric
BMetric
E什么时候适合用DeepSeek-R1,
什么时候更适合用DeepSeek-V3,
从数据洞
察的金字塔讲起Data
Discovery:
数据统计分析(如同环比、
占比、对比等)
Ex.“帮我看下今年10月不同分行的余额以及月环比增速,并对
增速进行降序排序“Ask
Data:
数据查询、数据检索、事务型查询Ex“帮我看下今年10月底余额”、“帮我查看下XX分行的
总资产”020304Data-Driven
Action
Plan:
核心指标整体复盘与建议输出
Ex.“帮我对今年10月份XX分行的业绩做个复盘“更适合由DS-V3模型快速进行意图识别和语义解析完成(“快思考”)
Data
Reasoning:
洞察归因分析、异常分析、趋势分析Knowledge
Ex.“帮我看下今年9月到10月的余额变化情况,
并做个归因分析“更适合由DS-R1等推理模型辅助完成(结合COT的“慢思考”)InsightFactsWisdom01大数据分析领域的
能力项类型R1-671BR1-distill-qwen32bQwen72b能力对比多步思考自我反思代码生成数学计算复杂决策任务分类实体抽取输入-输出性能R1-671B全参模型在数学、
代码、
复杂决策、
深度洞察等能力上领先其他模型,但相对而言输出速度
有限(目前R1还不支持通过入参控制思维链长度)
;
因此在进行大数据应用类产品设计时,建议考虑
多类型/多尺寸版本融合的方案R1-distill-qwen32b
or
Qwen72bR1-671B
全参版本02数势科技SwiftAgent与DeepSeek-R1结合后的核心能力数据洞察与总结的痛点:大量时间花费在导出数据到Excel里输
出结论:
"分析团队的日常就像Excel
的奴隶,时常花费大把时间将数据导
入、整理和分析,这种重复低效的工
作限制了我们对数据快速反馈的能力。"数据提取的痛点:SQL学习难度高:
"尽管我们有意愿
深挖数据背后的真相,但SQL的复杂
性让我们非技术人员望而却步。
时间都浪费在了查询语言的学习上
,
而不是洞察和行动。
"BI报表配置难度高:
"我们依赖BI工具来提
供数据的可视化,但每次都需要技术团队介
入来配置数据集和报表,它的复杂程度令人企业级数据分析的常见痛点数据分析的痛点:沮丧。
"数势认为,
基于指标语义层和大模型的数据AI
能分析新时代受众群体
=1%业务决策者财务等数据“依赖者”What受众群体
=15%
+BI分析师+业务分析师What
&
Why数据分析工具
Excel数仓+BI指标语义层
+
大模型数据消费者数据应用核心价值过往
当前
未来受众群体
=95%+业务全员+上下游合作伙伴What
&Why
&
How未来管理者/业务人员原始数据大模型的Agent架构结合指标语义层将加速数据民主化的进程管理者/一线业务员直达数据,
用数门槛降低,
提升企业经营决策与日常业务流中数据参与度
(民主化)管理者/业务人员数据分析师数据产品经理数据工程师原始数据DeepSeek
+
Agent架构ETL任务太多Semantic
Layer用不明白跑不过来教不明白现在共同维护BI数势科技SwiftAgent五大核心能力,
革新
Data
to
Insight
效率PC端与某著名企业端适配已适配各类国内外大模型基座,并且支持某著名企业
端和PC端等多端适配,支持文字与语音交互语义层确保准确性与安全性基于NL2MQL的实现方式,确保数据查
询准确性与安全性智能归因分析智能归因模型让用户对数据的理解从“What”跃迁到“Why”自然语言数据获取基于大模型赋能自然语言低门槛精准取数5
Core
Features智能数据报告生成能力让用户在30秒内快速获取业务结论报告总结与解读当企业业务指标出现波动时,
SwiftAgent利
用DeepSeek-R1的多维度数据分析能力,不
仅展示数据变化,还能深入挖掘背后的原因。决策建议更具前瞻性基于DeepSeek对因果推理数据的积累和企业
自身知识库,
SwiftAgent能够深度分析数据与
决策之间的因果关系某省市场拓展时,
它能综
合内外部数据,结合行业最佳实践和趋势预测,
提供多个可行的决策方案,并评估各方
案的潜在风险和收益。数势产品
全面适配
DeepSeek报告生成高效且优质用户只需提供报告主题和要求,
SwiftAgent便能利用DeepSeek-R1的动态思维链生成能力,在短时间内
整合相关数据,
自动生成结构清晰、
内容详实的行
业报告。
报告还能根据企业风格和语言习惯进行定
制,某省市人力和时间成本。数势科技SwiftAgent深度适配DeepSeek,
在四大方面带来产品能力飞跃SwiftAgent通过DeepSeek-R1的高级Coding生成和推理
能力,能够快速创建直观图表,还能推荐更合适
的数据可视化方式,使得非设计背景的人员也能轻松获得高质量的可视化成果,便于团队讨论和展示。可视化能力提升
智能归因解读更精准Detailed
Data
数势科技SwiftAgent深度适配DeepSeek后,
数据分析变得更“有理有据”了
Insightful
Report大模型思考过程白盒化数势科技SwiftAgent深度适配DeepSeek后,
前端流式输出思维链
效果API对齐API调用指标/标签查询
+数据分析因子归因参数解析归因分析场景指标推荐相似指标推荐元数据查询Text2Cod
eHM
API数据解读图表推荐解读知识库维度归因图表生成有了DeepSeek强大的代码能力,还需要Function
Call?为什么不直接让它端到端写代码呢?数据安全与隐私:企业数据往往包含敏感信
息,而调用封装的取数api,能在严格权限
控制下获取数据,保障数据安全。复杂业务逻辑处理:对于涉及多数据源整合、深
度业务归因分析等复杂场景,封装的api能更好
结合企业业务规则进行定制化处理,
DeepSeek生成的通用代码难以满足复杂多变的业务需求。稳定性和可维护性:封装的api经过企业测
试和优化,稳定性有保障。而
DeepSeek生成的代码可能因模型更新或不同版本差异出现兼容性
问题,维护成本较高。性能优化的针对性:企业封装的API在设计
时,可以针对特定的业务场景和数据规模进行深
度的性能优化。例如,对于高频次的数据分析任
务,
API可以通过指标数据加速、缓存机制、
分布式计算优化等手段,实现毫秒级的响应时间,
而
DeepSeek生成的通用代码很难直接达到这样
针对特定场景的高性能。TOT是否使用规划器基于Agent架构的技术选型极大提升复杂任务理解与规划能力基于大模型的理解和思考能力,实现基于自然语言的数据分析,并针对获取的结果数据进行智能解读与归因,提升经营分析效率R1在任务规划环节对复杂任务拆
解的能力尤为出色deep
see
lkFeedback:1.
Finish/fail2.
Result3.
Reward是否适用分析Agent短期记忆:会话上下文长期记忆:历史分析思
路否记忆调用外部工具/知识库/模型本身问答子目标分解ReAct用户Query工具调用COT指标行列权限校验规划是是LLM规划ResultAct否案例分享:金融行业数据智能应用思路分享03应用的核心产品能力行内领导可以通过自然语言
形式快速获取每日所需经营
数据,并支持智能生成可视
化图表自然语言数据查询根据行内常用分析维度与指标的因子关系,进行自动化
归因分析与建议生成,帮助
行领导快速发现数据异动的
原因,形成业务闭环。归因分析基于明细数据自动进行趋势
分析、
占比分析、排序分析
和异常值分析等工作,并将
生成的结果以清晰报
告形式进行展现报告生成客户痛点数据查询效率低:数据需求
无限,开发资源有限,需求排队严重;指标归因慢:主要依赖分析
师人工在BI工具或Excel中进
行维度与因子下钻,手工挖
掘洞见数据解读靠人工:领导每
次对于大量表格表示看不
过来,想直接知道结论和哪些指标出了问题使用部门项目一期服务重点总行领导分支行领导项目二期服务重点业务分析师使用场景净收入分析贷款情况分析存款情况分析同业负债分析成果概览
原来驾驶舱里的数据报表偏固化
旦行领导想灵活组合查询的时候,
还得由专门的分析师去从底表取数,分析效率不高;上线数势智能分析平台之后,
获取行内核心经营指标的成本降至最低,并且更多把数据里有价值的洞见帮领导以结论和报告形式总结出来了,这就是我们和数势合作中最大的价值“”一,某头部城商行率先集成DeepSeek,
支持领导实现各类核心经营指标智能分析与报告生成90%+上线一周领导
主动问询数量100%行领导分析
需求满足度指标语义理解准确率1200+数据查询
效率从询问到
结果<6秒x50数
据
需
求
需
求
排
队①
②财富管理团队…↓t…
…
指标加工
黑盒子指标口径不一致:各部门指标的数据来源不同、指标口径定义也不同
,
拉齐业务口径沟通成本高、技术口径难梳理,下游应用五花八门,分析决策难数据资产是个黑盒子:数仓模型与指标无清晰映射,指标定义全靠开发人员文档记录,上游指标变更影响哪些下游应用,追溯过程复杂难回答杂乱数据源数据工程师痛点1:
数据需求无限,
开发资源有限,
需求排队严重痛点2:
指标口径不一致,
定义黑盒,
无法高效复用某头部城商行在数据分析层面的核心痛点数据应用结果表数仓案例背景实施方案核心场景实施流程•指标定义黑盒子•无法高效复用•烟囱林立•指标口径不统一数③
据
开
发开发完成IT部门信用卡团队管理团队代发团队信贷团队↓↓↓
↓④用户
交互式数据查询数据查询任务DeepSeek能力意图理解/任务规划指标匹配及二次分析Agent规划层指标语义层映射数据层•
预设数据指标的定义与管理,避免业务理解对不齐•
借助思维链分析与歧义反问,提升泛化性,避免直接从文本到SQL②
自动化数据处理与语义层构建•
通过行业指标库与DeepSeek自动化构建业务语义层•
Top95可实现从检索到回答的秒级出数③
学习成本低,
分析推理过程白盒化•
一站式定义-自动开发-管理指标语义,
门槛极低•
思维链展示,实时展示分析洞察路径,大幅提高分析结果可信性④
数据安全可保障•
利用指标的权限管理能力,对数据与指标进行精细化的权限管控,实现数据
查询的安全可控⑤
深度推理与分析洞察•
高级数据分析问题,可通过精准的指标进行关联与展示•自动沉淀行业黑话与Know-how,减少对微调的依赖,全面提升数据洞察的
深度与广度数势科技SwiftAgent能力升级,
产品结合DeepSeek
+指标语义层为核心的
Semantics,
在准确率、
推理洞察深度和智能应用等层面提供更优方案企业数字化经营各场景:
智能问数、经营分析、报告洞察、决策建议等案例背景实施方案核心场景实施流程①
数据可信,
准确率明显提升查询结果输出指标语义定义企业数据平台数据查询指标查询+小模型能力场景数据分析诉求任务难度系数难点NL2SQLNL2Semantics+
Agent1最近7天客户的每日总资产是多少?枚举值转维度可实现可实现2XXX基金今年累计卖了多少?枚举值转维度指标语义模糊可实现但不准可实现且准确3今年XX基金的申购额与赎回额分别是多少?指标语义模糊跨表多指标查询难实现可实现且准确多任务规划结果排序指标取数衍生计算可实现但不准可实现且准确枚举值转维度多维归因同环比计算报告解读难实现可实现且5华东区XX基金的申购金额周环比为什么下降了?数势科技采用的NL2MQL+Agent核心技术架构的优势XX基金公司最近3个月销量最好的Top3基金是哪些?
这三个分别的保有量是多少?帮我解读下案例背景实施方案核心场景实施流程日维度上
卷年维度4以该金融机构的数据应用场景为例,通过自然语言指标取数,系统能够快速准确地获取相关数据;智能归因分析则帮助找出业务发展中的关键因素和问题
所在;
自动报告生成则以直观的方式呈现分析结果,为银行的决策制定、风险管理、业务优化等提供有力支持。这些场景展示了在银行业中运用自然语言
处理和数据分析技术的重要性和实用性,有助于提高银行的运营效率和决策科学性。财务部门经常询问“各项业务对利润的贡献比例是怎样的”,系统通过智能归因和自动报告生成,综合考虑各项业务的收入、
成本、
风险等因素,计算出各项业务对利润的贡献
比例,并以图表和报告的形式展示,帮助财务部门进行成本控制和利润优化客户行为分析运营团队提出“客户流失率与哪些因
素相关”,系统进行智能归因分析
,
找出导致客户流失的关键因素,如
服务质量不佳、产品缺乏竞争力等,
为银行改进服务提供依据。分支行业绩对比领导想要比较各分行的贷款业务总
量,询问“A分行和B分行今年的贷
款业务总量对比如何”,系统通过自
然语言取数与报告生成,为总行领
导提供业务指导提供参考。理财产品销售分析理财经理需要了解上个月理财产品
的销售情况,询问“上个月哪几款理
财产品销售额最高”,系统通过自然
语言指标取数,帮助理财经理了解某省市场需求,优化产品推荐策略常见问题如:“信用卡逾期率最高的客户群体
是哪些”,系统通过自然语言交互形式,从信
用记录、
消费行为、
收入情况等多维度数据,
找出逾期率最高的客户群体特征,
以便银行
采取针对性的措施降低风险在评估贷款风险时,询问“近期贷款违
约主要集中在哪些行业”,利用智能归
因分析,找出贷款违约集中的行业领
域,为信贷部门调整信贷政策、加强案例背景实施方案核心场景实施流程0405030201风险管理提供重要依据。●信用卡业务分析财务分析风险评估061
指标异动推送
【对公贷款余额】
出现指标
异动,通知领导进行关注我行今年每个月按分支行和客户类型的对公贷款余额如
何?趋势是怎样?3
归因分析哪个分行下降的最多,哪
些客户类型下降了4
结论输出帮我对上面数据形成一个
总结报告吧“银行领导的一天”:
利用SwiftAgent分析数据并生成洞察报告案例背景实施方案核心场景实施流程异
动
预
警
归
因
分
析2
多维度分析关心的问题?多维分析数据解读用户
开始↓
数据溯源
数据入湖/仓
数据治理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信用风险分析及报告编制协议
- 保温材料生产设备采购合同协议
- 线上数据标注兼职协议-2026年风险预防与措施
- 手机通讯信息安全防护合同
- 2026年养老院消毒隔离与感染控制安全培训课件
- 线上平面设计作品委托制作合同
- 期权交易收益分配服务2026
- 2026年抗菌不锈钢医疗器械应用
- 2026年雨水收集系统设计与经验分享
- 肝细胞癌淋巴转移:多因素解析与差异化治疗策略的临床剖析
- TCARM 002-2023 康复医院建设标准
- 2024年西藏开发投资集团有限公司招聘笔试参考题库含答案解析
- 新零件成熟度保障MLA培训
- 会计师事务所保密制度
- 写生基地建设方案
- 和大人一起读:《狐狸和乌鸦》
- 清洁环境-爱我校园-主题班会(共18张PPT)
- 四川省河长制湖长制基础数据表结构与标识符(试行稿)
- 维克多高中英语3500词汇
- 顶板危险源辨识及防范措施
- LED照明培训教程课件
评论
0/150
提交评论