计算机-DeepSeek惊艳世界算力与应用将迎来结构性变化_第1页
计算机-DeepSeek惊艳世界算力与应用将迎来结构性变化_第2页
计算机-DeepSeek惊艳世界算力与应用将迎来结构性变化_第3页
计算机-DeepSeek惊艳世界算力与应用将迎来结构性变化_第4页
计算机-DeepSeek惊艳世界算力与应用将迎来结构性变化_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

l

DeepSeek近期成为科技圈最炙手可热的明星企业:

DeepSeek近期分别发布大模型DeepSeek-v3和推理模型R1,前者在大模型主流榜单的开源模型中位列榜首,并与世界上最先进的闭源模型不分伯仲;后者性能对标OpenAI的o1正式版,在数

学、代码和自然语言推理等任务上表现卓越。以上两个模型均通过算法和架构的创新,大幅降低了训练成本和推理成本,为AI技术的普及与创新作出了卓越的贡献

DeepSeek相关模型自从推出后,立刻占据全球科技头条并引发巨大关注,我们认为,DeepSeek呈现出的算法创新、性能表现、开源属性等多重因素,将对AI应用

与算力行业产生深远的影响。lDeepSeek在模型训练与推理中采用了多项技术创新:DeepSeek-V3实现了多项工

程技术上的创新,包括通过FP8精度训练、DualPipe双向流水线等技术降低训练成

本,通过优化MoE负载均衡、多头潜在注意力机制(

MLA

)来降低推理成本,并通

过多Token预测(MTP

)以及模型蒸馏来进一步提升模型性能,最终用极低的成本完成了训练过程,与此同时推理的成本也较其他模型有大幅下降。而

R1-Zero的目标是验证纯RL能否激发模型的自主推理能力,探索无监督强化学习的潜力,而R1

则通过数据引导+多阶段优化,平衡推理性能和实用价值,目标是打造更符合人类偏好的通用推理模型,两个模型均实现了较为理想的效果。lDeepSeek将对AI算力与应用产生结构性影响:

由于DeepSeek-V3

、R1等模型通过算法与架构层面的多重创新大幅降低了训练端算力消耗,不过我们认为,在各模型公司仍致力于训练出性能更强大模型的目标指引下,庞大的训练集群将仍然被产业所追逐,训练算力长期看仍有前景和空间。而推理算力的需求空间则更为乐观,我们认为推理成本的大幅下降将带来需求更大幅度的增长,而在这样的过程中,算力需求结构可能将会改变,而美国如果进一步收紧AI芯片供应,则可能对国产芯片形成利好。而另一方面,此前AI应用的普及及其商业化还存在一定的困难,一方面在于模型性能仍然没法满足众多场景的需求,尤其是在推理能力和多模态环节,另一方面则是闭源模型性能领先但API调用的成本过高,影响了AI应用的大范围普及,我们认为,DeepSeek

的强推理能力、低算力成本、开源属性,使得其对AI应用的普及有望发挥重要的作用。lB端企业级应用,建议关注金山办公、鼎捷数智、泛微网络、汉得信息、软通动力、上海钢联、合合信息、新致软件、每日互动。l垂直行业应用领域有较强优势的企业,建议关注科大讯飞、焦点科技、润达医疗、

同花顺、卫宁健康

。lAI工具类应用,建议关注彩讯股份、虹软科技、万兴科技、福昕软件。l国产算力及算力服务企业,建议关注海光信息、寒武纪-U、中科曙光、云赛智联、

安博通、首都在线、优刻得-W

。风险提示技术落地不及预期;政策落地不及预期;美国进一步制裁风险;竞争激烈导致变现能力

下降。DeepSeek惊艳世界,算力与应用将迎来结

构性变化我们认为

AI

应用正逐步进入落地期,有望呈现较多的投资机遇,建议投资者关注行业整

体性机会,而国产算力及推理算力服务企业,也将从AI应用繁荣中受益。核心观点

字节加速AI

落地、小米、理想"All

in

AI"AI

应用前景广阔、自主可控已是大趋势:计算机行业2025年度投资策略AI

应用落地曙光已现2024-12-292024-12-272024-11-18投资建议与投资标的浦俊懿

S0860514050004行业研究

|

深度报告

计算机行业有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。看好(维持)报告发布日期

2025年02月04

日国家/地区

中国计算机行业行业目录引言

...............................................................................................................

4一、DeepSeek-V3、R1模型推出后“火”遍全球

..............................................

41.1

DeepSeek-V3性能表现不输全球顶尖模型

...................................................................41.2

R1模型实现了比肩OpenAIo1的推理能力

..................................................................51.3

DeepSeek-V3

、R1模型在产业中引发巨大反响

...........................................................7二、DeepSeek模型训练与推理技术创新解析

................................................

82.1

DeepSeek-V3模型采用了多项创新技术......................................................................82.2

R1-Zero与R1模型尝试强化学习边界.......................................................................

10三、DeepSeek将对AI算力与应用产生结构性影响.....................................113.1

DeepSeek模型有望引发算力需求与市场结构变化.....................................................113.2AI应用有望在高性能、低成本模型支撑下繁荣

...........................................................

13四、投资建议与投资标的.............................................................................15五、风险提示

...............................................................................................16有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化2图表目录图1

:DeepSeek-V3在多项评测中成绩领先

................................................................................4图2

:DeepSeek-V3在各类测试集上的表现................................................................................5图3:DeepSeek-V3API服务价格具备很强的吸引力.................................................................5图4

:DeepSeek-R1在推理能力上比肩OpenAIo1.....................................................................6图5:基于

R1蒸馏的小模型性能超越OpenAIo1-mini................................................................6图6

:DeepSeek-R1

API服务定价继续大幅低于OpenAIo1.......................................................7图7

:DeepSeek-V3模型训练仅需要278.8万GPU小时训练资源

..............................................7图8

:DeepSeek成为全球增速最快的AI应用

.............................................................................8图9:DeepSeek发布后下载量增长迅猛

.....................................................................................8图10

:DeepSeek-V3模型基本架构.............................................................................................8图11

:DeepSeek-V3采用FP8为主的混合精度训练方法............................................................9图

12:多Token预测(MTP

)模块结构示意............................................................................

10图13

:R1-Zero由基础模型直接进行强化学习训练而产生

.........................................................

10图14

:DeepSeek-R1-Zero训练期间

AIME准确率....................................................................11图15

:DeepSeek-R1-Zero在RL过程中的平均响应长度(输出长度不断增加)......................11图17

:“杰文斯悖论”指出成本下降将刺激资源需求更大增长

......................................................

12图18:硅基流动x华为云联合推出基于昇腾云的DeepSeek

R1

&V3

推理服务.......................

13图19:AI产品榜全球

Web端访问前

15情况(24年12月)

....................................................

14图20:AI产品榜全球APP端访问前

15情况(24年12月)

....................................................

14图21:2024年全球

AI产品付费用户规模

..................................................................................

14图22:short-CoT模式下,k1.5模型多方面能力领先...............................................................

15图23:long-CoT模式下,k1.5模型多方面能力比肩o1............................................................

15图24

:Qwen2.5-Max测试结果领先各类指令模型

.....................................................................

15图25

:Qwen2.5-Max表现优于各类开源模型............................................................................

15有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化3引言DeepSeek

近期分别发布大模型

DeepSeek-v3

和推理模型

R1,前者在大模型主流榜单的开源模

型中位列榜首,并与世界上最先进的闭源模型不分伯仲;后者性能对标OpenAI的o1正式版,在数学、代码和自然语言推理等任务上表现卓越。以上两个模型均通过算法和架构的创新,

大幅降低了训练成本和推理成本,为AI技术的普及与创新作出了卓越的贡献。我们认为,DeepSeek呈

现出的算法创新、性能表现、开源属性等多重因素,将对AI

应用与算力行业产生深远的影响。一

、DeepSeek-V3

、R1模型推出后“火”遍全球1.1

DeepSeek-V3性能表现不输全球顶尖模型2024年

12月26

日,杭州深度求索(DeepSeek

AI

)发布

DeepSeek-V3并同步开源,据介绍,

DeepSeek-V3

多项评测成绩超越了

Qwen2.5-72B

Llama-3.1-405B

等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o

以及Claude-3.5-Sonnet不分伯仲。具体而言,DeepSeek-V3在知识类任务(MMLU,

MMLU-Pro,

GPQA,

SimpleQA)上的水平相比前代DeepSeek-V2.5显著提升,接近当前表现最好的模型Anthropic公司于2024年10月发布的

Claude-3.5-Sonnet-1022;在长文本评测(DROP

、FRAMES和LongBenchv2

)方面,V3平均

表现也超越其他模型。在算法类代码场景(Codeforces),V3

远远领先于市面上已有的全部非o1

类模型,并在工程类代码场景(SWE-Bench

Verified)逼近

Claude-3.5-Sonnet-1022

。而在

美国数学竞赛(

AIME

2024,

MATH

)和全国高中数学联赛(CNMO

2024)上,DeepSeek-V3大

幅超过了其他所有开源闭源模型。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图

1

:DeepSeek-V3

在多项评测中成绩领先数据来源:

DeepSeek

微信公众号,东方证券研究所4另外,

DeepSeek-V3

通过算法和工程上的创新,将生成吐字速度从

20TPS(Transactions

PerSecond每秒完成的事务数量)大幅提高至60TPS,相比V2.5模型实现了3倍的提升,可以带来更加流畅的使用体验。同时,模型API

服务定价也将调整为每百万输入tokens

0.5

元(缓存命中)

/

2

元(缓存未命中),每百万输出tokens

8元,因此,V3模型在性能实现领先的同时,定价大幅低于市面上所有模型,性价比优势明显。1.2

R1模型实现了比肩OpenAI

o1的推理能力2025年1月20

日,DeepSeek再次扔出重磅炸弹,发布了推理模型R1,该模型在后训练阶段大

规模使用了强化学习技术,在仅仅使用极少标注数据的情况下,极大提升了模型推理能力,在数

据、代码、自然语言推理等领域均实现了比肩OpenAIo1模型的能力。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图3:DeepSeek-V3API服务价格具备很强的吸引力图2

:DeepSeek-V3在各类测试集上的表现数据来源:

DeepSeek

微信公众号,东方证券研究所数据来源:

DeepSeek

微信公众号,东方证券研究所5除了开源相关模型外,DeepSeek-R1

上线API,对用户开放思维链输出,服务定价为每百万输入

tokens

1元(缓存命中)/4元(缓存未命中),每百万输出

tokens

16元,与OpenAIo1API

调用相比,继续保持超高的性价比。与此同时,DeepSeek还上线了APP并更新官网,打开“深度思考”模式,即可调用最新版DeepSeek-R1完成各类推理任务。DeepSeek不仅开源了R1-Zero和R1两个660B模型,还通过

DeepSeek-R1

的输出,蒸馏了6

个小模型开源给社区,其中

32B

70B

模型在多项能力上实现了对标

OpenAI

o1-mini

的效果。

同时,DeepSeek

还修改了产品协议,支持用户进行“模型蒸馏”,即允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图5:基于

R1蒸馏的小模型性能超越OpenAIo1-mini图4

:DeepSeek-R1在推理能力上比肩OpenAIo1数据来源:

DeepSeek

微信公众号,东方证券研究所数据来源:

DeepSeek

微信公众号,东方证券研究所6图6

:DeepSeek-R1API服务定价继续大幅低于OpenAIo1数据来源:

DeepSeek

微信公众号,东方证券研究所1.3

DeepSeek-V3、R1模型在产业中引发巨大反响DeepSeek-V3

、R1

两款模型最让人印象深刻的不仅在于其比肩业内最佳表现的性能,更在于超低的训练成本:DeepSeek在V3相关的论文中披露,V3仅仅使用2048块H800GPU训练2个月的时间,共消耗

278.8

GPU

小时,而按照

OpenAI

创始成员之一

Andrej

Karpathy

介绍,

Llama3-405B则消耗了3080万GPU小时,是V3的

11倍;如果按照H800

GPU每小时2美金的租赁费用计算,意味着V3模型正式训练仅仅需要

557.6万美金,

而此前同等性能的模型则需

要0.6-1亿美金。而R1模型

是在DeepSeek

V3

的基础上,通过引入大

规模强化

学习

(Reinforcement

Learning)和多阶段训练,进一步提升推理能力的模型,据专家判断,在V3

的基础上生产R1模型的成本可能非常低廉。DeepSeek-V3

、R1两款模型的推出,犹如在AI行业投入了两颗重磅炸弹,DeepSeek

迅速成为

科技产业最耀眼的明星企业,并引发了巨大的讨论与关注。相较于各科技巨头不断构建更大规模

算力集群来训练更强大的模型,DeepSeek

向大家展示了通过精巧的算法优化,可以在低一个数量级算力消耗的情况下生产出顶尖性能的模型。DeepSeek

已经成为众多科技领域领袖重点关注的对象:微软

CEO

纳德拉在财报电话会议上称DeepSeek“有一些真的创新”,并透露R1

模型已经可以通过微软的

AI平台获取;MetaCEO

克伯格表示

Meta

DeepSeek

视为竞争对手并正在学习;ASML

CEO

则在接受采访时

表示DeepSeek这样的低成本模型将带来更多而非更少的AI芯片需求;Anthropic创始人认为V3是真正的创新所在;人工智能专家吴恩达也发文认为中美AI差距正在迅速缩小。OpenAI

CEO山姆奥特曼更是在发布o3-mini后罕见地承认“在开源上

OpenAI站在了历史的错误一方”

。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。图7

:DeepSeek-V3模型训练仅需要278.8万GPU小时训练资源计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化数据来源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,东方证券研究所7二、

DeepSeek

模型训练与推理技术创新解析2.1

DeepSeek-V3模型采用了多项创新技术据披露,DeepSeek-V3为自研MoE模型,总参数671B参数,而每项任务仅激活37B,在14.8Ttoken

上进行了预训练。DeepSeek-V3实现了多项工程技术上的创新,包括通过FP8精度训练、DualPipe

双向流水线等技术降低训练成本,通过优化MoE负载均衡、多头潜在注意力机制(MLA)

来降低推理成本,并通过多Token预测(MTP

)以及模型蒸馏来进一步提升模型性能,最终取得

了令人惊艳的效果。在超高的热度下,DeepSeek

成为了全球增速最快的

AI

应用,仅上线

18

天日活就达到了

1500

万,而

ChatGPT

1500

万花了

244

天,增速是

ChatGPT

13

倍;1月26

日同时登顶苹果

AppStore和谷歌PlayStore全球下载榜首,

目前仍然在100多个多家/地区维持领先。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化

数据来源:

invest

wallstreet

微信公众号,东方证券研究所

数据来源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,东方证券研究所图8

:DeepSeek

成为全球增速最快的AI应用图9:DeepSeek发布后下载量增长迅猛图

10

:DeepSeek-V3模型基本架构数据来源:

AI

产品榜,东方证券研究所8从训练的角度,FP8精度训练、DualPipe双向流水线以及高效的跨节点通信等技术是工程领域创

新的重点。1)FP8

精度训练:DeepSeek-V3

将大部分计算密集型操作(如矩阵乘法)使用FP8

精度进行,

同时保留一些关键操作(如嵌入层、输出头、归一化操作等)的高精度(BF16

FP32),

以确保训练的数值稳定性。

在此基础上,进一步叠加细粒度量化、高精度累加、在线量化、低精度存储和通信等技术方法,成功实现了高效的

FP8

精度训练。这些创新不仅显著提高了训练速度和效率,还保持了模型的高性能,为大规模语言模型的训练提供了新的解决方案。2)DualPipe

双向流水线:核心思想是将模型的不同层分配到不同的

GPU

上进行并行训练,并

通过双向流水线调度来同时处理正向传播和反向传播。具体来说,它允许从流水线的两端同

时输入微批次(micro-batches),从而最大化地利用计算资源并减少通信开销,该方法实现了高效的模型训练,为大规模分布式训练提供了强大的支持。3)

跨节点通信技术

:DeepSeek-V3通过高效的跨节点全对全通信内核、通信和计算的重叠、定

制化通信内核、低精度通信以及对未来硬件设计的建议,显著提高了跨节点通信的效率。这

些技术不仅减少了通信开销,还提高了整体训练效率,为大规模分布式训练提供了强大的支

持。而在推理领域,DeepSeek-V3

混合专家系统(MoE

)和多头潜在注意力机制(MLA

)是获得低成

本、高质量推理结果的重要原因。1)混合专家系统(MoE)

:MoE

是一种将多个小型专家模型组合起来,共同完成任务的架构

MoE

可以显著增加模型的参数数量,而无需像稠密模型那样增加计算量。具体而言,V3

模型每项任务仅激活370亿个参数,大大降低了计算成本,同时保持了高性能。2)多头潜在注意力(MLA):多头潜在注意力机制增强了模型处理细微关系和同时管理多个输入的能力,使其对需要上下文深度的任务非常有效。

如果以听一场演讲来类比,传统的注意力机制需要记住每个时间点的所有细节(就像记录每一秒的录音)

,而MLA则只提取关键信息(就像只记录每个重点句子),这样大大降低需要记忆的信息。此外,DeepSeek-V3还通过多令牌预测(MTP

)和模型蒸馏技术提高了模型的性能。1)多令牌预测(MTP):传统的语言模型通常只预测下一个令牌(token),而MTP

则是在每

个位置上,让模型预测多个未来的标记,从而提高模型的性能和效率

。它不仅增加了训练信号的密度,还使模型能够更好地规划未来的表示,从而生成更连贯和准确的文本。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图

11

:DeepSeek-V3采用FP8为主的混合精度训练方法数据来源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,东方证券研究所9图

12

:多Token预测(

MTP

)模块结构示意数据来源:

DeepSeek-AI《DeepSeek-V3Technical

Report》,东方证券研究所2.2

R1-Zero与R1模型尝试强化学习边界为了获得推理能力更强的模型,DeepSeek相继开发了

R1-Zero和

R1模型,其中

R1-Zero

尝试

了不使用监督微调(SFT)、仅采用大规模强化学习(RL

)的方式,而R1

则在强化学习之前引

入冷启动阶段,通过少量人工设计的长链思维(CoT)数据对基础模型进行初步监督微调,从而为强化学习提供更稳定、可读性更强的初始策略。R1-Zero

直接在基础模型上应用强化学习而不使用任何

SFT

数据,为了训练

R1-Zero

,DeepSeek

采用了一种基于规则的奖励系统(而非神经奖励模型),该系统包含准确率奖励和格式奖励,其中前者负责评估响应是否正确,而后者确保模型在生成响应时遵循特定的结构要求。而随着

RL

训练的持续推进,DeepSeek-R1-Zero

的性能呈现出稳步提升的趋势。此外,通过延长测试时间的计算,

DeepSeek-R1-Zero

自然而然地获得了解决更复杂推理任务的能力,从生成数百个

token

到数千个

token,模型得以更深入地探索和优化其思维过程。模型的「思考过程」会不断与最终的正确率奖励相互作用。当模型最初得出的答案并未得到较高奖励时,它会在后续

的推理中「回头反省」,尝试补充或修正先前的思路,从而获得更高的奖励

,通过这样的方式,模型在没有外部指导的情况下持续自主学习与迭代,最终具备了强大的推理能力。2

)模型蒸馏技术:模型蒸馏(Knowledge

Distillation)是一种将大型复杂模型(教师模型)的知

识迁移到小型高效模型(学生模型)的技术。其核心目标是在保持模型性能的同时,显著降低模

型的计算复杂度和存储需求

。DeepSeek

利用强大的教师(R1

)模型生成或优化数据,帮助小模

型更高效地学习,此外,

DeepSeek

通过监督微调(SFT)的方式,将教师模型的知识迁移到学生模型中。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。

数据来源:

图灵人工智能微信公众号,

东方证券研究所

计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图

13

:R1-Zero由基础模型直接进行强化学习训练而产生10R1-Zero

的目标是验证纯

RL

能否激发模型的自主推理能力,探索「无监督强化学习的潜力」

,而

R1则通过数据引导+多阶段优化,平衡推理性能和实用价值,目标是打造更符合人类偏好的通

用推理模型。R1的训练过程分为4

个阶段:1)阶段

1(冷启动):使用少量高质量的

CoT

数据对基础模型进行微调,作为

RL

训练的初始

起点,解决纯RL冷启动不稳定问题;2)阶段2(推理导向的强化学习):在冷启动模型上进行

RL训练,应用

GRPO

算法,结合规则奖励和语言一致性奖励,优化模型在数学、代码、逻辑等任务上的推理能力;3)

阶段3(拒绝采样+监督微调):使用上一阶段的

RL

模型进行拒绝采样,生成高质量的推理和非推理数据,并用这些数据对模型进行微调。侧重点是提升模型的综合能力,使其在写作、事实问答等多种任务上表现良好。4)阶段4(全场景强化学习):在上一阶段

SFT

模型的基础上进行

RL

训练,侧重点是使模型

在所有场景下都能表现良好,包括推理任务和非推理任务,对齐人类偏好,优化模型的实用

性、无害性和多任务能力。此外,为了获得更高效的小模型,并使其具有DeekSeek-R1的推理能力,DeepSeek还对Qwen和

Llama

等开源模型进行了微调,使用的是上面

SFT

DeepSeek-R1

的80万数据。研究结果表明,这种直接蒸馏方法显著提高了小模型的推理能力。在这里使用的基座模型是

Qwen2.5-Math-1.5B、Qwen2.5-Math-7B、Qwen2.5-14B、Qwen2.5-32B、Llama-3.1-8B和Llama-3.3-70B-

Instruct。三、

DeepSeek

将对AI

算力与应用产生结构性影响3.1

DeepSeek模型有望引发算力需求与市场结构变化由于DeepSeek-V3

、R1

等模型通过算法与架构层面的多重创新大幅降低了训练端算力消耗,使

得投资者对继续斥巨资构建超大规模算力中心的合理性和前景产生质疑,这导致了算力产业链相

关企业在

R1模型发布后暴跌,其中英伟达股价

1

27

日下跌

16.97%,市值蒸发约

5900亿美

金,创下美国上市公司单日市值损失记录,而博通公司股价跌幅一度接近

20%,收盘时下跌

17.4%,台积电股价也大跌13.3%。数据来源:

DeepSeek-AI《DeepSeek-R1:IncentivizingReasoningCapabilityin

LLMsvia

Reinforcement

Learning》,东方证券研究所

15

:DeepSeek-R1-Zero在RL过程中的平均响应长度(输

出长度不断增加)数据来源:

DeepSeek-AI《DeepSeek-R1:IncentivizingReasoningCapabilityin

LLMsvia

Reinforcement

Learning》,东方证券研究所有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图

14

:DeepSeek-R1-Zero训练期间AIME

准确率11训练算力长期看仍有前景和空间

。从训练算力的角度,

我们认为各模型厂商大概率将借鉴

DeepSeek公开的一系列优化方法,如FP8精度训练、跨节点通信、DualPipe双向流水线与自身模型训练结合,探索更高效的模型训练方式。不过,正如

Anthropic

CEO

Dario

所述:“训练越

来越智能的模型的经济价值是如此之大,以至于任何成本收益几乎都会立即被吃掉——它们被重

新投入到制作更智能的模型中,而我们最初计划花费的成本与此相同”。因此,在各模型公司仍致力于训练出性能更强大模型的目标指引下,庞大的训练集群将仍然被产业所追逐,因此,我们认为,训练算力需求从长期来看依然值得乐观。“杰文斯悖论

”有望在推理算力上再度印证。而从另一方面来看,开源模型和更低的推理成本将有助于应用的繁荣,从而对推理算力形成更加积极的影响。微软

CEO

纳德拉在社交平台上表示,

“杰文斯悖论(Jevons

Paradox)再次上演!随着

AI

变得更加高效和普及,我们将看到它的使用

量激增,最终成为一种我们永远无法满足的商品。”杰文斯悖论是一条知名的经济学理论,指当技

术的进步导致某种资源的使用更加高效时,消费者或企业对它的使用需求可能会大幅增加,虽然

其使用成本降低了,但总消耗最终反而会上升。这样的情况在当前的蒸汽机时代和内燃机时代都曾出现过,我们认为,随着推理成本的下降,AI

应用的广阔需求有望被激发,推理算力将具备更大的增长空间。算力芯片行业格局是否生变值得关注。此前,英伟达凭借领先的计算与互联性能、强大的

CUDA生态,在

AI算力芯片市场占据主导地位,但DeepSeek

在跨节点通信方案上的优化,以及推理阶

段的算力需求爆发潜力,让

AI

芯片厂商看到了突破口与希望。AMD

1

25

日宣布已将新的

DeepSeek-V3

模型集成到

Instinct

MI300X

GPU

上;2月1

日,硅基流动与华为云联合推出基于

昇腾云的

DeepSeek-R1&V3推理服务,可获得持平全球高端

GPU

部署模型的效果,而

2

2日,DeepSeek

两款模型完成海光

DCU

适配并正式上线,意味着国产芯片与

DeepSeek系列模型实现了无缝衔接。我们认为,DeepSeek

模型的开源性以及对芯片性能与生态要求的下降,可能会对AI芯片行业的格局产生一定影响。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图16:“杰文斯悖论”指出成本下降将刺激资源需求更大增长数据来源:

华尔街见闻

,东方证券研究所12此外,DeepSeek在使用英伟达A100

、H800等性能受限的芯片基础上训练出V3

、R1

等模型,使得是否要对中国进一步进行芯片限售成为热门话题。例如,

Anthropic

CEO

在万字长文中就提出要对中国进行更严格的芯片限制,而彭博社也援引知情人士报道称,美国正考虑进一步收紧英伟达(NVIDIA

)芯片对华出口限制,可能将限制范围扩大至英伟达针对中国市场特供的符合出口管制规则的H20

芯片。我们认为,如果英伟达等美国

AI

芯片进一步受到限制,则可能对国产芯片

的份额与需求产生进一步的影响。3.2AI应用有望在高性能、低成本模型支撑下繁荣自

ChatGPT问世以来,无论是大模型公司还是各类应用型企业均推出各类基于大模型的应用,寻找用户增长与商业闭环机会。近期我们关注到,无论是从产品用户数增长的角度,还是海外

B

端企业AI应用商业化落地的角度,均呈现积极的成果,基于大模型的商业化曙光已现。从各类产品用户数及访问量来看,ChatGPT

网站端

24年12

月3.4亿用户产生38

亿次的访问量,

APP端访问次数则超过3亿次,月度总访问次数超过40亿次,保持着明显的领先优势。在Web

端访问前

15榜单来看,中国仅有纳米AI位列其中,而在APP端,则有豆包、Talkie

AI

Kimi

助手三款,其中豆包、TalkieAI均位列前五,显示出中国AI应用在全球占有重要地位。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。图

17:硅基流动x华为云联合推出基于昇腾云的DeepSeek

R1&V3

推理服务计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化数据来源:

硅基流动微信公众号,东方证券研究所13我们认为,此前AI应用的普及及其商业化还存在一定的困难,一方面在于模型性能仍然没法满足众多场景的需求,尤其是在推理能力和多模态环节,另一方面则是闭源模型性能领先但

API

调用的成本过高,影响了AI应用的大范围普及,我们认为,DeepSeek

的强推理能力、低算力成本、

开源属性性有望推动AI应用的繁荣。此外,不仅是

DeepSeek系列模型,国内其他模型公司近期发布产品也取得了性能领先。如

1月

20

日,月之暗面推出的全新SOTA模型——Kimi

k1.5

多模态思考模型,在short-CoT模式下,

Kimi

k1.5

的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考

SOTA模型

GPT-4o

Claude

3.5

Sonnet

的水平,领先达到550%;在

long-CoT

模式下,k1.5推理能力达到长思考SOTA模型OpenAIo1

正式版的水平。而伴随着

AI

应用在日常生活中发挥着越来越重要的作用,各类

AI

应用的付费用户也在增长,目

前来看,2024年付费用户最多的产品是微软的Copilot,达到了5574万,百度文库紧随其后,达到4000万,而Canva和ChatGPT付费用户也超过了千万。此外,大模型应用

Claude、智能文

档与协作平台Notion

、AI

搜索应用Perplexity

、AI

Coding

应用Cursor

以及智能陪伴应用

Character

AI

也都榜上有名。用户愿意付费往往意味着产品已经触及到了其真正的需求,付费行为跨越了感兴趣和真正需要之间的鸿沟,是未来AI产品货币化的重要方向。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。图

18:AI产品榜全球Web端访问前

15情况(

24年12月)图

19:AI产品榜全球APP

端访问前

15情况(

24年12月)计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图20:2024年全球AI产品付费用户规模数据来源

:AI

产品榜,东方证券研究所数据来源:

AI

产品榜,东方证券研究所数据来源:

AI

产品榜,东方证券研究所14我们认为,DeepSeek-V3

、R1,月之暗面

Kimik1.5,以及Qwen2.5-Max等国产模型的集体性突破,为国内AI应用的发展与繁荣打下良好的基础,未来拥有场景和用户资源的厂商可以以更好的性能

、更低的成本提供产品和服务,与此同时,更开源的模型和更低的成本也意味着AI应用企业的商业模型将迎来更加积极正面的变化。四、投资建议与投资标的我们认为AI应用正逐步进入落地期,有望呈现较多的投资机遇,建议投资者关注行业整体性机会,而国产算力及推理算力服务企业,也将从AI应用繁荣中受益。B

端企业级应用,建议关注金山办公(688111,增持)

、鼎捷数智(300378,未评级)

、泛微网络

(603039,

买入)

、汉得信息(300170,

未评级)

、软通动力(301236,

未评级)

、上海钢联

(300226,增持

)、合

合信息

(688615

未评

)、新致

(688590

买入

)、每日互动

(300766,未评级)。1月29

日,阿里云通义千问旗舰版模型Qwen2.5-Max正式升级发布,据介绍,Qwen2.5-Max

模型是阿里云通义团队对MoE

模型的最新探索成果,展现出极强劲的综合性能,

阿里云官微发文

称,

Qwen2.5-Max

比肩Claude-3.5-Sonnet,

并几乎全面超越了GPT-4o

、DeepSeek-V3及Llama-3.1-405B。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化图22:long-CoT模式下

,k1.5模型多方面能力比肩o1图21:short-CoT模式下,k1.5模型多方面能力领先图23

:Qwen2.5-Max测试结果领先各类指令模型图24

:Qwen2.5-Max表现优于各类开源模型数据来源:IT

之家,

东方证券研究所数据来源:IT

之家,

东方证券研究所数据来源:

芯智讯,东方证券研究所数据来源:

芯智讯,东方证券研究所15垂直行业应用领域有较强优势的企业,建议关注科大讯飞(002230,买入)

、焦点科技(002315,未评级)

、润达医疗(603108,买入)、同花顺(300033,未评级)、卫宁健康(300253,未评级)。AI

工具类应用,建议关注彩讯股份(300634,买入)、虹软科技(688088,未评级)、万兴科技

(300624,未评级)、福昕软件(688095,未评级)。国产算力及算力服务企业,建议关注海光信息(688041,买入)、寒武纪-U(688256,未评级)

云赛智联(600602,未评级)、安博通(688168,未评级)、中科曙光(603019,买入)

、首都在线

(300846,未评级)、优刻得-W(688158,未评级)。五、风险提示技术落地不及预期

:DeepSeek

为代表的模型虽然在性能和成本上有显著提升,但仍存在大模型技术无法支撑AI应用在部分场景落地的风险;政策落地不及预期:政策是AI产业发展的重要因素,如果政策支持力度不及预期,也会对行业发

展带来偏负面影响;美国进一步制裁风险

:如果美国进一步收紧芯片供应,仍将对国内大模型训练产生负面影响;竞争激烈导致变现能力下降风险:

目前AI产业竞争激烈,如果各厂商由于竞争进一步降低产品定价,则对AI产业的商业化形成影响。有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。计算机行业深度报告——DeepSeek惊艳世界,算力与应用将迎来结构性变化16报告发布日后的12

个月内行业或公司的涨跌幅相对同期相关证券市场代表性指数的涨跌幅为基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论