版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DeepSeek
冲击全球Al
产业格局,看好国产算力与Al
应用2025年02月24日湘
财
证
券XIANGCAI
SECURITIES证券研究报告增持(维持)一、DeepSeek
的算法工程创新二、DeepSeek
冲击全球Al产业格局三、看好算力与应用环节
四、投资建议与风险提示湘财证券XIANGCAI
SECURITIES目
录一、DeepSeek的算法工程创新湘财证券XIANGCAI
SECURITIES3DeepSeek
从2023年到2025年的发展历程2023年11月2023年11月2024年5月2024年11月2024年12月2025年1月首个开源代码大模型DeepSeekCoder发
布,超越CodeLlama
等开源模型参数规模达670亿的通用大模型
DeepSeekLLM发布,包括7B
和67B的base及chat版
本
。开源第二代混合专家(MoE)
大模型DeepSeek-V2发布,性能比肩GPT-4Turbo轻量级推理模型DeepSeek-R1-Lite的预览版发布第三代开源大模型DeepSeek-V3,性
能接近GPT-4等顶级闭源
大模型,但成本大幅下
降第三代开源大模型DeepSeek-R1发布,在V3基础上,架构优化和训练方法创新,性能媲美国外顶级大模型,成本大幅下降朱佳冠朱佳冠朱佳斌朱佳斌5朱佳燃朱佳赋■
幻方量化拥有近10年的二级市场量化交易经验,是国内罕见的使用大模型做量化交易的公司;■
2021年已投资10亿元配置了超过1万张英伟达A100;■2023年5月,
AI
团队独立,成立DeepSeek,2023
年11月,推出了首个开源通用大语言模型DeepSeek
LLM,2024年5月,推出了DeepSeek
V2,使用了MOE
架构,并在架构层面进行了创新,从而大幅提高了推理效率,
成本大幅降低,在国内引发价格战。湘财证券XIANGCAI
SECURITIES图1DeepSeek发展历程资料来源:
运营在观察、湘财
证
券4DeepSeek
AI
TCOUnitA100H20H800H100TotalYears#4444#of
GPUs#10,00030,00010,00010,00060,000NVDA$ASP$$13,500$20,000$23,000Server
CapEx/GPU$$23,716$31,728$34,728Total
Server
CapEx$m$237$317$347$1,629Cost
to
Operation$m$157$170$230$944Total
TCO
(4y
Ownership)$m$395$1,114$487$577$2,573DeepSeek
V3论文中提到的550美元成本,是指训练成本,不包括前期实验成本、薪资支出以及服务器购置等成本,与之相比,
Claude3.5Sonnet的训练成本为几千万美元;■根据SemiAnalysis的分析,DeepSeek
的总服务器成本为16.29亿美元/年,总支出为25.73亿美元/年。图2DeepSeek总成本估计资料来源:SemiAnalysis、湘财证券矿Note:TCOassumesservercapitalcosts
are
amortized
over
4
years
at
a
13.3%WACCNote:NVDA$ASP
only
attributable
to
NVDA湘财证券XIANGCAI
SECURITIES$12,500$24,228$387$7275DeepSeek-V3
Competitive
AnalysisModelPrice
/1M
Input
TokensPrice
/1MOutput
TokensMMLU(Pass@1)SWE
Verified(Resolved)AIME
2024MATH-500Claude-3.5-Sonnet-1022$3.00$15.0088.350.816.078.3GPT-4o-0513$2.50$10.0087.238.89.374.6DeepSeek-V3(TogetherAl)$1.25$1.2588.5somian42.0glysis39.290.2DeepSeek-V3
Median
Provider⁴$0.90$1.10DeepSeek-V3(Normal
Price)¹2$0.27$1.10DeepSeek-V3(Discount
Price)12.3$0.14$0.28Gemini
1.5
Pro$1.25$5.0086.020.088.0GPT-4o-mini$0.15$0.6082.033.26.779.0Llama
3.1405B$3.50$3.5088.624.523.373.8Llama
3.270B$0.59$0.7386.020.064.0
资料来源:SemiAnalysis、湘财证券研穴所■
得益于训练成本的大幅下降,以及算法的优化,
DeepSeek
的推理成本也大幅下降;DeepSeek的推理价格大约是GPT-4o的1/30。湘财证券XIANGCAI
SECURITIES图3
DeepSeek
与竞品对比6技术理论的提出方哪些企业在大规模实践MoE(混合专家模型)架构1991年首次被麻省理工大学、多伦多大学雅各布斯、诺兰、辛顿三位学者在论文《本地专家的自适应混合》(《Adaptivemixturesoflocalexperts》)中提出
2017年谷歌在Transformer模型中最早引入MoE层2023年法国Al创业公司Mistral
Al最早大规模开源MoE模型。2024年5月DeepSeek发布V2时较早使用了MoE架构。字节跳动的豆包2024年6月大规模部署MoE模型,阿里的通义2024年3月发布小参数MoE模型,2025年1月发布大参数MoE模型Qwen2.5-MaxMLA(多头潜在注意力)机制DeepSeek2024年5月最先在DeepSeek-V2发布的论文中提出。该注意力机制在MHA(Multi-HeadAttention)多头注意力机制的基础上进行优化创新。目前仅有DeepSeek在V2/V3两款模型中大规模使用了这一技术FP8(8位浮点数)混合精度训练2022年首次被英伟达、Arm和英特尔联合提出,它们共同发表了论文《深度学习的FP8格式》(《FP8Formats
for
Deep
Leaming》)。2023年微软曾开发开源的FP8-LM
FP8混合精度框架2022年-2023年,亚马逊AWS、微软Azure、谷歌云均支持FP8数据格式的模型训练。但由于美国科技公司普遍不缺算力,且FP8训练会增加训练的复杂度,因此这一技术并未
被深入探索。传统上,大模型训练使用32位浮点数(FP32)格式来做计算和存储,这能保证精度,但计算速度慢、存储空间占用大。
DeepSeek则构建了FP8混合精度训练框架,根据不同的计算任务和数据特点,动态选择FP8或FP32精度来进行计算,把训练速度提高了50%,内存占用降低了40%强化学习训练1961年首次被普林斯顿大学明斯基(Marvin
Minsky)在论文《迈向人工智能的步骤》《StepsTowardArtificialIntelligence》提出。OpenAI2024年9月发布o
模型时使用了这一技术强化学习技术在大型科技公司的日常业务中被大规模使用。强化学习训练模型的做法,谷歌DeepMind、OpenAl
ol进行了阐释。2024年下半年之后,业内普遍认为,大模型性
能提升的重要技术方向是强化学习。DeepSeek更上层楼,推出新的强化学习算法GRPO(GroupRelativePolicyOptimization组相对策略优化),在显著降低计算成本的同时,还提高了模型的训练效率资料来源:财经、湘财证券研究所
7■DeepSeek
在算法工程方面作出了大量创新,这些创新大幅降低了训练成本,并取得了优异的训练效果。湘财证券XIANGCAI
SECURITIES图4
DeepSeek
的主要创新点二、DeepSeek
冲击全球Al产业格局
8湘财证券XIANGCAI
SECURITIES■
促使海外厂商反思传统的AI发展路径,开始重视算法的优化;■崛起为全球主要AI玩家之一。图5
DeepSeek
的亮点短期:外界惊讶&质疑长期:技术创新的信心
中国
挑战了OpenAl的垄断地位率先公开了用RL做模型推理的可能性低成本
推理模型用极低的算力成本实现了比肩GPT
40等闭源模型的能力开源资料来源:峰瑞资本、湘财证券研究
光脚的不怕穿鞋的借助开源的力量快速出圈湘财证券XIANGCAI
SECURITIES9TheHELM
leaderboardshowshowthevariousmodelsperform
across
different
scenarios
and
metrics.MMLU
SubjectsAccurtacyEfficlencyGneralinformationModetMMLUAISubjects-EMAbstractAlgobra-EMAoatomy-EMColleggChemistry-EMComputersecurity-EMEconometries-EMClaude
3.5
Sonnet(20241022)0.8730.780.8590.630.870.807DeepSeek
v30.8720.840.8670.650.860.746Gemini
1.5
Pro(002)0.8690.820.830.670.850.693Claude
3.5
Sonnet(20240620)0.8650.7500.8440.590.890.807Claude
3
Opus(20240229)0.8460.640.80.60.850.789Llama
3.1
InstructTurbo(405B)0.8450.70.8220.60.810.746GPT-40(2024-08-06)0.8430.580.9110.60.850.711GPT-40(2024-05-13)0.8420.660.9110.610.850.693Qwen2.5
InstructTurbo(72B)0.8340.680.8220.620.86=0.728Gemini1.5
Pro(001)0.8270.750.830.620.830.728DeepSeek几乎将其所有
研究成果都直接开源,打
破了OpenAIo1系列模型的垄断地位,后续开源模型有望超越闭源模型引领行业发展;■DeepSeek让中国AI
产
业摆脱
了追
随者
的
角
色
,
成
为AI创
新玩
家
,
提
升
了
国
内AI产
业
甚
至科
技
产
业
的
信
心
。斯坦福大学基础模型研究中心全球大模型综合性能排名X
HELM
MMLU
Leaderboard
Models
Scenarios
Predictions
GitHub
Release
v1.13.0(2025-01-10)
tatest湘
财
证
券XIANGCAISECURITIES资料来源:财经、湘财证券研究所图6大模型排名榜单HELMLeaderboardSelecta
group:10三、看好算力与应用环节
11湘财证券XIANGCAI
SECURITIES■
大量应用需求云厂商资源利用率提升;
DeepSeek
降低了算力卡门槛;■阿里巴巴称,未来三年,集团在云和AI基础设施投入预期将超越过去10年总和;■
看好国产算力需求,包括昇腾系服务器制造、国产算力芯片、液冷、超级电容、存储等需求。图7服务器产业链资料来源:富果研究部、湘财证券
終端應用客户ODMDirect上游
中游下游CPU
GPU高速傳輸晶片HDDPCBCCL機殻電源供應器散熱模組DRAMFlashBMC功率元件/半導體網通晶片湘财证券XIANGCAISECURITIES非半導體類O
DM設計製造伺服器品牌商半導體類12知识库
C
Al搜索
I三+公问问ima论中国从古至今美发文化
…
.我们看看中国美发发展史,就会对美发行业进一步的认识。中华民
…微信公众号
微信公众号刚刚
微信公众号
刚刚
微信公众号
1分钟前如何让顾客微笑走出理发…要让顾客微笑走出理发店,关键在于提供优质的服务和良好的体验。
以下是一些建议,帮助理发店提升
顾客满意度,让顾客满意而归:*真诚的服务态度**:理发师应真诚对待每一位顾客,耐心倾听他们的
需求和意见,确保服务符合顾客…微信公众号
1分钟前
微信公众号
1分钟前
问问ima
6分钟前
问问ima
6分钟前怎样道歉,可以让顾客快.
…当面对顾客的不满或投诉时,
一个恰当的道歉可以有效地缓解紧张气
氛,并有可能将顾客的不满转化为
满意。以下是一些可以让顾客快速
消气的道歉技巧:###道歉技巧**简明型道歉**:直接而简洁地表
达歉意,如“对不起"、"非常抱公问问ima7分钟前公
问问ma7分钟前公
问
问ima8分钟前
公
问问ima8分钟前■
DeepSeek
降低了大模型训练门槛以及推理调用价格,有望推动优质AI
应
用
的
繁
荣
;■DeepSeek
降低了端侧小模型部署门槛,有望推动端侧AI应用发展。如何成为一个职业美发
…成为一名职业美发师需要掌握一系列的技能和知识,并需要不断学习
和提升。以下是一些关键步骤和考
虑因素:##井教育和培训**参加
专业课程*:选择参加美发培训课
程,学习基本的美发技术和理论知
识。-**获得实践经验**:在美发如何提升个人的审美?提升个人的审美是一个涉及多方面学习和实践的过程。以下是一些具
体的方法和建议,帮助你提升审美
能力:###阅读相关书籍和杂志**书籍推荐**:《美学散步》[14]
(@ref)、《艺术的故事》[13](@ref)
等书籍,可以帮助你从理论上理…第一次给顾客剪头发要注
…第一次给顾客剪头发时,需要注意多个方面,以确保顾客的体验满意
且安全。以下是一些关键注意事项:###理发前的准备-**保持卫生*确保所有理发工具(如剪刀、梳子、推子等)清洁和消毒,
避免交叉感染。同时,理发师和…湘
财
证
券XIANGCAISECURITIES资料来源:腾讯、湘财证券研究所总结内容以下是对提供的内容的总结:###唐代女子发型-**惊鹄警发式**:
…中国女性发型变迁史中国女性发型变迁史·石器时代、先秦·远古的旧石器时代,人类还…人均Tony!古代女子搞…天气一热,长发人就开始渡劫了想要扎起来清爽一点却只会丸子头…深度|走进美发370年历…发型不仅是个人形象的重要标志,还浓缩着一个时期里经济和文化…中国
·
美发编年史MY-Craftsman
LMK
Makes
Everyone
Wonderful"燧人氏时为警,
…[
√]中国发廊百年老照片…点击上方1干百度发型库关注!每日更新最新时尚潮流发型,欢迎…图
8iMA
界面13四、投资建议与风险提示
14湘财证券XIANGCAI
SECURITIES>
投资建议:DeepSeek降低了算力卡门槛,阿里巴巴有望引领国内新一轮AI
算力资本开支周期;DeepSeek降低了大模型训练
门槛以及推理调用价格,有望推动优质AI应用的繁荣;DeepSeek降低了端侧小模型部署门槛,有望推动端侧AI
应用发展。我们建议关注AI算力和AI应用,给予电子行业“增持”评级。>
风险提示:AI算力资本开支不及预期;AI应用开发不及预期。湘财证券XIANGCAI
SECURITIES15分析师声明本人具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 博士生职业规划
- 航空维修质量管理与控制指南
- 旅游民宿业经营与服务规范
- 企业环境管理操作手册
- 2026年口腔医疗管理公司员工宿舍管理制度
- 2026年剧本杀运营公司应付账款管理制度
- 2026年剧本杀运营公司数字化转型管理制度
- 云计算技术概述
- 2025年金融科技领域人工智能客服系统开发应用前景分析
- 新型环保包装机械研发项目2025年市场潜力可行性研究报告
- (2025年)司法考试法理学历年真题及答案
- 2025年战伤自救互救题库及答案
- 2025年中小学教师正高级职称评聘答辩试题(附答案)
- 介入导管室知识培训课件
- 非道路授权签字人考试题及答案
- 2025年林教头风雪山神庙检测试题(含答案)
- 体检中心外科检查
- 中缅边境景颇克钦族:社会经济的历史、现状与发展路径探究
- 深圳市盐田区2025年数学六上期末综合测试试题含解析
- DB5203∕T 38-2023 特色酒庄旅游服务等级划分与评定
- 四川省成都市嘉祥外国语学校2024-2025学年七年级数学第一学期期末学业质量监测试题含解析
评论
0/150
提交评论