计算机行业动态:DeepSeekV4等多模型更新算力需求持续紧张_第1页
计算机行业动态:DeepSeekV4等多模型更新算力需求持续紧张_第2页
计算机行业动态:DeepSeekV4等多模型更新算力需求持续紧张_第3页
计算机行业动态:DeepSeekV4等多模型更新算力需求持续紧张_第4页
计算机行业动态:DeepSeekV4等多模型更新算力需求持续紧张_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录一、行情回顾 1二、本周周观点 1三、投资组合 6四、产业要闻 7五、行业公告 8六、风险提示 9一、行情回顾本周,计算机板块跑输大盘。44日,计算机(申万0.27%300指数位。二级子行业(申万)1.14%,IT60,。图表1:申万一级行业周涨跌幅(%)-0.275-0.2743210-1-2-3煤炭煤炭通信房地产个股方面,涨幅前五个股依次为:皖通科技(21.45%)、品高股份(19.18%)、宏景科技(17.61%)、佳华科技1.6*ST国华(-26%)(-2.%(-981%)、真视通、网达软件(-17.18%)。图表2:计算机行业(申万)个股周涨幅前十名图表3:计算机行业(申万)个股周跌幅前十名21.4519.1821.4519.1817.6117.0915.6114.8813.7813.4513.0713.07

中安科真视通(13.33)(14.58)(15.29)(13.33)(14.58)(15.29)(15.32)(16.11)(17.18)(18.20)(19.81)(20.11)(22.61)0102030-30-20-100indind二、本周周观点4月24日,DeeSek-V4正式发布,包含Pro(总参数16T,激活49)与Flah(总参数28B,激活13B)两个版本,原生支持1M上下文长度。在公开测评集表现上,DeepSeek-V4确立开源新标杆,紧逼顶尖闭源模型。在知识与推理维度,V4-Pro在MMLU-Pro87.5%,在编程竞赛基准Codeforces3206RatingGPT-5.4(3168)与Gemini3.1Pro(3052)。在长文本领域,其MRCR1M(百万上下文多海捞针)83.5%。在AgentV4-ProSWEVerified(80.6%)、TerminalBench2.0(67.9%)以及贴近真实商业场景的GDPval-AA(1554分)评测中,展现出极强的端到端图表4:DeepSeek-V4benchmark表现eepSee核心技术方面,DeepSeek-V4主要实现了CSA、HCA与mHC三项关键技术创新:CSA(压缩稀疏注意力):针对长序列推理中的KV缓存占用问题,V4并未采用传统的KV舍弃或标量量化策略,而是引入了Token级别的压缩机制。CSA通过带学习权重的压缩模块,将多个Token的KV特征映射为一个低维表示。同时,为了防止局部细粒度信息丢失,CSA保留了基于滑动窗口的未压缩KV条目,并内置轻量级的LightningIndexer进行Top-k检索。这一机制在大幅减少显存占用的同时,维持了模型对关键局部信息的精确召回能力。HCA(重度压缩注意力):面向百万级上下文的宏观信息处理,V4在CSA的基础上设计了压缩比更高的HCAHCA(如将百万Token8000)。在模型层级设计上,V4CSAHCAHCA野与CSATokenV3.227%,KVCache10%。图表5:CSA架构图 图表6:HCA架构图eepSeek,腾科 eepSeek,腾科mHC(流形约束超连接,2025年12月梁文锋挂名的论文提出):随着模型层数加深,传统残差网络极易出现信号传递衰减与激活值方差指数级放大的训练不稳定问题。DeepSeek提出了mHC机制以替代传统残差连接。该机制对层间映射矩阵施加了严格的数学约束,要求其必须满足双随机矩阵(即矩阵所有元素非负,且每行、每列之和均为1)。这种流形约束在理论上确保了矩阵的谱范数严格等于1,从根本上抑制了深层网络的梯度爆炸与数值漂移问题。在工程实现上,mHC利用Sinkhorn-Knopp迭代算法高效完成矩阵归一化,使得构建极深层大规模模型网络成为可能。图表7:mHC和传统RC、HC的对比eepSeek,腾讯科此外,在后训练阶段,V4放弃了传统的RLHF,转而采用多教师同策略蒸馏与生成式奖励模型,有效避免了传统强化学习导致的对齐税(对齐带来的模型降智)及模型通用能力退化现象,实现了模型多维能力的高度均一化。DeepSek与Kmi在底层技术上相互学习与验证。Kimi主张线性注意力机制以降低计算复杂度,而DeepSeekCSA/HCAKimiK2.6MuonDeepSeekV4Muon地。面对MuonLogitsDeepSeek入了Query/KV的RMSNorm操作进行底层规范化处理,成功将Muon稳定应用于万亿参数MoE模型的全量预训练中,大幅提升了模型的收敛效率。4月24日,OpenAI同样发布最新旗舰模型GPT-5.5。作为全新旗舰模型,GPT-5.5在推理精度、复杂任务规划及系统级自治能力上实现了对当前行业基准的全面超越。在衡量复杂命令行与代码流的Terminal-Bench测试中,GPT-5.582.7%(相较前代GPT-5.47ClaudeOpus4.769.4%)。在评估真实专业知识工作流的GDPval测试中,GPT-5.5亦取得84.9%的成绩,超越了大部分垂直行业专家基线。图表8:GPT-5.5与各竞品在Terminal-Bench2.0、GDPval、OSWorld-Verified等核心基准测试中的对比penAI,腾讯科从案例测试看,GPT-.53D引擎渲染(如WebGL/Three.js应用重构)及高难度数学证明(如在纯数学领域协作发现拉姆齐数的新证明路径)等复杂任务展现出较好的表现。此外,OpenAI在技术披露中指出,GPT-5.5驱动的Codex系统已能够分析底层数据中心的生产流量日志,并自主编写负载均衡启发式分区算法,使系统Token生成速度提升逾20%。这种模型优化自身基础设施的案例,验证了GPT-5.5在复杂闭环系统中的高度工程自治潜力。对比DeepSek-4和GP-55,二者在演进方向呈现出一定的差异。在API调用成本上,GPT-5.5的API定价为每百万Token输入5美元/输出30美元,相比前代大幅提升。而DeepSeek-V4CSA/HCAProToken1元(缓存命中)/12(缓存未命中)244252.5Flash0.2(缓存命中)/1(缓存未命中)2元;极低的模型API在算力底座上,OpenAI进一步加深了与英伟达核心算力集群的系统级绑定,以定制化硬件支撑模型能力的演进。而DeepSeek-V4则成功在NvidiaGPU与华为昇腾NPU双平台上完成了验证与性能对齐,海光、寒武纪等国产算力厂商亦完成了0Day适配,有望缓解国内算力资源短缺的局部难题。而和国内模型相比,DeepSeek-V4则依靠成本和国产适配突围:纵向对比V3:V367101.6万亿,预训练数据量TokensTokens,进一步验证ScalingHCA的机制亦成功将1M。实测数据显示,在处理百万级长序列时,V4单Token的推理计算量仅为V3的27%,KV缓存占用更被极致压缩至10%。横向对比其他国产模型:当前,以、智谱、MiniMax、阿里、小米正持续在模型智能上界不断突破。在Analysis智能指数评测中,DeepSeek-V4-Pro与上述大厂的旗舰模型能力基本相当。DeepSeek-1.6T参数规模(头部模型厂公开最2.4T)、上下文窗口(与小米MiMo-V2.5pro、Qwen3.6-Plus等并列第一),仍保持了基本相当的价格。图表9:主要大模型智能指数得分rtificialanalysi全球AI产业迅速发展,大模型底层能力与应用层Agent框架形成强烈共振。年初OpenClaw的爆火,以及随后Hermes框架的异军突起,标志着通用Agent系统正在加速演进。技术定位来看,OpenClaw作为多渠道交互的网关,具备强大的执行能力,可通过丰富的静态插件生态和严格的安全沙箱边界,解决Agent如何安全、合规地调度各类工具并跨设备执行任务的问题;而Hermes则开创了具备自我进化与技能沉淀(Skill)的闭环学习,解决了Agent如何利用历史经验实现自我优化的问题。Agent的发展高度依赖于底层基座模型的代际迭代。一方面,模型能力的迭代使Agent能够更精准地执行框架设定的Pipeline,并自主生成高质量的执行框架;另一方面,自主化Agent带来了Tokens的指数级消耗,以DeepSeek-V4为代表的国产模型使推理成本快速下降,使得Agent在全周期运行和大规模记忆检索上具备经济可行性。总结:DeepSeek-V4与GPT-5.5同期发布,前者凭借CSA/HCA注意力压缩与mHC网络重构,在性能紧逼闭源旗舰的同时将百万上下文推理成本降至极低水平,并成功跑通国产化算力基座;后者则依靠软硬件强耦合,主攻高复杂度知识工作,延续了高定价匹配高智能的商业模式。同时,基座模型的代际跃升与OpenClaw、Hermes等Agent框架形成共振,通过智能上限拓展与推理成本优化,加速Agent生态向商业化落地发展。投资方向:继续看好推理算力和商业航天产业趋势。Agent复杂推理驱动计算负载向CPU密集型演进,需求爆发叠加产能紧缺推动服务器CPU量价齐升;同时,为突破推理Token成本瓶颈,ASIC凭借极致能效成为降本最优解,异构算力协同加速落地。推荐海光信息。)本地推理逐步起量,利好服务和云厂商。推荐深信服等。)重视以阿里、腾讯、字节等大厂,以及智谱、MniMx、Kim、Deepeek等头部AI企业的Capex投资及生态圈玩家。随着基座模型能力持续跃升,具备核心算法平台、行业大模型构建能力以及融入大厂生态圈的模型层及AI平台玩家将深度受益。)Pr-AAI应用落地需要更多前期准备工作。OA+ERPre-I环节推荐达梦数据、海天瑞声、深信服、汉得信息、第四范式等。部分细分垂直场景AI收入更快。其中创收关注工业、医疗、教育、市场营销侧产品,推荐中控技术、合合信息、金山办公、拓尔思、税友股份、视源股份、京北方、国能日新、晶泰控股、创业慧康等;降本关注AIcodng、多模态生成,推荐万兴科技。)AI从训练阶段向千行百业的推理应用阶段迈进,带动AI服务器及通用服务器需求复苏与景气度回升。推荐浪潮信息、神州数码、中科曙光等。)推荐关注端侧AI和相关产业链,推荐虹软科技、中科创达等。火箭运力、卫星成本、终端场景为三大方向,建议关注a)火箭制造端的材料和结构件公司,如国机精工军工组覆盖等;b)卫星核心部件和测试服务属核心软件)环节,如电科数字、索辰科技、上海港湾(建筑组覆盖)等;c)终端与场景、服务侧相关标的,如太空算力、通信运营服务等。三、投资组合本期建议:上期回顾:天瑞声、国能日新,同权重下上期组合涨幅为+0.48%,同期计算机(申万)指数涨幅为-0.27%,组合超额收益为+0.75%。持续关注:浪潮信息、金山办公、中科曙光、合合信息、虹软科技等;云计算:金山办公、用友网络、金蝶国际等;数据要素:太极股份、中远海科、云赛智联等;信创:纳思达、华大九天、卓易信息等;行业IT:创业慧康、卫宁健康、指南针、恒生电子、同花顺等;产业互联网及工业软件:中控技术、赛意信息、中望软件、鼎捷数智等。四、产业要闻DeepSeekV4发布24小时,重绘全球AI权力版图。2026年4月24日,杭州DeepSeek与OpenAI同日发布AI大模型,其V4系列预览版开源上线,包含Pro与Flash两个版本,均支持百万token上下文,凭借突出的代码与数学能力在多项评测中超越GPT、Gemini等同台模型,不过在深度知识与高难度推理上仍较国际顶尖模型存在3至6个月差距,该模型凭借架构创新、强大自主编程能力获得全球开发者认可,定价极具性价比,同时深度适配华为昇腾等国产芯片,摆脱对英伟达生态的依赖,直接带动A股、港股AI及算力芯片概念股全线大涨,不仅夯实了国产AI算力生态的可信度,也让DeepSeek迈入估值超200亿美元的规模化发展与商业化新阶段,成为改写全球AI竞争格局的重要力量。( TechWeb)OpenAI正式发布GPT5.5:运算速度更快Token成本大降。026年4月24日OpenAI推出全新GPT-55模型,这是其目前智能水平最高的版本,相较GPT-5.5运算速度更快、逻辑更严谨、Token消耗更低,综合性能优于前代及谷歌、Anthropic等竞品模型,覆盖编程办公、数理科研、药物研发等多类场景,电脑操控与专业研究能力大幅升级,现已正式向ChatGPT付费及企业相关用户全面开放。( TechWeb)腾讯混元Hy3prviw发布并开源:混元重建后首个模型,Agent能力大幅提升。206年4月23日,腾讯正式发布并开源混元重建后的首个大模型Hy3preview,为混合专家架构,支持超长上下文,遵循实用化研发原则,整体推理、长文本理解、数理竞赛、代码开发与Agent智能体能力全面跃升,多项专业测评成绩突出。模型推理效率提升、使用成本下降,性价比突出,已批量落地腾讯云、元宝QQ、腾讯文档、和平精英等众多产品,在办公开发、智能交互、游戏NPC、内容生成等场景实现效能与体验升级,还兼容主流开源智能体工具,腾讯也将依托开源反馈持续迭代优化模型( TechWeb)月之暗面最强模型,KimK2.6发布:13小时不停写代码。4月21日,月之暗面开源发布全新升级的KimiK2.6强,可连续长时间高强度编码,还能结合视觉打造专业网页应用。模型本地部署与推理效率优化显著,同时升级多智能体集群架构,支持大规模子Agent并行协作,可一站式完成多类型复杂任务与多格式成果交付(资料 TechWeb)国务院:支持采购大模型、智能体服务,支持数据等无形资产投资。2026年4月,国务院发布服务业扩能提质相关意见,设定2030年行业发展目标。文件补强生产性服务业短板,升级民生服务供给,深入推进“人工智能+”行动,鼓励采购大模型、智能体服务,扶持数据、软等无形资产投资。同步完善算力布局与数据要素机制,从政策、基建、人才等多维度发力,推动服务业数智化与高质量融合发展。( 数要素社)五、行业公告图表10:本周行业公告公司 时间 公告内容金山办公2026年第一季度报告:公司实现营业收入16.13亿元,同比增长23.95%;归属于上市公司股东的净利润达21.95亿元,同比大幅增长444.97%,主要得益于部分对外投资基金项目产生的大额投资收益(约19.37金山办公 2026年4月日亿元)。扣非净利润亿,同增长显示营业盈利能显著强。营活动现金流净额万元同比长公司续推进AI协作及际化略,WPS365业务收同比长党政创需释放动软业务入增长。但注意,投资收益可能因市场环等因未来度出波动存在利润幅波动险。中科创达2025年年度报告:中科创达2025中科创达 2026年4月日告领域的重大/重要陷。司以AI生操系统为核技术底,重布局能汽车领域(),1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论