计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快

上传人：策*** IP属地：山西上传时间：2026-05-07 格式：DOCX 页数：55 大小：595.02KB 积分：19.9 举报 版权申诉

计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快_第2页

计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快_第3页

计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快_第4页

计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快_第5页

已阅读5页，还剩50页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

识别风险，发现价值请务必阅读末计算机行业AI模型系列（三）务和AgentSwarm编排能力。在官方博客示例中，K2.6曾在12小时在此趋势下，国产AI算力和模型自主可控建设的节奏有望加赛意信息，建议关注软通动力和中国软件国际；⑤算力租赁和算力调44%34%25%6%02/2604/26沪深30002/2604/26沪深300计算机请注意，吴祖鹏,周源并非香港证券及期货事务监察委员会的注册持牌人，不可在香港从事受监管活动。（二）:Anthropic收紧模型与算力发展识别风险，发现价值请务必阅读末----金蝶国际税友股份识别风险，发现价值请务必阅读末 5一、DEEPSEEKV4发布：长上下文能力突破 7 7（二）模型性能：开源第一梯队，与闭源前沿仍有差距 21 识别风险，发现价值请务必阅读末 7 7 8 8 9 20 20 22 22 23 25 26 23 27识别风险，发现价值请务必阅读末为284B总参数、13B激活，均支持1M上下文。KimiK2.6则更强调多模态优解；DeepSeekV4-Pro在1M长上下文、复杂分析和高强度推理中更具通用优大模型适配国产算力产品的新方向。国产AI产业自主可控建设也由国产AI芯片的单产AI芯片适配（数据来源：华为、寒武纪和璧仞科技官方微信公众号另一方面，英伟达的AI芯片在国内的销售受到政策较大的影有望采购较大比例的国产AI芯片来满足由于DeepSeekV4和KimiK2.6推理而带来的新增算力需求。此外，在Agent能力增强的情况下，DeepS辅助编程、工具调用、业务协同等场景的使用也有望拉动CPU的需求。尤其在多智能体协作的场景下，大规模并行运行的AIAgent将较数以及单核性能等硬件资源。最后，昇腾超节点通过芯片间高速互联实现Tokens吞吐量的提升也有望广泛推广。未来，国内服务器整机厂商推出的搭载国产AI芯片的超节点产品有望随着DeepSeekV4和KimiK2.6的应用而放量。识别风险，发现价值请务必阅读末伴随V4-Pro与V4-Flash显著下移API价格后，Token消费量有望进一步指数级增长。调度相关公司都将直接受益于V4发布后带来的需求量激增以及国产芯片的适配。对产芯片的适配将带动国产芯片的需求提升，这会在一定程度上缓解市面上目前高端投资建议：DeepSeekV4长上下文的突破、Agent能力和推理性能的提升以及对于寒武纪和璧仞科技官方微信公众号，DeepSeekV4发布即宣布于寒武等国产算力的适配，壁仞科技也在KimiK2.6发布的第一时间宣布其适配，模与算力厂商的紧密合作有望加快国产AI芯片在国产AI大模型训练和推理相关任务的科技、宝信软件、云赛智联、铜牛信息、卡莱特、思特奇、并行科风险提示：国产AI大模型相关应用的商业化落地不及预期的风险；AI大模型行业竞识别风险，发现价值请务必阅读末一、DeepSeekV4发布：长上下文能力突破，开源模型进入百万token原生时代在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。本次发布不同推理强度档位，便于用户在效果、时延和成本之间做权衡。数据来源：DeepSeek官网，广发升后，计算和显存压力都会明显增加，这也是超长上下文长期难以真正落地的核心数据来源：DeepSeek官方公众号，广发根据官方技术文档，V4将CSA（CompressedSparseAttention与HCA识别风险，发现价值请务必阅读末同时叠加滑动窗口分支，以保留局部依赖关系。整体思路并不是简单把窗口做大，算”，从而降低长序列中的无效访存和冗余计算。与此前主要依赖MoE做参数侧稀疏化不同，V4把优化重点进一步推进到序列处理路径，核心目标是降低长上下文数据来源：DeepSeek官方技术文档，广发数据来源：DeepSeek官方技术文档，广发识别风险，发现价值请务必阅读末复现”协同展开，说明V4更偏向模型结构与一模型。这种‘先拆分、再整合’的路径，有助于减少多任务直接混训时的能力牵制，尤其适合当前推理、工具使用和代码任务差异较大的模型阶段。对产业观察而言，这意味着模型优化正在从单一通用指标，转向更注重任务结构的后训练组织方数据来源：DeepSeek官方技术文档，广发官方报告提到的重点包括工具调用格式调整、长链任务中的上下文保留，以及用于训练和评测的DSec沙箱基础设施等，以及针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的识别风险，发现价值请务必阅读末上下文效率和开源模型综合能力提升上，但在通用知识和复杂Agent任务上3.1约3–6个月，但差距显著缩小。在性能逐步收敛的背景下，效率、成本和部署能学、STEM、竞赛型代码的测评也大体呈现开源领先、闭源仍强的任务较前代也有明显提升。数据来源：DeepSeek官方微信公众号，广识别风险，发现价值请务必阅读末数据来源：DeepSeek官方技术文档，广同样支持1M上下文长度，但价格端更低。DeepS下，OpenAIGPT-5.5API标价为$5/$30每百万token，ClaudeOpus4.$5/$25每百万token。因此，高token消耗场景中，V4-Pro在单位to码仓库级理解等高上下文依赖任务；V4-Flash则在轻量Agent、批量文本处理和成本敏感型场景中具备应用潜力有望在轻量Agent、批量文本处理和成本敏感型场景识别风险，发现价值请务必阅读末-输入：$0.20（命中）$1.00（不命中）(≤256K-中>128K命中有折扣），中>128K命中有折扣输出：24.00元(≤32K28.00元（>32K）输入：$0.06（命中）$0.30（输出：$0.375（命中）$1.20（不输入：$0.06（命中）$0.60（输出：$0.375（命中）$2.40（不--命中>272K）-输入：$0.50（命中）$5.00（输出：$6.25（命中）$25.00（不-数据来源：DeepSeek等公司官网、广识别风险，发现价值请务必阅读末在旗舰模型普遍向长上下文、Agent化和复杂任务执行方向演进的背景下，位token成本，有望压缩闭源模型在部分高token消耗场景中的识别风险，发现价值请务必阅读末二、KimiK2.6发布，全面精进代码和Agent集群能力显示，K2.6支持文本、图像和视频输入，支持思考/非思考模式以及对从K2.6的公开信息看，这一思路被进一步工程化。官方博客称，K2.6的AgentSwarm可动态拆解任务，并由自创建的领域子Agent并发执行；其规模从K2.5降低端到端任务时间。文视频联合训练实现视觉与语言能力的协同增强；其视频理解中还通过时序压缩，这使其更适合前端生成、视觉转代码、视频理解和多模态Agen识别风险，发现价值请务必阅读末数据来源：Kimi官方技术文档，广发从能力结构看，KimiK2.6的差异化主要体现在长程代码、复杂工程任务和自主任务场景（如前端、运维、性能优化）均具备更可靠的泛化能力；在官方博客示例地模型推理优化任务。并认为其性价比适合AgenticCoding和前端生成。这些数据更多来自合作方和内Agent能力方面，K2.6强调持续执行和主动协作。官方博客提到，K2.6可在更偏向真实工作流执行，而不只是一次性工具调用。识别风险，发现价值请务必阅读末数据来源：Kimi官方微信公众号，广发为27.00元百万token，上下文窗口为但其缓存命中输入价格较V4-Pro高约10%，输出价格较V4-Pro高约12.5%。此，KimiK2.6的成本优势不在最便宜toke识别风险，发现价值请务必阅读末AgenticCoding、前端/全栈生成、超长文档、代码库级理解、长上下文推理、低成本模型内部注意力与KVcache压缩，降低数据来源：Kimi、DeepSeek官方技术文档、广发总结：KimiK2.6和DeepSeekV4代表了两条不同的国产模型升级路径。强调多模态Agent执行和长程工程能力感型场景的更优解；DeepSeekV4-Pro在1M长上下文、复杂分析和高强度推理识别风险，发现价值请务必阅读末三、国产算力适配加快，DeepSeekV4和KimiK2.6推动算力国产替代进程家并行、长上下文缓存和低精度计算做了多项工程优化，并说明相关方案已在英伟构本身，也依赖底层算子、缓存管理和并行调度等系统工程能力。在国产模型与国产芯片适配后，国产芯片厂商可以更早介入模型迁移、算子适配和推理框架优化。半年昇腾950超节点批量上市后，Pro版本价格后续存在进一步优化可能。寒武纪也披露已完成DeepSeekV4的Day-0适配，基于vLLM推理框架实现V4-Flash和V4-Pro发布当日稳定运行，并围绕V4的新结构进行专项优化。此外，信公众号，昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销，大幅提升推理性能，结合多种量化算法，实现了高吞吐、低时延的DeepSeekV型推理部署。为了解决自定义算子开发门槛高、周期长的痛点，昇腾CANN推出了在保证模型精度的同时，可实现内存占用降低超过50%，计算能力翻倍。根据华为官网，与华为合作较为紧密的IT公司软通动力和中国软件国际有望受益于昇腾芯片数据来源：华为昇腾官网，广发证券发展研究中心识别风险，发现价值请务必阅读末万卡级别的Scaleout集群规模，解决了长序列4K到1M序列长度范效支撑支持长序列应用。基于昇腾A364卡超节点结合大EP模式部署，DeepSeekV4-Flash模型，8K/1K输入输出场景，基于vLLM推理引擎可实现2000+TPS的单卡表3：Atlas900A3Su最大支持1536个DDR5内存，最大内存传输速率散热方式软硬件协同，寒武纪的AI芯片多维度适配DeepSeekV4。寒武纪拥有长期积累的Neuware软件生态和芯片设计技术。根据寒武纪官方微信公众号，针对DeepSeek-mHC等模块进行专项加速；利用BangC高性能编程语言，编写稀疏/压缩Attention、GroupGemm等热点算子的极致优化Ke寒武纪芯片原生支持主流低精度数据格式，无需额外转换即可快速完成功能适配与精度验证；此外，寒武纪利用MLU访存与排序加速能力，有效加速稀疏Attention、AI芯片上的稳定运行。识别风险，发现价值请务必阅读末信公众号，依托壁砺166系列产品的高通用性与自研BIRENSUPA软件栈的成熟度，壁仞科技在KimiK2.6模型发布第一时间即完成了适配和兼容工作。壁仞团队采用MoE专家调度优化、稀疏计算、Te及int4量化推理等多项技术，使模型在壁仞科技平台上实现低时延、高吞吐的高效运行。在此过程中，壁仞科技对KimiK2.6的关键算子进行深度性能优化，通过自动化的算子调优策略显著提升了模型推理效率。主可控建设的加快。在AI芯片领域，英伟达的CU型的训练和推理相关计算均需与CUDA适配才可取得较好效果。而当前DeepSV4和KimiK2.6在发布的第一时间即选择与华为昇腾、寒武纪思元和壁仞等国产AI芯片产品适配（数据来源：华为、寒武纪和璧仞科技官识别风险，发现价值请务必阅读末提升。DeepSeekV4带来推理成本的下降使得AI应用厂商能够以更低成本、更高效率开发高价值应用，降低了AI技术的门槛，更多中小型企业和开发者能负担大模型所需的资源。此外，KimiK2.6在长程任务上表现优异。用户和开发者通过调用DeepSeek和Kimi的API可以开发各类AI应用，或直接接入其相关AI应用中生成文字和代码。在DeepSeek和Kimi性能优异、成本下降的趋势下，我们判断相关Tokens调用量有望快速上升，从而产为测算由于DeepSeek大模型Tokens调用，而产生的新增假设：到DeepSeek和Kimi大模型性能在行业内处假设DeepSeekV4和KimiK2.6模型tokens的调用量为40万至70万亿tokens。截止2026年3月底，国内AI大模型日均Tokens调用量已达140万亿。据国家数据局该数值约为100万亿，这反映了AI大模型在国内各行各业逐步应用与商业化落地。Token调用量是衡量AI模型使用强度与商业价值的核心指标，国内AI大模型Tokens识别风险，发现价值请务必阅读末2024年初2025年3月2025年6月2025年12月0单位：万亿Tokens训等ToB与ToC场景中，同样带动了调用量的高速增长。此外，火山引擎的持续扩展，使得越来越多的开发者通过API调用大模443.15.021.0000000004208642111单位：万亿Tokens数据来源：火山引擎官方微信公众号，广发证券发展研秒2000至5000tokens：根据华为官方微信公众号，在8K长序列的输入场景中腾950超节点在推理DeepSeekV4-Pro的单卡Tokens吞吐量可以达到4700To秒，在推理DeepSeekV4-Flash的单卡Tokens吞吐量可以达到1600Token识别风险，发现价值请务必阅读末虑到DeepSeekV4较大比例的推理采用华为昇腾等国产AI芯片，我们假设单位A速卡推理DeepSeekV4和KimiK2.6大模型tokens的吞吐量为每秒2000至5000模型推理场景数据来源：华为官方微信公众号，广发证券发展型的推理与用户对其调用的时间相关。正常情况下，用户在晚间睡眠时间（12:00-节点形态转变。根据华为微信公众号官网，当前支持DeepSeekV4参考华为Atlas900A3SuperPod超节点的求，预计新增采购的AI加速卡在11万至颗；新增的超节点在283至1236台之间。识别风险，发现价值请务必阅读末产AI芯片适配；另一方面，英伟达的AI芯片在国内的销售受到政策较大的影响，因此，我们预计下游客户有望采购较大比例的国产AI芯片来满足由于DeepSeekVKimiK2.6推理而带来的新增算力需拉动CPU的需求。尤其在多智能体协作的场景下，大规模并行运行的AIAgent将较大程度依赖CPU进程数、核心数以及单核性能等硬件资源。最后，昇腾超节点通过芯片间高速互联实现Tokens吞吐量的提升也有望广泛推广。未来，国内服务器整机厂商推出的搭载国产AI芯片的超节点产品有望随着Deep应用而放量。一方面，伴随V4-Pro与V4-Flash显著下移API价格后，Toke华为昇腾950，并已与寒武纪等国产芯片实现Day0适配。其官方技增将在一定程度上锁定后续长期的订单，而国产芯片的适配将带动国产芯片的需求再以算力调度运营为例，从长逻辑出发，需求激增后会进一步带动供给相关的算力资源建设，如何对算力进行统一的调度及运营则更为重要。因为现在还存在着算力资源利用率低、算力的弹性需求高、算力中心所处区域错配下导致供需不平衡、以及异构资源较多导致管控难度较高的特点。识别风险，发现价值请务必阅读末阶段性任务推动下，算力需求在短期内快速攀升，而在非高峰阶段又明显回落，的算力需求激增，也易在需求回落阶段造成资源闲置，整体投入产出效率承压。识别风险，发现价值请务必阅读末算力的高效、普惠供给，跨区域协同成为必然选择。角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏等8大国家算加速成型，国家枢纽节点间传输时延不超过20ms，集群到周边主要城市传输时宁夏枢纽算力网络国家枢纽节点•宁夏枢纽算力网络国家枢纽节点•发放“算力券”，支持高校、科研机构、算力中介服务机构等使用区内超算、智算资源，开展核心算法创新、模型训练研发等，全力建设“中国算力之都”。•2025年计划建成算力中心容量达1,650MW。和林格尔算力中心集群•从优化算力产业布局、强化电力保障、促进调度交易、推进绿色发展、拓展应用场景以及加强科技创新和人才培养等6方面提出16条支持措施，拿出“真金白银”赋能绿色算力产业高质量发展。•2025年计划建成算力中心容量达2,500MW。甘肃枢纽算力网络国家枢纽节点京津冀枢纽算力网络国家枢纽节点庆阳算力中心集群•布局以应用驱动为主的数据开发利用大格局，持续提升数据综合应用效能。庆阳算力中心集群•布局以应用驱动为主的数据开发利用大格局，持续提升数据综合应用效能。•2025年计划建成算力中心容量达750MW。成渝枢纽算力网络国家枢纽节点天府算力中心集群•建成服务京津冀的区域算力调度中心，初步实现集群内数据中心的一体化高效调度，可调度算力占总算力的比重超50%。•2025年计划建成算力中心容量达1,750MW。长三角枢纽算力网络国家枢纽节点长三角生态绿色一体化发展示范区集群•开展“算走协同长三角生态绿色一体化发展示范区集群•开展“算走协同”“算网协同”“算能协同”“算产协同”四大行•2025年计划建成算力中心容量达250MW。芜湖算力中心集群•2023—2025年，省级每年统筹安排1亿元，用于支持起步区数据中心项目建设。芜湖算力中心集群•2023—2025年，省级每年统筹安排1亿元，用于支持起步区数据中心项目建设。•2025年计划建成算力中心总容量达1,600MW。粤港澳大湾区枢纽算力网络国家枢纽节点韶关算力中心集群•在智慧基础设施建设、智算资源成本、公共算力调度平台建设等方面予以不同标准的保障和补贴。•持续深入实施“算力山城强算赋能”行动，构建云、边、端协同，算、运、存融合一体化的算力网络体系，全力打造全国算网融合发展高地。•重庆2025年计划建成算力中心容量达贵安算力中心集群•2025年计划建成算力中心总容量达1,250MW。•聚焦算力、赋能、产业三个关键词，因地制宜发展新质生产力，•2025年计划建成算力中心总容量达1,250MW。•2025年计划建成算力中心容量达2,000MW。识别风险，发现价值请务必阅读末），务针对特定领域优化的针对单一任务完全定规模数据处理针对特定领域优化的针对单一任务完全定针对单一任务完全定执行固定功能握并行编程技术但硬件兼容性较好执行固定功能造而出的商业模式也较为丰富。核心是通过算力资源池化、智能调度与市场化服务实现价值变现，主要涵盖算力银行、算力超市两大创新形态，辅以算力租赁、调度佣获利路径清晰，①赚利差，以较低成本归集闲置算力，高价出租获取差价；②抽佣识别风险，发现价值请务必阅读末逻辑。其盈利主要来自三方面：①交易佣金，向入驻服务商收取交易额一定比例的业用算门槛的同时，实现规模化、普惠化盈利。识别风险，发现价值

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快

文档简介

温馨提示

最新文档

评论

计算机行业AI模型系列（三）：DeepSeek V4和Kimi K2.6：性能跃升国产算力适配加快

文档简介

温馨提示

最新文档

评论

相关文档