版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容目录一、产Token破140万亿,CPU涨潮起 4内均Token调量破140亿产AI力需持扩,内力厂进业临点 4CPU与AI编端提价算通实性导 4二、推振算需极速放 6模“备赛并未温向高量更多态速步 6理力求以预期斜上升 8三、给外边改,内国化速量 11四、产力链胀有望价升 13五、关的 15风险示 15图表目录图表1:3月23-27球AI大型调量前阵营,国AI模型据六席 4图表2:算全共步入价期 43:NVIDIARubinCPUGPU5图表4:英达CPU为体AI作打造 6图表5:玄铁C950云算典场性达界先水平 6图表6:EazyDevelop员订套价调整 6图表7:EazyDevelop惠专各餐价 6图表8:Seedance2.0生成频示(1) 7图表9:Seedance2.0生成频示(2) 7图表10:各项测,Seedance2.0综现达行领水平 7图表AIArena模盲测据 7图表12:全球的ArtificialAnalysis榜,GLM-5位全第开源一 8图表13:GLM-5Coding能及Agent能取源8图表14:2025累音播量剧,前中AI及态漫多 9图表15:GPT‑5.3-Codex在SWE-BenchPro上到了尖(state-of-the-art)水平 10图表16:蚁阿“康陪”能 10图表17:KimiK2.5模使用个的agent群完文综述 11图表18:OpenClaw目正顶Github11图表19:OpenClaw的GitHub标长势 11图表20:产用GPU从“用向好”级 12图表21:芯国产能利用持提升 12图表22:讯云布面适主国芯片 13图表23:谱布GLMCodingPlan价调整 14图表24:2020-2028中国能力模预(EFLOPS,于FP16计算) 14一、国产Token量破140万亿,CPU涨价潮又起Token140AItokenAI20241000202510020263token140OpenRouter316-22AI20.4TokenAIAI7.36Token56.9323-27AITOP106202564.9720.59AI,通子计2025实归净润2.70元至3.30元同增速间达996.83至1240.57景科技预计2025年实现净利润3000万元至4350万元,较上年同期顺利扭亏为盈。图表1:3月23-27日全球AI大模型总调用量前十阵营中,中国AI大模型占据六席OpenRouterCPUAICPU2510TrendForce13RaptorLake14RaptorLakeRefresh10261WccftechCPUCPUAMDCPU325AMD34CPU10-151-26AIAIAMDCPUCPU图表2:算力全链共振,步入涨价周期厂商公告时间具体内容AWS1月4日EC2机器学习容量块价格上调约15%,包括由NVIDIAGPU驱动的P5en、P5e、P5、P4d,以及使用Trainium实例,P5e.48xlarge34.6139.80P5e43.26美元/49.75美元/小时。三星电子
1月5日 2026Q1将DRAM价格较2025Q4提升60%至70%(包括向服务器、PC及智能手机领域1月25日 2026Q1NAND闪存供应价格上调100%以上。SKSK海力士3月2日 上调2025Q2DRAM价格,DDR5颗粒统一涨价40%,部分产品涨幅高达100%。1月5日 2026Q1将服务器DRAM价格较2025Q4提升60%至70%(向服务器、PC及智能手机领域3月2日 上调2025Q2DRAM价格,DDR5颗粒统一涨价40%,部分产品涨幅高达100%。谷歌云 1月27
GoogleCloud、CDNInterconnect、PeeringAI与计算基础设施服务进行价格调整;北美地区数0.04美元/GiB0.08美元/GiB100%0.05美元/GiB0.08美元0.06美元/GiB0.085美元42%。网宿科技 2月4
CDN产品标准服务组流量上调35%,CDN产品快速回源通道流量上调40%,对象存储产品存储空间上调40%。优刻得 2月日 对续签及新签用户的全线产品与服务进行价格上浮调整。铠侠铠侠2月14日 2026Q1NAND闪存供应价格翻倍。Hetzner 223腾讯云 3月
30%38%CCXvCPU云服务器价格普遍涨30%水平。GLM5、MiniMax2.5、Kimi2.5HY2.0InstructHY2.0Think的价格上调,其中,HY2.0Instructtokens0.0008元调整为0.0045050.002元;HY2.0Think0.0010.0053元,输出价格从0.004元调整为0.0212元。阿里云 3月18日 平头哥真武810E等算力卡产品上涨5%-34%,文件存储产品CPFS(智算版)上涨30%。百度智能云 百度智能云 3月18日 AI算力相关产品服务上调约5%-30%,并行文件存储等上调约30%。英特尔 3月19日 计划3月起将全线CPU产品价格统一上调约10%。AMDAMD3月25日 计划4月起将全系CPU价格上调约10-15%。ftr6AgenticAICPU1)CPUAICPUAIAI80-90AgentCPU2)AgentCPUARMCEOHass(GW)CPU4CreativeStrategiesCPU20262502030600AI1000CPUAICPUCPU图表3:NVIDIARubin平台中CPU连接GPU、内存与高速互联网络,成为系统调度与资源协调的核心枢纽NVIDIATechnicalBlogCPUCPU1)316AIVeraCPUOlympusx86CPU5032)ARM324CPUx8621GWAI100Meta、OpenAI、Cerebras、CloudflareCPUAgenticAICPUAgent,CPUCPU324RISC-VCPU,SPECCint200670AIQwen3DeepSeekV37000,5000,3000图表4:英伟达VeraCPU专为智能体AI工作负载打造图表5:玄铁C950云计算典型场景性能达业界领先水平NVIDIABlog DAMOAIIDEEazyDevelop3250.9/tokens1.99/tokens0.598/tokens1.198/tokens、0.999/tokens1.999tokens0.7998tokens1.3998/tokens。AIAI图表6:EazyDevelop会员订阅餐价格调整 图表7:EazyDevelop普惠专区套餐定价卓信微公号 卓信微公号二、训推共振,算力需求极速释放大模型军备竞赛并未降温,向更高质量、更多模态加速进步头部互联网厂商的护城河效应日益显著,字节跳动(豆包系)、阿里巴巴(通义系)、腾讯(元宝系)近期密集发布了万亿参数级的新一代主力模型,以智谱AI、DeepSeek(深度求索)、Minimax、科大讯飞为代表的AI新势力亦在快速迭代其MoE架构。更为关键的是,Scaling-law在多模态领域也已展现出延续性,多模态视频生成是典型的算力吞噬兽,进一步显著利好算力基础设施。AI21220262142.0Seedance2.0Seedream5.0Preview2.0Agent12Seedance2.0Seedance2.0SOTASeedance2.0SOTASeedance2.0,Seedance2.0新增了视频编辑和视频延长能力,每位用户都能像导演一样掌控全场。在各项评测中,Seedance2.0的综合表现达到行业领先水平。图表8:Seedance2.0生成视频示(1) 图表9:Seedance2.0生成视频示(2)字跳官公号 字跳官公号图表10:在各项评测中,Seedance2.0的综合表现达到行业领先水平字节跳动官方公众号Qwen-Image-2.0,210Qwen-Image-2.0Qwen-Image-2.01)tokenPPT//2)2k/AIArenaQwen-Image-2.0图表11:AIArena模型盲测数据千问大模型官方公众号Deepseek211APP1M()Token8DeepSeekV3.1128K;20255智谱发布新一代旗舰模型GLM-5,在Coding与Agent能力上取得开源SOTA。2月12日,智谱上线并开源GLM-5,其在Coding与Agent能力上,取得开源SOTA表现,在真实编程场景的使用体感逼近ClaudeOpus4.5,擅长复杂系统工程与长程Agent任务。在全球权威的ArtificialAnalysis榜单中,GLM-5位居全球第四、开源第一。GLM-5基座能力全面演进:1)参数规模扩展:从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,更大规模的预训练算力显著提升了模型的通用智能水平;2)异步强化学习:构建全新的Slime框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力;3)稀疏注意力机制:首次集成DeepSeekSparseAttention,在维持长文本效果无损的同时,大幅降低模型部署成本,提升TokenEfficiency。图表12:在全球权威的ArtificialAnalysis榜单中,GLM-5位居全球第四、开源第一智谱官方公众号图表13:GLM-5Coding能力及Agent能力取得开源SOTA智谱官方公众号以字节、阿里、腾讯三家大厂为例,随着大厂围绕AI入口展开高强度竞争,流量获取与生态打通形成合力,推动AI20252.33APP阿里:千问借助阿里巴巴生态的资源优势,打通了淘宝闪购、飞猪、盒马、大麦、高德、支付宝等多款应用,融合生态内的交易体系、地理位置服务、出行资源、电商资源等能力,让AI能够丝滑地实现点外卖、购物、订机票等相对复杂的操作,真正化身为用户身边的全能管家。数据显示,上线两个月,千问C端(消费者端)月活跃用户数已突破1亿,在学生和白领人群中增长迅猛。腾讯:2026年开年以来,腾讯在AI领域动作频频:先是启动社交AI元宝派内测,接着狂撒10亿元红包为元宝派拉新,引发AI圈红包大战。除了模型本身的入口流量,AI漫剧、AI编程等原生应用的快速爆发,AI医疗、智能制造等垂类模型的蓄势待发。多模态驱动视觉质变及技术红利释放,动态漫、AI漫剧已成爆款。2025年多模态技术收敛推动视觉表现力跨越式提升。供给端,AI大幅压降制作周期,实现低成本批量化产出;需求端,紧凑节奏与高情绪密度精准击中用户痛点。供需双侧适配,驱动赛道从边缘迈向主流。根据短剧自习室公众号统计,从2025年度抖音端漫剧累计播放量TOP100榜单来看,共有52部沙雕漫、28部AI漫剧、17部动态漫、3部解说漫上榜,分别占比52、28、17、3。其中仅有1部突破5亿播放——AI漫《斩仙台下,我震惊了诸神》,10月份上线,截至26年1月初累计播放量10.6亿,成为当之无愧的2025年度剧王。图表14:2025年累计抖音播放量TOP10漫剧统计,前十中AI漫及动态漫居多短剧自习室公众号统计AI编程从辅助工具迈向原生入口,开发工作流进入Agent时代。随着模型在长上下文理解与多文件协作能力上的突破,AI编程正由代码补全插件升级为具备规划、生成与验证能力的编程Agent。2月2日OpenAI推出编码助手Codex独立App,并发布底层GPT-5.3-Codex模型,独立应用程序Codex在推出后的第一周下载量就超过了100万次且Codex用户总数环比增长60。相比于之前的AI编程大模型,GPT-5.3-Codex超越编程,旨在支持软件生命周期中的所有工作,包括调试、部署、监控、编写公关需求文档(PRD)、编辑文案、用户研究、测试、指标分析等,可以在几天时间内从零开始构建功能高度复杂的游戏和应用程序,在SWE-BenchPro和Terminal-Bench上创下了行业新高,并在OSWorld和GDPval上表现强劲。图表15:GPT‑5.3-Codex在SWE-BenchPro上达到了顶尖(state-of-the-art)水平OpenAI官网全球巨头抢滩,专业化闭环重塑医疗生态。1)爆款验证C端刚需:2025年12月25日,蚂蚁集团战略升级蚂蚁阿福,实现从单一工具向AI健康伙伴的形态跃迁。发布当日即冲至苹果应用商店总榜TOP3,现象级表现有力验证了C端用户在严肃健康场景下强烈的交互需求与信任交付。2)垂直闭环构筑壁垒:不同于通用大模型的泛化问答,阿福依托专业医疗底座,深度打通智能问诊-在线挂号-医保支付全链路。这种将信息流直接转化为服务流的闭环能力,确立了其在医疗垂直场景下不可复制的竞争优势。3)产业趋势全球共振:2026年1月8日,OpenAI跟进推出ChatGPTHealth。继蚂蚁阿福之后,全球AI领军者不约而同切入医疗赛道,进一步强化了该细分领域高壁垒、高单价、高粘性的产业逻辑,板块配置价值显著提升。图表16:蚂蚁阿福健康陪伴功能21世纪经济报道Agent1)Anthropic,ClaudeCodeAnthropic180550ClaudeCode111014902)K2.5AgentK2.51001500K2.5TokenAIAgentOpenClaw7×24TokenAI,KimiMinimaxOpenClawOpenClaw图表17:KimiK2.5agent集群完成文献综述
图表18:OpenClaw项目正式登顶Github榜首月面kimi公号 OpenClawX平台官方号PromptAgentGTC2026PromptAgentOpenRouter202633OpenClaw24.8GitHubLinuxGitHubOpenClawAgent图表19:OpenClaw的GitHub星标增长趋势star-historyAgentAnthropic41520261AIAIToken三、供给端外部边际改善,内部国产化加速放量NVIDIAH200(),113H200(AI)(BIS)H200国产算力芯片的性能与生态建设已跨过可用向好用的拐点。国产GPU在性能指标、软件生态、应用适配等方面与NV最先进一代仍有差距,但已基本追平H20、A100等,且在本地化服务、政策支持、成本控制等方面具备优势。随着资本持续注入,国产企业有望在细分场景实现突破,逐步扩大市场份额。1)算力指标上:国内多数头部企业主流在售产品的FP16/BF16在100-300TFLOPS左右,处于英伟达A100产品阶段,少数厂商通过先进封装等方式实现接近英伟达H100产品的算力,为国内最先进水平;2)显存方面:国内企业结合自身产品特点,分别选择HBM2e、HBM2、GDDR等显存类型,显存带宽在0.5-2TB/s左右。图表20:国产通用GPU从可用向好用升级参数/厂商平头哥NV华为壁仞型号PPUA800H20昇腾910B104P显存容量96G80G96G64G32G显存类型HBM2eHBM2eHBM3HBM2HBM2e片间带宽(GB/s)700400900392256PCIe5.0×164.0×165.0×164.0×165.0×16功耗(W)400400550350300芯东西微信公众平台2025202524.894.51.612利用保在95.7体8寸能用过100,体12寸近载,主是业重和迭效20262025持平。图表21:中芯国际产能/利用率持续提升TrendForceCSP厂商加速适配,助力国产芯片生态建设。英特尔的X86生态、英伟达的CUDA生态之所以难以撼动,核心在于形成了芯片-软件-应用的闭环。而当前国产阵营中,华为昇腾、阿里平头哥、壁仞科技等芯片厂商各有技术路线,生态分散问题显著。腾讯集团高级执行副总裁汤道生在交流中坦言,不同参数规模的AI模型需要适配不同芯片配置,当前只能通过与多家厂商合作实现场景覆盖。百度、阿里等企业加速适配国产芯片,推动芯片-模型-应用闭环形成。图表22:腾讯云宣布全面适配主流国产芯片腾讯全球数字生态大会四、国产算力全链通胀,有望量价齐升在供需双侧强逻辑的挤压下,我们预判2026年算力产业链将进入全链通胀周期,行业景气度将从核心芯片向AIDC、云
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年发改系统生物经济发展案例考核题库
- 2026年网络与信息安全问题解决方案集
- 2026年青年干部主动担当精神竞赛题
- 2026年物流标准化与托盘共用知识测试题
- 2026年招商引资项目亩均效益评价知识题库
- 2026年网安法制岗面试题库
- 2026年城市房地产管理法知识测试题
- 2026年文学鉴赏与文学理论应用测试题库
- 深度解析(2026)《GBT 18150-2006滚子链传动选择指导》与行业前瞻性应用策略
- 社区姑息护理:姑息护理的社会支持
- 2025年高职(酒店管理与数字化运营)酒店数字化阶段测试题及答案
- 涉密会议保密工作方案
- 《冲压工艺与模具设计》全套教学课件
- TCEC电力行业数据分类分级规范-2024
- 酒店突发事件应急处理方案应急预案
- 三角洲公司员工劳动合同协议
- 2025年江苏苏州数智科技集团有限公司招聘笔试参考题库含答案解析
- 2025北京保障房中心有限公司校园招聘笔试历年难易错考点试卷带答案解析试卷2套
- 泵站卧式水泵安装施工指南
- 《炼油与化工设备分类编码》
- 2025四川成都高新投资集团有限公司选聘中高层管理人员4人笔试历年参考题库附带答案详解(3卷合一)
评论
0/150
提交评论