算力芯片行业深度研究报告：算力革命叠浪起国产GPU奋楫笃行

上传人：b*** IP属地：广西上传时间：2026-03-06 格式：DOCX 页数：30 大小：1MB 积分：18 举报 版权申诉

已阅读5页，还剩25页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

目录一、并行计算能适用于AI训推需求，大型发展催化GPU需求 6（一）GPU长行算，于AI计加速 6（二）GPU业价集中中，AI片拉动GPU市规增长 7（三）ScalingLaw依成立大型发要GPU提海算力 9二、海外巨头持续码AI投入，英伟达占据全导地位（一）AI入产实闭环海巨定AI资信心（二）伟占全导地，与CUDA态共深壁垒 16三、美国扩大高端出口限制，国产奋力自主可控 19（一）国大口范围产GPU主迫在睫 19（二）内GPU商速追，产代辰海 19（三）GPU应主路线有异沐曦摩线程引于26/27陆续转盈 24四、相关标的 281、武纪 282、光息 283、尔程 294、曦份 295、芯际 306、虹司/虹导体 30五、风险提示 321、游求及期 322、产代展及期 323、工应险 32图表目录图表1 GPU有多去进数处理 6图表2 GPU加效超CPU 6图表3 GPU占务本百比(%) 6图表4 要AI算芯片类比表 7图表5 GPU产链 8图表6 2020-2029球GPU场模亿币） 8图表7 2020-2029国GPU场模亿币） 8图表8 2020-2029国AI算GPU场（亿民） 9图表9 项准中AI技表与类对比 10图表10 Scalinglaw依然效 10图表训和理需求续升 10图表12 Gemini3与他AI品力比图表13 OpenRouter模型token用量 12图表14 谷歌调量增示图万） 13图表15 谷第季要部业指（美） 13图表16 北科巨本开快上（美） 14图表17 海大关于capex引描述 14图表18 2025年美AI头部业资战合关系览 15图表19 GPU核参数 16图表20 英达营亿美） 17图表21 英达据营收亿元） 17图表22 英达件参数比 17图表23 CUDA构示图 18图表24 CUDA的成分 18图表25 华昇系品 20图表26 寒纪MLU370 21图表27 寒纪能器架示图 21图表28 海信产意图 22图表29 海软栈图 22图表30 摩线主品分类 22图表31 摩线程MTTS4000 23图表32 MUSA架意图 23图表33 沐股产类 23图表34 沐股曦云C500 24图表35 MXMACA软件框结构 24图表36 各司始/核心队源理 24图表37 国产GPU上公司入况析亿） 26图表38 GPU上公毛利情况 27图表39 寒纪海息净率况 27一、GPU并行计算能力适用于AI训推需求，大模型发展催化GPU需求（一）GPU擅长并行计算，适用于AI计算加速GPU不仅仅负责图形处理，也能负责通用计算。GPU，图形处理器（GraphicsProcessingUn的的GU被称为GG（Genealose007C能打通主机端和设备端的CUDA架构之后，所有的GPU都能够转化为GPUGPUGPU成为了驱动现代及未来尖端科技发展的核心引擎。以机器学习(ML)和人工智能(AI)GPU图表1 GPU有更多核去进行数据处理图表2 GPU加速效果超CPU伟达开发者网站伟达COMPUTEX发布会、转引自bilibili在服务器成本中，GPU占据核心部分。从成本占比看，以英伟达DGXH100为例，8GPU+4NVSwitch72.62%CPUGPU图表3 GPU占服务器本百分比(%)8GPU+4NVS8GPU+4NVSwitch基板,72.62%导体行业观当前共有四种AI计算加速芯片技术架构，GPUAI计算加速芯片可分为GPU、FPGA（FieldProgrammableGateArrayASIC（ApplicationSpecificIntegratedCircuitNPU（NeuralProcessingASICNPUAI更多专业化的AI图表4 主要AI计算加芯片种类对比表GPUFPGAASIC定制化程度通用型半定制化定制化编程语言/架构CUDA、OpenCL等Verilog/VHDL等硬件描OpenCL、HLS固定电路无需编程延迟1ms1us1us主要优点峰值计算能力强、通用性强、产品和生态成熟平均性能较高、功耗较低、灵活性强专业性强、功耗很低、体积小、量产成本低主要缺点成本高、不可编辑、功耗高量产成本高、峰值计算能力较低、编程门槛高前期投入成本高、不可编辑、研发时间长、技术风险大人工智能的应用范围模型训练模型推理模型推理模型训练模型推理尔线程招股书转引自弗若斯特沙利文、甲子光年《中国AI算力行业发展报告》，华创证券（二）GPU产业链价值集中在中游，AI芯片需求拉动GPU市场规模增长GPUEDAIPEDAIPGPUGPUASMLGPUGPU产业链的中游是附加值最高的环节，包括设计和制造两大方面。GPU设计呈现出一超多强的多元化态势。行业领导者英伟达以CUDA生态构筑了极高壁垒，TechInsights2023年全球数据中心GPU38598%2022与英特尔的GPUPCGPUGPU（FablessIDMFoundryGPU制GPU在GPU产业链下游，系统制造商将产品发往诸多终端应用。下游中，分销商负责销售GPUPCNVIDIA与AMDGPUGPUGPU。图表5GPU产业链尔线程招股书转引自弗若斯特沙利2020年至2029年，世界及中国的GPUAI算力需求激增使GPU市场爆发式增长，据弗若斯特沙利文测算，2024年全球规模达10,515.37GPU2020384.7720241,638.17AIGPU142.86996.7262.5%AI2029GPU36,119.74202415.6%37.8%13,635.78亿AIGPU202910,333.402024641.4520293,302.38亿元。图表6 2020-2029年全球市场规模（亿人币）图表7 2020-2029年中国市场规模（亿人币）40000350003000025000200001500050000

202020212022202320242025E2026E2027E2028E2029E全球GPU市场规模（亿元人民币） YoY

120%100%80%60%40%20%0%

16000140001200080006000400020000

202020212022202320242025E2026E2027E2028E2029EAI智算产品桌面级产品 YoY

90%80%70%60%50%40%30%20%10%0%-10%尔线程招股书转引自弗若斯特沙利尔线程招股书转引自弗若斯特沙利中国AI下游应用市场扩张带动的AI计算加速芯片需求扩张中，GPU仍为主导。根据AI20241,425.37202913,367.92202953.7%AI计算加速芯片的细分市场上看，GPU的市场增长速度最快，其市场份额预计将从69.9%202977.3%10,333.40GPUGPU2020822024687.2270.1%55.7%20296,639.16AI58.8%20293,694.24亿元。图表82020-2029年中国AI智算GPU市场规模（亿人民币）0

2020 2021 2022 2023 2024 2025E 2026E 2027E 2028E

100%3694.242413.483694.242413.481544.986639.16951.884449.0760.86 99.5382 135.66145.02194.84175.72340.03309.5687.22581.31130.912880.21827.5480%70%60%50%40%30%20%10%0%数据中产品其他产品 YoY尔线程招股书转引自弗若斯特沙利（三）ScalingLaw依旧成立，大模型的发展需要GPU提供海量算力人工智能取得突破性进展，多模态大模型涌现。十年前，世界上最好的人工智能系统也无法以人类的水平对图像中的物体进行分类。如今，人工智能已在多项基准测试中实现ArtificialIntelligenceIndexReport2024》20152017202020212023ChatGPTAI编GitHubCoPilotStableDiffusion8全面刷新最高记录，并在GPQA88.4%图表9 多项基准测试中AI的技术表现与人类表对比tanfordUniversity《ArtificialIntelligenceIndexReport2024》大语言模型进化遵循Scalinglaw能遵循ScalingLaw试损失会以可预测的幂律形式下降。据OpenAIScalingLaw已规律。未来，随着AIAI图表10 Scalinglaw法则依然有效图表训练和推理算需求持续提升penAI官网伟达官网二、海外巨头持续加码AI投入，英伟达占据全球主导地位（一）AI投入产出实现闭环，海外巨头坚定AI投资信心大模型在应用端的表现仍然在显著进步，为其市场发展奠定基础。2025年11月，谷歌发布Gemini3NanoGemini2.5ProClaudeSonnet4.5NanoBanana2在图表12 Gemini3与其他AI产品能力对比测试项目Gemini3ProGemini2.5ProClaudeSonnet4.5GPT-5.1学术推理37.50%21.60%13.70%26.50%视觉推理谜题31.10%4.90%13.60%17.60%科学知识91.90%86.40%83.40%88.10%数学95.00%88.00%87.00%94.00%具有挑战性的数学竞赛题23.40%0.50%1.60%1.00%多模态理解与推理81.00%68.00%68.00%76.00%屏幕理解72.70%11.40%36.20%3.50%从复杂图表中进行信息综合81.40%69.60%68.50%69.50%OCR（数值越低越好）0.1150.1450.1450.147从视频中获取知识87.60%83.60%77.80%80.40%竞争性编程题2,4391,7751,4182,243智能终端编码54.20%32.60%42.80%47.60%智能编码76.20%59.60%77.20%76.30%智能工具使用85.40%54.90%84.70%80.20%长期智能任务$5,478.16$573.64$3,838.74$1,473.43保留内部基础、参数化、多模态和搜索检索基准70.50%63.40%50.40%50.80%参数化知识72.10%54.50%29.30%34.90%多语言通用人工智能评估91.80%89.50%89.10%91.00%跨100种语言和文化的常识推理93.40%91.50%90.10%90.90%长上下文表现77.00%58.00%47.10%61.60%讯科技AI未来指北官方账AIAgent10月CaGT8亿DepchpeAI；AI20亿，Gemini6.5亿（Anthropic30。OpenRouter2025token25105旗下大模型GrokCodeFast1token5.5Antropic旗下ClaudeSonnet4.52.4token10Gemini2.5Flash1.6图表13OpenRouter平台模型token调用量penRouteToken调用量的大幅增加是大模型功能突破与AI赋能业务的结果。谷歌季度电话会议披露，2025年谷的度用从5的480亿幅至7的980亿，并在10爆式长至1300升奏歌Gemini2.5NonaBanana等品的更新调搜域概功和AIMode过升回质显提升用户搜索205年12宣旗下GeniAI的（ndpheacho现在支中等40种语，向GoogleOneAI级划户放而提强大的AI研辅能。图表14 谷歌调用量增长示意图（万）14001200100080060040020002025年5月 2025年6月 2025年7月 2025年8月 2025年9月 2025年10月Token歌官注：25年6月8月及9月token调用量未披露）与tokenAI202573500ChatGPTPlusPro2020020302.2ChatGPTAlphabet2025三季1023.5亿美元，同比增长16%；净利润为349.8742565.6151.59.9%15%图表15谷歌第三季度主要部门业绩指标（亿美元）120010008006004002000营业收入广告收入搜索部门入云业务收入利润2024年三季度 2025年三季度loomberg 注：广告和搜索业务收入存在重叠）AI算力成为此轮AIChatGPT掀AIScalinglawAIAIAI础设施。CY2025前三季度北美云厂商Meta、亚马逊、谷歌、微软CapEx总和达2574.2Y+5024图表16 北美科技巨头本开支快速上行（美）0Amazon Microsoft Google Meta

120%100%80%60%40%20%0%-20%loomberg海外云厂商25202550%202591030Y73.27.的AIMeta25700-720,251250Y+0.6图表17 海外大厂关于capex指引及描述公司名称最新全财年capex指引财年对应自然季度YoY（%）语言描述Amazon1250亿美元2025Q1-2025Q450.6%大部分支出将用于支持技术基础设施的增长。这主要包括AWS的投资，以满足AI服务的需求，并支持北美和国际业务板块的技术基础设施。此外还会继续投资于提高我们履约和运输网络的能力，以支持未来的增长，还会投资当日达配送设施和入库网络，以及机器人和自动化技术，以提高配送速度，降低履约成本。这些资本投资将支持amazon未来多年的增长。Google910-930亿美元2025Q1-2025Q473.2%-77.0%将继续向AI领域倾斜，开支主要用于对服务器和数据中心的投资Meta700-720亿美元2025Q1-2025Q487.9%-93.3%2025AI示未来数年，Meta还将投入数千亿美元用于人工智能基础设施，他仍然认为，从长远来看，大力投入资本支出和基础设施建设将成为一种战略优势。公司业绩说明会、Bloomberg北美巨头战略合作坚定AI2025OpenAIOracle+AI9OpenAI1000时间投资/合作方被投资/合作方投资/合作方承诺被投资/合作方承诺2025年微软英伟达AzureNVIDIADGXSuperPOD架构；①在AzureAIFoundryNVIDIANIM务②深度集成NVIDIAAI软件栈；②优化热门开源语言模型的推理功能并确保这些模型能在AzureAI时间投资/合作方被投资/合作方投资/合作方承诺被投资/合作方承诺2025年微软英伟达AzureNVIDIADGXSuperPOD架构；①在AzureAIFoundryNVIDIANIM务②深度集成NVIDIAAI软件栈；②优化热门开源语言模型的推理功能并确保这些模型能在AzureAIFoundry上使用AzureNVIDIAGPUAzure虚拟机驱动的创新产品；AzureNDGB200V6等虚拟机实NVIDIA加速器NVIDIANIMAzureContainerApps无服务器图形处理单元正式上市；NVIDIABlackwellUltraGPUNVIDIAPRO6000Blackwell服务器版引入Azure。2025-2026分批次英伟达OpenAIOpenAI1000亿美1001中心的建成而逐步投入；①部署至少10GW的NVIDIA系统，用于训练和运行下一代AI模型②支持OpenAI建设10GW的AI数据中心。②联合优化OpenAI的模型路线图、基础设施软件与英伟达的硬件及软件2025年初OpenAIOracle53000OracleAI数据中心算力。①在美国德克萨斯州阿比林等地投资建设超大规模AI数据中心（Stagte项目OpenAI训练与推理需求；②提供总计4.5GW数据中心容量及英伟达GB200芯片；2025.5Oracle英伟达1040GB200Superchip400OpenAIStargate数据中心建设。①按期交付GB200芯片；2025.11微软+英伟达Anthropic①微软、英伟达分别投资至多50亿、100亿美元；①向微软采购300亿美元Azure算力和最高1GW额外算力ClaudeCopilot问权限。②算力完全基于英伟达的GraceBlackwall和VeraRubin架构；③允许微软和英伟达云服务平台使用Claude公司官网，IT之家，华尔街日报、路透社，转引自币界网，AI科技网，华尔街见闻，爱范儿，至顶头（二）英伟达占据全球主导地位，硬件与CUDA生态共筑深厚壁垒GPU的核心性能指标主要包括核心数量、工作频率、显存容量、显存带宽、计算能力与精度覆盖范围。GPU的核心数量越多，在处理任务时就能够同时处理更多线程，不仅能GPUAI计算，GPUGPUAI图表19 GPU核心参数GPU参数说明核心数量作为GPU的核心指标，核心数量越多，GPU在处理图形渲染、科学计算、AI计算加速等任务时能够处理更多线程，提升运算效率。核心数的增加不仅可以显著提升性能，也能有效分摊工作负载，从而更好地满足高强度计算需求。时钟速度时钟速度指GPU每秒可执行的时钟周期数，对数据处理速度和性能输出具有直接影响。更高的时钟速度意味着在同等时间内能够完成更多的运算任务，满足对实时性、低延时的应用场景需求。显存容量显存是GPU临时存储数据的空间，容量的大小在处理大型数据集、高分辨率图像或视频时尤为重要。较大的显存容量可减少GPU与系统内存之间的频繁数据传输，在多任务或高分辨率场景下有效提升性能和效率。显存带宽显存带宽指单位时间内GPU内部存储器可传输的数据量。较高的显存带宽确保了在面对高负载时，数据能被快速送达处理核心，进而维持流畅的运行效率。对需要高吞吐量的应用（如深度学习推理或复杂图形渲染）而言，显存带宽是关键的性能瓶颈之一。计算能力GFLOP/S（）GPU并行计算性能的主要指标。更高的计算能力意味着在AI算、工程模拟等高强度场景中可以实现更快的运算速度和更高的产出。计算精度覆盖范围GPU支持的计算精度范围（如FP64、FP32、FP16、FP8、INT8等）反映了其在多样化任务中的灵活度。随着AI技术的不断演进，不同的应用场景对计算精度的要求也各不相同。能够支持多种精度水平的GPU不仅具备更高的灵活度，也能在多样化的AI任务中实现更佳的性能与能效。尔线程招股说明英伟达处于全球GPU市场领先地位。英伟达（NVIDIA）总部位于美国加利福尼亚州，1993GPUJonPeddieResearch94%AMD求的兴起，英伟达凭借领先的GPUAI在数据中心GPUGPUAI中，英伟达的总收入从Q4FY25393.3亿美元上涨到Q3FY26（20251026日570.162.5%355.8512.2Q366.4%90.5%88.8%87.9%GPU（CFO）（ColetteKress）2026BlackwellRubinAI5000图表20 英伟达总营收亿美元）图表21 英伟达数据中营收（亿美元）0

FY24Q4FY25Q1FY25Q2FY25Q3FY25Q4FY26Q1FY26Q2FY26Q3

25%20%15%10%5%0%

FY24Q4FY25Q1FY25Q2FY25Q3FY25Q4FY26Q1FY26Q2FY26Q3

30%25%20%15%10%5%0%总收入 QoQ 数据中心收入 QoQ伟达官伟达官英伟达GPU产品AI智算性能不断革新，GB300专为推理任务打造。A100兼具大模型的LLM推理性能是H10030倍，训练性能是H1004H100的25GB300采用NVIDIABlackwellUltraGPU，相较于NVIDIABlackwellGPUFP4FLOPS高出1.52AIA100SXMH100SXMH200SXMGB200NVL72GB300NVL72BlackwellUltraGPUs|GraceCPUsA100SXMH100SXMH200SXMGB200NVL72GB300NVL72BlackwellUltraGPUs|GraceCPUs--72|3672|36FP4TensorCore--20PFLOPS20PFLOPS|15PFLOPSFP8TensorCore-3.958PFLOPS3.958PFLOPS10PFLOPS10PFLOPSFP6TensorCore---10PFLOPS10PFLOPSINT8TensorCore624TOPS3958TOPS3958TFLOPS10TOPS330TOPSFP16/BF16TensorCore0.312|0.624PFLOPS1.979PFLOPS1.979PFLOPS5PFLOPS5PFLOPSTF32TensorCore0.156|0.312PFLOPS0.989PFLOPS0.989PFLOPS2.5PFLOPS2.5PFLOPSFP3219.5TFLOPS67TFLOPS67TFLOPS80TFLOPS80TFLOPSFP32TensorCore--80TFLOPS80TFLOPSFP649.7TFLOPS34TFLOPS32TFLOPS40TFLOPS1.3TFLOPSFP64TensorCore19.5TFLOPS67TFLOPS67TFLOPS40TFLOPS1.3TFLOPSGPU容量80GBHBM2E80GBHBM3141GBHBM3E186GBHBM3E279GBHBM3EGPU带宽1.935TB/s3.35TB/s4.8TB/s8TB/s8TB/s最大热设计功耗(TDP)300w700w700W1200W1400W互联技术NVLink：600GB/s；PCIeGen5：64GB/sNVLink：900GB/s；PCIeGen5：128GB/sNVLink：900GB/s；PCIeGen5：128GB/sNVLink：1.8TB/s；PCIeGen5：128GB/sNVLink：1.8TB/s；PCIeGen5：256GB/s伟达官CUDA编程工具可大幅降低开发门槛，构建其在AI智算领域的护城河。CUDA（ComputeUnifiedDeviceArchitecture）GPUCUDAC++GPU还2007图表23 CUDA构架示图图表24 CUDA的组成分伟达官网伟达官网三、美国扩大高端GPU出口限制，国产奋起力争自主可控（一）美国扩大出口管制范围，国产GPU自主可控迫在眉睫美国多次修订出口规则管制范围，国产算力自主可控迫在眉睫。近年来，美国多次修订AI日特朗普允许英伟达向中国出售GB200GB300GPU国家政府立足发展需求，高度支持国产算力产业发展。2025年8月，国务院出台《关于深入实施人工智能+行动的意见》，其中提出应强化智能算力统筹，支持人工智能芯片攻坚创新与使能软件生态培育，加快超大规模智算集群技术突破和工程落地。同月，在《电子信息制造业2025-2026年稳增长行动方案》中，两部门提出加强CPU、高性能人工智能服务器、软硬件协同等攻关力度，开展人工智能芯片与大模型适应性测试。适度超前部署新型基础设施建设，提升各地已建基础设施运营管理水平，强化服务器、芯片和关键模块的兼容适配，并从供应链政策支持、加强基础技术研究、促进国际合作、构筑人才队伍等角度为先进算力产业助力，继承发展了既往算力领域的积极政策。持续利好的政策为国产算力实现自主可控创造良好条件。（二）国内GPU厂商加速追赶，自主开发星辰大海AI热潮下，GPGPU自主开发如火如荼。美国不断升级对华限制导致英伟达高端GPU在中国市场供应几乎被完全切断。在市场空缺和国家战略的双重刺激下，国产GPU企业迎AI智算芯片产品，并逐步追赶国际领先标准。华为昇昇腾910持续更新华为持续研发昇腾系列商用2018310（12nm功耗8W）和昇腾910（7nm，云端高算力，可组成Ascend集群）两款AI芯片，均基于达芬奇架构。后续的昇腾910B基于7nm+EUV工艺与32核自研架构，支撑千亿参数大模型训练，已实现规模化落地。基于华为昇腾系列AI处理器和基础软件，华为构建Atlas人工智能计算解决方案，包括Atlas系列模块、板卡、小站、服务器、集群等丰富的产品形态，打造面向端、边、云的全场景AI基础设施方案，覆盖深度学习领域推理和训练全流程。图表25 华为昇腾系列品为官网MLU590表现亮眼2016IP务布局。近年公司云端产品线（包括智能芯片、加速卡及训练整机）PAIAI5907nm工314TFLOPS（FP16）80GB2TB/s云一体的可扩展性，以TPIPUMTPIPUClusterMLU-LinkAIMLU590AI2024MLU370-X4AIU5969TL2LDR507.GB，最大设计功耗150W。这款新品在延续寒武纪技术优势的基础上，以更低功耗和适中性能，为中低端AI图表26 寒武纪MLU370 图表27 寒武纪智能处器架构示意图武纪招股书武纪招股书海光信息：CPU、DCU海光业务以商用CPU和DCU为主。海光信息成立于2014年，主营业务是研发、设计（CPU）（DCU，GPGPU求。公司DCUDCU进行升级迭代，每代际产品细分为8000系列的各个型号。公司核心产品包括深算一号、深算二号和深算三号。目前深算三号产品进展顺利，海光DCU产品已与互联网、金融、电信等各大行业、企业用户进行了广泛适配，适配效果较好，能够支持人工智能、大数据、云计算等领域的发展。配套的开发工具套件DTK、人工智能基础软件栈DAS及应用平台DAP形成的三驾马车，可全面覆盖从十亿级到千亿级模型的训练与推理需求，为各行业AI创新提供一体化支撑。其中，海光DCU具备自主研发的开发工具套件DTK，是目前国内最为完备的生态之一，减少了应用迁移难度。完善的统一底层硬件驱动平台，能够适配不同API接口和编译器，并支持常见的函数库，在百度、阿里等头部互联网厂商得到认证，并推出联合方案，打造全国产软硬件一体全栈AI基础设施。针对AI行业应用场景，海光DCU已形成多元化落地成果。在科研领域，支撑全球首个L2级高能物理大模型溪悟及科研智能体系统赛博士实现世界领先的数据分析效率；在医疗领域，与卫宁健康等伙伴合作的医疗AI解决方案已在全国30多个项目落地，为临床诊断、基因分析等提供高效算力支持；在天文领域，处理中国天眼FAST的海量观测数据时，计算效率较传统CPU提升超百倍，碳星识别等场景性能表现突出。图表28 海光信息产品意图图表29 海光软件栈示图光官网光官网摩尔线程：拥有完整GPU产品矩阵，最新架构平湖功能强大摩尔线程是拥有完整GPU产品矩阵和解决方案的供应商。摩尔线程成立于2020年，以GPUMUSAGPU卡MTTS4000MCCXD800X1MTTX300图表30 摩尔线程主要品分类分类芯片板卡/模组一体机集群设备服务器级AI智算企业级第四代GPU平湖S5000D800X1/XKUAE2第三代GPU曲院S4000KUAE1专业图形加速企业级第二代GPU春晓S3000D200/D400/D800MCCX第一代GPU苏堤S1000/S2000--桌面级图形加速消费级第二代GPU春晓S70/S80企业级第二代GPU春晓X300第一代GPU苏堤S10/S30/S50/X100智能SoC类企业级第一代SoC长江AI模组-E300AI算力本-A140消费级示意图尔线程招股摩尔线程最新芯片架构平湖AI智算性能显著提升。2024年摩尔线程推出第四代芯片架构平湖，最大频率提升至2.0GHz，Tensor核心数量升级为512个，增加了FP8精度支持，大幅提升AI算力。最大显存容量80G，支持更训练更复杂的模型。使用自研MTCodecGen3编解码器，AI视觉处理编解码效率提升。片间互联带宽800GB/s，摩尔线程基于该芯片支撑面向DeepSeek类前沿大模型预训练的万卡集群智算中心解决方案。图表31 摩尔线程MTTS4000 图表32 MUSA架构意图尔线程官网尔线程招股书（4）沐曦股份：打造全栈GPU芯片产品，曦云C500已实现量产GPU供应商。2020GPUGPU围绕GPU芯片提供配套的软件栈与计算平台。公司产品采用自主研发的GPUIP和指令集、统一的GPU计算和渲染架构，形成了由用于AI智算的曦思N系列，用于推训一体和通用计算的曦云C系列，以及用于图形渲染的曦彩G系列构成的GPU产品体系和自主开放的软件生态，以满足高能效和高通用性的算力需求。公司产品涵盖了计算（GPU图表33 沐曦股份产品类产品类型型号产品特征应用场景训推一体GPU曦云C500系列公司曦云C系列产品拥有多精度混合算力，内置大量运算核心，具有较强的并行计算能力和较高的能效比，适用于向量计算和矩阵计算等计算密集型应用，可广泛应用于智算训练与推理、通用计算、AIforScience等场景云端智算（训推一体算、AIforScience等曦云C600系列智算推理GPU曦思N100系列公司曦思N100产品系面向传统人工智能场景，内置性能强劲的视频处理器和运算核心，可广泛应用于智慧城市、智慧交通、智慧教育、智能视频处理等场景云端及边端推理、视频转码曦思N260系列公司曦思N系列后续迭代产品系面向生成式人工智能场景，拥有多精度混合算力、大容量显存和较高的能效比，可广泛应用于大模型推理、生成式应用等场景云端推理、一体机及工作站曦思N300系列图形渲染GPU曦彩G100系列公司曦彩G系列产品系面向图形处理场景，内置性能强大的图形处理器，可广泛应用于云游戏、数字孪生、云渲染、影视动画和专业制图等场景云端及边缘端图形处理曦股份招股公司曦云C500C500的XCORE1.0AIforScienceHBM2eMetaXLink7MetaXLinkMXMACAAPI层面实现了对CUDA图表34 沐曦股份曦云C500 图表35 MXMACA模型软件栈框架结构曦股份招股书曦股份招股书（三）GPU供应商主攻路线各有差异，沐曦/摩尔线程指引有望于26/27年陆续转盈GPU姓名现任职务原有工作任职期间原有职务寒武纪姓名职务中科院任职期间姓名现任职务原有工作任职期间原有职务寒武纪姓名职务中科院任职期间中科院任职职务陈天石董事长、总经理2010-2019就职于中科院计算所，历任助理研究员、副研究员、硕士生导师、研究员、博士生导师王在董事、副总经理兼首席运营官2016-2018就职于中科院计算所从事科研工作刘少礼董事、副总经理2014-2019就职于中科院计算所并任副研究员张佩珩董事（已离职）2005-2016任职于中科院计算所高性能计算机研究中心，历任中心副主任、中心主任职务喻歆职工监事，验证部总监（已离职）2016-2019就职于中科院计算所，任高级工程师刘道福副总经理（已离职）2015-2019就职于中科院计算所，历任助理研究员、高级工程师海光信息姓名职务中科曙光任职期间中科曙光任职职务沙超群董事、总经理2011-2020技术副总裁、高级副总裁徐文超董事、副总经理、财务总监、董事会秘书2017-2021董事、董事会秘书、高级副总裁王颖副总经理2006-2020副总裁刘新春副总经理2009-2016研发中心负责人摩尔线程姓名职务英伟达任职期间英伟达任职职务张建中创始人、董事长、总经理2006-2020英伟达全球副总裁，大中华区总经理周苑联合创始人、职工董事2004-2020英伟达市场生态高级总监张钰勃联合创始人、董事、副总经理2013-2017英伟达GPU架构师王东联合创始人、副总经理2007-2019英伟达销售总监沐曦姓名职务AMD任职期间AMD任职职务陈维良董事长、董事2007年-2020年超威半导体（上海）有限公司高级总监彭莉董事、副总经理、首席技术官2007-2020超威半导体（上海）有限公司企业院士杨建董事、副总经理、首席技术官2007-2019超威半导体（上海）有限公司企业院士陈阳总经理助理2015-2020超威半导体（上海）有限公司项目经理周俊研发总监2009-2020超威半导体（上海）有限公司资深研发经理公司招股说明注：选用资料截至各公司上市，仅用于创始及核心团队来源参考；核心人员未列举完全）从国产四大GPUCPUCPUAI25GPUAICU（UU营CPUx86具有较强的系统兼容性和安全性，已大规模应用于电信、金融等信创领域，由于重点信创领域起量对安全性要求刚需、起量相对较快，因此海光信息整体收入规模较大。寒武纪：公司主要产品为应用于云服务器、边缘计算设备、终端设备中人工智能核心芯2025（244.63546.07摩尔线程：AIGPU硬件和软件的全功能GPU257.85亿元（+18.99AIGPU25年前季实收12.6亿（o+53.5图表37 国产上市公司收入情况分析亿元）、沐曦股份招股说明书、摩尔线程招股说明寒武纪24Q4开始单季度转盈，沐曦及摩尔线程指引预计最早26/27年实现盈利。由于GPU221021年实现净利率1894，23.12024Q42025Q1-Q346.072027份预计最早2026年实现盈亏平衡。图表38 GPU上市公毛利率情况图表39 寒武纪及海光息净利率情况202220232022202320242025Q1-360%40%20%-20%-40%-60%-80%

50%202220232022202320242025Q1-3-50%-100%-150%-200%寒武纪海光信息摩尔线程沐曦股份寒武纪海光信息四、相关标的1、寒武纪云边端协同发展，掌握核心技术构筑竞争壁垒。公司主营业务为应用于各类云服务器、SoC品包括终端智能处

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

算力芯片行业深度研究报告：算力革命叠浪起国产GPU奋楫笃行

文档简介

温馨提示

最新文档

评论

算力芯片行业深度研究报告：算力革命叠浪起国产GPU奋楫笃行

文档简介

温馨提示

最新文档

评论

相关文档