版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目 录一、国内通用GPU领军企业之一,推动人工智能赋能千行百业 6(一)全栈GPU芯片产品矩阵,广泛应用前沿领域 6(二)股权结构集中,管理层产业经验丰富 8(三)营收高速增长凸显业务潜力,盈利结构优化彰显发展韧性 9(四)募资投向三大GPU新品研发,助力主业发展 二、大模型发展催生算力刚性需求,国产芯片加速替代突围 13(一)GPU并行计算能力适用于AI训推需求,大模型发展催化GPU需求 131、GPU擅长并行计算,适用于AI计算加速 132、GPU产业链价值集中在中游,AI芯片需求拉动GPU市场规模增长 143、ScalingLaw依旧成立,大模型的发展需要GPU提供海量算力 15(二)海外巨头持续加码AI投入,英伟达占据全球主导地位 151、AI投入产出实现闭环,海外巨头坚定AI投资信心 152、英伟达占据全球主导地位,硬件与CUDA生态共筑深厚壁垒 19(三)美国扩大高端GPU出口限制,国产奋起力争自主可控 21三、全栈技术闭环筑基,GPU算力基座赋能 23(一)技术积累深厚全面,核心技术自主可控 231、硬件架构:深耕GPU硬件技术,筑牢AI算力基座 232、软件生态:打造软件栈MXMACA,软硬协同助力国产GPU自主可控 25(二)科创板上市赋能核心技术攻坚,两款训推一体GPU新品在研 27(三)曦思、曦云系列GPU迭代量产,公司预计最早26年实现盈亏平衡 28四、盈利预测 31五、风险提示 331、供应链安全风险 332、经营不确定性风险 333、核心竞争力风险 33图表目录图表1 沐曦股份发展历程 6图表2 沐曦股份产品行业应用场景 7图表3 沐曦股份主要产品 7图表4 公司交付产品形态 8图表5 沐曦股份股权结构(截止至2025年12月31日) 8图表6 沐曦股份管理层状况 9图表7 沐曦股份营收及增速/亿元 10图表8 沐曦股份归母净利润/亿元 10图表9 沐曦股份产品收入构成 10图表10 沐曦股份分产品毛利率 10图表沐曦股份预付账款余额(亿元) 图表12 沐曦股份存货/存货周转率 图表13 沐曦股份毛利率及净利率 图表14 沐曦股份期间费用率 图表15 沐曦股份募投项目运用情况 12图表16 GPU有更多核心去进行数据处理 13图表17 GPU加速效果远超CPU 13图表18 主要AI计算加速芯片种类对比表 13图表19 GPU产业链 14图表20 2020-2029年全球GPU市场规模(亿人民币) 15图表21 2020-2029年中国GPU市场规模(亿人民币) 15图表22 Scalinglaw法则依然有效 15图表23 训练和推理算力需求持续提升 15图表24 OpenRouter平台模型token调用量 16图表25 谷歌第四季度主要营收(亿美元) 17图表26 北美科技巨头资本开支快速上行(亿美元) 17图表27 海外大厂关于capex指引及描述 18图表28 2025年北美AI头部企业投资与战略合作关系一览 18图表29 英伟达总营收(亿美元) 20图表30 英伟达数据中心营收(亿美元) 20图表31 英伟达硬件产品参数对比 20图表32 CUDA构架示意图 21图表33 CUDA的组成部分 21图表34 沐曦股份典型GPU芯片基本组成架构 23图表35 沐曦股份产品型号对比表 24图表36 沐曦股份技术储备情况 24图表37 MXMACA软件栈框架结构 26图表38 沐曦股份开源合作社区 26图表39 沐曦股份MXMACA异构计算平台 26图表40 第二代高性能通用GPU芯片(C600)研发项目进度安排 27图表41 第三代高性能通用GPU芯片(C700)研发项目进度安排 27图表42 新一代人工智能推理GPU研发及产业化项目进度安排 28图表43 面向前沿领域及新兴应用场景的高性能GPU技术研发项目进度安排 28图表44 沐曦股份训推一体GPU板卡销量 29图表45 沐曦股份训推一体GPU板卡平均单价 29图表46 沐曦股份公司训推一体GPU服务器的销售情况 29图表47 沐曦股份智算推理GPU板卡销量 30图表48 沐曦股份智算推理GPU板卡平均单价 30图表49 沐曦股份业务拆分 31一、国内通用GPU领军企业之一,推动人工智能赋能千行百业(一)全栈GPU芯片产品矩阵,广泛应用前沿领域(上海20209GPUGPUNCG顾公司的成长历程,可以主要分为三个阶段:初创奠基期(020年:220年9PU的研发202010由和利资本、泰达科投联合领投。融资扩张与技术研发期(201年-24年:201年初,密集完成-A轮等多轮融资为研发提供充足资金。2022GPUN100GPU曦云C500C50020232024C600流片,全年算力集群落地规模超万卡,公司正式完成股份制改革。(025-至今2025年7C60020252026GPU芯片曦云20254月2026Q2开始进行流片及测试,2027年下半年进行量产。图表1 沐曦股份发展历程司官GPU沐曦股份主营业务是研发、设计和销售应用于人工智能训练和推理、通用计算与图形渲染领域GPUGPUNGPUCGPU产品,以及用于图形渲染的曦彩G系列GPUGPU产品主要服务于人工智能产业链,图表2 沐曦股份产品行业应用场景司招股书GPUIPAIGPUGPUIPGPU计算和渲染架构,在通用性、单卡性能、集群性能及稳定性、生态兼容与迁移效率等方面具备较强的核心竞争力,产品综合性能已处于国内领先水平。公司的主要产品全面覆盖人工智能计算、通用计算和图形渲染三大2022NGPU、用于训推一体和通用计算的曦云C系列GPUGGPU。图表3 沐曦股份主要产品产品类型型号产品特征应用场景训推一体GPU曦云C500系列公司曦云C系列产品拥有多精度混合算力,内置大量运算核心,具有较强的并行计算能力和较高的能效比,适用于向量计算和矩阵计算等计算密集型应用,可广泛应用于智算训练与推理、通用计算、AIforScience等场景算、forScience等曦云C600系列智算推理GPU曦思N100系列公司曦思N100云端及边端推理、视频转码曦思N260系列公司曦思N系列后续迭代产品系面向生成式人工智能场景,拥有多精度混合算力、大容量显存和较高的能效比,可广泛应用于大模型推理、生成式应用等场景云端推理、一体机及工作站曦思N300系列图形渲染GPU曦彩G100系列公司曦彩G系列产品系面向图形处理场景,内置性能强大的图形处理器,可广泛应用于云游戏、数字孪生、云渲染、影视动画和专业制图等场景云端及边端图形处理司招股产品交付形态多样,覆盖板卡、服务器、智算集群等。从产品形态来看,公司从事GPUGPU芯片GPUGPU芯片的板卡//GPU(CUDA)的MXMACA图表4 公司交付产品形态司招股书(二)股权结构集中,管理层产业经验丰富11.96大股东。鉴于上海骄迈、上海曦骥的执行事务合伙人均为陈维良,因此上海骄迈、上海曦骥以及陈维良构成一致行动人合计控制公司20.63股权持股比例远高于其他任何股东,陈维良为公司实际控制人。图表5 沐曦股份股权结构(截止至2025年12月31日)核心高管兼具顶尖技术积淀与全流程产业经验,为公司技术突破与商业化落地提供核心支撑。公司核心创始人及高管团队主要来自AMD、华为、海思等国际顶尖芯片企业,在GPU长兼CEO20GPUAMD前企业院士,彭莉女士是芯片架构资深专家,杨建博士是三维图形与高性能计算生态领域资深专家,两位首席技术官分别在硬件架构设计与软件生态构建领域形成互补。核心团20GPU的差异化竞争壁垒。姓名职务学历年龄履历陈维良董事长,总经理、创始人博士50姓名职务学历年龄履历陈维良董事长,总经理、创始人博士5020027200612GPU120208AMD监,自2020年9月起,担任沐曦股份董事长及总经理。彭莉董事、副总经理、首席技术官、联合创始人硕士48毕业于上海交通大学电路与系统专业并取得硕士学位。2000年7月至200772007720209AMDGPU20209副总经理、首席技术官。杨建董事、副总经理、首席技术官博士53200272006101020061220071201911AMDGPU201911202092020年9月起,担任沐曦股份董事、副总经理、首席技术官。魏忠伟财务负责人、董事会秘书硕士4620065201788等机构的投行管理岗位。自2024年10月起,担任沐曦股份财务负责人董事会秘书。;、司招股书(三)营收高速增长凸显业务潜力,盈利结构优化彰显发展韧性营业收入实现突破性增长,亏损持续收窄提质增效。随着公司训推一体系列产品市场认7.4320230.53亿元实现大幅跨越同比增幅达1301.46实现爆发式增长年延续增长态势全16.44121.26年归母净利润为-14.092023-8.7161.72主要系研发投入加大及市场拓展生态建设费用增加所致但2025年盈利状况已出现显著改善归母净利润亏损-7.89亿元亏损额同比大幅收窄43.97随着收入规模扩大及规模效应逐步显现,公司盈利能力修复趋势向好。图表7 沐曦股份营收及增速/亿元 图表8 沐曦股份归母净利润/亿元
2022 2023 2024 营业收入 YoY/%
14000%12000%10000%8000%6000%4000%2000%0%
0-2-4-6-8
2022 2023 2024 归母净利润 YOY/%
60.00%40.00%20.00%0.00%-20.00%-40.00%-60.00%-80.00%产品结构呈现显著优化趋势,核心产品竞争力与盈利水平同步强化。推一体系列为核心,2022GPU板卡为唯一有营收贡献2023GPUGPU板卡占比大幅下降。2024年训GPU服务器作为新增品类实现28.29的占比,毛利率31.70。2025年产品集中度进一步提升,25Q1训推一体系列GPU板卡占比攀升至97.55,其他产品营收占比均处于较低水平。GPU板卡已成为驱动营收与利润增长的核心支柱。图表9 沐曦股份产品收入构成 图表10 沐曦股份分产品毛利率
2022 2023 2024 2025Q1
2022 2023 2024 2025Q1训推一体系列-GPU板卡 训推一体系列-GPU服务器 训推一体系列-GPU板卡 训推一体系列-GPU服务器智算推理系列-GPU板卡 IP授权其他
智算推理系列-GPU板卡 IP授其他司招股相契合。20220.5220258.3415HBMHBMA24年末占比为6173251占比为4129公司晶圆代工供应商C预付款项24年末占比为232,25Q1占比为43.43反映公司在产能上的锁定力度加强存货方面公司存货规模呈较(20220.18202514.96亿220.02250.63化能力明显改善,产品逐步实现市场化放量。图表沐曦股份预付账款余额(亿元) 图表12 沐曦股份存货/存货周转率10864202022 2023 2024 预付账款余额 YoY
600%500%400%300%200%100%0%-100%
16141210864202022 2023 2024 存货(亿元) 存货周转率(次)
0.80.70.60.50.40.30.20.10招书 招书2022年销售毛利率达24102023年大幅提升至6288204年虽有小幅回落但2025年重新回升至5651,整体维持在较高水平,反映出产品核心竞争力较强。净利率层面,受业务拓展初期投入影响仍处于亏损状态,但近年亏损收窄趋势清晰。费用控制方面,随着公司收入规模的202210697显著下降至2025年的12.43;管理费用率从2022年的22532大幅下降至2025年的22.58;研发费用率虽保持较高投入以支撑技术迭代,但也从2022年151857的高位逐步回落至2025年的62.49,费用结构的持续优化为盈利端的进一步改善奠定坚实基础。图表13 沐曦股份毛利率及净利率 图表14 沐曦股份期间费用率
70.00%62.88%56.51%62.88%56.51%53.43%-1643.04%-189.60%-48.02%24.10%-182215.10%50.00%40.00%30.00%20.00%10.00%
151857.63%22532.42%
% 12124% 6249%-200000%
0.00%
0%10696.94%118.62%
78.27%16.34%
12.43%22.58%2022 2023 2024 2025销售净利率(左轴) 销售毛利率(右轴)
2022 2023 2024 2025销售费用率 研发费用率 管理费用率(四)募资投向三大GPU新品研发,助力主业发展公司IPOGPU新方向,契合国家产业政策和公司发展战略。募投项目落地后,将推动核心产品线迭代升级,巩固行业地位、扩大市场份额,同时增强研发实力、丰富技术储备、构筑竞争壁IPO3个项目:GPUGPU(代号C600)和第三代高性能通用GPU芯片(代号C700)GPU,应用于AICGPU装技术的云端大模型推理芯片(代号NxAIAIPCGPUGPU工GPUPOLGPUscaleup图表15 沐曦股份募投项目运用情况序号项目名称投资总额(亿元)拟使用募集资金投入金额(亿元)募集资金投入占比1新型高性能通用GPU研发及产业化项目34.1024.5963.00其中:第二代高性能通用GPU13.708.4121.54第三代高性能通用GPU20.4016.1841.462新一代人工智能推理GPU研发及产业化项目5.784.5311.603面向前沿领域及新兴应用场景的高性能GPU技术研发项目10.219.9125.4合计50.0939.04100司招股二、大模型发展催生算力刚性需求,国产芯片加速替代突围(一)GPU并行计算能力适用于AI训推需求,大模型发展催化GPU需求1、GPU擅长并行计算,适用于AI计算加速GPU(GraphicsProcessingnit端中负责图像和图形运算的处理器芯片。因其具有出色的数学计算能力,一些学者开始将其用于粒子模拟、电路仿真、计算生物学等诸多目的。后来,这些被用于通用计算目的的PU被称为PGenealurposeU2007年英伟达正式推出基于C语言、能CUDAGPU,为设备进行各种复杂计算提供算力支撑。GPUGPUGPU成为了驱动现代及未来尖端科技发展的核心引擎。以机器学习(MLGPU务,训练时间因此从数月缩短至数天。图表16 GPU有更多核心去进行数据处理 图表17 GPU加速效果远超CPU达发网站 达COMPUTEX布、引自bilibili当前共有四种AI计算加速芯片技术架构,GPU为目前大模型训练及推理主力。GPUFPGA(FieldProgrammableGateArray,可编程逻辑门阵列、ASIC(ApplicationSpecificIntegratedCircuit,专用集成电路)NPU(NeuralProcessingASICNPUGPUAI技术的深入发展,更多专业化的AI计算加速芯片也会进入市场。图表18 主要AI计算加速芯片种类对比表GPUFPGAASIC定制化程度通用型半定制化定制化编程语言/架构CUDA、OpenCL等Verilog/VHDL等硬件描述语言、OpenCL、HLS固定电路无需编程延迟1ms1us1us主要优点峰值计算能力强、通用性强、产品和生态成熟平均性能较高、功耗较低、灵活性强专业性强、功耗很低、体积小、量产成本低主要缺点成本高、不可编辑、功耗高量产成本高、峰值计算能力较低、编程门槛高前期投入成本高、不可编辑、研发时间长、技术风险大人工智能的应用范围模型推理AI证券2、GPU产业链价值集中在中游,AI芯片需求拉动GPU市场规模增长GPU产业链的中游是附加值最高的环节,包括设计和制造两大方面。GPU设计呈现出“一超多强”CUDA生态构筑了极高壁垒,据芯智讯援引TechInsights2023GPU3852022GPUPC市场占有重要地位。GPU制造指从晶圆制造到芯片封装、GPU(Fabless模式,IDM模式相对FoundryGPU制GPU成至显卡或服务器模块中,并为下游系统集成提供接口支持。图表19GPU产业链若斯特沙利文、转引自摩尔线程招股2020年至2029年,世界及中国的GPU市场规模持续大幅增长。AI算力需求激增使GPU市场爆发式增长,据弗若斯特沙利文测算,2024年全球规模达10,515.37GPU2020384.7720241,638.17AI智算GPU增速尤为显著从142.86亿元增至996.72亿元年均复合增长率达62.5展望未AI2029GPU市场规模将达36,119.74亿元中国占比由2024年的15.6提升至37.8规达13,635.78亿元。AIGPU202910,333.40亿元,期间年均复合增长率56.7桌面级产品亦稳步发展预计从2024年的641.45亿元增至2029年的3,302.38亿元。图表20 2020-2029年全球GPU市场规模(亿人民币)
图表21 2020-2029年中国GPU市场规模(亿人民币)50000
202020212022202320242025E2026E2027E2028E2029E全球GPU市场规模(元人民币) YoY
120%100%80%60%40%20%0%
80006000400020000
202020212022202320242025E2026E2027E2028E2029E智算产品 桌面级产品 YoY
90%80%70%60%50%40%30%20%10%0%-10%斯沙文转自尔程招股 斯沙文转自尔程招股3、ScalingLaw依旧成立,大模型的发展需要GPU提供海量算力ScalinglawScalingLaw法则。即在固定的模型架构下,模型的最终性能主要与计算量、模型参数量和训练数据量相关。当保持其中两个因素不变时,提升第三个因素,模型的测OpenAIScalingLaw已得到充分验证;同时,模型在各类下游推理任务上表现出的能力,也展现出类似的缩放AIAI应用的广泛落地。图表22 Scalinglaw法则依然有效 图表23 训练和推理算力需求持续提升penAI官网 达网(二)海外巨头持续加码AI投入,英伟达占据全球主导地位1、AI投入产出实现闭环,海外巨头坚定AI投资信心Token调用量保持高速增长,显示出大模型终端推理需求持续向上。Token为大模型处理的最小文字单位,可被翻译为词元,不仅用于衡量大模型处理的任务量,也是最主流的OpenRouter调用量大幅提升,20262月模型token50.421月相比20.61万亿。在具体模型上,MinMaxMinMaxM2.5排行第一,月token5.64万亿;MoonshotaiKimiK2.54.34万亿;谷歌旗下两款模型位居月度token10Gemini3FlashPreview调用量3.65万亿。图表24OpenRouter平台模型token调用量penRoutertokenAI大模型面世以来,个人与企业逐渐养成付费模型的使用习惯。据同花顺财经援引财联社消息,202573500万人付费订阅了ChatGPTPlusPro服务,其月费用一般分2020020302.2亿人将为ChatGPTAlphabet20251138.2834530%;其中,谷歌主营业务共分为谷歌服务、958.62176.643.7带来算力需求的持续扩张。图表25 谷歌第四季度主要营收(亿美元)120010008006004002000营业收入
谷歌服务
谷歌云 利润2024年季度 2025年季度lphabet官网AI算力成为此轮AI发展的核心驱动力,海外大厂加快算力基础设施建设。ChatGPT掀AIScalinglaw法则即大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,AIAI发展的核心AIMetaCapEx3760.51亿美元o6469%,已超过2024图表26 北美科技巨头资本开支快速上行(亿美元0
120%100%80%60%40%20%0%-20%Amazon Microsoft Google Meta YoYloomberg26从海外云厂商对未来资本指引202650%2026年资本开支将达1750150亿美元(o9141023%,开支主要用于人工智能、芯片、机器人技术等。Meta261150-1350亿美元(YoY+65.0%-93.7%),26年资本开支指引高达2000亿美元(o5172%图表27 海外大厂关于capex指引及描述公司名称最新全财年capex指引财年对应自然季度YoY(%)语言描述Amazon2000亿美元2026Q1-2026Q451.72%鉴于现有产品需求强劲,加之人工智能、芯片、机器人技术及低地球轨道卫星等战略机遇,公司资本支出预计能获得可观的长期投资回报。Google1750-1850亿美元2026Q1-2026Q491.4%-102.3%人工智能领域的投资与基础设施建设正全面推动营收增长。为满足客户需求并把握未来机遇,公司资本支出将成倍增加。Meta1150-1350亿美元2026Q1-2026Q465.0%-93.7%2026于对Meta公司业绩说明会、BloombergAI2025OpenAIOracle等陆续签订投资+AI9OpenAI1000OpenAI10GW数据中心。图表28 2025年北美AI头部企业投资与战略合作关系一览时间投资/合作方被投资/合作方投资/合作方承诺被投资/合作方承诺2025年微软英伟达①在Azure云平台大规模部署NVIDIADGXSuperPOD架构;①在AzureAIFoundry中提供NVIDIANIM服务②深度集成NVIDIAAI软件栈;②优化热门开源语言模型的推理功能并确保这些模型能在AzureAIFoundry上使用③在Azure市场推出由基于NVIDIAGPU的Azure虚拟机驱动的创新产品③联合开发AzureNDGB200V6等虚拟机实例,配备NVIDIA网络加速器④支持NVIDIANIM的AzureContainerApps无服务器图形处理单元正式上市⑤将NVIDIABlackwellUltraGPU和NVIDIARTXPRO6000Blackwell服务器版引入Azure2025-2026分批次英伟达OpenAI①向OpenAI1001投入①10GW的NVIDIA②支持OpenAI建设10GW的AI数据中心②联合优化OpenAI的软件2025年初OpenAIOracle①53000服务采购协议,长期使用OracleAI数①在美国德克萨斯州阿比林等地投资建设超大规模AI数据中心(tgte交付并满足OpenAI训②4.5GW2025.5Oracle英伟达①以单价约10万美元采购约40万片GB200Superchip芯片,总金额约400亿美元,用于支持OpenAIStargate数据中心建设①按期交付GB200芯片;2025.11微软Anthropic①微软、英伟达分别投资至多50亿、100亿美元;①3001GW外算力②微软继续为Claude提供在微软Copilot系列产品中的访问权限②算力完全基于英伟达的GraceBlackwall和VeraRubin架构;③允许微软和英伟达云服务平台使用Claude公司官网,IT之家,华尔街日报、路透社,转引自币界网,AI科技网,华尔街见闻,爱范儿,至顶头2、英伟达占据全球主导地位,硬件与CUDA生态共筑深厚壁垒英伟达处于全球GPU市场领先地位。英伟达(NVIDIA)总部位于美国加利福尼亚州,自1993年成立起就专注于GPU的设计开发,形成了强大的实力和竞争壁垒。根据泡泡网转载的JonPeddieResearch的报道,在PC(个人电脑)领域,2025年二季度英伟达独立显卡的市场份额达到94%,断崖式领先于AMD及其他厂商。随着大模型训练推理需求的兴起,英伟达凭借领先的GPU产品和生态在AI领域进一步称霸市场。GPU市场,英伟达一家独大且保持高速增长。芯片为主导的AI90%FY26440.62Q4FY26681.27Q12781615(o85%126391.12Q4FY26623FY27752(o92%12612788.8%87.9%89.8%91.4%GPU公司首席科莱特·(ColetteBlackwellRubinAI5000亿美元的可见收入。图表29 英伟达总营收(亿美元) 图表30 英伟达数据中心营收(亿美元)0总收入 QoQ
25%20%15%10%5%0%
0数据中心收入 QoQ
30%25%20%15%10%5%0%达官 达官英伟达GPU产品AI智算性能不断革新,GB300专为推理任务打造。A100兼具大模型的LLMH10030H1004H10025GB300采用NVIDIABlackwellUltraGPUNVIDIABlackwellGPUFP4核心FLOPS1.52AI推理任务而打造。图表31 英伟达硬件产品参数对比A100SXMH100SXMH200SXMGB200NVL72GB300NVL72BlackwellUltraGPUs|GraceCPUs--72|3672|36FP4TensorCore--20PFLOPS20PFLOPS|15PFLOPSFP8TensorCore-3.958PFLOPS3.958PFLOPS10PFLOPS10PFLOPSFP6TensorCore---10PFLOPS10PFLOPSINT8TensorCore624TOPS3958TOPS3958TFLOPS10TOPS330TOPSFP16/BF16TensorCore0.312|0.624PFLOPS1.979PFLOPS1.979PFLOPS5PFLOPS5PFLOPSTF32TensorCore0.156|0.312PFLOPS0.989PFLOPS0.989PFLOPS2.5PFLOPS2.5PFLOPSFP3219.5TFLOPS67TFLOPS67TFLOPS80TFLOPS80TFLOPSFP32TensorCore--80TFLOPS80TFLOPSFP649.7TFLOPS34TFLOPS32TFLOPS40TFLOPS1.3TFLOPSFP64TensorCore19.5TFLOPS67TFLOPS67TFLOPS40TFLOPS1.3TFLOPSGPU容量80GBHBM2E80GBHBM3141GBHBM3E186GBHBM3E279GBHBM3EGPU带宽1.935TB/s3.35TB/s4.8TB/s8TB/s8TB/s最大热设计功耗(TDP)300w700w700W1200W1400W互联技术NVLink:600GB/s;PCIeGen5:64GB/sNVLink:900GB/s;PCIeGen5:128GB/sNVLink:900GB/s;PCIeGen5:128GB/sNVLink:1.8TB/s;PCIeGen5:128GB/sNVLink:1.8TB/s;PCIeGen5:256GB/s伟达官CUDAAIUnifiedDeviceArchitecture)是一套英伟达提供给开发人员的编程工具。它连接主机端GPUCUDAC++等高级编程语言来编写复GPUCUDA2007都只能在英伟达平台上使用。图表32 CUDA构架示意图 图表33 CUDA的组成部分达网 达网(三)美国扩大高端GPU出口限制,国产奋起力争自主可控美国多次修订出口规则管制范围,国产算力自主可控迫在眉睫。AIGB200GB300GPU实现自主可控的紧迫程度。202582025-2026CPU、高性能人工智能服务器、软硬件协同等攻关力度,开展人工智能芯片与大模型适应性测试。适度超前部署新型基础设施建设,提升各地已建基础设施运营管理水平,强化服务器、利好的政策为国产算力实现自主可控创造良好条件。AI热潮下,GPU国产替代如火如荼。GPU在中GPU历史性发展机遇。当前,寒武纪、海光信息、摩尔线程、沐曦股份等国内厂商推出多款AI智算芯片产品,并逐步追赶国际领先标准。三、全栈技术闭环筑基,GPU算力基座赋能(一)技术积累深厚全面,核心技术自主可控2022GPUN100,适配云端与边端传统AI场景;2023GPU芯片曦云C500,并在C550C600已20252026年上半年实现量产销售,新品曦云C700XCORE2.0GGPU,可覆盖云渲AI现落地应用。1、硬件架构:深耕GPU硬件技术,筑牢AI算力基座GPUGPU性能的AMDGPUGPU研发了两个大代际、五个小代际流处理器架构。公司是国内少数坚持“从零到一”自主GPUIP(GPU600(CR10计算P800(CR20渲染GU指令组成自主安全MXMACA指令集。图表34 沐曦股份典型GPU芯片基本组成架构司招股书算力水平大幅缩小与英伟达H100差距,在国内处于先进水平。受限于工艺制程,国内AIA100(如双芯粒封装H100GPUIPXCOREGPU算力处于国内第一梯队。以行业内通常用来衡量GPU芯片在人工智能训练场景下的算力性能指标FP16/BF16C500/C550A100C588芯C550H100的差距,在国内处于先进水平。图表35 沐曦股份产品型号对比表C500
产品概况采用公司自研的XCORE1.0forScience采用HBM2e64GB采用公司自研的XCORE1.0forScience
产品特性MetaXLink7MetaXLink248卡、163264具备国内稀缺的高带宽、超多卡互连AI
产品图示C550
拥有富标、量张计单,力密更⚫ 基于研的MXMACA软栈适配C588
高,支持多种混合精度计算采用HBM2e64GB采用公司自研的XCORE1.0forScience采用HBM2e128GB
主流算法框架、运算库、通信库、操作APIGPUCUDA度兼容司招股在计算精度范围方面,计算功能的完备性与精度完整性是支撑多元场景的核心基石。基于全面覆盖计算和图形领域、灵活可扩展的处理器指令集,沐曦股份的产品能同时支持人工智能训练和推理、通用计算、科学计算等场景、实现训推融合。公司拥有丰富的标FP64、FP32、TF32、FP16、BF16、FP8、INT8、FP6、FP4图表36 沐曦股份技术储备情况序号核心技术储备名称技术储备简介所处阶段1新一代微处理器设计技术GPU计算架构。增加、FP4据,提升实际计算效率。研发中期2高性能显存设计技术研发新一代显存控制器接口构,通过CXL(研发中期3超节点系统与互连技术算MetaXLink(光互连的TOSA/ROSA研发初期、能效、稳定可靠的通信链路;大功率密度的换热系统,助力GPU实现更高的功率和算力。,4光互连通信技术MetaXLinkGPUGPU模GPUMetaXLinkMetaXLink光(CPO)/输出互连带宽和更大的GPU研发中期5高性能推理优化技术DRAM和更高的DRAM概念阶段6GPU图形处理设计技术研发后期7新一代MXMACA软件生态MXMACAGPU研发后期8新一代芯粒架构与(3DICGPU概念阶段9设计工艺联合优化工艺文件和SPICE模型。、概念阶段司招股2、软件生态:打造软件栈MXMACA,软硬协同助力国产GPU自主可控基于“自主创新与开放兼容”双轨并行策略,适配全系列GPU芯片的基础系统软件。MXMACAGPUC/C++/Python6000CUDA应用,适等多类开源框架与模型;内置智能资源管理引擎和协同计算框架,可统一管AICUDA坚实的竞争壁垒并持续扩大领先优势。MXMACA软件栈为开发者提供了简单易用的编程AI开发工具链,利用自有技术完成对相关开源框架和工具的适配、编(能分析工具,不断降低开发者使用门槛,开发者可以以极低的学习成本使用MXMACA软件栈。GPU准定义硬件的功能与性能,通过理论建模、硅前验证、硅后分析等方法,实现软硬SDMAGPUDirectRDMAMXMACAGPU的近乎全部性能潜力。此外,公司自主研发的AI编译器能够生成极具高性能的代码,例如使得HPCG性能相比英伟达A100大幅提高。通用性方面:MXMACACUDA生态的高度兼容,为人工MXMACAGPUMXMACAAI6,000个CUDA应用、超过2,200个高性能算子,与超过1,000个模型实现了原生适配图表37 MXMACA软件栈框架结构司招股书推动生态开源共享,助力算力自主可控。20252142026313MXMACA软件栈注册用户及实际使用客户合计超30API5591万次。快速增长的开发者数量将为公司的软件生态贡献新的场景应用并形成正反馈效应。公司是国内少数提供核心软件生态开源、提SDKGPU公司,MXMACA软件栈已200余份开发文档和手册,并已成功引入中国高校教育体系,覆盖超过半数的中国C9高校,有望打破国外软件生态垄断、支持中国人工智能产业转型升级。图表38 沐曦股份开源合作社区 图表39 沐曦股份MXMACA异构计算平台官网 官网硬件和软件技术有效支撑开发者构建多元化的人工智能算法和人工智能应用程序,推动人工智能在各场景快速落地。在集成电路设计领域,公司已全面掌握多项关键技术,涵GPUGPUGPU多GPUMetaXLink高速互GPUGPUGPU异构计算编程语言与GPUGPU高性能数学库设计与优化技术、GPU核心驱动程序、GPU相关技术在公司各系列产品的研发与应用中发挥了关键作用,显著提升了产品的性能、效率和竞争力。(二)科创板上市赋能核心技术攻坚,两款训推一体GPU新品在研聚焦GPU研发产业化,筑牢科创竞争护城河。20251217GPU研发及产业化项目GPU术储备、构筑竞争壁垒,为长期发展夯实基础。GPU能通用GPU的技术底座与竞争优势。34.124.59C系列训推一体芯片的C600和C700是基于国产先进工艺开发的通用UC700是基于国产先进工艺开发的下一代通用PUGPUIP及MXMACA软件栈,可提供混合精度算力支持,并搭载超高带宽显存,深度融合计算密度与互连系AI图表40 第二代高性能通用GPU芯片(C600)研发目进度安排
图表41 第三代高性能通用GPU芯片(C700)研发项目进度安排 招书 招书GPU智算中心,为其提供高性价比的大模型推理解决方案。5.784.53(代号xI采用公司最新的第三代指令集和先进封装工艺,通过超高显存带宽和大容量显存提高token吞吐量,同时保持低功耗和高能效,大幅降低AI推理成本图表42 新一代人工智能推理GPU研发及产业化项目进度安排司招股书2)面向前沿领域及新兴应用场景的高性能GPU技术研发项目,既增厚公司技术积淀、筑牢竞争壁垒以支撑长期发展,亦推动国内GPU行业技术创新升级。本项目投资总额约10.29.91及基础技术的研究,公司将主要围绕前沿芯片技术研发和前沿GPU系统研发两大方向开展研发工作。其中,前沿芯片技术研发具体包括但不限于超高带宽显存、先进工艺芯粒架构、设计工艺联合优化(DCOU光互连技术等研发内容;前沿U系统研发POLGPUscaleup互连方式优化改进、超节点服务器系统交换架构的演进与优化等研发内容。图表43面向前沿领域及新兴应用场景的高性能GPU技术研发项目进度安排司招股书(三)曦思、曦云系列GPU迭代量产,公司预计最早26年实现盈亏平衡产品迭代量产提速,营收规模逐级跃升。2022GPUN1月20234月,曦思N系列产品CGPU产品,可广泛应用于智算训练AIforScience等场景,2023-2025训推一体GPU板卡系近年收入增长核心来源,销量持续高增。2023年,公司推出曦云CGPU236月完成首批芯片回片,尚未进入量产阶段,因此235.69万元/20242GPU板卡正式量产,叠加人工智能、大模型产业爆发及智算中心建设加速带来的需求红利,特定客户2025GPU33649208.56%。图表44 沐曦股份训推一体GPU板卡销量 图表45 沐曦股份训推一体GPU板卡平均单价0
2023 2024 2025销售数量(张) YoY
4500%4000%3500%3000%2500%2000%1500%1000%500%0%
65432102023 2024 2025Q1平均单价(万元/张) 相对增长
-16.7%-16.8%-16.9%-17.0%-17.1%-17.2%-17.3%-17.4%-17.5%-17.6%-17.7%司招股书、公司年
招书公年 :25Q1速和24作较)拓展训推一体GPU服务器整机业务,销量及单价受客户配置需求影响较大。2024GPU品牌的CPUGPUGPU服务器整机交付给部分GPUGPU图表46 沐曦股份公司训推一体GPU服务器的销售情况项目2024年度2025年1-3月销售收入(亿元)2.0990.0104销售数量(台)3432平均单价(万元/台,不含税)61.2052.01司招股GPU系公司首款产品,GPU曦思N202220222023年末至2024AI大模型领域的井喷式增长促使市场对于传统人工智能推理芯片的需2024N2025年,公司根据市场需求调整其定价策略,该系列产品销量有所上升。图表47 沐曦股份智算推理GPU板卡销量 图表48 沐曦股份智算推理GPU板卡平均单价0
2022 2023 2024 销售数量(张) YoY
4500%4000%3500%3000%2500%2000%1500%1000%500%0%-500%
0.90.80.70.60.50.40.30.20.10
2022 2023 2024 平均单价(万元/张) 相对增长率
10%0%-10%-20%-30%-40%-50%-60%招书公年 招书公年 :25Q1速和24作较)高壁垒高投入导致盈利短期承压,25202220257.8亿元、-8.7亿元、-14.1亿元和-7.892025年已实现亏损收窄。主要原因有:GPUGPU芯片渗透率低,面临GPU大量资源用于研发、市场拓展和生态建设,导致成本居高不下;公司产品切入重点行业客户需通过严苛的技术验证与生态适配流程,周期相短期盈利承压。GPU入特点,为夯实产品竞争优势持续加大研发投入;公司重视人才激励与长期发展,因此股份支付费用较大。AI2026AI芯片行业高速增长及国产替代进程持续加速,沐曦股份主营业务所处市场空间持续拓宽,同时,公司预计将维持高水平研发投入,凭借产品迭代与技术积累巩固核心竞争力,将能够保持良好的持续经营能力,营业收入有望实现稳步增长。公司业务规模总体保持增长态势,在训推一GPU产品毛利率保持相对稳定的情况下,公司的主营业务毛利将快速增长,同时随着新产品的研发成功及客户逐步导入,公司盈利能力将得以进一步提升。在主营业务收2026年。四、盈利预测我们进行盈利预测的关键假设是(1公司以曦云C5002025C600已完成回片并点亮、推进产业化,第三代C700H100MetaXLink高速互联带宽性能达H200AI(2)智算推理业务:N100N系列后续迭代产品系面向生成式人工智能场景,可广泛应用于大模型推理、生成式应用等场景。2025GPU4,946N260N300(3)预计绝对费用金额仍随公司研发投入呈现上升趋势,但公司收入规模有望实现高增,预计公司费用率有所下降。图表49 沐曦股份业务拆分2023202420252026E2027E2028E训推一体系列营业收入(亿元)0.157.2116.1635.2858.4386.41YoY(%)4561%124%118%66%48%毛利率65.5%53.3%56.6%58.6%59.9%60.3%毛利(亿元)0.103.849.1520.6834.9952.13智算推理系列营业收入(亿元)0.140.030.150.190.210.23YoY(%)3109%-75%326%27%10%9%毛利率5.37%10.09%6.00%6.00%6.00%6.00%毛利(亿元)0.010.000.010.010.010.01IP授权及其他营业收入(亿元)0.240.180.130.140.150.15YoY(%)-25%-26%5%5%5%毛利率94.2%70.1%98.2%98%98%98%毛利(亿元)0.220.130.130.140.140.15合计营业收入(亿元)0.537.4316.4435.6158.7886.79YoY(%)12320%1303%121%117%65%48%毛利率62.88%53.43%56.51%58.49%59.79%60.25%毛利(亿元)0.3333.979.2920.8335.1552.29测(注:25年未披露训推一体&智算推理产品毛利率,为假设数据)GPUAI景,已形成曦云训推一体推理渲染MXMACAC60020252026年上半年量26-2835.61/58.78/86.790.55/8.41/17.07亿元,首次覆盖给予“强推”评级。五、风险提示1、供应链安全风险公司采用FablessHBMEDAIP等方面的采购,也面临主要终端供应商来自于境外的情况。在中美科技博弈持续升级的背HBM到不利限制。由于集成电路领域专业化分工的产业结构及较高的技术门槛,其中部分供应商的产品或服务具有稀缺性和独占性,较难在短时间内形成同质量的国产替代。如果未来公司与相关供应商的合作关系发生恶化、中断等情形,或者由于其他不可抗力因素而无法继续进行合作,若公司未能及时落实高质量的国产替代解决方案,则将对公司生产经营的可持续性构成不利影响。2、经营不确定性风险公司通过持续高强度、高水平的研发投入形成技术领先优势,并逐渐将研发优势转换为产品优势,已量产的产品线覆盖了人工智能训练及推理、通用计算(包括科学计算)等计算场景。核心产品快速商业化落地,市场认可度、影响力不断提升。公司目前处于快速发展阶段,业务规模不断扩大,为保持技术先进性和市场竞争力,公司将继续进行较大金额的研发投入以及其他必要的经营相关资金支出,此外,公司产品进入重点行业客户需经历严苛的技术验证及生态适配周期。因市场景气度、行业竞争、客户拓展、供应链管理等影响经营结果的因素较为复杂,公司的营业收入增速可能不及预期,存在未来一段时期内持续亏损的风险。3、核心竞争力风险GPU识产权是公司最重要的无形资产,对于公司保持和提升核心竞争力尤为关键。公司自主GPUIPGPU产品已规模化量产,软件生态的丰富度、兼容性与稳定性不断提高,产品综合性能达到AI来越多的行业参与者,市场竞争日趋激烈。此外,如果产品迭代和技术创新无法满足市场需求,公司将可能面临主要产品销售不及预期、毛利率持续下滑、长期无法实现盈利等风险。附录:财务预测表资产负债表利润表单位:百万元2025A2026E2027E2028E单位:百万元2025A2026E2027E2028E货币资金6,7214,0294,0695,581营业总收入1,6443,5615,8788,679应收票据1051120营业成本7151,4782,3643,450应收账款7266971,0361,276税金及附加5111826预付账款8341,0351,1821,035销售费用204241289370存货1,4961,8172,2042,566管
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业大学就业方向解析
- 2026年中国新一代信息技术产业深度分析报告-中投顾问
- 人工智能与金融硕士
- 英国会计就业趋势分析
- 个人长期职业发展规划指南
- 测试工装技术入股合作合同
- 2025-2026学年下学期2026年6月高二数学核心高频考点
- 《高中数学二项分布与超几何分布课|区分分布 掌握应用》
- 体育学科素养试题及答案
- 2026年辽宁省导游基础知识考试卷及答案(八)
- 2026年人教版七年级下册政治期末学业水平卷(含答案可下载)
- 2026年湖南娄底市农商银行系统招聘34人考试模拟试题及答案详解
- 2026年医学影像设备采购案例分析
- 2026重庆市合川区渭沱镇招聘农村基层本土人才13人考试参考试题及答案解析
- 2026广东广州市海珠区社区专职工作人员招聘23人考试备考题库及答案解析
- 小学英语五年级下册期末分层复习教案(人教PEP版)
- 2026年人教版三年级下册道德与法治知识点总结
- 2026年人工智能训练师(三级)职业技能鉴定理论考试题库(含答案)
- 肝硬化合并腹水康复护理培训指南
- 卫生管理(副高)高级职称考试题库及答案
- 高压开关柜生产工艺及质量标准
评论
0/150
提交评论