寒武纪深度研究报告:国产AI芯片领军者云边端共铸核心壁垒_第1页
寒武纪深度研究报告:国产AI芯片领军者云边端共铸核心壁垒_第2页
寒武纪深度研究报告:国产AI芯片领军者云边端共铸核心壁垒_第3页
寒武纪深度研究报告:国产AI芯片领军者云边端共铸核心壁垒_第4页
寒武纪深度研究报告:国产AI芯片领军者云边端共铸核心壁垒_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目 录一、科研技术背景大国产人工智能芯片头业 6(一)研实雄,国AI芯领领企一 6(二)营规突与利拐显,品构焦高值道 8二、市场需求爆发国产替代空间广阔 13(一)产链芯设为核,GPU成AI计算动引擎 13(二)需端发:GPU市场长云商AI资支出速 161AI大模拉动GPU求大提升 162、内巨与营同码AI力CAPEX 18(三)供端构美升级片口制国芯片速赶 19三、硬软协同筑壁,力加码强全栈 25(一)技领:主建AI芯技壁,协同局 251、件能出产能迭突,准端力需求 252、件态开者:开易体降门,生粘持增强 27(二)战布:增码大型力强全技术争力 29四、盈利预测 31五、风险提示 33图表目录图表1 司史革 6图表2 司权构(数至2025年10月167图表3 司心术队介绍 7图表4 司要品业务绍 8图表5 司2020-2025年前季营收入 9图表6 司2020-2025年前季归净润 9图表7 司2020-2025年上年要品收 9图表8 司2020-2025年上年要品利率 9图表9 司利、利率况 10图表10 公三情况 10图表研费情况 10图表12 研人及比情况 10图表13 公存情况 图表14 公预款况 图表15 公经性流情况 12图表16 公加权ROE及ROA12图表17 AI计算速片产链 13图表18 AI算力特征 14图表19 GPU的成 14图表20 GPU关参介绍 15图表21 GPU生系图 16图表22 中人智场支预测 17图表23 中人智场支预(业)2026 17图表24 2020-2029年国AI计加芯市模 17图表25 2024-2029年国GPU片其他AI片市份额 17图表26 国云头CAPEX投规及长势单位亿,%) 18图表27 三运商CAPEX投规及长势单位亿,%) 19图表28 英达超导体比况 20图表29 近美科域部限制 20图表30 我国AI芯关政工(分) 21图表31 部省及算力政要点 22图表32 国龙企国内点业工能片发情况 23图表33 2024H1我国GPU场额 24图表34 寒纪能架构进 25图表35 寒纪能领域用核技积累 26图表36 寒纪端AI芯片加卡术数 27图表37 CambriconNeuware框架 27图表38 寒纪发区 28图表39 寒纪GitHub项目 28图表40 市主流AI片厂研进对表 29图表41 本募资资项的体况 29图表42 面大型片平项进安排 30图表43 面大型件平项进安排 30图表44 公主业分及测单:万) 31一、科研技术背景强大,国产人工智能芯片龙头企业(一)研发实力雄厚,中国AI芯片领域领军企业之一专注AI芯片研发,我国AI芯片领域领军企业之一。寒武纪成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片。公司始终围绕云-边-端全场景战略持续开展技术迭代与产品演进,已完成多代架构升级,具体来看:2016-2018年,先后推出1A/1H/1M处理器及思元100系列芯片,初步构建云端与边缘端产品体系;2019年,推出第二代云端芯片思元270,并于2021年科创板上市后发布思元290训练芯片及玄思1000加速器。2021年,实现思元370量产,同步推出MLU370系列加速卡,完成训练-推理一体化产品布局。2022-2024年,MLU370-X8及思元590芯片已与智象未来、百川智能等大模型客户完成全面适配,进入生成式AI算力供应链。当前,寒武纪产品广泛应用于服务器厂商和产业公司,面向互联网、金融、交通、能源、电力和制造等领域的复杂AI应用场景提供充裕算力,推动人工智能赋能产业升级。图表1公司历史沿革股权结构稳定,重要股东具备国资背景。2025101628.35%(有7.27%35.62%图表2 公司股权架构(数据截至2025年10月16日)、核心技术成员兼具深厚学术背景与丰富行业经验,为公司战略延续与技术发展提供了重要保障。团队技术背景突出,核心研发由多位中国科学院计算技术研究所博士主导:董2010206图表3 公司核心技术队介绍姓名职务年龄介绍陈天石董事长、总经员40中国科学技术大学计算机软件与理论专业博士学历,2010720199月就职于生导师。2016年3月创立公司,现任公司董事长、总经理、核心技术人员。陈帅副总经理、核心技术人员39中国科学院计算技术研究所计算机系统结构博士学历。2014年至2015年,任中国科学院计算技术研究所工程师。2015年至2016年,任多伦多大学电子和计算机工程系博士后。2016年至今,就职于寒武纪,现任公司副总经理、核心技术人员。王在董事、副总经理41中国科学技术大学计算机应用技术博士学历。2011年至2015年就职于郑州商品交易所并任核心交易系统工程师,2016年至2018年就职于中科院计算所从事科研工作。2016年作为公司创始团队成员加入公司,现任公司董事、副总经理。刘少礼董事、副总经理38中科院计算所计算机系统结构博士学历。2014年至2019年就职于中科院计算所并任副研究员。2016年作为创始团队成员加入公司,现任公司董事、副总经理、核心技术人员。刘毅副总经理、核心技术人员40北京大学微电子与固体电子学硕士学历。2010年至2012年,就职于龙芯中科,任工程师。2012年至2016年,就职于上海英伟达半导体(科技)有限公司任高级工程师。2016年至今,就职于中科寒武纪科技股份有限公司,现任公司副总经理、核心技术人员。张尧副总经理、核心技术人员39中国科学院计算技术研究所计算机系统结构硕士研究生学历。20122014年任计算技术研究所微处理器中心助理工程师。20142015年任龙芯中科高级工程师。20152016年任北京小米松果电子有限公司高级工程师。2016纪科技股份有限公司,现任公司副总经理、核心技术人员。产品矩阵完善,提供云边端一体、软硬件协同的人工智能综合解决方案。IP370芯片、加速卡及训练整机,凭借支持多数据位宽,超大容量和低功耗特点,为云服务商220IP授AI驾驶、边缘计算和AIOTAI浪潮。2023年,公司从底层硬件架构出发,针对自然语言处理、视频图像生成等软件使用重点场景进行图表4 公司主要产品业务介绍产品线产品类型产品特征云端产品线云端智能芯片及加速卡为云计算和数据中心场景中的人工智能应用提供高计算密度和高能效的硬件资源,以支持这些场景下复杂性和数据吞吐量的快速增长所需的人工智能处理任务。智能整机面向有技术基础的商业客户提供计算集群中单体训练服务器。边缘产品线边缘智能芯片及加速卡有效弥补终端设备计算能力不足,缓解云计算场景中数据隐私、带宽延时限制的隐患。IP授权及软件IP授权授权分享智能处理器IP到客户产品中给其使用。基础系统软件平台通过消除不同场景间的软件开发壁垒,同时具备灵活性和可扩展性的特点,使得同一人工智能应用程序无需复杂的移植过程,就能在公司云、边缘端以及系列化芯片与处理器产品上便捷且高效地运行。智能计算集群系统业务数据中心集群要聚焦人工智能技术在数据中心的应用,为人工智能应用部署技术能力相对较弱的客户提供软硬件整体解决方案,以科学地配置和管理集群的软硬件、提升运行效率。(二)营收规模突破与盈利拐点显现,产品结构聚焦高价值赛道公司业绩拐点确立,云端芯片成为核心增长引擎。2020-2025H1,寒武纪完成从战略调整期到业绩爆发期的关键转型,核心财务指标呈现显著改善趋势。1)营收端呈现阶梯式增长。2020-2023年,受行业周期波动及供应链因素影响,公司营业收入分别为4.59亿元、7.21亿元、7.29亿元、7.09亿元。2024年,随着云端智能芯片开始实现规模化商业落地,公司营收同比大幅增长65.56%至11.74亿元,成功达成股权激励设定的2024年营收不低于11亿元目标。2025年前三季度,云端产品线在互联网及运营商46.072386.38%2)2020-2022-4.52202516.05321.49%图表5 公司2020-2025年前三季度营业收入 图表6 公司2020-2025年前三季度归母净20151050(5)(10)(15)

350%300%250%200%150%100%50%0%-50%-100%-150%归母净利润(亿元) 同比增长(%)1)2020-20230.86/0.80/2.19/0.9202499.3%56.69%-76.30%2),20211.75亿元24.3%,20240.070.6%31.11%-55.88%。终端智能处理器IP业务,99%+IP202546.072386.38%;其中2025H1,99.6%收入来自云端AI芯片业务,公司战略聚焦算力主赛道成效显著,产品结构优化有力支撑了盈利能力提升。图表7 公司2020-2025年上半年主要产品收 图表8 公司2020-2025年上半年主要产品利率1),2020-202365.38%62.39%65.76%69.16%2024-202556.71%55.29%2)-94.68%、-115.08%、-181.75%、-123.78%和-38.91%202534.81%20209.79%显20250.93%202035.97%20252.99%,图表9 公司毛利率、利率情况 图表10 公司三费情况250%200%150%100%0% 销售费用率(%) 管理费用率研发费用率(%)7.6815.2312.168.432025792人,77.95%80.18%图表研发费用情况 图表12 研发人员及其比情况1)存货方面,2020-20250.91/2.87/2.87/0.99/17.74/37.29亿元;2021217%2022年边缘端市场需求收缩,存货维持2.87亿元;2023年公司战略聚焦云端芯片业务,库存管理精准度显著提升,存货规模下降;2024年因云端战略备货存货同比增长1685%。2025年前三季度受云端芯片订单放量影响,在互联网及运营商客户大额订单推动下,公司适度增加原材料与在产品备货,存货规模同比增长267.39%升至37.29亿元。2)预付款项变动与公司供应链协作及研发投入密切相关,2020-2024年分别为0.09/0.85/0.08/1.48/7.7420256.90202120231.48202420247.74424%图表13 公司存货情况 图表14 公司预付款项况1)经营活动现金流量净额2025-0.292021-20222023-5.9620242025-0.292)2020-2024年加权ROEROA2025ROE与ROA33.61%22.14%图表15 公司经营性现流情况 图表16 公司加权ROE及ROA情况0

经营活动产生的现金流量净额(亿元)

40%30%20%10%0%-10%-20%-30%ROE(加权)(%) ROA(%)二、GPU市场需求爆发,自主开发空间广阔(一)产业链:芯片设计为核,GPU成AI计算驱动引擎AI计算加速芯片产业链分为上、中、下游三部分,中游设计为产业核心环节。中游IDMFablessEDAIP上游提供设计环节所需的EDA/IP下游方案,最终应用于AI图表17 AI计算加速片产业链尔线程招股说明书》AI算力芯片是指专门为AIAIAI任AIAI化的硬件加速器,如GPUTPU图表18 AI算力的特征瞻产业研究GPUGPU(GPUGPUAPI已成为AIGPU也广泛应用于科学计算与数据分析等多个高性能计算领域,逐步成长为现代计算基础设施中不可或缺的核心组件。图表19 GPU的构成尔线程招股说明书》GPUAI训练GPUGPU图表20 GPU关键参介绍参数名称参数简介参数性能核心数量作为GPU的核心指标,核心数量越多,GPU在处理图形渲染、科学计算、AI计算加速等任务时能够处理更多线程,提升运算效率。核心数的增加不仅可以显著提升性能,也能有效分摊工作负载,从而更好地满足高强度计算需求。时钟速度时钟速度指GPU每秒可执行的时钟周期数,对数据处理速度和性能输出具有直接影响。更高的时钟速度意味着在同等时间内能够完成更多的运算任务,满足对实时性、低延时的应用场景需求。显存容量显存是GPU临时存储数据的空间,容量的大小在处理大型数据集、高分辨率图像或视频时尤为重要。较大的显存容量可减少GPU与系统内存之间的频繁数据传输,在多任务或高分辨率场景下有效提升性能和效率。显存带宽显存带宽指单位时间内GPU内部存储器可传输的数据量。较高的显存带宽确保了在面对高负载时,数据能被快速送达处理核心,进而维持流畅的运行效率。对需要高吞吐量的应用(如深度学习推理或复杂图形渲染)而言,显存带宽是关键的性能瓶颈之一。计算能力计算能力通常以GFLOP/S(每秒十亿次浮点运算)表示,是衡量GPU并行计算性能的主要指标。更高的计算能力意味着在AI计算、科学计算、工程模拟等高强度场景中可以实现更快的运算速度和更高的产出。算精度覆盖范围GPU支持的计算精度范围(如FP64、FP32、FP16、FP8、INT8等)反映了其在多样化任务中的灵活度。随着AI技术的不断演进,不同的应用场景对计算精度的要求也各不相同。能够支持多种精度水平的GPU不仅具备更高的灵活度,也能在多样化的AI任务中实现更佳的性能与能效。尔线程招股说明书》、GPU组成GPU硬件基础:GPU件,决定GPUDirectX/OpenGL/CUDA等开发者生态:CUDA富的工具和库推动GPUMUSA图表21 GPU生态系图尔线程招股说明书》(二)需求端爆发:GPU市场增长,云厂商AI资本支出提速1、AI大模型拉动GPU需求大幅提升我国AIIDC2024年全球生成式AI市场五年CAGR20282842AI市场投35024年我国生成式AI占AI18.9。AI2028AI投资占比将达到30.6%,投资规模超300亿美元,对应的五年CAGR为51.5%。从长期发展动力来看,AI技术的创新迭代不断推动应用场景进一步落地,其中AIGC、多模态、智能决策等热点方向,为市场拓展带来了更多想象力与可能性。同时,数字化、数智化转型背景下,AI大模型被政府、企业广泛关注并积极推动,为我国AI市场规模的长期增长奠定了基础。从行业应用来看,在五年预测期内AI支出主要来自专业服务领域的行业用户、政府和金融行业,合计约占市场总量50%以上。增长速度来看,银行和地方政府增速最快,五年CAGR均超23%。图表22 中国人工智能场支出预测 图表23 中国人工智能场支出预测(行业)2026专业服务,专业服务,29.30%其他,47%地方政府,8.90%银行,通讯,7.80%7.00%DC中国《2025年V1版全球人工智能和生成式人工智能支出指南

通财经网,转引自IDC中国202AIAIAIVR/AR等算力需求由通用性CPUGPU2029AI20241,425.3713,367.922025202953.7%202469.9%2029年的77.3%。图表24 2020-2029年我国AI计算加速芯片市场

图表25 2024-2029年我国芯片及其他AI芯片场份额

若斯特沙利文,援引自《摩尔线程招股说明书》、2、国内云巨头与运营商共同加码AI算力CAPEX国内云厂商CAPEX投入提速,AI2023年以AIDC202418752025字节跳动:AI2024735303800AIAI腾讯:2024年,腾讯实现营收6602.57亿元。2025年公司资本开支预计将占全年收入的低两位数百分比,据此测算,全年CAPEX或将接近千亿的水平;百度:2024CAPEX8010%。图表26国内云巨头CAPEX投入规模及增长趋势(单位:亿元,%)、运营商整体CAPEX20243188.720252,898CAPEXAI。中国移动:20241,6409.04%37122%20251,5122024年小幅下调;其中算力方向计划投入373亿元,与2024年基本持平,在资本开支中的占比提升至25%。在2025中国移动全球合作伙伴大会主论坛上,中国移动正式发布AI+行动计划,表明到2028年底,中国移动将持续加大对人工智能领域的投入力度,总体投入翻一番,建成国内规模最大、技术领先的智算基础设施,探索十万卡智算集群建设,全国产智能算力规模突破100EFLOPS。中国联通:2024613.717%19%20255506G935的产业数字化投为325202583610.6%,38%22%20%图表27三大运营商CAPEX投入规模及增长趋势(单位:亿元,%)公司公告及业绩说明会、(三)供给端重构:美国升级芯片出口限制,国产芯片加速追赶AI芯片行业整体呈现寡头垄断格局,国际龙头企业在技术、市场和生态方面具有显著优势。全球范围来看,经过多年竞争与发展,全球GPU市场头部化现象显著,整体呈寡头垄断格局,英伟达(NVIDIA)和超威半导体(AMD)两家国外领先厂商基本分割了全球市场,在综合技术实力、销售规模、资金实力、人才团队等方面优势明显。根据沐曦股份招股说明书引用JonPeddieResearch的数据,独立GPU市场方面呈现一超一强格局,其中英伟达一家独大,近年来持续维持超80%的市场份额,而AMD公司则占据剩余近20%的市场份额。自人工智能市场爆发式增长以来,英伟达凭借优越的产品性能和完善的CUDA生态筑造了护城河,领先优势不断扩大。根据沐曦股份招股说明书引用TechInsights数据,在GPU市场,2023年全球应用于智算中心的GPU总出货量达到了385万颗,相202226744.2%GPU37690%。图表28 英伟达与超威导体对比情况公司名称成立时间主营业务及主要产品英伟达(NVIDIA,NVDA.O)1993年4月GPU的设计和制造,产品应用于游戏、专业可视AI领域处于领先地位超威半导体(AMD,AMD.O)1969年5月专注于计算机、通信和消费电子行业的微处理器(CPU、GPU、主板芯片组等)设计和制造,提供高性能计算解决方案,并提供闪存和低功率处理器解决方案尔线程招股说明书、美国限制措施不断升级,加速国内AI芯片自主开发进程。近年来,针对芯片、先进计算等领域,美国通过出口管制、实体清单,法案等方式出台了一系列限制措施,包括调整高性能芯片受限参数、防止芯片厂商绕过限制等,芯片管制措施持续升级。据摩尔线程招股说明书数据,寒武纪、海光信息等公司的AI芯片产业化程度较高,并已在国内市场实现规模化营收。美国高端GPU出口限制逐步加强的背景下,中国企业推进自主开发的步伐正不断加快。图表29 近年美国科技域部分限制发布机构发布时间制裁限制内容美国特朗普政府2025/4/16出口管制对英伟达H20芯片实施出口许可证制度,名义上允许合规申请,但因许可证无限期生效且实际审批停滞,或构成事实禁售(备注:当地时间7月14日,英伟达通过官网宣布将恢复向中国销售H20;2025年11月美国宣布暂停实施‘出口管制50%穿透性规则’一年,相关管制措施或存在阶段性调整)BIS2025/3/26实体清单扩大实体清单至54家中国实体,新增目标包括AI、量子技术、高超音速武器相关企业,适用推定拒绝许可政策BIS2024/12/2实体清单14024种半导体制造设备、3EDAHBM实施新管控,新规在之前基础上补充,涉及的设备包括蚀刻、沉积、微影等关键设备,几乎涵盖所有晶圆厂所需美国财政部2024/10/28投资禁令美国政府以美在华投资可能威胁国家安全为名,发布了主要针对中国半导体、量子技术、人工智能的投资禁令,并于2025年1月2日生效BIS2024/3/29出口管制进一步限制中国获取美国人工智能芯片和芯片制造工具的能力:新规不仅限制芯片本身出口,还适用于含有这些芯片的笔记本电脑等高端消费电子产品BIS2023/10/17出口管制2022107日发布的规则进行修改更新的版本,调整了高级芯片受到限制的参数且出台了新的措施,防止芯片厂商绕过限制政策;同时制裁13家中企BIS2023/3/3实体清单28家中国企业列入实体清单,包括浪潮集团、龙芯中科、华大基因、第四范式等BIS2022/10/7出口管制1术、特定半导体制造设备及相关软件和技术、及特定半导体制造设备;2、针对先进计算及超级计算机新增两个外国直接产品规则(FDPR)规则;3、针对中国境内的超级计算机以及半导体制造设施开发生产特定参数集成电路的任何物项设置最终用途管制;4EAR74445、限制美国人直接或间接参与或帮助中国境内的半导体制造设施开发、生产特定集成电路或获得用于开发该等集成电路的任何物项BIS2022/8/12出口管制GAAFETEDA/ECAD软件、以金刚石和氧化镓为代表的超宽禁带半导体材料、包括压力增益燃烧(PGC)在内的四项技术实施了新的出口管制美国总统拜登签署2022/8/9《芯片与科学法》加大对美国半导体产业发展的资金支持,限制接受补贴的企业与中国合作行政命令授权美国财政部禁止、限制、监督美国投资者对中国、中国香港和中国澳门的特定领域投资,包含半导体和微电子、量子信息技术和人工智能BIS2019/5/15、8/19实体清单先后将华为及其114家附属公司列入实体清单BIS2016/3/7实体清单将中兴通讯等中国企业列入实体清单,对中兴公司采取限制出口措施BIS网、ictimes、山东省商务厅、钛媒体、强调适度超前建设网络设施,国产算力落地路径清晰。国务院提出深入实施人工智能+行动政策,旨在推动人工智能与经济社会深度融合。计划到2027年实现人工智能与六大重点领域广泛深度融合,到2030年全面赋能高质量发展,到2035年全面建成智能经济与社会新阶段,为中国式现代化提供核心支撑。中国信息通信研究院副院长魏亮在2025中国算力大会上表示,国家正按照‘点、链、网、面’体系化推进全国一体化算力网络工作,通过推动优化算力布局、强化技术协同创新、适度超前建设网络设施、丰富算力应用场景,持续提升算网综合供给能力。下一步,加快突破GPU芯片等关键核心技术,扩大基础共性技术供给。同时,东数西算工程在推进算力基建过程中,助力破解区域发展不平衡等问题,为算力基建自主化提供了资源调配与产业协同机遇,推动构建更均衡、更自主可控的算力网络。目前地方已率先落地相关布局,如甘肃庆阳市政府与燧原科技、亿算智能签订《共建国产十万卡算力集群及新质生产力生态圈战略合作框架协议》;河南2024年计划投资568亿元推进智算中心建设;截至2025年4月,宁夏标准机架、智算算卡、算力规模分别较2024年底新增2.6万架、2.3万张、3.4万P,预计2025年内新增标准机架28万架,强化东数西算枢纽功能;标志着我国自主可控的超大规模AI算力基础设施建设进入实质推进阶段。图表30 我国AI芯片关政策工程(部分)维度核心政策/工程量化目标与要求人工智能与经济社会融合发展国务院深入实施人工智能+行动政策2027年实现人工智能与六大重点领域广泛深度融合;2030年人工智能全面赋能高质量发展;2035年,全面建成智能经济与社会新阶段,为中国式现代化提供核心支撑点、链、网、面体系化推进算力布局政策体系持续推动算力网络点、链、网、面体系化高质量发展:加快突破GPU芯片等关键核心技术,扩大基础共性技术供给;面向教育、医疗、能源等重点行业,开展算力赋能专项行动。算力基建自主化东数西算工程为算力基建自主化提供了资源调配与产业协同机遇,推动构建更均衡、更自主可控的算力网络;地方协同布局省级/市级算力规划地方政府主导推进,通过项目签约、资金投入等落地:568202528容枢纽节点能力;甘肃庆阳市共建国产十万卡算力集群及生态圈。民周刊、经济日报、庆阳融媒、算力券定向补贴落地,助力国产AI算力需求释放。超长期特别国债资金以算力券形式定向支持智算需求侧,成为推动AI产业发展的重要政策工具。从地方推进节奏看,北京、贵州、浙江、天津、河南、安徽、河北、深圳等省市已率先出台实施细则。这种定向支持不仅能直接刺激企业对国产智算资源的需求,还或将加速寒武纪、海光、昇腾等国AI图表31 部分省份及城算力券政策要点省份/城市发布时间补贴比例河南省2025年8月9日使用算力资源的企业每年可享不超过100万元算力券奖励石家庄市2025年7月2日按照购买算力资源费用的50%予以补贴,最高不超过100万元算力券;每家企业每年享受奖补累计不超过100万元算力券安徽省2025年5月18日10%30%核价后,按照智算算力服务支持比例计算补贴金额;核价后金额高于或等于限高价的,统一按照限高价补贴浙江省2025年5月16日10%30%实际执行金额核价后,按照智算算力服务支持比例计算补贴金额;核价后金额高于或等于限高价的,统一按照限高价补贴天津市2025年4月27日按照算力服务合同的10%申请算力券,同一企业每年度累计兑现算力券金额不超过200万元,同一合同仅能申请一次算力券且申请补贴金额不低于1万元深圳市2025年3月31日年租用智能算力开展AI大模型训练、推理费用达到50万元(含)以上,以训力券单次抵扣不超过服务合同金额的50%。同一需求方年度累计申请的训力券额度最高1000万元贵州省2024年11月13日对使用本地国产化算力开展适配的,可按适配服务金额的30%给予现金券的激励,同一适配需求主体年度累计激励额度不超过150万元北京市2023年10月11日单次申领算力券金额最高不超过智能算力合同额的20%,同一企业每个自然年度累计申领和兑付算力券金额不超过200万元省市政府公开文件、额,并持续向新应用领域延伸。GPU图表32 国际龙头企业国内重点企业人工能片发展情况公司产品结构经营模式盈利模式企业规模研发实力产业化程度应用场景落地技术成熟度生态竞争能力英伟达基于GPU云端和边Fabless销售芯片、加速卡以及整机系统大型企业2024年研发投入129.14亿美元,研发费用率9.90%产业化程度极高,市场占有率全球领先主要面向云端和边缘端人工智能、游戏、专应用场景技术成熟度全球领先,且不断迭代中生态竞争能力全球领先,CUDA生态引领国际市场AMD数据中心、客户端、游戏及嵌入式四大业、FPGA、DPUSoC等芯片产品Fabless、销售芯片、加速卡以及整机系统大型企业2024年研发投入64.56亿美元,研发费用率23.23%产业化程度高,在全球市场占有率较高成熟且不断迭代中生态竞争能力较强,ROCm生态在专业计算等领域表现较为优异海光信息x86和基于GPGPUDCUFabless销售CPU和DCU产品大型企业202434.462024年底研发人员数量人,占比90.18%产业化程度较高,并已在国内市场实现规模化营收较为成熟且不断迭代中积极参与开源社区,与众多厂商合作,构建软硬件生态寒武纪云端、边缘端、终端Fabless销售授速卡以及智能计算集群系统大型企业202410.722024年底研发人员数量人,占比75.61%产业化程度较高,并已在国内市场实现规模化营收云边端的视觉、语音、自然语言、搜索推荐等较为成熟且不断迭代中具备云边端一体化开发环境,支持统一的软件生态景嘉微GPUFabless销售GPU芯片、图形显控模块和品、小型专大型企业2024年研发投入2.812024年底研发人员数量人,占比61.55%产业化程度较高,并已在国内市场实现规模化营收应用于图形渲染等领域,产品在图形处理和可视化等场景中广泛应用较为成熟且不断迭代中产品以图形渲染为主,应用场景明确摩尔线程基于全功能GPU的板卡、一体机及集群设备,覆盖云端、边缘端和终端场景Fabless销售GPU板卡、一体初创企业202413.592024年底研发人员数量人,占比78.69%量产,并已在国内市场实现商业化AI以及端侧智能设备较为成熟且不断迭代中MUSA架构搭建国产计尔线程招股说明书、国产AI20251-2284.690.621.4%12.8IDC202427082202570GPU202417%3%图表332024H1我国GPU市场份额华为,17%英伟达,华为,17%英伟达,80%DC《2024H1ChinaDatacenterGPU&OtherAcceleratorAdapterMarketAnalysis》、华创证券三、硬软协同筑壁垒,算力加码强全栈(一)技术领先:自主构建AI芯片技术壁垒,硬软协同破局1、硬件性能突出:产品性能迭代突破,瞄准高端算力需求寒武纪依托全栈自主研发,在AI芯片硬件领域构建核心壁垒。公司自2016年推出首款商用智能处理器后,持续聚焦自主可控。MLUarch®20253623(214)。MLU2025年3月末,22858SoC图表34 寒武纪智能芯架构演进IT之家、图表35 寒武纪智能芯领域通用性核心技积累技术大类在主营业务及主要产品中的应用和贡献情况专利或其他技术保护措施成熟程度技术来源智能处理器架构已完成五代智能处理器架构研发。公司是国内外在该技术方向积累最深厚的企业之一。公司在云端、边缘端、终端三条产品线的所有智能芯片和智能处理器核均基于自研处理器架构研制。已取得专利623项(其中境外专利214项)成熟稳定自主研发智能处理器指令集指令集是处理器芯片生态的基石。公司是国际上最早开展智能处理器指令集研发的少数几家企业之一。已完成五代智能处理器指令集研发。公司已形成了体系完整、功能完备、高度灵活的智能芯片指令集专利群。公司在云端、边缘端、终端三条产品线的所有智能芯片和智能处理器核以及基础系统软件均构建于自研的MLU指令集基础之上。已取得专利228项(其中境外专利58项)成熟稳定自主研发SoC芯片设计公司已掌握复杂SoC设计的一系列关键技术,有力支撑了云端大型SoC芯片(思元100、思元270、思元370和思元290)和边缘端中型SoC芯片(思元220)的研发。81项(其中境外专利25项)成熟稳定自主研发处理器芯片功能验证公司拥有成熟先进的处理器和SoC芯片功能验证平台,确保了智能处理器和SoC芯片逻辑设计按时高质量交付,有效保障了多款芯片产品的一次性流片成功。已取得专利14项成熟稳定自主研发先进工艺物理设计公司已掌握7nm等先进工艺下开展复杂芯片物理设计的一系列关键技术,已将其成功应用于思元100、思元220、思元270、思元290、思元370等多款芯片的物理设计中。非专利技术成熟稳定自主研发芯片封装设计与量产测试应用于公司云端、边缘端不同品类芯片产品的封装设计与量产测试过程,有效支撑了公司处理器芯片的研发。项(利5项)成熟稳定自主研发硬件系统设计有效解决了高速信号完整性、大功率供电下的电源完整性、大型芯片散热、机箱模块化等关键问题,支撑公司基于自研芯片研发模组/智能板卡、整机、集群等多样化的产品形态。60项(其中境外专利11项)成熟稳定自主研发告、寒武纪通过思元系列芯片与加速卡构建了覆盖云端训练至边缘视频解析的全栈算力体系。核心产品MLU370-S4/S8加速卡7nmMLUarch03自研架构,支持FP32INT419218TFLOPS(FP32),搭配307.2GB/sLPDDR548GBMLU370-X440,000帧/132HEVC1080P(128)云端训练场景590MLU-Link82.048达英伟达A100动态稀疏计算技术提升30%有效算力利用率,显著缩短千亿参数模型训练周期。MagicMind370MLUarch03为AI计算相关场景提供推理加速支撑。图表36 寒武纪云端AI芯片及加速卡技术数芯片名称加速卡型号算力参数制程工艺内存容量/带宽最大热功耗思元270MLU270-S4INT8:128TOPSINT4:256TOPSINT16:64TOPS台积电16nm16GBDDR4ECC102GB/s70WMLU270-F4INT8:128TOPSINT4:256TOPSINT16:64TOPS台积电16nm16GBDDR4ECC102GB/s150W思元370370-S8INT8:192TOPS视频解析:132路1080P流台积电7nm48GBLPDDR5307.2GB/s75W370-X4FP16:96TFLOPS图片解码:40,000帧/秒台积电7nm24GBLPDDR5307.2GB/s150W思元590590集群FP16集群算力:2.048PFLOPS(8卡互联)武纪官网、湖北日报、21世纪经济报道、2、软件生态与开发者支持:开放易用体系降低门槛,生态粘性持续增强NeuWare统一平台:跨场景开发效率提升,技术能力覆盖核心环节。寒武纪NeuWare统一基础系统软件平台是其AI技术落地与生态构建的核心支撑,不仅为云边端全系列智能芯片(思元系列)提供底层支持,更通过关键环节的技术优化与生态开放举措,夯实自主软件体系竞争力。从核心技术能力来看,NeuWare软件栈以模块化分层设计为基础,整合软件开发工具链,有效消除不同应用场景下的开发障碍,核心实现一次开发、多端部署的关键价值——开发者无需对AI应用进行复杂移植,即可使其在寒武纪云端、边缘、终端全系列芯片上高效运行,既显著提升跨硬件平台的开发与部署效率,也实现云边端异构硬件资源的统一管理、调度与协同计算,充分释放全场景算力潜力,且整体具备高性能、灵活性与可扩展性的技术特征。图表37CambriconNeuware框架股书、多维度布局开发者支持体系,以开源与协作筑牢AI生态根基。寒武纪围绕线下技术服务、人才培养协作、开源社区运营三大核心方向展开布局,通过多维度资源整合与能力协同,搭建起全方位、立体化的开发者支持体系,既为生态注入持续活力,也为芯片+软件技术体系的产业落地提供保障。1)在人才培养层面,公司聚焦生态长期发展的续扩张与技术迭代夯实人才基础。2)在开源社区运营与生态协同层面,寒武纪以主动开源为核心策略,通过开源核心软件工具链(包括Torch-MLU、Triton-LinalgAI编译器前端等)吸引开发者参与,其GitHub平台已形成活跃的开发者社区,有效提升生态凝聚力。同时,公司从开发者实际需求出发,原生支持Transformers、Accelerate、DeepSpeed等主流组件,并全面适配开源推理引擎vLLM,大幅降低开发者的技术使用门槛;更依托社区用户的实时反馈形成开发-反馈-优化的迭代闭环,持续完善自主AI软件生态的兼容性与易用性。从生态构建的最终价值来看,上述多维度举措与技术协同优势形成互补,不仅强化了生态伙伴的粘性,更推动公司云边端产品矩阵在多行业实现规模化落地,助力技术价值向产业应用高效转化,进一步巩固其在AI芯片领域的生态竞争优势。图表38 寒武纪开发者区 图表39 寒武纪GitHub项目网 ithub硬件架构与软件平台为AI芯片厂商发力重点。AMD图表40 市场主流AI片厂商研发进展对表公司处理器架构指令集芯片直连多卡全互联交换软件平台英伟达Blackwell架构已量产,Rubin架构在研CUDA指令集NVLink持续迭代NVSwitch交换芯片持续迭代中CUDAAMD代架构(CDNA4)正在5代架构(CDNA5)在研CDNA指令集InfinityFabricLink持续迭代AMDInfinityFabric网络扩展技术持续迭代中ROCm华为海思达芬奇架构已量产,新一代架构计划尚未公布Ascend指令集HCCSUBSwitchMindSpore寒武纪第5代架构已量产,新一代架构在研MLU指令集MLU-Link持续迭代MLU-Link支持8卡全相连寒武纪软件栈025年度向特定对象发行股票申请文件的审核问询函回复》、(二)战略布局:定增加码大模型算力,强化全栈技术竞争力AI芯片全栈竞争力。公司已于2025年9月22日完成定向增发,并于10月2139.85动资金。与技术创新,全面系统掌握智能芯片及其基础系统软件研发和产品化核心技术,在智能芯片及相关领域开展了体系化的知识产权布局,先后研制了多款领先智能处理器及芯片产品。本次募集资金投资项目围绕大模型需求的多样化,研发新一代的智能芯片技术和相关产品,将全面提升公司在大模型演进趋势下的技术和产品综合实力。在软件方面,将开展相应的优化策略、软件算法以及软件工具的创新研究,并建设面向大模型的软件平台,有望进一步支撑公司智能芯片算力性能的充分发挥,增强公司智能芯片对大模型新技术趋势和新应用拓展的灵活适应能力,将有效提升面向大模型算法开发和应用部署的高效支撑与服务能力。图表41 本次募集资金资项目的具体情况项目名称实施主体总投资万元)拟用募集资金(万元)建设/实施内容面向大模型的芯片平台项目中科寒武纪科技股份有限公司290,000205427.94研发面向大模型训练、大语言模型推理、多模态推理及交换需求的系列化芯片;建设先进封装技术平台,提升对未来大模型需求的硬件适应性面向大模型的软件平台项目中科寒武纪科技股份有限公司160,000145207.77构建灵活编译系统、训练平台、推理平台三大模块,形成面向大模型的完整软件栈,提升芯片易用性与大模型全业务流程支撑能力补充流动资金项目中科寒武纪科技股份有限公司48,00047897.02补充营运资金,保障日常经营及业务拓展资金需求合计498,000398532.73信证券股份有限公司关于中科寒武纪科技股份有限公司2025年度向特定对象发行A股股票之上市保荐书》、面向大模型的芯片平台项目,有助于完善系列化产品布局与先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论