版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2024年海光信息跟踪报告:CPU和DCU领军企业引领AI芯片国产浪潮1、海光信息:CPU/DCU领军企业,盈利能力持续提升1.1公司专注于CPU/DCU业务海光信息成立于2014年,公司的主营业务是研发、设计和销售应用于服务器、工作站等计算、存储设备中的高端处理器。公司的产品包括海光通用处理器(CPU)和海光协处理器(DCU)。公司专注于高端处理器的研发、设计与技术创新,掌握了高端处理器核心微结构设计、高端处理器SoC架构设计、处理器安全、处理器验证、高主频与低功耗处理器实现、高端芯片IP设计、先进工艺物理设计、先进封装设计、基础软件等关键技术。公司于2022年在科创板上市。公司的控股股东为曙光信息产业股份有限公司,截至2023年年报,曙光信息产业股份有限公司持股27.96%。1.2营收利润双增长,注重研发投入营收利润双增长,产品需求旺盛。2022年,公司成功推出CPU产品海光三号,与在售的海光二号,广泛应用于电信、金融、互联网、教育、交通等重要行业或领域,得到了国内用户的广泛认可。海光DCU系列产品兼容国际主流商业计算软件和人工智能软件,软硬件生态丰富,DCU产品深算一号在2022年实现了在大数据处理、人工智能、商业计算等领域的商业化应用。2023年公司业务进一步发展,通过技术创新、产品迭代、功能提升等举措保持了领先优势,市场竞争力持续增长实现营收60.12亿元,同比增长17.30%;实现归母净利润12.63亿元,同比增长57.17%。盈利能力逐步向好。公司2019年以来毛净利率均整体呈现增长趋势,其中2022年毛利率为52.42%,净利率为21.95%。2023年公司的毛利率为59.67%,同比增长7.25pct,净利率为28.30%,同比增长6.35pct。在费用管理方面,2023年公司销售、管理、研发和财务费用率分别为1.85%、2.23%、33.14%和-4.43%,同比增长0.27pct、-0.40pc、5.56pct和-2.71pct。公司注重研发投入,不断提高技术水平和产品的竞争优势。2023年公司研发投入为28.10亿元,同比增长35.95%,研发投入占营业收入比46.74%。公司研发技术人员1,641人,占员工总人数的91.68%,79.28%以上研发技术人员拥有硕士及以上学历。公司2023年研发费用为19.92亿元,研发费用率为33.14%。关联交易额度大幅提升,业绩支撑较强。公司与“公司A及其控制的其他公司”关联交易额较高。根据公司2023年4月17日晚公告,从2023年1月1日截至公告日,公司与关联人“公司A及其控制的其他公司”累积已发生的“销售商品和提供劳务”交易金额达6.33亿元,公司2023Q1营收为11.61亿元。根据公司2024年4月11日晚公告,从2024年1月1日截至公告日,公司与关联人“公司A及其控制的其他公司”累积已发生的“销售商品和提供劳务”交易金额达22.00亿元,有望为公司2024年一季度业绩提供较强支撑。此外,公司预计2023年年度股东大会召开之日至2024年年度股东大会召开之日期间,公司与关联人“公司A及其控制的其他公司”的“销售商品和提供劳务”交易金额将达63.22亿元,对比2022年年度股东大会召开之日至2023年年度股东大会召开之日期间公司与关联人“公司A及其控制的其他公司”“销售商品和提供劳务”交易金额43.00亿元,同比增长约47%。关联交易额度大幅提升有望显著拉动公司营收及利润。2、AIGC推动服务器市场持续扩张2.1海内外服务器市场持续增长,AI服务器采购力度加大海内外服务器市场持续增长,国内市场一超多强。全球方面,根据IDC数据,2022年全球服务器出货量突破1,516万台,同比增长12%,产值达1,215.8亿美元,预计未来四年内仍保持增长,2026年全球服务器出货量达1885.1万台,2022-2026年全球服务器出货量CAGR为5.59%,产值有望达到1664.95亿美元,2022-2026年产值CAGR为8.18%。中国方面,据智研咨询数据,2022年中国服务器出货量为434.1万台,同比增长5.36%。据IDC,2022年中国服务器市场规模为273.4亿美元(1888.37亿人民币),同比增长9.1%。据中商情报网预测,2023年中国服务器出货量有望达到449万台,同比增长3.43%;中国服务器市场规模有望达到308亿美元,同比增长12.66%。从市场份额(按营业收入统计)上看,据IDC,浪潮、新华三、超聚变、宁畅、中兴位居2022年中国服务器市场前五,市场份额占比分别为28.1%/17.2%/10.1%/6.2%/5.3%,同比变动-2.7pct/-0.3pct/+6.9pct/0pct/+2.2pct。IDC认为,中期来看X86架构仍然会是主流的服务器,未来将会形成以X86为核心多种架构并存的丰富算力市场。另外,随着互联网、云服务、电信、银行等各行业超大规模客户不断扩张和升级扩容对于服务器的强劲需求,以硬件为中心的集成硬件与软件支持多样化工作负载的解决方案将成为服务器厂商制胜未来的关键。当前服务器产业正往技术多样化、服务定制化、软件定义、异构计算与边缘计算方向发展。在高端处理器领域,由于x86处理器起步较早,生态环境较其他处理器具有明显优势,因此,全球应用x86处理器的服务器销售额占全部服务器销售额的比例约为90%,销售量占比超过96%,处于显著领先的地位。在我国,根据IDC统计数据,2023年全年,中国x86服务器市场出货量为362万台,预期2024年还将增长5.7%。随着近几年人工智能技术快速突破,人工智能产业链与商业化应用进入了高速发展阶段。根据《2023-2024中国人工智能计算力发展评估报告》,IDC预计全球人工智能硬件市场(服务器)规模将从2022年的195亿美元增长到2026年的347亿美元;预估2023年中国人工智能服务器出货量为31.60万台,同比增长11.3%,2027年将达到69.1万台。AI服务器有望迎高速增长。ChatGPT、文心一言等AIGC大模型带来计算资源需求井喷,催生AI服务器需求增长,叠加配置升级带动单台AI服务器价值较通用型成倍增长,量价齐升。据TrendForce预测,2023年全球AI服务器出货量同比增速可达8%,2022~2026年复合增长率将达10.8%。据IDC数据,2021年全球AI服务器市场规模156亿美元,预计到2025年全球AI服务器市场将达到318亿美元,21-25CAGR为19.5%;2021年中国AI服务器市场规模达350亿元,预计2025年中国AI服务器市场规模将达到702亿元,21-25CAGR为19.0%。海内外云巨头加大AI服务器采购。从AI服务器的采购量来看,据TrendForce统计,2022年AI服务器采购量中,北美四大云端供应商Microsoft、Google、Meta、AWS合计占比约66%。根据TrendForce集邦咨询预估,从2024年全球主要云端服务业者(CSP)对高端AI服务器(包含搭载NVIDIA、AMD或其他高端ASIC芯片等)需求量观察,预估美系四大CSP包括Microsoft、Google、AWS、Meta各家占全球需求比重分别达20.2%、16.6%、16%及10.8%。中国近年来AI建设浪潮持续升温,字节跳动2022年采购占比达6.2%,腾讯、阿里巴巴、百度紧接其后,分别约为2.3%、1.5%与1.5%。海外云巨头对AI服务器的需求更大,但随着国内AI大模型的开发及应用拉动更多AI服务器需求,中国AI服务器市场空间有望进一步提升。2.2服务器芯片配置或成服务器厂商制胜关键,AI芯片需求旺盛芯片作为服务器算力的载体,与服务器整体性能紧密相关。传统服务器芯片组仅由2颗CPU构成,价格在800-850美元/颗,而AI服务器芯片组通常需要搭载2颗1000-1100美元/颗的CPU,训练AI服务器与推理AI服务器还分别需要增加8/4颗GPU以提升服务器的综合算力。目前完整规格的英伟达HGXH100AI服务器搭载配备8个H100GPU,总计8个GPC图形集群,72个TPC纹理集群,144个SM流式多处理器,共计18432个FP32CUDA核心,每组SM配备4个专用于AI训练的第四代张量核心TensorCore,共计528个。相较于同等GPU数量配置的A100,H100在HPC和AI计算(FP64/TF32/FP16/INT8)上由156TF/2.5PF/5PF/10POPS提升至480TF/8PF/32PF/32POPS,在多专家(MoE)模型训练速度上提升了9倍,大幅度提升万亿参数的AI大模型应用效率。在AIGC快速发展背景下,服务器芯片配置或成服务器厂商制胜关键。CPU和GPU等核心芯片在高算力AI服务器领域成本占比可达80%以上。根据Wind及芯八哥数据,在普通服务器中,CPU和GPU等芯片在服务器中总成本约30%左右;在高性能服务器和推理服务器中,核心芯片的成本占比约为50%;在目前市场主流的高算力AI服务器领域,CPU和GPU等核心芯片占比最高可达80%以上。GPU、ASIC和FPGA搭载率均将持续提升。IDC预计到2025年人工智能芯片市场规模达726亿美元,AI芯片搭载率将会持续提升。根据嘉世咨询,2022年全球加速服务器市场规模为67亿美元,同比增长24%,其中GPU市场规模为60亿美元,占比达89%。目前每台AI服务器上约搭载2个GPU,未来GPU、ASIC和FPGA搭载率均将持续提升。2.3国产AI芯片崛起,各家争相布局AI芯片AI芯片国产化进程加速。我国AI芯片产业起步相对较晚,技术上与世界先进水平还存在差距。目前,Nvidia控制着80%的高端AI芯片份额,而我国AI芯片市场较为分散,集中度较低。2024年4月1日,美国拜登政府修订了旨在使中国更难获得美国AI芯片和芯片制造工具的出口限制规定,新规定长达166页,于2024年4月4日生效。在政策鼓励和市场驱动下,我国AI芯片行业加速发展。根据嘉世咨询报告,2021年我国AI芯片市场规模达427亿元,同比增长124%,预估2023年我国AI芯片市场规模将会扩大至1206亿元。我国各企业争相布局AI芯片。1)华为Atlas300T训练卡(型号:9000)是基于昇腾处理器,配合服务器为数据中心提供强劲算力的训练卡,加快深度学习训练进程。该训练卡具有高计算密度、大内存、高带宽等优点,标准全高3/4长PCIe卡,适用于通用服务器,满足运营商、互联网、金融等需要人工智能训练以及高性能计算领域的算力需求。该训练卡支持16channel4K(或64channel1080P)60FPSH.264/H.265,此外,该训练卡JPEG解码能力为1080P2048FPS(或等价的解码能力),最高分辨率为8192*4320。Atlas800训练服务器(型号:9010)是基于Intel处理器+华为昇腾处理器的AI训练服务器。该服务器拥有4U的超强算力密度,以及8*100GRoCEv2高速接口的高速网络带宽,芯片间跨服务器互联时延缩短10~70%。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。2)燧原科技邃思2.0芯片基于人工智能领域专用处理器架构设计,提供强劲的全精度人工智能算力、先进的存储方案、灵活的可扩展性,广泛支持视觉、语音语义、强化学习等各技术方向的模型训练。该芯片采用GCU-CARA®2.0架构,提供多数据精度AI算力支持,针对张量、矢量、标量等多计算范式提供领先性能,支持指令驱动、可编程的融合式数据流架构,提供软件透明、基于任务的智能调度。该芯片基于独家GCU-LARE®技术支持专属P2P通道,提供互联高带宽低延时,高效应对多卡间高并发高流量的数据通信需求,提升分布式训练性能。3)沐曦曦云C系列通用GPU(GPGPU)芯片是针对智算及通用计算的完美解决方案。沐曦自主知识产权架构提供强大高精度及多精度混合算力,片间互联MetaXLink无缝连接多GPU系统,自主软件栈MXMACA提供全面生态解决方案,可广泛应用于智算以及通用计算、教育和科研等场景。4)壁仞科技壁仞科技BR104在BERT模型下达到了英伟达A100单卡性能的1.58倍。壁砺™106M产品形态为OAM模组,凭借强大的供电和散热能力,能够充分解放澎湃算力,驱动包括人工智能深度学习在内的通用计算领域高速发展。5)寒武纪MLU370-X8采用双芯思元370配置,为双槽位250w全尺寸智能加速卡,提供24TFLPOS(FP32)训练算力和256TOPS(INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度。基于双芯思元370打造的MLU370-X8整合了两倍于标准思元370加速卡的内存、编解码资源,同时MLU370-X8搭载MLU-Link多芯互联技术,每张加速卡可获得200GB/s的通讯吞吐性能,是PCIe4.0带宽的3.1倍,支持单机八卡部署,可高效执行多芯多卡训练和分布式推理任务。3、掌握CPU/DCU核心技术,产业生态完善3.1海光CPU/DCU持续迭代公司的产品包括海光通用处理器(CPU)和海光协处理器(DCU),CPU产品对公司营业收入的贡献度较高,DCU产品的营业收入不断增长。在AIGC持续快速发展的时代背景下,公司拥有先进算法和强大计算能力,随着算法和计算能力与人工智能应用场景紧密结合,业务逐步落地。海光CPU是当前生态兼容性最优异的芯片之一,完全能够满足商业市场需求;海光DCU兼容“CUDA”生态,对文心一言等大多数国内外主流大模型适配良好。依托DCU可以实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用,从大模型生态上DCU已经达到国内领先水平。3.1.1海光CPU:产品性能领先,国产进程加速海光CPU系列产品兼容x86指令集以及国际上主流操作系统和应用软件。作为服务器和工作站的重要组成部件,CPU在计算、存储设备中发挥了至关重要的作用。海光CPU主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流x86处理器架构和技术路线,具有先进的工艺制程、优异的系统架构、丰富的软硬件生态等优势。海光CPU按照代际进行升级迭代,每代际产品按照不同应用场景对高端处理器计算性能、功能、功耗等技术指标的要求,细分为海光7000系列产品(最多集成32个处理器核心)、海光5000系列产品(最多集成16个处理器核心)、海光3000系列产品(最多集成8个处理器核心)。2023年上半年,海光CPU系列产品海光三号为主力销售产品,海光四号、海光五号处于研发阶段。海光三号系列芯片最高规格具备32核心64线程,拥有多达128条PCle4.0通道,支持内存频率提升至3200MHZ。相比上一代产品,海光三号的整体实测性能提升了约45%。在SOC设计、I/O带宽、取指单元、功能模块、防御机制等方面,海光三号均做了不同程度的优化,综合性能大幅跃升。公司通过与AMD合作,获得了x86处理器设计核心技术,进入到x86处理器设计领域,研制出符合中国用户使用需求、兼具“生态、性能、安全”三大特点的国产x86架构处理器产品。海光CPU具有优异的产品性能、良好的系统兼容性和较高的系统安全性。1)优异的产品性能。海光CPU使用先进的处理器微结构和缓存层次结构,改进了分支预测算法,使得每个时钟周期执行的指令数得到显著提高;依托先进的SoC架构和片上网络,海光CPU集成了更多处理器核心;采用先进的工艺制程和物理设计方法,实现了处理器高主频设计,使海光CPU产品具有优异的产品性能。公司在国内率先完成了高端通用处理器和协处理器产品成功流片,并实现了商业化应用。公司产品性能达到了国际上同类型主流高端处理器的水平,在国内处于领先地位。2)良好的系统兼容性。海光CPU可以兼容国内外主流操作系统、数据库、中间件等基础软件及广泛的行业应用软件。3)较高的系统安全性。海光CPU通过扩充安全算法指令、集成安全算法专用加速电路等方式,有效提升了数据安全性和计算环境的安全性,原生支持可信计算。海光CPU支持国密算法,扩充了安全算法指令,集成了安全算法专用加速电路,支持可信计算,大幅度地提升了高端处理器的安全性,可以在数据处理过程中为用户提供更高效的安全保障。产业应用多元,信创趋势加速。使用海光CPU的服务器主要应用与电信运营商、金融、互联网等领域,例如,电信运营商云服务资源池系统支撑云业务应用,银行和证券公司查询、交易系统,互联网的搜索、计算服务、存储等应用;使用海光CPU的工作站主要应用场景为工业设计和应用、图形图像处理,例如VR、AR图形渲染场景,以及智能工厂数字孪生应用等。此外,海光CPU性能优异,软硬件生态丰富,安全可靠,得到了国内用户的高度认可,海光CPU在国产处理器中具有非常广泛的通用性和产业生态,已经广泛应用于电信、金融、互联网、教育、交通等重要行业或领域。随着信创趋势的深化,海光CPU有望充分受益于进程的加速。3.1.2海光DCU:采用GPGPU架构,AI浪潮机遇期海光DCU以“类CUDA”良好的兼容性,为用户提供强大的计算服务能力。海光DCU属于GPGPU的一种。CUDA是一种由NVIDIA推出的通用并行计算架构,包含了应用于NVIDIAGPU的指令集(ISA)以及GPU内部并行计算引擎。海光DCU协处理器全面兼容ROCmGPU计算生态,由于ROCm和CUDA在生态、编程环境等方面具有高度的相似性,CUDA用户可以以较低代价快速迁移至ROCm平台,因此ROCm也被称为“类CUDA”。因此,海光DCU协处理器能够较好地适配、适应国际主流商业计算软件和人工智能软件,软硬件生态丰富,可广泛应用于大数据处理、人工智能、商业计算等计算密集类应用领域,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。海光DCU按照代际进行升级迭代,每代际产品细分为8000系列的各个型号。海光8000系列具有全精度浮点数据和各种常见整型数据计算能力,具有最多64个计算单元,能够充分挖掘应用的并行性,发挥其大规模并行计算的能力,快速开发高能效的应用程序。截至2023年半年报,海光DCU系列产品深算一号为公司GPGPU主要在售产品。根据公司2023年9月投资者交流记录,深算二号已经发布并实现商用,深算二号实现了在大数据处理、人工智能、商业计算等领域的商业化应用,具有全精度浮点数据和各种常见整型数据计算能力,性能相对于深算一号实现了翻倍的增长。根据公司2024年3月13日和15日上证e互动投资者问答,公司深算三号和深算四号产品研发进展顺利。海光DCU具有强大的计算能力、高速并行数据处理能力和良好的软件生态环境等优势。1)强大的计算能力。海光DCU基于大规模并行计算微结构进行设计,不但具备强大的双精度浮点计算能力,同时在单精度、半精度、整型计算方面表现同样优异,是一款计算性能强大、能效比较高的通用协处理器。2)高速并行数据处理能力。海光DCU集成片上高带宽内存芯片,可以在大规模数据计算过程中提供优异的数据处理能力,使海光DCU可以适用于广泛的应用场景。3)良好的软件生态环境。海光DCU采用GPGPU架构,兼容“类CUDA”环境,解决了产品推广过程中的软件生态兼容性问题。公司通过参与开源软件项目,加快了公司产品的推广速度,并实现与GPGPU主流开发平台的兼容。DCU产品对文心一言等大多数国内外主流大模型适配良好,已获百度、阿里等互联网企业的认证。在AIGC持续快速发展的时代背景下,与业务紧密结合的人工智能应用场景逐渐落地,拥有先进算法和强大计算能力的企业成为了最主要的推动者。海光DCU兼容“CUDA”生态,对文心一言等大多数国内外主流大模型适配良好。依托DCU可以实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用,从大模型生态上DCU已经达到国内领先水平。公司的D
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沈阳药科大学《会计学原理》2025-2026学年期末试卷
- 上海邦德职业技术学院《新编中国秘书史》2025-2026学年期末试卷
- 沈阳建筑大学《高级英语》2025-2026学年期末试卷
- 内蒙古能源职业学院《社会研究方法》2025-2026学年期末试卷
- 山西同文职业技术学院《成本会计学》2025-2026学年期末试卷
- 上海戏剧学院《工程监理》2025-2026学年期末试卷
- 上海出版印刷高等专科学校《西医内科学》2025-2026学年期末试卷
- 上海商学院《电子测量原理》2025-2026学年期末试卷
- 石家庄经济职业学院《Java》2025-2026学年期末试卷
- 大数据财政管理的应用与优化
- 2026年国家队反兴奋剂准入教育考试试题及答案
- 第九章第一节压强课件2025-2026学年人教版物理八年级下学期
- 100以内看图写数专项练习题(每日一练共6份)
- 移动模架施工安全监理实施细则
- 中兴新云2026年测评-B套题
- 2026年全国体育单招考试时事政治(2025.6-2026.1)-2026届中职高考
- 2026年商丘职业技术学院单招职业技能测试题库带答案详解
- 2026年山西经贸职业学院单招职业技能考试题库及答案解析
- 2026年丽水职业技术学院单招职业适应性考试题库带答案详解(基础题)
- 2025年广东中烟工业机电岗位笔试及答案
- 2026浙大二院临床医学博士后招聘备考题库及完整答案详解1套
评论
0/150
提交评论