版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
LPO CPODCI5G-AAIAI。请参阅附注免责声明1/请参阅附注免责声明2请参阅附注免责声明3NVDA
GB200数据来源:英伟达发布会,国泰君安证券研究请参阅附注免责声明4表:NVDA新一代GPU集群架构情况光模块数量和比例取决于不同组网方式和计算单元,差异较大,最终整体需求取决于不同组合的销售占比情况,总体仍然会有强有力的需求。5请参阅附注免责声明Google
TPUv4
TPUv5谷歌自研TPU系列作为训练芯片,其中其2023年6.17
ISCA的论文提到90%的训练在TPU上进行。2020年开始部署TPUv4,对应400G光模块,而我们预计当前已经开始部署TPUv5,对应800G光模块。一个TPUv4
Package有16个OSFP连接口,作为外部的ICI互联。,每个TPUv4有6个ICI
link,16个Package组成一个机柜(Rack),一共有64个机柜,按8*8去排列。数据来源:谷歌图:TPUv4封装形态数据来源:谷歌图:1个4096集群里64个机柜中的8个图示Google OCS MEMs 136*136数据来源:谷歌机柜与机柜间的连接要经过OCS,全称Optical
Circuit
Switch,是谷歌自研的光交换机。谷歌OCS交换机成为Palomar,拥有136*136个端口交互能力,用MEMS阵列控制光路输入输出。应用中,一般128个通道是工作通道,8个是测试通道。图:OCS实际架构群 图:OCS原理图数据来源:谷歌请参阅附注免责声明6AWS Trainium 2D
Torus NeuronLink-v2AWS
Trainium
是
AWS
专门为超过
1000
亿个参数模型的深度学习训练打造的第二代机器学习(ML)
加速器。每个加速器包括2个NeuronCore,具备32GB
HBM内存,提供190TFLOPS的FP16/BF16,380
INT8
TOPS,47.5
FP32
TFLOPS卡间互联网络采用NeuronLink-v2,类似于NVLink,互联速率达到384GB,比A100
300GB要高。数据来源:AWS官网图:大模型时代算力需求增长超越摩尔定律图:Trn1/Trn1n服务器内卡间互联采用2D
Torus
拓扑结构数据来源:AWS官网请参阅附注免责声明7AWS Trainium H100 A100 Trainium EC2
UltraClustersEC2
UltraClusters是可以扩展到数千张GPU或者ML加速器,例如AWS
Tranium、H100、A100的集群EC2
允许扩展到20000H100,A100则是仅扩展到4000张,Trainium可以扩展至30000张。数据来源:AWS官网图:UltraCluster允许进行non-blocking大量组网UltraClusterAIAccelaratorMaxiumNetworking总算力P4A10010000400Gb/s3EflopsP5H100200003200Gb/s20EflopsTrn1Trainium30000800Gb/s或1.6T/s6Eflops请参阅附注免责声明8表:不同类型AI芯片组网情况数据来源:AWS官网,国泰君安证券研究META
MTIAMeta自研的MTIA芯片当前仅使用100G总带宽,而卡间互联还是使用PCIE
GEN4。也可以看到,在云厂商中8个A100的方案大部分采用400G的总带宽接入,而不是Nvidia的1.6T。表:
Meta的MITA推理服务器目前采用100G网卡表:
MTIA性能指标数据来源:MTIA数据来源:MTIA请参阅附注免责声明9Intel
Gaudi2
2.4T
8
2.4T每个OAM非卡间互联带宽为300G
RoCE,8张卡对应8*300G对应6个QSFP-DD1连接口,即每个QSFP-DD为400G。如果构建成二层、三层400G网络集群则对应卡:400G光模块=1:4.5图:8-OAM的Gaudi服务器需要2.4T接入带宽 图:8-OAM的Gaudi服务器需要6个QSFP-DD口数据来源:Baudi2白皮书数据来源:Baudi2白皮书请参阅附注免责声明10昇腾910B作为AI处理器,是构成Atlas
900
PoD集群的核心组件之一。Atlas
900
PoD通过集成昇腾910B等AI处理器,构建出一个强大的AI训练集群,提供高性能的AI计算能力。Atlas
900
PoD(型号:9000)是基于华为鲲鹏+昇腾处理器的AI训练集群基础单元,具有超强AI算力、更优AI能效、极佳AI拓展等特点。该基础单元广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大AI算力的领域。Atlas900
PoD900047UCPU32
* 920CPU256
DDR4RDIMM32GB/64
GBAI64
*64*
2.5RAIDRAID
0/16
3+3 380V,32A4
2+2 380V,32A46
kW5℃40℃41℉
104℉≤1800mASHRAEClass
A2/A3/A4H*W*D•2250mm600mm
1500mm•2410mm980mm
1455mm数据来源:华为官网请参阅附注免责声明11图:华为昇腾计算产品数据来源:华为官网表:Atlas
900
PoD技术参数800含光800是平头哥发布的首颗数据中心芯片。含光800是一颗高性能人工智能推理芯片,基于12nm工艺,
集成170亿晶体管,性能峰值算力达820
TOPS,推理性能达到78563
IPS,能效比达500
IPS/W。含光800采用平头哥自研架构,通过软硬件协同设计实现性能突破。平头哥自主研发的人工智能芯片软件开发包,让含光800芯片在开发深度学习应用时可以获得高吞吐量和低延迟的高性能体验。含光800已成功应用在数据中心、边缘服务器等场景。图:含光800
NPU/NPU核架构图 图:含光800
核心参数请参阅附注免责声明12数据来源:平头哥官网数据来源:平头哥官网请参阅附注免责声明13传统数通市场受益于交换机芯片3年一代的升级周期,速率端口基本上3年升级一倍;受益于AI芯片的快速迭代和上量,预计端口速率升级翻倍的时间将缩短至2年以内。图:谷歌在论文中预计2024年开始会出现1.6T光模块的需求数据来源:Mission
Apollo:
LandingOptical
Circuit
SwitchingatDatacenter
Scale数据来源:半导体行业观察,Semianalysis,Nvidia路线图请参阅附注免责声明14图:预计2024H2和2025年将开始出现1.6T端口需求OFC
2024,Broadcom、Lumentum等大厂展出200G
EML、DSP和配套激光芯片驱动器。国内众多厂商在2024年OFC上展出了1.6T光模块,头部厂商研发领先优势较为明显。表:OFC
2023上200G/Lane
供应链逐渐成熟请参阅附注免责声明15数据来源:讯石,国泰君安证券研究核心物料供应厂商产品激光器芯片Ⅱ-Ⅵ200G
EMLCoherent200GInP
EML索尔思200GPAM4EMLSumitomo200G
EMLLumentum200GPAM4EMLSemtech200G
PAM4
PMD
EML驱动器Broadcom200GUncooled
EMLDSP芯片Ciena1.6T
WaveLogic
6
Extreme
(WL6e)Marvell1.6TNovaPAM4
200G/λBroadcom1.6TPAM-4PMD,
BCM85852,BCM87850模块新易盛OSFP-XD
DR8中际旭创OSFP-XD
DR8+可插拔光通信模块光迅科技OSFP-XD
DR8索尔思OSFP-XD
DR8CoherentOSFP-XD
DR8SenkoAdvanced
ComponentsOSFP-XD
DR8AECCredo1.6Tb
OSFP-XD
Hi
Wire
CLOS有源电缆ColorChip1.6TOSFP-XD
AECMCB,
HCB与
热负载及控制器板MultilaneOSFP-XDMCB,OSFP-XD
HCB数据来源:ICCSZ,
国泰君安证券研究表:我们预计硅光技术在800G模块中渗透将明显上升电口速率光口速率4通道8通道16通道112G
serdes100G/lane400G
非硅光800G非硅光or硅光1.6T
OSFP-XD硅光200G/lane800G非硅光or硅光1.6T非硅光
or
硅光3.2TCPO硅光224G
Serdes200G/lane800G非硅光or硅光1.6T非硅光or硅光3.2TCPO硅光硅光技术是利用现有集成电路
CMOS
工艺在硅基材料上进行光电子器件的开发和集成。与分立器件方案不同,硅光技术的集成度更高,封装形态也更加简化。图:传统光模块方案(左)vs
硅光光模块(中)及硅光芯片(右)请参阅附注免责声明16数据来源:ICCSZ,博创科技,
国泰君安证券研究请参阅附注免责声明17lnPGaAsSOISi衬底价格($/cm2)4.551.651.30.2功能晶圆价格($/cm2)33.9527.161.30.2最大尺寸(mm)150200450450类别硅光传统lnP晶圆尺寸8-12’2-3’工艺精度65nm-250nm0.3-0.5um集成度耦合器、波导、调制器、和波器、探测器、分束器、Driver、LA、CDR单片集成难实现高密度集成工厂维护代工生产自有Fab产业链成熟相对不成熟芯片良率>80%<40%成本量大可以很低受限于良率和固定开支数据来源:ICCSZ,博创科技,
国泰君安证券研究硅光芯片晶圆利用率高,可以复用CMOS集成电路较为成熟的产业链,上量后边际成本低。硅光的应用取决于客户接受度,而我们认为AI驱动的光模块需求爆发供应紧缺下,客户对硅光的接受度有望提升。表:硅光在集成度、产业链成熟度、良率、成本等都具有优势 表:硅/SOI衬底价格便宜且晶圆尺寸更大Lightcounting预计使用基于SiP的光模块市场份额将从2022年的24%增加到2028年的44%。此外Lightcounting认为SiP调制器相较GaAs、LnP材料而言是线性驱动设计的最佳选择,LPO有望加速硅光渗透率进一步提升。数据来源:国泰君安证券研究注:Intel在2023年将模块业务给予Jabil进行运营图:部分具有自研硅光芯片能力的模块厂商图:Lightcounting预计硅光市场份额将持续提升数据来源:Lightcounting请参阅附注免责声明18功耗和成本收益:一般光模块的功耗大约占整机功耗的40%以上,LPO模块主要将光模块DSP去掉,将功能和复杂度交给交换机芯片ASIC,预计将降低设备整体功耗(
7nm
DSP,功耗占到了整个模块功耗的50%左右),从而节省电费。DSP的BOM成本约占20-40%,Driver和TIA集成了EQ,成本略有增加,但整体还是下降的。时延收益:单通道比DSP方案节约~100ns,比模拟CDR方案节约~10ns。图:LPO主要是将光模块侧DSP功能让渡给交换机芯片侧 图:LPO电芯片侧主要供应商交换机芯片TIA+Driver数据来源:Lightcounting
Webinar,国泰君安证券研究请参阅附注免责声明19数据来源:国泰君安证券研究Marvell认为LPO适合Host
side链路较短、损耗减小的场景,例如SR;而DSP则可以覆盖SR\DR\FRMarvell认为LPO方案有望与DSP方案共存,主要应用场景在距离较短的服务器到TOR交换机层级。图:LPO模块主要应用在SR场景图:Marvell认为LPO可用在TOR接入层数据来源:Marvell,Lightcounting
Webinar请参阅附注免责声明20实际中,不同Vendor制造的交换机可能存在电性能的差异;同一个交换机不同端口插损也差异较大;最终测试结果LPO光模块的BER误码率等参数数值也存在差异。标准上,Asic-Module这一段电学性能仍需要进一步完善定义。图:不同Vendor的交换机、交换机不同端口都有差异数据来源:讯石研讨会,Lightcounting,阿里巴巴,华为海思图:阿里测试51.2T交换机有不同端口插损、BER差异较大请参阅附注免责声明21光模块是通信、网络设备端口实现光电信号转换与收发的分立器件,与交换机芯片分开。CPO将光模块中的光学部分(光引擎)拉近,以解决高速电信号传输距离远带来的功耗更大、带宽较低的问题。数据来源:Perspective
on
the
future
of
silicon
photonics
and
electronics图:CPO是通信技术中进一步的“光进铜退”图:单位带宽密度和单位带宽能耗是CPO比较好的优势请参阅附注免责声明22光模块企业-可能性1(CPO光模块+交换机芯片+封装高频载板)光模块企业-可能性2(仅CPO光模块)光模块企业-可能性3(仅CPO光引擎)请参阅附注免责声明23一是联合交换机芯片、高频基板做CPO整体封装,即PCB板上面高频载板的部分;二是不包括交换机芯片,仅做Optics、DSP、TIA、Driver及光学部分的封装,地位、能力与光模块没有太大差异;三是仅做Optics代工封装,价值量预计是光模块的60%。图:光模块企业的参与可能性数据来源:AVGO,国泰君安证券研究24请参阅附注免责声明在400G
DR4、800G
DR8需求量比2023年有望翻1-2倍的情况下,高速光芯片100G
EML将十分紧缺。光芯片扩产需要核心设备MOCVD,到货到调试至少需要一年时间,我们预计至少到24H1行业光芯片将十分紧俏。1.6T需求或催生行业200G
EML,国内厂商当前积极研发布局100G/200G
EML。数据来源:
Sumitomo图:100G
EML产品制作较为复杂图:200G/通道将成为下一个代际数据来源:
COBO协会CW
DFB广泛应用于外耦合光源的硅光模块中,除了Intel,绝大部分光模块厂商采用外耦合方案。我们预计2024年硅光模块在800G占比有望提升,将带动CW大功率光源的需求量发展。CW光源国内外光芯片厂商基本处于同一起跑线,我们认为国产突破的可能性更大。图:新易盛外接光源的硅光方案数据来源:OFC2021数据来源:源杰科技,光通信女人图:硅光洗牌外部耦合大功率光源的几种方法请参阅附注免责声明25薄膜铌酸锂是一种高带宽的材料,可以支持800G\1.6T等更高速率模块;硅光的带宽到达单通道200G/lane难度大,传统方案带宽到单通道200G难度也接近极限(EML),TFLN的上限可以更高。薄膜方案处于研发导入状态,2024年或见部分应用。数据来源:Innovium,Lightcounting,国泰君安证券研究图:薄膜铌酸锂功耗可以比硅光更低材料类型长度/mm芯片损耗/dB/cm3dB带宽/GHz半波电压/V直流消光比(dB)SiPh硅光磷化铟传统LN45>4016100.1506535433-52525>40薄膜LN5/10/200.2100/80/4.4/2.3/1.43045薄膜LN23/50.98707.4/5.140请参阅附注免责声明26图:铌酸锂调制性能好,薄膜化后尺寸与硅和LnP无异数据来源:铌酸锂调制器发展进展请参阅附注免责声明27数据来源:中国联通,国泰君安证券研究数据来源:微软请参阅附注免责声明28微软星际之门的计划出炉,百万级GPU是部署在一个数据中心内部还是部署在多个数据中心,引发DCI需求的探讨。东数西算、算力光网的大规模投入建设,带动国内骨干网升级的需求。新时代光传输网络作为算力底座,根本是需要解决大容量和低时延的问题。大容量需以400G
OTN为核心,低时延要求围绕算力枢纽、省节点建设互联线路。算力时代将重塑我国干线光网架构,并带来400G技术代际投资机会。图:微软凤凰城数据中心 图:传输网升级架构数据来源:中兴400G白皮书,国泰君安证券研究图:各种规格的相干光模块和业务光模块、业务板块图:光放大器图:光放大器板块图:合分波板块图:光交叉板及光背板请参阅附注免责声明29传统地面通信可以解决移动用户、固定用户(有线用户)的通信问题。全球仍有27亿人口没有接入互联网,卫星通信目前看是解决更大量移动用户方面的通信问题的重要方法。截止至2022年,全球按应用发射的卫星数量如下:通信80%、遥感10%、技术开发7%、科学1%、其他1%。数据来源:中国移动研究院,国泰君安证券研究图:卫星互联可以实现移动网络的全面覆盖图:卫星互联包括星间链路和星地链路请参阅附注免责声明30行业投入现金流有望拓宽降本增效技术革新更加明确用户数量、体验快速提升垣信公司是G60星链实施的核心企业,其打造的“商业低轨宽带卫星星座”已获得发改委项目核准许可。垣信公司预计将于2024年开始批量发射G60星链第一批次卫星,建设周期为2024至2027年。根据垣信公司发射规划,每次发射任务将以1箭18星方式进行,在2025年底前完成648颗GEN1卫星发射任务,在2026~2027年完成后续648颗GEN2卫星发射任务。卫星互联网的标准化进程在加快,国际组织以3GPP为主,请参阅附注免责声明31国内以CCSA和TAF(电信终端产业协会)参与为主,2022年R17冻结进一步增强了透明转发框架下的内容;R18将为未来消费级的商用终端引入更多可用频段。2024年从卫星资产运营模型维度有不同领域的催化。我国当前主要的两个低轨卫星星座运营主体。图:卫星网络运营模式图:我国主要卫星星座主体数据来源:国泰君安证券研究数据来源:垣信官网,国泰君安证券研究星上处理是指基站部署于空间段,在卫星上进行数据调制解调以及数据处理,才能进行卫星组网,更有意义;透明转发的意思是星上不做数据的处理,仅通过射频链路对数据进行转发。T/R芯片被集成在
T/R组件中,负责信号的发射和接收并控制信号的幅度和相位。相控阵天线是通过控制阵列天线中辐射单元的馈电相位来改变方向图形状的天线,可以方便某方向的信号增强,在卫星、雷达中广泛应用。卫星通信需要地面接收站,其中核心网主要作为用户注册管理等的应用,未来卫星用户增加有望带动地面站点的建设图:卫星互联组网可分为透明转发和星上处理 图:相控阵天线&TR组件 图:银河航天北京信关站请参阅附注免责声明32数据来源:太空安全,铖昌科技,银河航天5G-A(5.5G)是5G的增强版本,也是5G向6G发展的演进技术,5G-A具有毫秒级时延和厘米级定位精度,具有更高速率、更大连接、更低时延、通感一体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 消化内科核心疾病嗜酸细胞性胃肠炎康复课件
- 2026年生活老师招聘笔试综合素养练习题集含答案
- 2026年污水处理厂提标改造技术专项考核练习题及解析
- 2026年智慧城市系统集成与项目管理考题含答案
- 2026年常州工程职业技术学院高职单招职业适应性考试备考试题带答案解析
- 2026年朝阳师范高等专科学校高职单招职业适应性测试参考题库带答案解析
- 2026年供应商管理师资格题含答案
- 2026年海南体育职业技术学院高职单招职业适应性测试参考题库带答案解析
- 2026年职业天赋能力测试模块分类强化练习题含答案
- 2026年四川大学面试基础考点突破测试题附答案
- 2025秋人美版(2024)初中美术七年级第一学期知识点及期末测试卷及答案
- 如何做好消化内科健康宣教
- kotlin android开发入门中文版
- 电力安全生产典型违章300条
- 2025年国企招标面试题库及答案
- 2026年2月1日执行的《行政执法监督条例》解读课件
- 【生 物】复习课件-2025-2026学年人教版生物八年级上册
- 航道工程社会稳定风险评估报告
- 力的合成与分解说课课件-高一上学期物理人教版
- 政府补偿协议书模板
- 2025年超星尔雅学习通《临床医学研究方法》考试备考题库及答案解析
评论
0/150
提交评论