版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 通信沪深3002025/6XPO是保留可插拔特性的前提下针对空间、散热、功耗问题的优秀解决方案。AI训练和高性能计算推动网络带宽与能效需求急剧上升,传统可插拔光模块在功耗、散热和前面板带宽密度上逐渐成为瓶颈;而共封装光学(CPO)虽性能更优,但在现场可维护性与良率上存在显著挑战。Arista联合超40家行业伙伴发布XPO(eXtra-densePluggableOptics)白皮书,提出了一种面向下一代AI数据中心的全新可插拔光模块标准,旨在通过超高密度、内置液冷设计等创新,化解散热和密度难题,标志着AI数据中心光互联正式进入“超高密度可插拔”新阶段。XPO方案重构机械结构+引入液冷系统,实现全方位技术突破。机械结构上,采用紧凑型“腹对腹”设计与双桨式电路板,摒弃传统单PCB布局,配合1:11的机械弹射器解决插拔受力问题。散热方面,摒弃依赖热界面材料的设计,将原生液态冷板直接集成于模块内部,轻松支持超400W高功率散热,使组件温度比风冷同类产品低20°C至25°C。电气架构上,创新采用50V高压直流输入,显著降低电流额定值与连接器物理尺寸;同时通过清洁线性通道与专用电源/控制连接器隔离,确保了12.8Tbps(规划至25.6Tbps)的高速传输信号完整性。相比现行OSFP标准,XPO在带宽密度与系统级效益上具备4倍显著优势。要实现204.8Tbps的总交换吞吐量,XPO系统仅需占用机架空间的四分之一,密度提升幅度达4倍。在液冷机架系统应用中,基于OSFP的机架最大功率消耗约为32kW,无法完全利用冷却设施;而基于XPO的机架运行功率约为128kW,能充分发挥液冷基础设施的效益,降低单位算力的相对成本。在超大规模部署中(如12.8万个XPU集群XPO可大幅减少交换机机架数量,节约约75%的占地面积,降低层级数量及往返延迟,改变了数据中心设计的整体经济性。XPO兼容性强,有望大幅延长可插拔光模块的生命周期,预计于2027年实现量产。XPOMSA联盟将制定新型液冷式可插拔封装规格,联盟创始成员包括Arista、Lightmatter、中际旭创、新易盛、华工科技、联特科技核心大厂。在OFC2026大会上,中际旭创(TeraHop)、新易盛、华工正源、联特科技等头部企业均展出了12.8TXPO液冷可插拔模块产品(支持全系列光标准及LPO等接口验证了下一代高密度互联技术的可行性,彰显了国内厂商从核心制造向全球规则制定者升级的实力。投资建议:AI算力向1.6T/3.2T及更高速率升级,传统风冷光模块面临严重的密度与散热功耗瓶颈。XPO光互联凭借超高密度、原生液冷兼容、高压供电以及保留可插拔运维优势的特性,完美契合新一代AI数据中心的核心诉求,长期有望成为1.6T/3.2T时代的主流光互联路径之一。投资聚焦深度参与XPO联盟且率先具备量产演示能力的光互联龙头。重点关注光模块/器件厂商:中际旭创、新易盛、华工科技、联特科技等。风险提示:技术研发与量产落地风险、产业链协同与生态兼容风险、AI发展不及预期风险等。行业动态报告/通信行业动态报告/通信1XPO——保留可插拔特性的前提下针对空间、散热、功耗问题的优秀解决方案 32XPO相比OSFP的优势:密度提升、引入液冷 63XPO将延长可插拔光模块生命周期,目前产业处于初级阶段 84投资建议 5风险提示 插图目录 表格目录 21XPO——保留可插拔特性的前提下针对空间、散热、功耗问题的优秀解决方案AI训练和高性能计算推动网络带宽与能效需求急剧上升,传统可插拔光模块在功耗、散热和前面板带宽密度上逐渐成为瓶颈,而共封装光学(CPO)虽然性能更优,但在现场可维护性、可扩展性和良率等方面存在显著挑战,难以在超大规模环境中广泛部署。在这一背景下,2026年3月11日,Arista联合超过45家行业合作伙伴正式发布eXtra-densePluggableOptics(XPO)白皮书,提出了一种面向下一代AI数据中心的全新可插拔光模块标准。XPO旨在通过超高密度、内置液冷设计、50V高压供电等创新,解决散热和密度问题,同时保留可插拔的运维优势,为AI数据中心提供可扩展、低成本的互连方案。XPO的推出标志着AI数据中心光互联或将进入“超高密度可插拔”新阶段。Arista阐明新一代数据中心光网络技术的五大核心需求包括极限带宽、高可靠性、液体冷却、能耗问题、密度要求。广泛采用的OSFP模块并不完全符合人工智能驱动数据中心的新兴需求。表1:新一代数据中心光网络技术的五大核心需求 核心需求具体要求人工智能网络的核心需求在于实现海量数据传输时的极低延迟。在分布式加速器集群上训练大规模AI极限带宽超传统数据中心工作负载。这一挑战不仅需要提升链路速度,更需要构建非阻塞型高基数网络架构,以支持数万台加速器之间的在由数万条光链路构成的大规模人工智能网络架构中,组件故障在统计学上已不可避免。然而当前光模块的硬故障率与软故障率仍高于此类环境所需运行可靠性标准。单个故障就可能中断价值数百万美元的训练任务,造成计算资源浪费并带来重大经济损高可靠性失。在包含5万+光链路的网络架构中诊断并更换故障模块,不仅构成重大运维挑战,更会液体冷却现代人工智能加速器的超高计算密度会产生远超传统风冷系统承载能力的热负荷。因此,超大规模AI术作为基础设施的核心配置。这种技术转型对机架内所有组件都提出了严苛的热设计要求。任何无法与液冷环境高效兼容的光互连解决方案,本质上都不适合新一代AI液体冷却功率功效能耗问题是现代数据中心设计中的关键制约因素。高密度机架在有限的电力预算下运行,网络每消耗一瓦电力,就意味着一力无法用于创收的计算资源。因此,光互连技术必须实现每传输比特的显著低功耗。高效能不仅对降低运营成本至关重要,功率功效物理空间是现代数据中心的核心资源。为构建人工智能工作负载所需的海量网络架构,网络架构师需要具备显著更高带宽密度的解决方案。带宽密度不足将迫使部署规模更大、结构更复杂的多层网络拓扑架构,并增加脊层和超级脊层层级,从而导致延迟增密度加、成本上升及布线复杂度加剧。当前标准的密度限制构成了重XPO是专为应对超大规模人工智能数据中心独特挑战而从零开始设计的解决方案,其架构直接针对新一代人工智能和机器学习工作负载所需的带宽、密度、可靠性、散热及能效等关键指标。通过重新设计光模块外形尺寸及其与主机系统的集成方案,XPO在提升网络可扩展性与性能方面实现了显著突破。3XPO的机械结构采用“腹对腹”设计,实现单模块带宽较标准1.6TbpsOSFP提升8倍,摒弃了传统的单PCB布局方案。毫米(长度)×21.3毫米(高度),可实现高前面板密度。2.双桨式电路板:模块外壳内部,XPO架构包含两块独立的32通道印刷电路板(PCB称为桨式电路板。3.腹对腹布局:这两张完全相同的电路板(电路板1和电路板2)采用“腹对腹”布局方式,彼此相对朝向共享的中央元件。高功率发热元件(如发射电路和激光驱动器)被集成在电路板内侧的“热端”区域,而低功率元件(如接收电路和控制逻辑模块)则安装在外侧的“冷端”区域。4.弹射器机制:由于电触点数量众多,插入和拔出时需施加较大作用力。XPO模块采用带释放拉片的机械弹射器,通过1:11的机械杠杆比协助操作人员完成插入动作,并与主机笼体实现顺畅啮合。图1:12.8Tbps液冷式XPO模块图2:XPO组件包含共享冷板和两块32通道桨式卡资料来源:AristaXPO白皮书,XPO模块的一项核心创新在于其原生液冷技术。XPO摒弃了依赖热界面材料(TIM)和机箱安装式散热器的设计方案,将冷却系统直接集成于模块内部。1.中央冷板:液态冷板通过物理夹持方式置于两块桨卡的“热”侧之间,可同步冷却两块电路板。2.热性能:该设计能高效散热功率超过400W的高功率模块,轻松支持XPO模块内部8个1.6TbpsZR光学元件等高负荷应用。通过采用40-45°C温水液冷技术,XPO使组件温度比风冷同类产品低20°C至25°C。3.流体接口:该模块配备集成式流体通道,通过盲接式快速拆卸液体连接器与主机系统的冷却歧管相连。这些防滴漏连接器经认证可承受500次对接循环,支持动态低流量调节范围:低功率模块流量为0.25升/分钟(LPM高功率模块可达0.7升/分钟。4XPO模块采用64条高速电通道,通过200GbpsPAM4信号传输实现12.8Tbps传输速率,并规划通过400Gbps通道支持25.6Tbps速率。为确保信号完整性和能效最大化,其电气设计采用严格隔离方案:1.清洁线性通道:高速发射(Tx)与接收(Rx)信号被分离至桨形卡的相对两侧,以最大限度减少串扰,从而形成优化的线性通道,特别适用于线性驱动可插拔光学器件(LPO)。2.专用电源/控制连接器:为防止电源噪声耦合至高速数据通道,电源信号与低速控制信号(如I2C/I3C、复位信号及中断信号)均通过模块中央的独立专用边缘连接器进行传输。3.50V直流架构:传统插拔式电源依赖3.3V直流输入,为高功率光学器件提供大电流支持。XPO采用直接从机架母线获取46V至53V直流输入(标称值为48V或50V),这种高压输入方案显著降低了所需电流额定值及电源连接器的物图3:立讯精密展示的XPOdemo52XPO相比OSFP的优势:密度提升、引入液冷与现行OSFP标准对比,从最基础层面来看,XPO技术显著提升了前面板带宽密度。要实现204.8Tbps的总交换吞吐量,XPO系统仅需占用机架空间的四分之一,而同等OSFP部署方案则需更多空间。相较于OSFP技术,其密度提升幅度达4倍,使网络架构师能在相同物理空间内构建性能更强的网络架构。图4:一个XPO模块可替代8个OSFP模块图5:204.8Tbps交换机示意图(上图为XPO,下图为OSFP)当这种密度优势在标准ORv3(HPR)液冷机架系统层面得到应用时,其优势将更加显著。下表对比了基于不同光学标准的满载机架配置,该对比结果为总拥有成本(TCO)分析提供了重要参考依据。液冷基础设施属于重大资本投入,为合理化这笔支出,机架部署通常需以120千瓦或更高功率密度为目标。基于OSFP的机架最大功率消耗约为32kW,导致现有冷却基础设施利用率显著不足。相比之下,基于XPO的机架运行功率约为128kW,能充分发挥机架液冷功能的优势。这使得冷却与电力传输基础设施的效益可更高效地分摊至更大的计算负载上。因此,XPO使数据中心运营商能够在相同基础设施规模下实现4倍的网络容量提升。通过大幅提升机架内的可用负载容量,支持基础设施(如电力供应、冷却系统和机架空间)的相对成本得到有效降低。这一改进不仅体现在组件级效率提升上,更开始重塑大规模人工智能数据中心部署的整体经济性。表2:OSFP与XPO机架层级对比 指标OSFPXPO每机架带宽1.6Pbps6.5Pbps 404.8T交换机数量83每机架功率32kWXPO的组件级改进能转化为整个数据中心层面的系统级效益。4倍密度优势从根本上改变了数据中心设计,显著降低了物理占地面积、资本支出、部署时间和运营复杂度。假设一个由512个计算单元(如GPU或其他加速器)组成的AI集6群采用横向扩展架构。若每个XPU的带宽为25.6Tbps,则该扩展架构需要64个交换机,每个交换机的容量需达到204.8Tbps。采用现有OSFP技术(每4个机架单元提供204.8Tbps带宽)时,网络需要8个交换机机架才能满足连接需求。相比之下,基于XPO架构的方案仅需2个交换机机架即可支持相同规模的集群,因为XPO技术能够实现单机架单元内具备204.8Tbps交换容量,实现4倍密度在超大规模部署中,这种效率提升具有深远影响。以一个支持128000个扩展处理器单元(XPUs)的400MW人工智能数据中心为例。在此场景下,我们假设采用每XPU12.8Tbps的横向扩展网络和每XPU1.6Tbps的纵向扩展网络,且加速器通过三层Clos拓扑结构互联。在此条件下,每个机架的交换容量约为采用OSFP架构时的1.64Pbps比特率,相较于XPO架构的6.55Pbps比特率,体现了XPO架构带来的显著密度优势。表3:OSFP与XPO机柜对比 网络层OSFP交换机机架XPO交换机机架 XPO所需交换机机架占地面积可减少约75%,同时电气基础设施、冷却容量及管道系统需求也相应降低。因此对资本支出的影响可能相当显著。对于建设成本高达数十亿美元的超大规模人工智能设施而言,此类改进不仅能大幅缩减所需建筑数量,还能在同一场地内实现远超预期的计算能力。另一方面,拥有现有数据中心的运营商可利用这种密度优势提升单栋建筑内的加速器密度,从而最大化现有基础设施和房地产资源的利用率。此外,XPO支持的高基数交换机可实现更简单的横向扩展网络拓扑结构,减少层级数量并降低往返延迟,直接提升大规模AI训练工作负载的性能与效率。图6:OSFP机柜图7:XPO机柜73XPO将延长可插拔光模块生命周期,目前产业处于初级阶段我们认为相比CPO方案,XPO保留了即插即用的运维优势,又在散热、机柜密度方面走出了自己的解决方式,将在未来的几年内渗透率得到较大幅度的提升。我们认为XPO在众多光连接方案中有以下应用优势。首先XPO的兼容性极强,由于XPO支持DR、FR、LR、SR、ZR/ZR+、铜连接等各种传输介质,赋予云厂商高度的定制空间,具有开放的供应链生态。同时铜连接等连接方案有望凭借XPO获得新的活力,据TeraHop,XPO可以与CPC配合使用,CPC完成交换机柜内连接,减少长距离PCB走线带来的损耗和信号失真。第二,基于XPO对传输介质的包容性,其在Scaleup、Scaleout、Scaleacross三个方面都很有应用潜力。尤其是在大功率的Scaleacross场景,在单集群向多数据中心协同演进的趋势下。XPO凭借液冷和高密度优势,更加适配长距离传输环境。图8:XPO的多重应用场景第三,XPOMSA使得光模块厂商从标准的遵循者变成了标准的制定者,有机会深度参与前期系统架构与物理接口的设计。26年3月,Arista官宣了XPO联盟超过40个创始成员,包括Cohr、Lite等光芯片巨头,还包括DSP供应商Marvell、DCI供应商Ciena等,其中我国的中际旭创(子公司TeraHop)、新易盛、华工科技(子公司华工正源)、联特科技、立讯精密等公司也深度参与其中。新易盛、中际旭创、联特科技、华工正源等均在OFC2026大会上展出了12.8TXPO液冷可插拔模块产品,支持包括SR、DR、FR、LR和ZR/ZR+在内的全系列光标准,以及线性、半重定时和全重定时接口,具有部署灵活性。我们认为国产光模块厂商有望借XPO东风,从标准的遵循8者成长为标准的制定者,深度参与前期系统架构与物理接口的设计。图9:XPOMSA资料来源:华工正源官方公众号,我们同时看好中际旭创、新易盛等龙头厂商向AI光学整体解决方案提供商转型。以中际旭创为例,其在OFC大会上发布:业界首款12.8T-8xDR8XPO光收发器模块;业界首款高密度、低功耗的6.4T-4xDR8可插拔NPO模块;业界首款4x400G光收发器模块,验证了下一代3.2T单通道400G光技术的业界首款适用于多个人工智能数据中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中学教师资格认定笔试学科知识与教学能力真题试卷及答案
- 2026三支一扶考试法律知识应用测试试卷及答案
- 口腔执业助理考试试题及答案
- 非标自动化钳工模拟考试试题及答案
- 施工现场临时用电用水施工方案
- 2025年医疗器械软件监管政策升级与产品适配方案
- 海底捞新员工培训-员工行为规范
- 思维灵感随手记
- 八上1.2在社会中成长
- 湛江市廉江市河唇镇社区工作者招聘考试题目
- 物流公司业务部管理制度
- 铝屑收集储存安全管理制度(3篇)
- (正式版)DB33∕T 1224-2020 《城市轨道交通结构监测技术规程》
- 2025中考满分作文开头结尾集锦
- 北森测评题库及答案2026
- 2026年高考理科综合新高考一卷试题解析及答案
- 2025年危化品安全员资格证考试题库及答案
- 2025年少先队辅导员技能大赛考试测试题及参考答案(共四套)
- GB/T 28009-2025冷库安全规程
- 通信用电安全培训课件
- 洁净装饰工程彩钢板施工技术交底
评论
0/150
提交评论