面向下一代AI基础设施800V直流架构白皮书_第1页
面向下一代AI基础设施800V直流架构白皮书_第2页
面向下一代AI基础设施800V直流架构白皮书_第3页
面向下一代AI基础设施800V直流架构白皮书_第4页
面向下一代AI基础设施800V直流架构白皮书_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面向下一代人工智能基础设施的800VDC架构面向下一代人工智能基础设施的800VDC架构介绍.3为了更高效率而增加的电力需求.3负载摆动与能量存储.5电网互连要求.7电力分配选项.9800VDCMGX架构.13数据中心参考设计.16行业合作与未来发展道路.17结论.183面向下一代人工智能基础设施的800VDC架构介绍就在几年前,数据中心还是围绕计算空间建造的,庞大的服务器数据大厅中,电源和冷却系统只占据了较小的空间比例。随后,GPU革命出现,将数据中心转变为“AI工厂”。如图1所示,与网页服务器相比,GPU机架的功率密度接近提高了100倍,并且功率的增加几乎呈指数级发展,改变了原本的平衡。电力基础设施曾经是次要的,现在却与计算所占空间相匹敌,甚至超出。图1:发电量随时间增加随着CPU或GPU的改进,通常每一代的GPU热设计功耗(TDP)会有约20%的递增。这导致每台服务器所需的功率随时间增加。Nvidia的NVLink允许多个GPU互联,从而有效地作为一个大型同步GPU运行,并在与以太网连接相比时提供显著的性能提升。从功率和成本角度来看,当GPU通过铜连接时,这种互联是最有效的,但由于信号完整性,其传输距离有限。由于实现最高性能需要更多的GPU在同一个铜域内运行(传输距离有限因此最大性能与最大功率密度相关。这意味着功率增长不再是每代约20%,而是随着NVLink网络域规模的增加,很容易达到2倍、4倍甚至8倍。4面向下一代人工智能基础设施的800VDC架构图2:TDP功耗增加了75%,但性能提高了50倍e上图2中的一个例子是从Hopper到GB300的性能提升。TDP功耗增加了75%,但通过这些改进,性能提升了50倍。这也导致机架功率密度增加了3.4倍,从4x8GPUNVLink域(机架中32个)增加到72GPUNVLink域。随着GPU封装和包装的改进以及网络拓扑向更大的域规模发展,这种功率密度可以继续增加。与过去的GPU相比,这种在NVLink域范围内的发电量增加导致功率增长速度更快。一个次要目标是尽可能将更多电源组件从NVLink域半径中移出,因为这是机架中性能价值最高的区域。这种提高功率水平并将电源组件远离GPU的组合,推动了对不同机架电源架构的需求。为了满足这些前所未有的需求,800VDC已成为下一代电力分配的最佳架构。它可以在计算空间中最小化转换和布线体积,同时减少数据中心分配损耗和整体端到端转换阶段。相比机架内的54VDC或设施级的480VAC系统,800VDC显著降低了电流、铜材使用量和电缆体积,同时保持安全性和可扩展性。它受益于碳化硅(SiC)和氮化镓(GaN)功率转换器件的日益成熟,以及电动汽车(EV)行业对800VDC系统的广泛采纳。这使得从电网到机架的无缝端到端集成成为可能,实现超过1MW的更高功率密度。数据中心历史上由运行各种工作负载的数千台服务器组成。借助GPU,这些工作负载可以在整个数据中心同步,从而在非常短的时间内导致巨大的负载波动。可以使用能源存储来缓解这些波动。这种数据中心电力的快速变化面向下一代人工智能基础设施的800VDC架构基础设施需求使行业处于十字路口。为了跟上未来GPU的需求,我们需要重新思考供电方式。这引导我们迈向更高效、可扩展、并能够应对极度动态AI工作负载的下一代配电系统。将800VDC架构与储能整合,是为未来AI工厂做好准备的关键。本文白皮书涵盖了推动数据中心变革的因素,以及如何从电网到芯片为高功率密度AI工厂分配电力的前瞻性愿景。负荷摆动与能量储存GPU同步的一个结果是它们的工作负载以及因此的功耗特征也会同步。这在超级计算机中已经存在几十年了,但现在在AI工厂部署中也被广泛认为是一个挑战。在典型的LLM工作负载中,会有一段强烈的矩阵计算间隔,然后是数据交换的间隔。如果不加以缓解,这会导致功耗快速波动,从机架功率的约30%空闲到100%功率利用率。这不仅对机架的功率分配造成问题,在集群规模足够大时,它在数据中心层面甚至电网层面也会成为问题。图3:用于平抑负载需求的储能为了应对这些负载波动,可以采取多种方法,如图3所示:使用储能来平抑负载需求。解决方案1–优化软件空闲期–如果可以在软件中最小化这些空闲期,这是理想的解决方案,因为它可以降低数据中心的电力需求。解决方案二–能量存储–应对这些负载波动的一种节能方法是使用能量存储。能量存储允许在空闲期间充电,在高峰期间放电,从而对机架电流需求进行低通滤波。这种能量存储可以采用多种形式,如电解电容器、超级电容器、电池等。解决方案3–消耗功率–这是通过NvidiaGPU的电源平滑功能完成的。这允许在延迟后消耗功率,使得功率仅在能量储存限制达到后才消耗。面向下一代人工智能基础设施的800VDC架构已达到。这本身并不理想,但结合能源存储,可以在本地能源存储无法维持的较长闲置期间提供后备支持。解决方案4–限制GPU性能以减少峰值–这些软件控制可在NvidiaGPU上使用,但这不是理想方案,因为它可能会在某些工作负载下降低性能。这四种解决方案可以结合使用,以提供全面的负载波动缓解策略。理想情况下,能源存储用来覆盖大部分负载波动持续时间,而燃烧功率和性能调节仅在极端情况下作为备用。正如图4所示,实际负载远比上面显示的理想化波形更具动态性。图4:在大型语言模型工作负载期间的GPU负载波动图4:整个计算周期内的功率包络在查看GPU工作负载时,Error!Referencesourcenotfound.Error!Referencesourcenotfound.是在多个时间尺度上的事件。观察整个系统,有电网级的波动需求以及GPU负载需求。能源存储需要填补这两个相互冲突的需求之间的差距;电网需要稳定且可预测的负载,而GPU需要非常动态的能源来源。GPU超调被称为电气设计点(EDPp),峰值功耗和典型工作负载空闲时间范围可达100毫秒,检查点保存可能需要1到5秒,然后面向下一代人工智能基础设施的800VDC架构工作负载的增加和减少需要在几分钟内完成。此外,根据具体的使用场景,可能需要使用储能作为过渡电源,以确保即使在主电源丢失后切换到备用电源期间,负载仍能正常运行。图5:按技术划分的储能量与持续时间上图显示了不同能源存储解决方案的体积随时间的变化。按体积计算,电解电容器是处理低于100毫秒时间段的良好解决方案。在100毫秒至10秒之间的时间段,有多种优化的解决方案,而在超过该时间尺度的情况下,电池是更好的体积化解决方案。尽可能靠近GPU缓解负载波动是理想的,以保持数据中心的升降速率可控,并减少有效值电流的增加。一个50%占空比、峰值为平均值50%的方波,然后回到空闲状态,将导致有效值损耗增加25%。数据中心的设备需要根据机架的峰值电流以及有效值损耗的增加进行尺寸设计,因此尽可能将这些峰值降低到靠近GPU的位置,对于降低整个数据中心设备的成本和影响具有重要意义。电网互连要求上述负荷需求由于其电力需求的规模和波动性,带来了前所未有的互联挑战。电网运营商开始要求更大的负荷灵活性,面向下一代人工智能基础设施的800VDC架构可控性和可预测性,以维持电网稳定,避免为峰值需求过度建设,并减轻对输电基础设施的压力。AI工作负载的无缓解阶跃变化,尤其是来自大型、同步GPU集群的变化,可能导致电压和频率快速偏离可接受范围。这些事件可能违反互连要求,降低电网性能,并导致互连审批的延迟或拒绝。为了确保及时接入电网并保证长期稳定运行,AI计算负载应包含计算设置调整、主动功率调节以及通过以太网进行的电网合规控制,包括:•能源存储系统:能量存储(长时和短时)结合快速实时功率补偿,以稳定电力消耗、控制斜率变化,并减轻大幅度变化。•GPU性能调优与工作负载调节:调整计算固件和操作设置,以平滑快速的功率波动、限制周期间的变化速率,并抑制峰值功率行为。•协调控制策略:整合储能、计算和设施配电系统,以确保符合公用事业关于斜率速率、暂态稳定性、谐波/闪变和电压耐受(VRT)的要求,同时支持整体电网的稳定性。展望未来,人工智能工厂有潜力发展成为支持电网的资产,而不仅仅是作为大型被动负载运行。通过采用先进的技术能力,行业合作伙伴可以帮助确保人工智能基础设施不仅能够可持续地扩展,还能增强其所依赖的能源系统的稳健性。•通过以太网实现的电网形成型和快速响应控制,在电网扰动期间积极支持电压和频率稳定性。增强内部IT负载的故障穿越能力,通过参考ERCOT电压穿越(VRT)要求,超越当前ITIC曲线的预期,适用于大功率电子负载,以在电压下降或故障期间维持关键操作并支持电网恢复。有关详细信息,请参阅链接:/calendar/07112025‑LLWG‑线的预期,适用于大功率电子负载,以在电压下降或故障期间维持关键操作并支持电网恢复。有•实时电力支持,在电网压力大时提供补充电力,在电力过剩时吸收多余电力,有助于平稳突发变化,维持公共电网的稳定。•具有韧性的系统设计和运营实践,使人工智能工厂能够作为整体电网可靠性和韧性的贡献者,从而实现部署的更快速、更可预测的扩展。为了确保高密度人工智能工厂的电网稳定性和电能质量,必须在电气架构的两端战略性地部署储能系统。储能系统,例如电池储能系统(BESS应放置在接近公用事业接入点以及厂区自发电的附近。9面向下一代人工智能基础设施的800VDC架构管理大型GPU集群的稳态功率波动。BESS提供负载平衡、并网支撑以及从电网切换到发电机时的过渡电力。在另一端,短时储能设备如电容器被集成在计算机机架附近,以缓解由AI工作负载产生的快速动态功率变化(快至400微秒)。这些设备用于限制功率变化速率并吸收功率峰谷,确保对敏感计算基础设施提供稳定且可预测的800VDC电源。这种双层储能策略对于满足AI原生电力系统的性能和可靠性需求至关重要。互连审批仍然是AI工厂部署的主要瓶颈,这在很大程度上是由于GPU驱动的负载波动不可预测。需要行业协作来建立标准化的负载行为模型、响应指标和调节要求。在提升率限制、负载灵活性和能源存储整合方面达成明确共识,将帮助公用事业公司更有信心地评估AI工厂项目,加快审批速度,并实现更快速、更可扩展的部署。能源存储必须被视为AI工厂架构的核心元素。除了稳定GPU负载外,其标准化角色应涵盖瞬态缓解、备用电源和负载调节,并提供通用集成接口,以实现机架、行或设施级别的无缝部署。这种方法确保与电力转换系统和电网接入方案的互操作性,提高设备利用率,并在不影响计算性能的情况下实现可靠扩展。电源分配选项传统的415V或480V三相交流电力系统长期以来支持了数据中心的增长。然而,随着计算机机架功率密度接近并超过兆瓦级,这些系统正达到其实际限制。•鞭线尺寸和载流量:典型的交流鞭线额定电流为60A或100A,受热限制和连接器标准(如IEC60309)约束。•机架电源接口:更高的机架电源需求需要更多和/或更大的输入连接,占用宝贵的机架空间,并使线缆管理更加复杂。•电力资产协调:管理和保护多个交流电源增加了设计复杂性,并占用更多设备空间。随着机架级功率的上升,使用传统的交流配电会导致系统复杂性增加、组件增多、可扩展性降低,从而推高下一代部署的资本成本和运营成本。从下表中可以看到,通过额定持续电流为48A的固定线规传输的功率与电压的关系,当从415VAC转换为800VDC时,通过相同铜导体截面积传输的功率可以增加157%。在北美,从现有基础设施中获取更多功率的一种常见方法是使用480VAC,但这仅能提高16%的基础设施容量。如果进一步采用1500VDC配电,通过相同导体尺寸传输的功率将增加382%.面向下一代人工智能基础设施的800VDC架构表1:交流与直流电源电缆比较每条电缆直径的功率功率增加参考文献415VAC415伏交流电4(P1,P2,P3,PE)0.6-480伏交流电4(P1,P2,P3,PE)0.83(POS,RTN,PE)+382%+382%3.1PE)过渡到800VDC配电转向800伏直流设施级配电可应对这些挑战,并提供几个关键优势:•简化的IT电源接口:随着GPU机架的功率密度迅速超越传统Web服务器,达到兆瓦级别,现有的415/480VAC电缆和连接方案已不再可行。转向800VDC可实现机架的精简物理接口,显著减少所需的电缆和组件数量。这简化了安装、减少了空间占用,并提升了运营灵活性:在电力基础设施如今在占地面积和复杂性上已与计算能力相当的情况下,这些因素尤为关键。•简化系统架构•简化系统架构:将交流/直流(AC/DC)转换从IT机架上移至设施级,最终实现直接中压交动因素。与GPU机架的直接兼容性:虽然设施级数据中心配电可以设计为支持多种电压架构,但最终交付到计算单元时必须保持800VDC电压差。这确保了设施电力基础设施与机架级硬件之间的无缝互操作性,简化了集成过程,减少了定制需求,并在AI工厂部署中实现统一的部署策略。LVDC配电的相邻行业蓝图几个相关行业已经证明了低压直流(LVDC)配电的可行性,为人工智能工厂的电力系统提供了宝贵的参考。•电动汽车(EV):电动汽车平台已从400VDC发展到800VDC及以上,如保时捷、现代和通用汽车的车型所示。其系统强调快速充电、高功率密度、减少铜材料使用,并配备高效率整流器、大安培容量便携电缆、先进的安全连接器以及容错保护方案。面向下一代人工智能基础设施的800VDC架构•铁路与工业:长距离低压直流(LVDC)配电被广泛应用于交通和工业微电网。例如,•铁路与工业:长距离低压直流(LVDC)配电被广泛应用于交通和工业微电网。例如,这些行业表明,经过验证的设备、安全策略和操作实践可以被用于人工智能工厂。然而,即便已有这样的成熟经验,数据中心的部署仍需进行大量的工程调整,以应对更高的功率密度以及超大规模计算环境中特有的更严格的电气安全要求。正在评估的设施级直流配电选项领先的数据中心运营商和云服务提供商目前正在评估多种设施级的数据中心架构:800VDC(NVIDIAMGX):直接支持Nvidia800VDC机架架构。受益于氮化镓(GaN)和碳化硅(SiC)器件的基于转换器件日益成熟以及电动汽车的广泛采用。实现AI计算的端到端无缝集成。获得认可。±400VDC(OCP标准技术上可行,且基于先前的400VDC架构进行开发。然而,中点参考会形成四线系统,在扩展到数据中心级别分配时,会增加接地、相位平衡和故障检测的复杂性。1500伏直流(潜在未来目标):1500伏直流是《国家电气规范》第690条(光伏系统)和I1500伏直流(潜在未来目标):1500伏直流是《国家电气规范》第690条(光伏系统)和I然而,在数据中心内部,特别是在计算机机架内应用1500VDC面临重大挑战。当前针对IT和室内环境的UL和NEC标准仍在不断发展,并且在这一电压水平下很少有认证组件。此外,器件间距和爬电距离要求、组件电压等级以及电弧闪络安全问题,使得在有限的机架空间内安全实施1500VDC变得困难。因此,1500VDC仍然是大型AI工厂潜在的长期目标,而800VDC则作为切实可行的短期解决方案,在效率、转换阶段、设备可用性和法规遵从之间取得平衡。建议采用分阶段实施策略:•近期:使用商用1000V级组件向机架部署800V直流。•潜在长期影响:随着机架内保护设备向1500V直流电转变、DC/DC密度增加、安全标准巩固以及配套设备广泛可用。面向下一代人工智能基础设施的800VDC架构800V直流MGX架构上述对于指数增长功率、将功率推出NVLink域以及用于缓解负载波动的能量存储的要求,共同定义了800VDC电源架构的需求。图8:800VMGX机架概览整体机架架构直接将800VDC输入机架,并将800VDC直流电分配到计算节点。安全性是800V系统的重要设计特性。因此,在所有用户可接触的位置都使用了防触电连接器。为了在连接和断开负载时确保安全,所有连接器中还使用了机械互锁,以确保在负载下不会发生断开。这有助于最大限度地减少电弧的风险,同时作为二次保护,确保没有可触及的带电部件。这些技术在电动汽车充电器中被广泛使用,普通消费者也可以安全使用。目前计划使用的连接器正是在利用这一现有技术,并针对数据中心环境进行优化。为了尽量减小连接器尺寸和铜的用量,直流/直流转换尽可能靠近GPU。这利用了800VDC来最小化系统中的功率开销。然后将电压从800VDC转换为12VDC,并短距离传输到电压调节器。面向下一代人工智能基础设施的800VDC架构800V直流电压通过64:1的LLC转换器和矩阵变压器直接转换为12V。这有助于消除当前标准数800V直流电压通过64:1的LLC转换器和矩阵变压器直接转换为12V。这有助于消除当前标准数图9:带对称熔断和热插拔控制器的DC/DC,以支持±400VDC或800VDC电源如图9所示的IT机架也设计为支持具有多种接地方案的800VDC总电位的电源。这使得±400V的设备可以被重复使用来为机架供电。这通过在DC/DC转换器的高端和低端输入端安装保险丝,并确保两个输入端与次级具有加强隔离来实现。为了为IT机架生成800VDC电源,可以使用多种方法:侧面电源机架、设施级整流、中压整流器和固态变压器。决定实施800V直流单端配置是基于在向数据中心级分配过渡时保护设备可用性和系统简化的实际考虑。虽然诸如±400V直流的双极配置在接地和故障隔离方面具有理论上的优势,但它们需要使用行业中不广泛可用的特殊三极断路器和保护设备。开发此类组件将带来延迟并增加工程开销。相比之下,单端800V直流方法符合现有的两极断路器设计,允许更快速的部署并降低复杂性。此外,数据中心级的单端配电在正极和回路电源之间不存在任何负载平衡问题。图10展示了数据中心电力分配从当前的415VAC架构演进到面向未来的800VDC系统,以满足人工智能工厂的需求。图10顶部所示的现有415VAC架构涉及多个组件:中压降压变压器、低压配电盘、交流不间断电源(ACUPS)、配电单元(PDU)和交流配电面板(RPP或母线槽)。电力以415VAC的形式供应至每个计算机机架,其中机架内的电源模块(PSU)将其转换为54VDC,用于计算托盘和IT设备。可选的外部储能系统可用于缓冲GPU工作负载引起的动态功率波动。面向下一代人工智能基础设施的800VDC架构为了支持不断增加的功率密度并为现有设施提供适配器,一种过渡性的800VDC架构将交流/直流转换移至机架外,如图10中的第二种架构所示。仅针对WhiteSpace改造并尽量减少影响,800VDC侧电源机架是一种专用电源机架,包含整流器和电源分配单元,用于将交流电转换为各机架本地的直流电。在近期,由于相关组件变得更加易于获得,以部署800VDC数据中心,这是必要的。这并不是端到端的最佳解决方案,因为增加了额外的转换阶段,但它通过将电源转换移出计算机机架,使提高计算机机架功率密度成为可能。随着800VDC电源分配设备和数据中心运营变得更加普及,侧电源机架可以被高功率密度的整流器取代,并放置在电源分配的上游。图10:数据中心架构随时间的演变设施级交流/直流电源整流器,作为另一种变化,在图10中显示为第三种架构,可从低压交流(<600V)输出800VDC。典型整流器串的目标容量为~1.5MVA,并可通过公共直流母线并联。位于低压配电盘下游或中/低压变压器下方,这些系统可减少机架级复杂性,并支持在直流输出端集成储能。虽然仍需要降压变压器,但整流器提供成熟、高效率(~99%)的解决方案,广泛用于储能系统和可再生能源。该架构简化了电力供应,并可扩展以支持高密度计算,同时占用最小的空白空间。为了满足人工智能工厂日益增长的电力需求,英伟达正在探索中压整流器的应用(将中压交流电转换为800V直流电并推进固态变压器(SST)技术,作为面向未来的设施配电解决方案。如图10底部架构所示,中压整流器和固态变压器的目标是实现从中压(例如35kV交流电)直接转换为800V直流电,从而无需传统的低压(480VAC)层级,简化设施电力系统。面向下一代人工智能基础设施的800VDC架构架构。中压整流器和SST的容量可达每单元7.5MVA,效率为98.5%或更高。中压整流器是一种经过验证的高容量电力转换系统,广泛应用于采矿、电解、铁路和电网级储能等行业,以提供稳定的大功率直流电。它由降压变压器、整流模块、滤波器和保护系统组成,其成熟的设计提供了高可靠性和供应链准备。与不断发展的固态变压器(SST)相比,中压整流器为快速部署800VDC提供了更快捷且经过验证的路径,使其成为近期人工智能工厂应用的有力候选方案。SST系统结合了中压交流输入、电力整流模块和直流输出分配部分。其紧凑且高功率容量的设计支持计算机机架密度的增长,具有可扩展性,并且在直流电源设备方面节省大量空间。然而,将SST扩展到数兆瓦容量在高功率整流模块的开发和可靠性以及高密度下热、电应力的管理方面存在挑战。NVIDIA正在积极与领先的行业合作伙伴合作,共同开发基于SST的解决方案。工厂级直流电系统的设计必须优先考虑韧性和可扩展性,以满足人工智能工厂不断变化的需求。韧性要求具备强大的保护方案、故障隔离策略以及电力路径的冗余,以确保在故障或维护期间持续运行。可扩展性则需要模块化和灵活的架构,使电力扩展能够无缝进行而无需大规模返工,同时保持安全性和效率。关键开发领域包括大容量、可靠的电力整流,高级直流配电板,与直流设备的协调保护,为安全维护而明确的隔离点,简化的IT机架电力接口,以及用于缓解动态电力波动的集成直流储能。这些要素共同构成了高密度计算环境中长期可靠性和操作灵活性的基础。数据中心参考设计NVIDIA加速生态系统准备的策略是通过分享设施级参考设计,展示先进电力架构的可行性。这些设计并非固定规范,而是用作示例,指导生态系统合作伙伴在可扩展、互操作的AI工厂解决方案上达成一致。它们有助于识别开发机会,并加快相关技术的联合开发。参考设计将与NVIDIA的计算产品规范同步发展,以确保持续的对齐性和适用性。如图11所示,所提出的概念性电气架构通过一个17.5MW的电力模块支持可扩展且具有弹性的AI工厂部署,该模块利用五个3.5MW中压(MV)整流器,采用“5取4”的冗余配置。每个整流器将35kVAC转换为800VDC,并供电给一个集中的5000A直流配电板。电力通过1500A母线槽或液冷电缆分配,每条线路都配备了带负载断开功能的接触器、固态断路器和隔离二极管,以确保安全隔离、故障保护和故障电流控制。该系统向四个1.1MW计算机机架以及相关的CDU和IT支持设备供电。面向下一代人工智能基础设施的800VDC架构每个计算机机架都有本地或集中式的能源存储支持,以提供斜率控制、电力平滑、电压调节和可选的备用能力。为了保持同时可维护性和正常运行时间,机架配置了来自独立整流器的1+1冗余电源。在单个整流器发生故障的情况下(例如,源#2丢失系统会自动将负载切换到备用电源,确保操作不中断。即使在最严重的负载情况下,单个整流器(例如,源#1)也可以承受高达3.3兆瓦的计算负载。这表明系统在满负载时仍具有生存能力,并为高密度关键任务的人工智能工作负载做好了准备。图11:800VDC17.5MW功率模块示意图行业合作与前进路径要实现这一架构,需要在未来与行业在多个方面进行合作。就通用电压范围、连接器和电流水平达成一致,以保持模块化建立标准化的电压等级、电流额定值和连接器接口,对于实现跨供应商和系统集成商的模块化和互操作解决方案至关重要。对于采用800VDC架构的人工智能工厂来说,行业范围内的一致性将最小化定制需求,加快部署时间,并支持可扩展性。一个统一的框架可以在减少设计、安装和维护复杂性的同时,实现灵活的部署策略。开发并认证直流原生设备向设施级直流配电的过渡需要新一代本地直流设备,包括整流器、配电系统、保护设备、布线、连接器、传输跳闸方案以及面向下一代人工智能基础设施的800VDC架构计量。需要协调发展和认证工作,以满足数据中心环境的性能、安全性和可靠性预期。与设备制造商和测试机构的合作对于加快验证过程并建立对大规模数据中心电力采用的信心至关重要。对齐安全支持800VDC及以上的数据中心标准和运营实践在800VDC电压下运行会引入新的安全考虑因素,这些必须通过符合行业标准的规范和程序来解决。明确的操作指南,包括维护操作、电弧闪络防护、接地策略和培训,将确保800VDC基础设施的安全处理。行业工作组和监管机构必须合作,以更新或扩展适用的规范和最佳实践。结论GPU功耗的指数级增长以及电网和GPU负载配置要求的不断变化,正在推动新的机架和数据中心电力架构的需求。这种新架构将有助于降低系统复杂性、成本,并提高效率。通过结合能源存储和800V直流配电,可以解决同步负载波动问题以及为实现最大计算效率而日益增加的GPU功率密度问题,从而满足未来AI工厂的发展需求。本文件仅供参考,不应被视为对产品的特定功能、状况或质量的保证。NVIDIA公司(“NVIDIA”)不对本文件所包含信息的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论