解决人工智能数据中心 PSU 的功率密度问题
出处:网络整理 发布于:2024-11-28 16:13:47
如果我们查看内部冗余电源的 M-CRPS 规范,就可以看出这一点,该规范构成开放计算项目的 DC-MHS(数据中心 - 模块化硬件系统)标准化接口和外形尺寸系列的一部分,这些规范包括:用作从控制面板连接到计算机主机处理器模块和高速数据接口等一系列功能的构建块。
M-CRPS 电源模块有多种外形尺寸,其中的包括 CRPS185 (185 x 73.5 x 40 mm) 和 CRPS265 (265 x 73.5 x 40 mm)。输出电压可设置为 12 V 或 54 V,使用后一种 54 V 标准可提高高功率超大规模/AI 工作负载的分配效率。
近年来,生成式人工智能的能力和需求都在快速增长。因此,这对服务器电源网络提出了特殊的要求。
支持一代人工智能处理器的进步,例如 NVIDIA 的 Grace Hopper 和 Blackwell GPU 以及 AMD 的 Instinct“Antares”MI300X GPU,与前代产品相比,能效显着提高,每 petaFLOPS 千瓦数显着下降,尽管它应该是表示尽管如此,每个处理器消耗的原始功率同时显着增加。
根据图 1 所示,NVIDIA 的这两代改进使处理能力提高了 14 倍以上,而这仅是在功率增加一倍的情况下实现的,这是巨大的飞跃。
图 1. NVIDIA 的 AI 处理器产品的功效。注意: NVIDIA Rubin 处理器的规格尚未公布,但预计将遵循表中的趋势。图片由博多电力系统提供
但同样清楚的是,为了从标准 CRPS 外形尺寸中提供改进的执行性能,需要提高 PSU 功率密度……而且需要尽快提高。
NVIDIA 的数据中心 SuperPOD 参考设计包含六个 1U CRPS PSU 插槽。对于 DGXH100 SuperPOD 设计,PSU 配置为 4+2 冗余。但是,如果我们查看 DGX B200 (Blackwell) SuperPOD 参考文档,我们会发现冗余减少了,六个中的五个需要在任何给定时间通电:“如果单个内部电源单元被解除,系统就可以运行。 - 通电,但如果多个电源装置断电,则无论上游电力冗余如何,都不会运行。”
由于当前一代的冗余度已降至,因此可以肯定的是,电力的挤压只会加剧。
将功率密度从 98 W/In 提高至 137 W/In 3
随着硅达到其物理极限,宽带隙半导体,特别是碳化硅 (SiC) 和氮化镓 (GaN),可以应用于 PSU 中,以提供更高密度的电源设计。今年早些时候,Navitas Semiconductor 开发了 54 V CRPS PSU 的参考设计,使标准 CRPS185 外形尺寸内的输出功率增加了 40%(4.5 kW 与现有的 3.2 kW)。这将参考设计的功率密度从 98 W/in 3 (3.2 kW PSU) 增加到 137 W/in 3。图 2. 4.5 kW 参考设计与市售 3.2 kW CRPS185 PSU 的功率密度和效率。图片由博多电力系统提供 [PDF]
当然,数据中心的电源必须满足效率规范,80PLUS Titanium 要么是自愿采用,要么是通过强制立法(对于欧盟的数据中心)。为了证明合规性,PSU 需要满足整个负载范围(10%、20%、50% 和 100%)的效率目标,标准规定 50% 负载时的效率为 96%。该参考设计超出了整个负载范围的要求,在 50% 负载时达到了 97% 以上。 80PLUS Titanium 还规定 PSU 在较低负载水平下的功率因数至少为 0.95,因此需要有源功率因数校正 (PFC)。
无桥交错图腾柱 PFC
如图 3 所示,Navitas Semiconductor 在参考设计中采用了无桥交错图腾柱 PFC,其中包括带有转向开关的升压级。与传统的桥式整流器相比,这具有大大降低元件损耗的优点。
SiC MOSFET 因其的开关和反向恢复损耗而得到使用,使 PFC 能够以远远超出仅通过硅所能承受的损耗预算运行。
LLC 谐振转换器
该 PFC 级反过来为带有全桥方波发生器的 LLC 谐振转换器供电,以激励谐振回路电路,并通过 CR 滤波器和 GaN 整流器在变压器的次级侧提供稳定的 54 V 输出。
我们可以通过在储能电路的谐振频率下使用全桥晶体管的零电压开关(ZVS)来进一步提高效率。然而,谐振组件以及相关电路和输出滤波器必须在相同的整体外形尺寸内处理更大的电流,输出电流为 54 V PSU,提供 4.5 kW、83 A 的满载功率。
4.5 kW 参考设计的全桥是使用 650 V GaNSafe IC 构建的,该参考设计的功率密度需要选择 300 kHz 的开关频率。这大约是强大的硅基 CRPS 单元(约 150 kHz)的两倍,虽然硅的开关频率不能显着超过 150 kHz,但 GaN 功率晶体管的输出电容和栅极电荷等特性使其能够有效运行远超过 300 kHz。
图 4. 集成驱动器允许控制栅极环路电感。图片由博多电力系统提供GaN 栅极脆弱性
此时,应该注意GaN脆弱的栅极结构。栅极驱动电路的设计对于缓解这种情况并防止负电压尖峰和振铃至关重要。
GaNSafe IC 集成了优化的驱动器来保护栅极,从而能够仔细控制输出和栅极之间的电感和电阻。这也可以通过分立元件来实现,但这样做会带来额外的设计挑战,并且需要增加 PCB 面积(从而降低功率密度)。
版权与免责声明
凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。
本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。
如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
- 应用 LDO 时需要注意的三个问题2024/12/4 16:07:23
- ESS 中双向 CLLLC 谐振转换器的控制方案2024/11/25 16:30:45
- 开关电源的常见故障及其修复方法2024/11/21 17:52:01
- 降低开关模式电源噪声的设计技术2024/11/21 17:11:23
- E类功放介绍2024/11/20 17:09:16