












径:格 → 变电站 → 开关柜 → 不间断电源
训习巨量语言模型,数据中心乃作一统之超级计算机。当训习之序发轫,此设施必感巨量、协同步之需于电。
此程始於用電之網,載未經調治之電力,其壓極高(逾110千伏)。場中變電所降其壓,為中壓(常為11千伏至35千伏)。
至要之设,莫过于 UPS(不中断电源)。若电网波荡或倾颓,柴或煤气之发电机需数秒方启。UPS 乃恃巨量电池之阵,以弥此隙,使 AI 之群无失其力。
[图一] 终端至终端之电力架构
+------------------+ +------------------+ +------------------+ +------------------+
| Utility Grid | --> | Substation | --> | UPS & Genset | --> | Room PDU |
| > 110 kV AC | | 11-35 kV AC | | 480 V AC | | 415 V AC |
+------------------+ +------------------+ +------------------+ +------------------+
|
v
+------------------+ +------------------+ +------------------+
| AI GPU Core | <-- | VRM / PoL | <-- | Power Shelf |
| 0.7 V / 2,083 A | | 48 V -> 0.7 V | | 48 V DC |
+------------------+ +------------------+ +------------------+ 电压自电网降至硅基,每降一级,皆损其利、延其时、耗其资。
主角者: 施耐德(Schneider Electric)、伊顿(Eaton)、ABB诸公司,此基建之主导也。半导体企业(如英飞凌(Infineon)、沃尔夫速度(Wolfspeed)),供硅碳(SiC)之开关于UPS,增其效逾九九,杜兆瓦之热耗。
路径:UPS → 楼层配电单元 → 总线 → 机架
UPS调治其电,则分之至数据中心之层。其行于楼层之配电单元(PDU)内之大变压器,变压器降其压为415V或240V之交流电。
此力循机架之廊道,由顶悬或地底之铜条,名曰总线道,以输之。盖人工智能之架,耗电远胜于传统网页托管之架(每架至120千瓦,较之传统10千瓦),故此总线道必承巨流。
旧式机械断路器,渐为固态断路器(SSCBs)所取代,此器能于微秒间断电,以防毁灭性电弧闪爆。
路径:机架电源分配单元 → 功率柜
此阶段乃现代人工智能之架构转折之最。数十年来,传统服务器皆以十二伏直流为背板。然人工智能之GPU功率密度甚高,故十二伏因传输之限,数学上不可行。
为达此目的,架体现配以电力架——集中式电源单元(PSU)之总库。此架取入之交流电,化而为极稳之四十八伏直流。于斯PSU之内,氮化镓(GaN)与超结MOSFET以超乎寻常之频次切换,使电源得以紧凑之姿,而呈钛级之效能。英伟达之NVL72架构,已为超大规模液冷架百二十千瓦之圭臬。[1]固本之变,行于四十八伏直流之板。
+ + + 加
功率之式:P = V × I
若智能机架需用十万瓦于十二伏,则必推八千三百三十三安之电流。此致酷热铜损(I²R)。若将机架电压增为四十八伏直流,则电流降为二千零八十三安。此减功率损十六倍。
径路四十八伏直流电 → 电压调节模块 → 人工智能硅芯
终段乃天下电力工程之至艰境也。四十八伏直流电至主板,须立时降为硅逻辑所需之确电压——通常在零点六伏至零点八伏之间。
此转换由负载点(PoL)转换器与电压调节模块(VRMs)所掌之。一旗舰AI GPU(如NVIDIA之Blackwell)可耗电逾一千二百瓦。[二] 七百之电压,一芯片需千七百安之电流。
古之传电,横布硅晶,以聚VRM。然瞬变之阻,今世之构,易之以直布,VRM置于GPU之下,非侧之。半导体之司,供精巧之智电,数字之控,以调此疾电之输,精微无差。
+ 与 相加,复与 相加,又与
相加,此乃瞬息之挑战也
人工智能之作业,其势甚骤,如电光石火。GPU或需千七百安培之全力,不过瞬息之间。若VRM不能立应,则电压骤降,GPU遂崩。
人工智能之变,与动力基础密不可分。模型之规模既增,计算之物理极限,系于吾辈能效转化电网十一万伏为硅核七伏。通此转化于宏观至微观之全价值链者,将定高性能计算之来世.
* * *
此內容由慣性聚合(RSS閱讀器)自動聚合整理,僅供閱讀參考。 原文來自 — 版權歸原作者所有。