Blackwell GPU 的性能有望比 H100 GPU 提高 7 到 30 倍,B200 GPU將取代 H100 成為數(shù)據(jù)中心最先進(jìn)的 AI 加速器。
Blackwell GPU芯片
圖源:Nvidia
將兩個(gè)B200 GPU與一個(gè)基于Arm的Grace CPU進(jìn)行配對(duì),再通過900GB/s的超低功耗NVLink連接在一起,可以組成GB200超級(jí)芯片。Blackwell B200 GPU單顆芯片的功耗1000W,一顆Grace CPU和兩顆Blackwell GPU組成的超級(jí)芯片GB200的功耗達(dá)到了2700W。 Blackwell GB200 圖源:Nvidia GB200使用了NVLink5.0,每顆B200 GPU有18個(gè)NVLink5.0端口可以和交換芯片NVlink Switch 進(jìn)行互聯(lián),每個(gè)端口的速率是雙向100GB/s,由4對(duì)差分信號(hào)線組成。 英偉達(dá)GB200 NVL4是基于GB200擴(kuò)展的一個(gè)全新模塊,GB200 NVL4模塊在更大的主板上配置兩個(gè)Grace CPU和4個(gè)Blackwell B200 GPU。具有4-GPU NVLink域和1.3T相干內(nèi)存的單服務(wù)器解決方案。 GB200 NVL4 圖源:Nvidia超級(jí)芯片GB200
GB200 NVL4
將兩個(gè)GB200超級(jí)芯片合并安裝到一塊主板上,可以組成一個(gè)Blackwell計(jì)算節(jié)點(diǎn)。Blackwell Compute Node 也叫Compute Tray。
Blackwell Compute Node
圖源:Nvidia
把18個(gè)Blackwell 計(jì)算節(jié)點(diǎn)(Compute Tray)組合在一起,可以形成新一代計(jì)算單元:GB200 NVL72(Blackwell Node × 18 + NVLink Switch = GB200 NVL72)。 GB200 NVL72 包含18個(gè)Blackwell Compute Node 圖源:Nvidia 為了給18個(gè)Blackwell Compute Node提供數(shù)據(jù)交換能力,GB200 NVL72配備了9個(gè)NVLink交換節(jié)點(diǎn)(Switch Tray),每個(gè)交換節(jié)點(diǎn)中配置了2顆NVLink Switch芯片,向外提供14.4TB/s的聚合帶寬。 Blackwell NVLink Switch Tray 圖源:Nvidia Quantum-X800可提供 144 個(gè) 800Gbps 端口和 ConnectX-8 SuperNIC 設(shè)備端智能網(wǎng)卡。利用英偉達(dá) SHARPv4x 協(xié)議進(jìn)行的網(wǎng)內(nèi)算力也提升了 9 倍,達(dá)到 14.4 Tflops。 Blackwell Quantum-X800 圖源:Nvidia 把若干GB200 NVL72計(jì)算單元用Quantum InfiniBand交換機(jī)連接起來,再配合上散熱系統(tǒng),可以組成新一代DGX GB200 SuperPod集群。 DGX GB200 SuperPod 圖源:Deltacomputer DGX GB200 SuperPod 是一個(gè)包含32000塊GPU的分布式超算集群,采用新型高效液冷機(jī)架,可在FP4精度下提供11.5 Exaflops算力和240TB高速內(nèi)存。 Blackwell GPU加速成長,重點(diǎn)關(guān)注光模塊、銅連接和PCB方向-廣大證券 英偉達(dá)官網(wǎng):https://www.nvidia.comGB200 NVL72
Blackwell NVLink Switch Tray
Quantum-X800
DGX GB200 SuperPod