英伟达发布最强AI加速卡Blackwell GB200 计划今年发货

news/2024/10/4 3:26:58/文章来源:中华网

IT之家 3 月 19 日闪讯速报，英伟达发布最强 AI 加速卡--Blackwell GB200，今年发货。

英伟达在今天召开的GTC开发者大会上，正式发布了最强AI加速卡GB200，并计划今年晚些时候发货。

GB200采用新一代AI图形处理器架构Blackwell，黄仁勋在GTC大会上表示：“Hopper固然已经非常出色了，但我们需要更强大的GPU”。

英伟达发布最强AI加速卡Blackwell GB200 计划今年发货

英伟达目前按照每隔2年的更新频率，升级一次GPU架构，从而大幅提升性能。英伟达于2022年发布了基于Hopper架构的H100加速卡，而现在推出基于Blackwell的加速卡更加强大，更擅长处理AI相关的任务。

Blackwell GPU

黄仁勋表示，Blackwell的AI性能可达20petaflops，而H100仅为4petaflops。Nvidia 表示，额外的处理能力将使人工智能公司能够训练更大、更复杂的模型。

英伟达发布最强AI加速卡Blackwell GB200 计划今年发货

Blackwell GPU 体积庞大，采用台积电的 4 纳米（4NP）工艺蚀刻而成，整合两个独立制造的裸晶（Die），共有 2080 亿个晶体管，然后通过 NVLink 5.0 像拉链一样捆绑芯片。

英伟达发布最强AI加速卡Blackwell GB200 计划今年发货

英伟达表示每个 Blackwell Die 的浮点运算能力要比 Hopper Die 高出 25%，而且每个封装中有两个 Blackwell 芯片，总性能提高了 2.5 倍。如果处理 FP4 八精度浮点运算，性能还能提高到 5 倍。取决于各种 Blackwell 设备的内存容量和带宽配置，工作负载的实际性能可能会更高。

英伟达使用 10 TB / sec NVLink 5.0 连接每块 Die，官方称该链路为 NV-HBI。Blackwell complex 的 NVLink 5.0 端口可提供 1.8 TB / 秒的带宽，是 Hopper GPU 上 NVLink 4.0 端口速度的两倍。

GB200

英伟达表示 GB200 包含了两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU 组成，推理大语言模型性能比H100提升30倍，成本和能耗降至25分之一。

Nvidia声称，训练一个1.8万亿个参数的模型以前需要8000 个 Hopper GPU 和 15 兆瓦的电力。如今，Nvidia 首席执行官表示，2000 个 Blackwell GPU 就能完成这项工作，耗电量仅为 4兆瓦。

在参数为1,750亿的GPT-3LLM基准测试中，Nvidia称GB200的性能是H100的7倍，而训练速度是 H100的4倍。

英伟达发布最强AI加速卡Blackwell GB200 计划今年发货

英伟达还面向有大型需求的企业提供成品服务，提供完整的服务器出货，例如GB200NVL72服务器，提供了36 个 CPU 和 72 个 Blackwell GPU，并完善提供一体水冷散热方案，可实现总计 720petaflops的AI训练性能或1,440petaflops（又称1.4exaflops）的推理性能。它内部使用电缆长度累计接近 2英里，共有 5000 条独立电缆。

英伟达发布最强AI加速卡Blackwell GB200 计划今年发货