На днях компания NVIDIA провела большую презентацию на конференции для разработчиков GTC 2025. В центре внимания были решения для систем искусственного интеллекта. Сейчас компания поставляет системы на базе графических процессоров Blackwell, но уже объявлено, что сменит их в ближайшие годы. Во второй половине текущего года NVIDIA предложит решения на второй поколении чипов Blackwell B300, известные как Blackwell Ultra, в 2026 году будут представлены чипы Rubin, а в 2027 году их сменят Rubin Ultra.
Blackwell B300 Ultra сохранит базовый дизайн первого чипа Blackwell B200 с двумя вычислительными кристаллами и 8 стеками HBM3e. Но применение новой 12-слоной памяти позволило перейти к объему 288 ГБ на одном чипе вместо 192 ГБ.
NVIDIA предложит серверные системы с новыми чипами GB300 NVL72 и HGX B300 NVL16. Стоечные решения NVL72 будут использовать суперчипы GB300, где каждый «чип» включает два GPU B300 и один ARM-процессор Grace с 72 ядрами на одной плате. Это замена для актуальных GB200 в составе систем GB200 NVL72. Одна система GB300 NVL72 предложит до 20 ТБ быстрой памяти HBM3e и 40 ТБ общей памяти при пиковой производительности 1,1 EFLOPS при выводе (инференс) и 0,36 EFLOPS при обучении нейросети.
Через год их сменят решения на графических процессорах Rubin. Первое поколение чипов будет по-прежнему содержать две плитки на кристалле и 8 стеков памяти, но уже нового типа HBM4. Объем памяти останется на прежнем уровне 288 ГБ, но пропускная способность вырастет. Пиковая производительность должна достигнуть 50 PFLOPS, что в 5 раз выше, чем у актуальных чипов Blackwell B200. Но также серьезные изменения получит вся серверная платформа. Будут представлены стоечные системы Rubin NVL 144 с новыми суперчипами, где будут и новые CPU Vera (88 ядер). И теперь одна стойка будет содержат не 72 GPU, а 144 GPU. Одна такая система обеспечит производительность 3,6 EFLOPS при выводе (инференс) и 1,2 EFLOPS при обучении нейросети.
В 2027 появятся Rubin Ultra и системы Rubin Ultra NVL576. Новый чип Rubin Ultra будет настоящим титаном из четырех кристаллов на одной подложке и 16 стеков памяти. Переход на следующее поколение HBM4e позволит оснастить один чип 1 ТБ памяти! Стоечная система NVL576 получит 365 ТБ быстрой памяти, производительность достигнет 15 EFLOPS при инференсе и 5 EFLOPS при обучении нейросети.
Также будут обновлены сетевые узлы. Будущая система NVL576 получит 144 коммутаторов NVLink 1500 ПБ/с, 576 сетевых карт ConnectX‑9 и 72 сетевых устройства обработки данных Bluefield DPU.
|
Blackwell B200 |
Blackwell B300 Ultra |
Rubin |
Rubin Ultra |
Feynman |
Производительность FP4 |
10 PFLOPS |
15 PFLOPS |
50 PFLOPS |
100 PFLOPS |
? |
Тип памяти |
HBM3 |
HBM3e |
HBM4 |
HBM4e |
? |
Объем памяти |
192 ГБ |
288 ГБ |
288 |
1 ТБ |
? |
Год запуска |
2024 |
2025 |
2026 |
2027 |
2028 |
На 2028 год NVIDIA планирует представить поколение устройств на архитектуре Feynman, но никаких деталей пока не раскрывает.
Источники: NVIDIA, Videocardz.com