Компания NVIDIA на GDC 2018 представила новый суперкомпьютер DGX-2 для крупных вычислительных центров и систем машинного обучения.
Это улучшенная версия системы NVIDIA DGX-1 на чипах новой архитектуры Volta. В основе этого вычислительного кластера 16 ускорителей Tesla V100, два процессора Xeon Platinum, 1,5 ТБ системной памяти, хранилище данных NVMe на 30 ТБ. Общий потенциал суперкомпьютера представлен 81920 ядрами CUDA, 10240 тензорными ядрами, а общий объем памяти HBM2 на чипах исчисляется 500 ГБ. Для сравнения напомним, что в DGX-1 находится 8 ускорителей Tesla P100.
Такой суперкомпьютер обеспечивает невероятную производительность до 2 PFLOPS (1920 TFLOP) в тензорных вычислениях, 480 TFLOPs в вычислениях FP16; 240 TFLOPs в вычислениях двойной точности FP32 и 120 TFLOPs в FP64.
DGX-2 использует новую скоростную шину NVSwitch для объединения всех Tesla V100. NVSwitch обеспечивает пропускную способность между чипами в 300 ГБ/с и расширяет возможности объединения устройств с интерфейсом NVLink. NVSwitch позволяет ускорить работу с большими объемами данных, открывая возможности для более сложных нагрузок, включая параллельную тренировку нейронных сетей. DGX-2 может обучить FAIRSeq, современную модель нейронных машин, менее чем за два дня, обеспечивая 10-кратное повышение производительности относительно DGX-1.
DGX-2 потребляет около 10 кВт. Масса всей системы 350 фунтов (159 кг).
Рекордная производительность DGX-2 сочетается с рекордной же ценой в 400 000 долларов. Не удивительно, что NVIDIA не очень торопиться с выпуском игровых устройств на архитектуре Volta, сосредоточив пока все усилия на рынке вычислительных устройств.
Источник: TechPowerUp