14 мая компания NVIDIA представила новый графической процессор NVIDIA A100 и одноименный ускоритель выселений. Это специальное решение уже обрело воплощение в виде решений для дата-центров. Представлены вычислительные системы NVIDIA DGX A100 на базе восьми NVIDIA A100, которые обеспечивает производительность до 5 petaFLOPS в задачах ИИ.
Передовая архитектура Ampere обеспечивают максимальную производительность такой системы. Референсная система NVIDIA DGX A100 построена базе платформы с двумя 64-ядерными процессорами AMD Rome , 1 ТБ памяти, накопителя SSD NVMe 15 ТБ, используется девять быстрых сетевых контроллеров Mellanox ConnectX-6 200 Gb/s. Ускорители A100 объединены на плате HGX A100 8-GPU с сетевой топологией соединения через NVSwitch.
NVIDIA DGX A100 будут задействованы в сервисах Alibaba Cloud, AWS, Baidu Cloud, Google Cloud, Microsoft Azure, Oracle и Tencent Cloud. Аппаратные серверные решения на базе A100 вскоре представят Atos, Dell Technologies, Fujitsu, GIGABYTE, H3C, HPE, Inspur, Lenovo, Quanta/QCT и Supermicro.
NVIDIA также анонсировала несколько обновлений своего программного стека, включая новые версии более чем 50 библиотек CUDA-X, используемых для ускорения графики, моделирования и ИИ; для CUDA 11; для NVIDIA Jarvis, мультимодального фреймворка для диалоговых ИИ-сервисов; для NVIDIA Merlin, фреймворка для рекомендательных систем; и NVIDIA HPC SDK, который включает компиляторы, библиотеки и инструменты, помогающие HPC-разработчикам отлаживать и оптимизировать свой код для A100.