В последние дни появились слухи относительно проблем с производством новых графических процессоров Blackwell и возможной задержке в поставках. Но компания NVIDIA накануне конференции Hot Chips опровергает эти слухи и демонстрирует первые серверные системы в составе дата-центра Goliath, который оснащен новыми GPU для обработки искусственного интеллекта.
NVIDIA напоминает, что Blackwell не просто один чип, а целая инфраструктура с дополнительными ARM-процессорами, скоростным интерфейсом NVLink и сетевым оборудованием с высокой пропускной способностью:
- Blackwell GPU
- Grace CPU
- NVLink Switch Chip
- Bluefield-3
- ConnectX-7
- ConnectX-8
- Spectrum-4
- Quantum-3
Новый чип Blackwell B200 предлагает два мощных процессора, объединённых в одном корпусе. Производится по техпроцессу TSMC 4NP и насчитывает 208 миллионов транзисторов. Он обеспечивает производительность 20 Peta FLOPS в вычислениях FP4 для ИИ. Оснащен быстрой памятью HBM3e с пропускной способностью 8 TB/s. Интерфейс NVLink обеспечивает двунаправленную пропускную способность 1.8 TB/s.
Коммутаторы NVLink позволяют объединять до 72 графических процессоров в стойках GB200 NVL72. Чип NVLink обеспечивает двунаправленную полосу пропускания «все ко всем» по 72 портам при 7,2 TB/s и имеет вычислительную мощность внутри сети 3,6 TFLOPS.
Также серверные решения на базе Blackwell GB200 и B200 будут использовать жидкостное охлаждение. Оно позволяет повысить производительность и эффективность вычислительных систем. Использование «воды» может обеспечить снижение затрат на электроэнергию в центрах обработки данных до 28%.
Поколение Blackwell предназначено для удовлетворения современных потребностей ИИ, для высокой производительности в больших языковых моделях LLM (например в 405B Llama-3.1). С увеличением числа параметров модели LLM постоянно растут в размерах, поэтому центрам обработки данных потребуется больше вычислительных ресурсов и меньшая задержка. Все это может обеспечить платформа Blackwell.
Также NVIDIA внедряет систему квантования NVIDIA Quasar для ускорения вычислений ИИ. Она позволяет переходить от вычислений FP16 к FP4 без потери точности. И компания продемонстрировала первое изображение полученное в режиме FP4, которое практически не отличается от генерации в режиме FP16.
Источник: Wccftech.com