Версия для печати

В рамках презентациb NVIDIA на конференции GTC 2016 состоялся анонс графического ускорителя на базе новой архитектуры Pascal. Публике показали продукт профессионального класса Tesla P100 для ускорения вычислений.

Он базируется на GPU Pascal с использованием скоростной памяти HBM2 и предложит рекордную производительность:

  • 21,2 Тфлопс для вычислений с половинной точностью FP16)
  • 10,6 для вычислений с одинарной точностью FP32
  • 5,3 для вычислений с двойной точностью FP64

В основе новинки процессор GP100, который выполнен по 16-нм техпроцессу FinFET и насчитывает более 15 миллиардов транзисторов. GPU насчитывает 3840 вычислительных ядер CUDA, но Tesla P100 будет оперировать 3584 ядрами при 224 активных текстурных блоках. Общая структура нового GPU изображена на блок-схеме внизу. В нем 60 мультипроцессорных блоков обработки данных (Streaming Multiprocessor), в Tesla активно 56.

Базовая частота GPU установлена на уровень 1328 МГц при Boost Clock 1480 МГц. Вычислительный ускоритель Tesla будет оснащаться 16 ГБ памяти HBM2, обмен данными с которой происходит по 4096-битной широкой шине. Кристалл GPU и банки памяти конструктивно выполнены на одной подложке в виде одного устройства. Частота памяти 1400 МГц обеспечит пропускную способность 720 Гбайт/с.

Сравнить характеристики нового продукта со старыми Tesla можно по нижней таблице, составленной Videocardz.com:

Заявлен уровень TDP 300 Вт. Следовательно, если позже выйдет версия ускорителя со всеми CUDA ядрами, то она может быть еще горячее.

NVIDIA Tesla P100 уже в производстве. Первые клиенты получат устройства в ближайшее время, но массовые поставки для производителей серверных систем начнутся в 2017 году.

  • Комментарии: 1

Комментарии: