В Сеть утекло очередное фото графического процессора  NVIDIA GP104. Сайт Videocardz публикует это изображение и проводит сравнение размеров с кристаллами GM204 и GM200.

Новый процессор ожидаемо меньше в размерах, ведь он изготовляется по более тонкому 16-нм техпроцессу. Согласно примерным подсчетам Videocardz площадь кристалла около 333 кв. мм. Полная маркировка чипа GP104-200-A1, эта версия должна стать основной для GeForce GTX 1070. Также на общей фотографии платы вновь замечены чипы памяти Samsung стандарта GDDR5, которые рассчитаны на эффективную частоту 8 ГГц. Что касается старшей видеокарты GeForce GTX 1080, то тут разные источники упоминают как возможность работы с GDDR5, так и с более быстрой памятью GDDR5X.

По последним данным на базе GP104 будет выпущено три видеокарты. Так что ожидаемая пара GeForce GTX 1080 и GeForce GTX 1070, которые должны сменить GeForce GTX 980 и GeForce GTX 970, будут не единственными моделями на новом GPU.

Мы решили собрать воедино все последние данные и провести анализ, чтобы спрогнозировать примерные характеристики новых видеокарт. В этом отчасти помогут документы, опубликованные компанией NVIDIA по их топовому GP100. Данный процессор был презентовал в составе устройства Tesla P100, и, возможно, так и останется уделом суперкомпьютеров и вычислительных ускорителей.

Процессор GP100 базируется на знакомой кластерной архитектуре. У него 6 кластеров GPC, каждый на 10 SM-блоков. А каждый SM оперирует 64 СUDA cores и 4 текстурными блоками.

Традиционно во всей линейке устройств NVIDIA архитектура кластера остается неизменной, меняется лишь их количество. Так что озвученное соотношение можно считать актуальным для GP104, GP106 и GP108 (если последний будет выпущен).

По аналогии с поколением Maxwell процессор средне-высокого уровня GP104 должен получить 4 кластера, GP106 получит 2 кластера, а самый простой чип ограничится 1 кластером. Наглядно это покажет еще одна иллюстрация, позаимствованная в одной из прошлых заметок Videocardz.

В таком случае GP104 при 4 кластерах получит 40 мультипроцессорных блоков SM с общим количеством вычислительных СUDA cores в 2560 штук. У GeForce GTX 980 на GM204 было 2048 таких ядер, сгруппированных в 16 SM. То есть рост минимальных вычислительных единиц небольшой, но их организация иная. Значительный рост SM-блоков позволит лучше распараллелить вычисления. Аналитики и журналисты сходятся на том, что GP104 получит 256-битную шину памяти. Лучшие на данный момент чипы GDDR5 могут обеспечить эффективную частоту 8 ГГц, более новая память GDDR5X обеспечит еще лучшие показатели пропускной способности.

Было бы логично, если бы GeForce GTX 1080 и GeForce GTX 1070 отличались типом памяти: GDDR5X обеспечила бы старшей модели лучшую ПСП, а GeForce GTX 1070 в случае использования простой памяти GDDR5 8 ГГц все равно получила бы рост ПСП относительно старых моделей Maxwell. Также традиционно идет дифференциация соседних продуктов на базе одного GPU за счет урезания некоторой части вычислительных блоков у младших версий. С нашей точки зрения наиболее логичным было бы отключение 4-8 блоков SM из 40 (вариант на 8 более реалистичен). Тогда GeForce GTX 1070 получит 2304 или 2048 СUDA cores. При таком соотношении у GeForce GTX 1080 будет 160 текстурных блоков, а у GeForce GTX 1070 от 144 до 128 текстурников.

Больше всего вопросов вызывает наличие некоей третьей модели на базе GP104. С нашей точки зрения ею может стать улучшенная версия GeForce GTX 1080 с более высокими частотами и гарантированной памятью GDDR5X. В качестве аргумента стоит снова обратиться к Tesla P100. В данном продукте активны не все вычислительные блоки (3584 из 3840 ядер CUDA), что говорит о трудностях с производством полноценных чипов этой серии. В такой ситуации выпуск топовой видеокарты на базе GP100 под вопросом, хотя это не исключает вероятность появления в будущем нового Titan с характеристиками на уровне Tesla P100. Например, ускоритель выселений Tesla M40 и GeForce GTX Titan X тоже являются аналогичными продуктами, причем графическая карта работает при более высоких частотах. А на фоне характеристик Tesla P100 с базовой частотой 1328 МГц и Boost-частотой 1480 МГц можно смело говорить, что любые графические вариации на GP100 и более простых GPU получат частоты не ниже, а только выше.

Так что у NVIDIA будет большой запас по частотам, который позволит регулировать производительность похожих продуктов. Например, GeForce GTX 1080 Ti на  GP104 получит более высокую частоту ядра и самую быструю память GDDR5X, а GeForce GTX 1080 получит частоту ядра ниже и память GDDR5. Но пока это лишь предположения. Зато можно более-менее уверенно говорить о том, что реальные частоты GPU у таких видеокарт вполне могут приблизиться к отметке в 1,5 ГГц. Что касается памяти GDDR5X, то ее ПСП эквивалентна значениям эффективной частоты от 10 ГГц до 14 ГГц. Разница с простой память GDDR5 8 ГГц значительная.

Для лучшего наглядного сравнения приведем две таблицы с предполагаемыми характеристиками новых GeForce и с данными по актуальным решениях GeForce архитектуры Maxwell.

Предполагаемые характеристики линейки видеокарт Pascal

 

New GeForce GTX Titan (?)

GeForce GTX 1080 Ti (?)

GeForce GTX 1080

GeForce GTX 1070

GeForce GTX 1060

GeForce GTX 1050

Архитектура

GP100

GP104

GP104

GP104

GP106

GP106

Кодовое имя GPU

Pascal

Pascal

Pascal

Pascal

Pascal

Pascal

Количество транзисторов, млн.

15300

≈8000

≈8000

≈8000

?

?

Техпроцесс, нм

16nm FinFET

16nm FinFET

16nm FinFET

16nm FinFET

16nm FinFET

16nm FinFET

Площадь ядра, кв. мм

 610

≈333

≈333

≈333

?

?

Количество потоковых процессоров

3584

2560

2560

2304-2048

1280

1152-1024

Количество текстурных блоков

224

160

160

144-128

80

72-64

Частота ядра, МГц

1300+

1300-1500

1300-1500

1300-1500

≈1500

≈1500

Шина памяти, бит

4096/512

256

256

256

128

128

Тип памяти

HBM2/ GDDR5X

GDDR5X

GDDR5X/GDDR5

GDDR5

GDDR5X/GDDR5

GDDR5

Эффективная частота памяти, МГц

?

10000+

8000+

8000

8000+

8000

Объём памяти, Гбайт

16

8/16

8

8

4

4

Интерфейс

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

Уровень TDP, Вт

<300

?

?

?

?

?

 

Характеристики видеокарт Maxwell

 

GeForce GTX Titan X

GeForce GTX 980 Ti

GeForce GTX 980

GeForce GTX 970

GeForce GTX 960

GeForce GTX 950

Архитектура

Maxwell

Maxwell

Maxwell

Maxwell

Maxwell

Maxwell

Кодовое имя GPU

GM200

GM200

GM204

GM204

GM206

GM206

Количество транзисторов, млн.

8000

8000

5200

5200

2940

2940

Техпроцесс, нм

28

28

28

28

28

28

Площадь ядра, кв. мм

601

601

398

398

228

228

Количество потоковых процессоров

3072

2816

2048

1664

1024

768

Количество текстурных блоков

192

176

128

104

64

48

Количество блоков ROP

96

96

64

56

32

32

Частота ядра, МГц

1000–1075

1000–1075

1126-1216

1051-1128

1126-1178

1124-1188

Шина памяти, бит

384

384

256

256

128

128

Тип памяти

GDDR5

GDDR5

GDDR5

GDDR5

GDDR5

GDDR5

Эффективная частота памяти, МГц

7010

7010

7010

7010

7010

6610

Объём памяти, Гбайт

12

6

4

4

4

2048

Интерфейс

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

Уровень TDP, Вт

250

250

165

145

120

90

Пока нет никаких данных о TDP новых продуктов. Заявленные 300 Вт для Tesla P100 настораживают, но GP104 и другие младшие GPU могут быть порезаны по части неграфических вычислений, что обеспечит лучший баланс экономичности и более низкие показатели потребляемой мощности. Вряд ли топовые решения на GP104 превысят отметку в 200 Вт, скорее всего, они будут близки к уровню TDP существующих GeForce GTX 980/970.

Также мы взяли на себя смелость составить прогноз по GeForce GTX 1060 и GeForce GTX 1050. О них пока вообще ничего не известно, недавние слухи лишь говорят о вероятности выхода видеокарт на базе GP106 осенью этого года. Данный чип получит 2 кластера, значит, решения на его базе сменят GeForce GTX 960 и GeForce GTX 950. Гипотетическая видеокарта GeForce GTX 1060 получит 20 блоков SM на 1280 CUDA cores. Шина памяти с большой вероятностью ограничится значением 128 бит. Летом обещают старт массового производства GDDR5X, поэтому GeForce GTX 1060 может получит такую память в объеме 4 ГБ. Но даже в случае использования более простых микросхем GDDR5 частота памяти будет не ниже 8000 МГц. Также на базе GP106 должен увидеть свет и более доступный продукт, как нынешний видеоадаптер GeForce GTX 950. Если он лишится 4 SM, то в его активе останется 1024 ядер CUDA. С целью максимального удешевления продукта можно ожидать на нем только память GDDR5. На фоне частот старших видеокарт такие бюджетные модели уж точно не должны получить частоты ниже 1500 МГц.

Насколько верны окажутся наши прогнозы, покажет время. Следите за новостями, читайте наши обзоры, подписывайтесь на нас ВКонтакте, Facebook и Twitter!

  • Комментарии: 1

Комментарии:

  • Комментировать Пятница, 22 Апреля 2016

    Интересно будет посмотреть на тесты и каков прирост производительности.

О проекте

Информационный портал Nvplay.ru посвящен электронным технологиям и компьютерной индустрии с акцентом на продукции NVIDIA. В центре нашего внимания видеокарты и компьютерные комплектующие, игры и игровые устройства, сопутствующее программное обеспечение и новые технологии.

Правила сайта NVPLAY.RU

Контакты

Сотрудничество, размещение рекламы и общие вопросы:

  • Email Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Для пресс-релизов и новостей:

  • Email Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Мы в соцсетях

Следите за нами в социальных сетях