В Сеть утекло очередное фото графического процессора NVIDIA GP104. Сайт Videocardz публикует это изображение и проводит сравнение размеров с кристаллами GM204 и GM200.
Новый процессор ожидаемо меньше в размерах, ведь он изготовляется по более тонкому 16-нм техпроцессу. Согласно примерным подсчетам Videocardz площадь кристалла около 333 кв. мм. Полная маркировка чипа GP104-200-A1, эта версия должна стать основной для GeForce GTX 1070. Также на общей фотографии платы вновь замечены чипы памяти Samsung стандарта GDDR5, которые рассчитаны на эффективную частоту 8 ГГц. Что касается старшей видеокарты GeForce GTX 1080, то тут разные источники упоминают как возможность работы с GDDR5, так и с более быстрой памятью GDDR5X.
По последним данным на базе GP104 будет выпущено три видеокарты. Так что ожидаемая пара GeForce GTX 1080 и GeForce GTX 1070, которые должны сменить GeForce GTX 980 и GeForce GTX 970, будут не единственными моделями на новом GPU.
Мы решили собрать воедино все последние данные и провести анализ, чтобы спрогнозировать примерные характеристики новых видеокарт. В этом отчасти помогут документы, опубликованные компанией NVIDIA по их топовому GP100. Данный процессор был презентовал в составе устройства Tesla P100, и, возможно, так и останется уделом суперкомпьютеров и вычислительных ускорителей.
Процессор GP100 базируется на знакомой кластерной архитектуре. У него 6 кластеров GPC, каждый на 10 SM-блоков. А каждый SM оперирует 64 СUDA cores и 4 текстурными блоками.
Традиционно во всей линейке устройств NVIDIA архитектура кластера остается неизменной, меняется лишь их количество. Так что озвученное соотношение можно считать актуальным для GP104, GP106 и GP108 (если последний будет выпущен).
По аналогии с поколением Maxwell процессор средне-высокого уровня GP104 должен получить 4 кластера, GP106 получит 2 кластера, а самый простой чип ограничится 1 кластером. Наглядно это покажет еще одна иллюстрация, позаимствованная в одной из прошлых заметок Videocardz.
В таком случае GP104 при 4 кластерах получит 40 мультипроцессорных блоков SM с общим количеством вычислительных СUDA cores в 2560 штук. У GeForce GTX 980 на GM204 было 2048 таких ядер, сгруппированных в 16 SM. То есть рост минимальных вычислительных единиц небольшой, но их организация иная. Значительный рост SM-блоков позволит лучше распараллелить вычисления. Аналитики и журналисты сходятся на том, что GP104 получит 256-битную шину памяти. Лучшие на данный момент чипы GDDR5 могут обеспечить эффективную частоту 8 ГГц, более новая память GDDR5X обеспечит еще лучшие показатели пропускной способности.
Было бы логично, если бы GeForce GTX 1080 и GeForce GTX 1070 отличались типом памяти: GDDR5X обеспечила бы старшей модели лучшую ПСП, а GeForce GTX 1070 в случае использования простой памяти GDDR5 8 ГГц все равно получила бы рост ПСП относительно старых моделей Maxwell. Также традиционно идет дифференциация соседних продуктов на базе одного GPU за счет урезания некоторой части вычислительных блоков у младших версий. С нашей точки зрения наиболее логичным было бы отключение 4-8 блоков SM из 40 (вариант на 8 более реалистичен). Тогда GeForce GTX 1070 получит 2304 или 2048 СUDA cores. При таком соотношении у GeForce GTX 1080 будет 160 текстурных блоков, а у GeForce GTX 1070 от 144 до 128 текстурников.
Больше всего вопросов вызывает наличие некоей третьей модели на базе GP104. С нашей точки зрения ею может стать улучшенная версия GeForce GTX 1080 с более высокими частотами и гарантированной памятью GDDR5X. В качестве аргумента стоит снова обратиться к Tesla P100. В данном продукте активны не все вычислительные блоки (3584 из 3840 ядер CUDA), что говорит о трудностях с производством полноценных чипов этой серии. В такой ситуации выпуск топовой видеокарты на базе GP100 под вопросом, хотя это не исключает вероятность появления в будущем нового Titan с характеристиками на уровне Tesla P100. Например, ускоритель выселений Tesla M40 и GeForce GTX Titan X тоже являются аналогичными продуктами, причем графическая карта работает при более высоких частотах. А на фоне характеристик Tesla P100 с базовой частотой 1328 МГц и Boost-частотой 1480 МГц можно смело говорить, что любые графические вариации на GP100 и более простых GPU получат частоты не ниже, а только выше.
Так что у NVIDIA будет большой запас по частотам, который позволит регулировать производительность похожих продуктов. Например, GeForce GTX 1080 Ti на GP104 получит более высокую частоту ядра и самую быструю память GDDR5X, а GeForce GTX 1080 получит частоту ядра ниже и память GDDR5. Но пока это лишь предположения. Зато можно более-менее уверенно говорить о том, что реальные частоты GPU у таких видеокарт вполне могут приблизиться к отметке в 1,5 ГГц. Что касается памяти GDDR5X, то ее ПСП эквивалентна значениям эффективной частоты от 10 ГГц до 14 ГГц. Разница с простой память GDDR5 8 ГГц значительная.
Для лучшего наглядного сравнения приведем две таблицы с предполагаемыми характеристиками новых GeForce и с данными по актуальным решениях GeForce архитектуры Maxwell.
Предполагаемые характеристики линейки видеокарт Pascal
|
New GeForce GTX Titan (?) |
GeForce GTX 1080 Ti (?) |
GeForce GTX 1080 |
GeForce GTX 1070 |
GeForce GTX 1060 |
GeForce GTX 1050 |
Архитектура |
GP100 |
GP104 |
GP104 |
GP104 |
GP106 |
GP106 |
Кодовое имя GPU |
Pascal |
Pascal |
Pascal |
Pascal |
Pascal |
Pascal |
Количество транзисторов, млн. |
15300 |
≈8000 |
≈8000 |
≈8000 |
? |
? |
Техпроцесс, нм |
16nm FinFET |
16nm FinFET |
16nm FinFET |
16nm FinFET |
16nm FinFET |
16nm FinFET |
Площадь ядра, кв. мм |
610 |
≈333 |
≈333 |
≈333 |
? |
? |
Количество потоковых процессоров |
3584 |
2560 |
2560 |
2304-2048 |
1280 |
1152-1024 |
Количество текстурных блоков |
224 |
160 |
160 |
144-128 |
80 |
72-64 |
Частота ядра, МГц |
1300+ |
1300-1500 |
1300-1500 |
1300-1500 |
≈1500 |
≈1500 |
Шина памяти, бит |
4096/512 |
256 |
256 |
256 |
128 |
128 |
Тип памяти |
HBM2/ GDDR5X |
GDDR5X |
GDDR5X/GDDR5 |
GDDR5 |
GDDR5X/GDDR5 |
GDDR5 |
Эффективная частота памяти, МГц |
? |
10000+ |
8000+ |
8000 |
8000+ |
8000 |
Объём памяти, Гбайт |
16 |
8/16 |
8 |
8 |
4 |
4 |
Интерфейс |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
Уровень TDP, Вт |
<300 |
? |
? |
? |
? |
? |
Характеристики видеокарт Maxwell
|
GeForce GTX Titan X |
GeForce GTX 980 Ti |
GeForce GTX 980 |
GeForce GTX 970 |
GeForce GTX 960 |
GeForce GTX 950 |
Архитектура |
Maxwell |
Maxwell |
Maxwell |
Maxwell |
Maxwell |
Maxwell |
Кодовое имя GPU |
GM200 |
GM200 |
GM204 |
GM204 |
GM206 |
GM206 |
Количество транзисторов, млн. |
8000 |
8000 |
5200 |
5200 |
2940 |
2940 |
Техпроцесс, нм |
28 |
28 |
28 |
28 |
28 |
28 |
Площадь ядра, кв. мм |
601 |
601 |
398 |
398 |
228 |
228 |
Количество потоковых процессоров |
3072 |
2816 |
2048 |
1664 |
1024 |
768 |
Количество текстурных блоков |
192 |
176 |
128 |
104 |
64 |
48 |
Количество блоков ROP |
96 |
96 |
64 |
56 |
32 |
32 |
Частота ядра, МГц |
1000–1075 |
1000–1075 |
1126-1216 |
1051-1128 |
1126-1178 |
1124-1188 |
Шина памяти, бит |
384 |
384 |
256 |
256 |
128 |
128 |
Тип памяти |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
GDDR5 |
Эффективная частота памяти, МГц |
7010 |
7010 |
7010 |
7010 |
7010 |
6610 |
Объём памяти, Гбайт |
12 |
6 |
4 |
4 |
4 |
2048 |
Интерфейс |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
Уровень TDP, Вт |
250 |
250 |
165 |
145 |
120 |
90 |
Пока нет никаких данных о TDP новых продуктов. Заявленные 300 Вт для Tesla P100 настораживают, но GP104 и другие младшие GPU могут быть порезаны по части неграфических вычислений, что обеспечит лучший баланс экономичности и более низкие показатели потребляемой мощности. Вряд ли топовые решения на GP104 превысят отметку в 200 Вт, скорее всего, они будут близки к уровню TDP существующих GeForce GTX 980/970.
Также мы взяли на себя смелость составить прогноз по GeForce GTX 1060 и GeForce GTX 1050. О них пока вообще ничего не известно, недавние слухи лишь говорят о вероятности выхода видеокарт на базе GP106 осенью этого года. Данный чип получит 2 кластера, значит, решения на его базе сменят GeForce GTX 960 и GeForce GTX 950. Гипотетическая видеокарта GeForce GTX 1060 получит 20 блоков SM на 1280 CUDA cores. Шина памяти с большой вероятностью ограничится значением 128 бит. Летом обещают старт массового производства GDDR5X, поэтому GeForce GTX 1060 может получит такую память в объеме 4 ГБ. Но даже в случае использования более простых микросхем GDDR5 частота памяти будет не ниже 8000 МГц. Также на базе GP106 должен увидеть свет и более доступный продукт, как нынешний видеоадаптер GeForce GTX 950. Если он лишится 4 SM, то в его активе останется 1024 ядер CUDA. С целью максимального удешевления продукта можно ожидать на нем только память GDDR5. На фоне частот старших видеокарт такие бюджетные модели уж точно не должны получить частоты ниже 1500 МГц.
Насколько верны окажутся наши прогнозы, покажет время. Следите за новостями, читайте наши обзоры, подписывайтесь на нас ВКонтакте, Facebook и Twitter!