Состоявшийся недавно анонс NVIDIA GeForce GTX 1080 открывает эру Pascal. Новая архитектура предлагает ряд усовершенствований и поддержку новых технологий. А GeForce GTX 1080 является самым прогрессивным продуктом компании в игровом сегменте. О технических особенностях нового графического ускорителя и возможностях архитектуры Pascal мы поговорим в данной статье.
Компания NVIDIA выделяет пять основных преимуществ Pascal:
- архитектура GPU нового поколения
- 16-нм процесс FinFET
- передовая память GDDR5X
- «высокое мастерство» (сочетание высоких частот и низкого энергопотребления)
- потрясающие игровые технологии.
Все эти аспекты будут раскрыты в данном материале. Результаты практического знакомства с тестированием производительности будут представлены в одной из последующих статей.
GPU GP104 и GeForce GTX 1080
В течении последних лет производители GPU развивали свои решения в рамках 28-нм техпроцесса, поскольку переход на более тонкое производство в значительной мере затянулся, да и сам прогресс в этой области замедлился. Регулярная смена техпроцесса позволяла наращивать транзисторный бюджет новых процессоров, удерживая энергопотребление в разумных пределах. Новые условия выдвинули новые требования, и компания NVIDIA отлично ответила на этот вызов. Нынешняя серия видеокарт на архитектуре Maxwell предложила лучшее сочетание производительности и энергоэффективности за счет архитектурных улучшений. Pascal продолжает это эволюционное движение, а новый техпроцесс 16-нм FinFET обеспечивает еще лучшую экономичность. GeForce GTX 1080 является первой видеокартой, чей GPU произведен в рамках нового технологического процесса.
Сам процессор носит кодовое имя GP104. Как следует из его номера, он является преемником GM204. Ранее компания NVIDIA представила ускоритель вычислений Tesla P100 на базе более сложного процессора GP100. Но данный продукт рассчитан для применения в суперкомпьютерах и в сфере графики пока не применятся. Поэтому если говорить об обычных графических картах, то GeForce GTX 1080 действительно является пионером Pascal, а GP104 — первый чип новой архитектуры для массового рынка.
Взглянем на схему GPU GP104.
Общая организация GPU напоминает старый GM204, который является основной для GeForce GTX 980 и GeForce GTX 970. В процессоре четыре кластера GPC. Регулируя количество этих кластеров, производитель легко масштабирует производительность разных решений. У GP100 шесть кластеров. Более слабый GP106, который может стать основной для GeForce GTX 1060 или GeForce GTX 1050, получит два кластера, как современный GM206. Внутри кластера вычислительные блоки сгруппированы в пять мультипроцессоров SM вместо четырех аналогичных мультипроцессоров у нынешних Maxwell. То есть при аналогичном количестве кластеров новые GPU будут оперировать большим количеством вычислительных блоков.
Каждый SM связан с движком обработки геометрии PolyMorph Engine, такая связка теперь носит название TPC. PolyMorph Engine получили серьезные нововведения, которые ускоряют VR-рендеринг, о чем подробнее будет расписано ниже. Мультипроцессор кардинальных изменений не получил, его структура повторяет мультипроцессоры Maxwell. Вычислительные блоки сгруппированы в четыре массива обработки данных со своей управляющей логикой. Основной вычислительной единицей является потоковый процессор CUDA. Всего в активе SM насчитывается 128 таких CUDA cores. Они работают в связке с 8 текстурными блоками. Есть выделенный текстурный кэш и внутренний кэш L2 объемом 95 КБ (аналогично Maxwell). В итоге один кластер GPC насчитывает 640 потоковых процессоров и 40 текстурных блоков вместо 512 CUDA cores и 32 TMU в кластере Maxwell.
Полная версия GPU GP104 насчитывает уже 2560 CUDA cores и 160 TMU. Для сравнения нужно сказать, что GeForce GTX 980 на GM204 имеет в активе 2048 CUDA cores и 128 TMU, а GeForce GTX 980 Ti может похвастать 2816 ядрами и 96 текстурными блоками.
У процессора GP104 общий кэш L2 объемом 2 МБ и 64 связанных с ним боков ROP, что аналогично характеристикам GM204. Была изменена подсистема памяти. При общей разрядности шины в 256 бит внутри ядра восемь раздельных 32-битных контроллеров вместо привычного сочетания четырех 64-битных контроллеров. Процессор получил поддержку памяти нового стандарта GDDR5X. У GeForce GTX 1080 такие микросхемы работают со скоростью передачи данных в 10 Gbps, т.е. эффективное значение частоты 10 ГГц. Высокие частоты новой памяти требуют особого подхода к разводке линий на плате и структуре самого GPU для минимизации длины проводников и предотвращению электронных помех. Все это реализовано в новых видеокартах Pascal. Была оптимизирована и изменена компоновка самого GPU, что видно на небольшом фото в левой части нижнего слайда. Реальная компановка отличается от симметричной схемы, приведенной выше, в то время как Maxwell GM204 в кремнии строго повторял свою упорядоченную структуру с блок-схемы.
При росте физической и эффективной частоты новая память GDDR5X работает на пониженном напряжении 1,35 В, что делает ее более экономичной. Также в Pascal улучшено сжатие данных в буфере кадра, что повышает эффективность работы с 256-битной шиной. В итоге мы имеем видеокарту GeForce GTX 1080, которая производительнее GeForce GTX 980 Ti и GeForce GTX Titan X с 384-битным интерфейсом памяти.
Оптимизация структуры ядра и новый техпроцесс позволили значительно поднять рабочие частоты GPU. Согласно заявлениям производителя Maxwell при простом переходе на 16-нм не мог бы обеспечить тех частот, которые возможны на Pascal. Для GeForce GTX 1080 базовое значение частоты установлено на уровне 1607 МГц при Boost Clock 1733 МГц. Вторая величина отражает среднюю частоту в Boost-режиме.
Размеры кристалла у GP104 меньше, чем у GM204, но транзисторов больше на 38%. Энергопотребление нового флагмана ближе к предшественнику GeForce GTX 980. Для GeForce GTX 1080 заявлен уровень TDP в 180 Вт, что на фоне нынешнего лидера GeForce GTX 980 Ti с 250 Вт выглядит весьма скромным значением.
|
GeForce GTX 1080 |
GeForce GTX 980 Ti |
GeForce GTX 980 |
Архитектура |
Pascal |
Maxwell |
Maxwell |
Кодовое имя GPU |
GP104 |
GM200 |
GM204 |
Количество транзисторов, млн. |
7200 |
8000 |
5200 |
Техпроцесс, нм |
16 |
28 |
28 |
Площадь ядра, кв. мм |
314 |
601 |
398 |
Количество потоковых процессоров |
2560 |
2816 |
2048 |
Количество текстурных блоков |
160 |
176 |
128 |
Количество блоков ROP |
64 |
96 |
64 |
Частота ядра, МГц |
1607-1733 |
1000–1075 |
1126-1216 |
Шина памяти, бит |
256 |
384 |
256 |
Тип памяти |
GDDR5X |
GDDR5 |
GDDR5 |
Эффективная частота памяти, МГц |
10010 |
7010 |
7010 |
Объём памяти, Мбайт |
8192 |
6144 |
4096 |
Интерфейс |
PCI-E 3.0 |
PCI-E 3.0 |
PCI-E 3.0 |
Уровень TDP, Вт |
180 |
250 |
165 |
Улучшения архитектуры и высокие частоты обеспечивают преимущество GeForce GTX 1080 над GeForce GTX 980 примерно в 1,7 раз по оценке NVIDIA. Столь весомый отрыв характерен для простых игра, а при работе с виртуальной реальностью (VR) разница чуть ли не трехкратная.
Конструкция видеокарты GeForce GTX 1080 напоминает актуальные модели Maxwell старшего сегмента. Слегка изменились очертания корпуса, охлаждение без изменений.
Детальнее об отдельных аспектах новой архитектуры и о новых технологиях ниже.
GPU Boost 3.0
В Pascal реализована новая версия GPU Boost. Эта технология позволяет ускорять видеокарту относительно базового значения, которое является гарантированным для любых режимов нагрузки. Если при этом GPU не превышает установленные ограничения по максимальной температуре и мощности, то его частота может повышаться на какое-то определенное значение. Для нерефенсных Maxwell с хорошим охлаждением типичной является ситуация, когда в играх итоговая частота всегда превышает даже официальный Boost Clock. Попутно с изменением частоты регулируется напряжение, но общее значение смещения частоты относительно напряжения фиксированное. В GPU Boost 3.0 это значение может меняться, что позволит при каких-то напряжениях получать больший выигрыш от Boost, чем это позволял бы старый алгоритм.