Около года назад компания NVIDIA представила старшие игровые решения на базе новой архитектуры Pascal, открыв дорогу новому поколению. Настало время обновить линейку GeForce GTX за счет нового флагманского продукта. Вначале были представлены две версии нового TITAN, которые выпускаются малым тиражом при высокой цене. А теперь на арену выходит новый чемпион массового рынка в лице GeForce GTX 1080 Ti, серьезно поднимающий планку производительности относительно предшественников. Все об архитектуре, технологических особенностях и производительности нового флагмана в данной статье. Рассмотрим стандартную референсную версию GeForce GTX 1080 Ti Founders Edition, проверим ее на разгон и сравним с GeForce GTX 1080.

В основе GeForce GTX 1080 Ti графический процессор GP102, который состоит из 6 кластеров GPC вместо 4 кластеров у GP104 (GeForce GTX 1080). И в целом GP102 напоминает первый чип поколения Pascal в лице GP100. Но если последний использовался строго для специализированных вычислительных устройств NVIDIA Tesla, то GP102 является уже оптимизированным чипом для игровых решений. В рамках архитектуры Pascal структура кластеров идентична, и один GPC включает 5 блоков TPC из мультипроцессорного массива SM и блока обработки геометрии PolyMorph Engine. В SM насчитывается 128 ядер CUDA, которые являются минимальной вычислительной единицей. Всего GP102 может оперировать 3840 ядрами CUDA. Также общий потенциал ядра включает 240 текстурных блоков TMU и 96 блоков ROP. 12 контроллеров памяти образуют общую шину разрядностью 384 бита.

Первым графическим ускорителем на базе GP102 стал TITAN X, и GeForce GTX 1080 Ti можно назвать его преемником. Оба продукта используют неполную конфигурацию вычислительных блоков. У GeForce GTX 1080 Ti активно 3584 процессора CUDA и 224 текстурных блока. Также частично урезана шина памяти — ее разрядность 352 бита. Объем памяти достигает 11 ГБ вместо 12 ГБ у TITAN X. Вероятно, производство массивных GPU на первых порах было связано с определенными трудностями. Поэтому полноценный GP102 увидел свет в виде реальных продуктов совсем недавно — это обновленный TITAN Xp с полной конфигурацией вычислительных блоков и небольшим повышением частот. И точно такие же частоты демонстрирует GeForce GTX 1080 Ti: для ядра базовый уровень 1480 МГц при среднем Boost Clock 1582 МГц, а эффективная частота памяти на уровне 11 ГГц.

Для наглядности мы привели характеристики всех трех видеокарт на базе процессора GP102 в одной таблице.

 

TITAN Xp

TITAN X

GeForce GTX 1080 Ti

Архитектура

Pascal

Pascal

Pascal

Кодовое имя GPU

GP102

GP102

GP102

Количество транзисторов, млн.

12000

12000

12000

Техпроцесс, нм

16

16

16

Площадь ядра, кв. мм

471

471

471

Количество потоковых процессоров

3840

3584

3584

Количество текстурных блоков

240

224

224

Количество блоков ROP

96

96

88

Частота ядра, МГц

1480-1582

1415-1531

1480-1582

Шина памяти, бит

384

384

352

Тип памяти

GDDR5X

GDDR5X

GDDR5X

Эффективная частота памяти, МГц

11016

10008

11016

Объём памяти, Гбайт

12

12

11

Интерфейс

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

Уровень TDP, Вт

250

250

250

Все видеокарты демонстрируют производительность примерно одного класса. TITAN Xp безусловно является самым быстрым игровым видеоускорителем, но отставание GeForce GTX 1080 Ti будет небольшим. А если говорить о TITAN X, то GeForce GTX 1080 Ti даже оказаться чуть быстрее из-за повышенных частот.

В сравнении с GeForce GTX 1080 прогресс весьма серьезный, ведь старый флагман оперировал только 2560 ядрами CUDA при 256-битной шине. У GeForce GTX 1080 Ti на 40% больше вычислительных блоков, а пропускная способность памяти выше примерно на 51%. Объем кэш-памяти L2 увеличен до 2,8 МБ вместо 2 МБ у GP104. Высокий объем памяти в 11 ГБ является рекордным для массовых игровых устройств. Единственным упрощением относительно GeForce GTX 1080 можно назвать более низкие частоты. Однако опыт реального сравнения покажет, то в игровой нагрузке средний Boost у них примерно на одном уровне.

Процессор GP102 насчитывает 12 миллиардов транзисторов вместо 7,2 млрд. у GP104. Поэтому возрос уровень тепловыделения и энергопотребления. При этом тепловой пакет TDP на уровне 250 Вт, что привычно для старых флагманов NVIDIA. GeForce GTX 980 Ti с процессором GM200 (8 млрд. транзисторов) демонстрировал такой же TDP, как и более старый флагман GeForce GTX 780 Ti. Производятся новые чипы по привычному уже 16-нм техпроцессу.

NVIDIA оценивает разницу в производительности между GeForce GTX 1080 Ti и GeForce GTX 1080 на уровне 35%, что выше различий между аналогичными продуктами старшей серии в предыдущих поколениях. Напрямую сравнить характеристики GeForce GTX 1080 Ti с предшественниками можно по нижней таблице.

 

GeForce GTX 1080 Ti

GeForce GTX 1080

GeForce GTX 980 Ti

Архитектура

Pascal

Pascal

Maxwell

Кодовое имя GPU

GP102

GP104

GM200

Количество транзисторов, млн.

12000

7200

8000

Техпроцесс, нм

16

16

28

Площадь ядра, кв. мм

471

314

601

Количество потоковых процессоров

3584

2560

2816

Количество текстурных блоков

224

160

176

Количество блоков ROP

88

64

96

Частота ядра, МГц

1480-1582

1607-1733

1000-1075

Шина памяти, бит

352

256

384

Тип памяти

GDDR5X

GDDR5X

GDDR5

Эффективная частота памяти, МГц

11016

10012

7010

Объём памяти, Гбайт

11

8

6

Интерфейс

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

Уровень TDP, Вт

250

180

250

GeForce GTX 1080 Ti работает с самой быстрой памятью GDDR5X. Для перехода к рекордной частоте в 11 ГГц инженеры NVIDIA тесно сотрудничали с производителями памяти, чтобы улучшить качество передачи сигнала и минимизировать электронный шум. Поэтому подсистема памяти подверглась определенной доработке и совершенствованию. И хотя такие частоты памяти при разгоне достижимы и на старых GeForce GTX 1080, от флагманского решения можно ожидать и общего повышения частотного потенциала GDDR5X. Практическое знакомство покажет, что максимальная планка разгона памяти у GeForce GTX 1080 Ti действительно выше. В сочетании с широкой 352-битной шиной получается пропускная способность 484 ГБ/с. Нужно отметить, что единственная игровая карта с прогрессивной HBM-памятью, AMD Radeon R9 Fury X, демонстрирует пропускную способность на уровне 512 ГБ/с, то есть разница минимальна. При этом архитектура Pascal использует прогрессивные методы компрессии цветовых данных, позволяя снизить объем передаваемых данных и поднять эффективность использования памяти. Подробнее об этом рассказывалось в нашем развернутом материале по технологическим возможностям Pascal.

Также в решениях Pascal и Maxwell поддерживается тайловое кэширование (Tiled Caching) на базе модифицированного метода тайлового рендеринга. Последний предлагает выполнять растеризацию изображения при разбиении на фрагменты (тайлы), что в некоторых случаях позволяет эффективнее использовать ресурсы. Тайловое кеширование частично использует такой подход в сочетании со стандартным рендерингом. Это снижает обращение к внешней памяти, увеличивая нагрузка на скоростной кэш L2.

Сочетание сжатия данных и тайлового кеширования позволяет существенно повысить эффективность передачи данных, доведя пропускную способность до теоретических 1,2 ТБ/с. В реальности эффективность всех улучшений зависит от программной поддержки в каждом приложении, поэтому заявленное значение является весьма условным. Хотя ясно, что в плане работы с памятью видеокарта GeForce GTX 1080 Ti — самое быстрое игровое решение, с которым может поспорить только TITAN X.

Сейчас в индустрии используется несколько графических API. Основным для многих игр остается DirectX 11 или OpenGL, но все больше новых проектов разрабатывается под DirectX 12 и Vulkan. Первые относятся к высокоуровневым API, где оптимизация во многом зависит от видеодрайвера. Вторые относятся к низкоуровневым, которые дают больше возможностей самому приложению, частично ограничивая оптимизацию на уровне драйвера.

Видеоадаптер GeForce GTX 1080 Ti готов эффективно работать со всеми API. В случае DirectX 11 мы имеем годы программной оптимизации и совершенствования архитектуры GPU NVIDIA. Поэтому актуальные модели GeForce GTX демонстрируют самые лучшие результаты в DirectX 11. В случае DirectX 12 пока все неоднозначно. Первые игры показывали стабильное падение производительности в сравнении с DirectX 11. Но постепенная оптимизация приложений и драйверов позволила улучшить ситуацию. Привычной стала ситуация, когда проходит несколько месяцев или даже полгода, и только тогда игра начинает работать быстрее именно в DirectX 12. Хорошее ускорение принесли последние версии видеодрайвера GeForce. И следующий слайд от NVIDIA демонстрирует, что на март этого года некоторые игры получили ускорение от 4% до 30%, если сравнивать с производительностью на момент релиза. Среди наиболее ярких примеров Hitman, Rise of the Tomb Raider. В список не попала игра Deus Ex: Mankind Divided, но и там уже удалось добиться более высокого fps в DirectX 12 в сравнении со старым DirectX 11.

Процесс разработки под DirectX 12 более ресурсоемкий. Важно иметь качественные инструменты для отладки приложений. Недавно Microsoft представила специализированную утилиту PIX для этих целей. NVIDIA поддержит разработчиков выпуском приложений nSight Visual Studio Edition 5.3 и NVIDIA Aftermath для дебаггинга и поиска ошибок.

 

Также NVIDIA расширяет набор инструментов GameWorks для реализации разных графических эффектов, внедряя поддержку DirectX 12. Многие эффекты уже нашли широкое применение в игровой индустрии, в частности глобальное затенение HBAO+, мягкие тени HFTS и PCSS, объемное освещение Volumetric Lighting. В качестве примера можно вспомнить Fallout 4, где используется HBAO+, освещение Volumetric Lighting и реализованы эффекты осколков на базе NVIDIA Flex. Подробно все это разобрано в специальном нашем обзоре.

Перевод GameWorks на платформу DirectX 12 дает больше свободы разработчикам, а также позволяет улучшить реализацию самих эффектов, задействовав возможности нового API. Под DirectX 12 уже адаптирована технология NVIDIA HairWorks, позволяющая визуализировать волосы и шерсть с проработкой отдельных волосков и достоверной физикой такого волосяного покрова. Динамическая шерсть и волосы хорошо знакомы игрокам по The Witcher 3: Wild Hunt.

Среди новых технологий GameWorks есть Turf Effects для визуализации сложной травы с более реальной физикой и мягким затенением. Эта технология нашла применение в Tom Clancy's Ghost Recon: Wildlands. Данная игра работает под DirectX 11, но технология совместима и с DirectX 12.

Большое внимание уделяется симуляции динамических сред и разрушаемости. Для реализации таких эффектов имеется целый пакет инструментов GameWorks. Например, Flex позволяет симулировать поведение рассыпчатых и жидких сред, WaveWorks воссоздает динамические волны на поверхности воды, Blast упрощает реализацию отдельных разрушаемых объектов.

В этом списке есть и NVIDIA GameWorks Flow для симуляции газов и огня. Пример реализации с использованием DirectX 12 показан в следующем видео:

Переход на DirectX 12 позволяет использовать новые возможности, в частности, асинхронные вычисления Async Compute. Это ускоряет вычисления для визуализации эффектов Flex и Flow. В качестве примера приводятся данные по симуляция частиц на базе Flex с использованием видеокарты GeForce GTX 1080: в среде DirectX 12 расчеты выполняются почти вдвое быстрее относительно DirectX 11.

Ускорение эффектов NVIDIA GameWorks на новом API позволит поднять и общий уровень производительности в играх. Поддержка GameWorks реализована в ряде крупных движков, включая последние версии Unreal Engine и Unity, также в списке перспективный открытый движок Amazon Lumberyard. GameWorks под DirectX 12 работает через программный интерфейс DirectCompute, поэтому эффекты должны поддерживаться не только GeForce GTX, но и AMD Radeon.

Тихими шагами продвигается вперед направление виртуальной реальности. GeForce GTX 1080 Ti обладает всеми преимуществами для работы с VR, поддерживая пакет инструментов NVIDIA VRWorks. Технологии Multi-Res Shading и Lens Matched Shading позволяют серьезно ускорить обработку изображения, подробнее об этом в статье по технологиям Pascal. В сочетании с изначально максимальной производительностью вы получаете лучшее решение для VR, купив GeForce GTX 1080 Ti.

В последнее время активно развиваются технологии на базе систем искусственного интеллекта с нейронными сетями. Такие самообучающиеся системы позволяют ускорить выполнение многих интеллектуальных задач. Специализированные аппаратные решения NVIDIA активно применяются для создания беспилотных транспортных средств. Ускорители Tesla используются в крупных вычислительных центах, и уже анонсировано новое поколение ускорителей Tesla V100. NVIDIA экспериментирует с применением технологий глубокого обучения в разных сферах, например, для распознавания и улучшения изображений, для воссоздания объектов по изображениям при помощи фотограмметрии. Недавно мы писали, что у NVIDIA есть наработки для ускорения обработки изображения при рендеринге с трассировкой лучей.

Все это пока далеко от рядового пользователя. Но есть у GeForce GTX и ряд особых возможностей для простых игроков. Развивается GeForce Experience, этот программный центр получает новые функции.

Приложение ShadowPlay для захвата видео получит новые возможности в ShadowPlay Highlights. Программа будет отслеживать активность пользователя, автоматически записывая самые насыщенные игровые моменты.

Все большую популярность приобретает NVIDIA Ansel – специальный инструментарий, который позволяет делать красивые постановочные скриншоты. С Ansel вы можете использовать свободную камеру для фоторежима, получать разные ракурсы, накладывать эффекты пост-обработки и сохранять изображения в сверхвысоких разрешениях. Подробнее о возможностях Ansel в отдельной статье.

Поддержка Ansel уже присутствует во многих популярных играх — The Witcher 3, Dishonored 2, For Honor, War Thunder, Watch Dogs 3 и других. SDK будет выложен в публичный доступ, что позволит любому разработчику внедрить поддержку Ansel в свой проект. Так что игр с поддержкой этого приложения станет еще больше.


Страница 1 из 4

  • Комментарии: 1

О проекте

Информационный портал Nvplay.ru посвящен электронным технологиям и компьютерной индустрии с акцентом на продукции NVIDIA. В центре нашего внимания видеокарты и компьютерные комплектующие, игры и игровые устройства, сопутствующее программное обеспечение и новые технологии.

Правила сайта NVPLAY.RU

Контакты

Сотрудничество, размещение рекламы и общие вопросы:

  • Email Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Для пресс-релизов и новостей:

  • Email Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Мы в соцсетях

Следите за нами в социальных сетях