Флагманские видеокарты являются острием прогресса графических технологий, подстегивая общий процесс развития видео ускорителей. В данном обзоре мы рассмотрим флагманы NVIDIA последних двух поколений на базе архитектуры Kepler и Maxwell, сравним их технические особенности и производительность. В центре внимания GeForce GTX 780 Ti, GeForce GTX 980 и GeForce GTX 980 Ti, которые заодно будут сравниваться с топовыми решениям от AMD в лице Radeon R9 290X, Radeon 390X и Radeon R9 Fury X. Шесть участников, шесть самых производительных одночиповых видеокарт, на примере которых можно будет наблюдать рост производительности за последние два года.

Наметившийся застой в производстве кремниевых кристаллов в рамках 28-нм техпроцесса послужил хорошим стимул для плотной работы в сфере архитектурных улучшений и изменений. Первые графические карты на базе архитектуры Kepler вышли еще в рамках серии GeForce GTX 600, где первое место было за GeForce GTX 680. Позднее эта карта трансформировалась в GeForce GTX 770, получив неплохое ускорение за счет повышения частот. В рамках Kepler была опробована тактика поэтапного выводы новых GPU. Вначале были выпущены решения на базе процессора GK104, которые в серии GTX 700 уже были переквалифицированы в средний класс, а новые флагманские карты базировались на более сложном процессоре GK100. По такой же схеме компания NVIDIA поступила с Maxwell — вначале лидер на базе не самого мощного GM204 (GeForce GTX 980), а спустя время появился более быстрый флагман на базе GM200 (GeForce GTX 980 Ti).

Процессор GK110 стал вершиной развития Kepler. Вычислительные блоки внутри его организованы в пять кластеров GPC (Graphics Processing Cluster). У каждого кластера три мультипроцессорных блока SMX со своей управляющей логикой и вычислительными блоками. Шесть контроллеров памяти обеспечивают обмен данных с внешней памятью по шине разрядностью 384 бита.

GPU GK110

Основной рабочей единицей являются вычислительные ядра CUDA cores в числе 192 штук. В активе одного SMX 16 текстурных блоков с выделенным кэшем 48 КБ, основной кэш L1 объемом 64 КБ, плюс дополнительный унифицированный сегмент кэш-памяти и кэш инструкций. Распределением нагрузки и управлением занимаются четыре планировщика с восемью блоками-диспетчерами. Обработкой геометрии занимается блок PolyMorph Engine 2.0 с выделенным внутренним тесселятором. Высокое количество блоков DP Unit в числе 64 штук на один SMX обеспечивают высокую производительность в вычислениях двойной точности FP64.

У этого процессора общий кэш L2 объемом 1,5 МБ при 48 ROP.

На базе GK110 было выпущено две массовые видеокарты в лице GeForce GTX 780 и GeForce GTX 780 Ti, которые дополнены первой версией Titan. Но только в GeForce GTX 780 Ti активны все вычислительные блоки, GeForce GTX Titan оперировал 2688 потоковыми процессорами CUDA, у GeForce GTX 780 их было 2304. Самые высокие рабочие частоты тоже у GeForce GTX 780 Ti. Базовое значение GPU установлено на 876 МГц при официальном Boost Clock 926 МГц. Три гигабайта памяти GDDR5 работают на эффективной частоте 7010 МГц.

Смена поколений в сегменте старших графических карт произошла с появлением GeForce GTX 980 и GeForce GTX 970 на базе процессора GM204 новой энергоэффективной архитектуры Maxwell. При первом взгляде на блок-схему кажется, что новый процессор компактнее, и это правда. У него четыре кластера GPC с обновленной архитектурой. В кластере по четыре мультипроцессора SMM с меньшим количеством CUDA cores.

GPU GM204

Общая структура SMM напоминает SMX, но с более четкой привязкой отдельных групп вычислительных блоков к четырем планировщикам. У каждого свой буфер инструкций и два управляющих блока-диспетчера. Текстурных блоков 8, у них есть свой кэш. Общий кэш L1 увеличился до 96 КБ. PolyMorph Engine стал работать быстрее и получил индекс 3.0.

Всего а распоряжении GM204 оказывается 2048 вычислительных ядер при 128 текстурных блоках, 64 блока ROP и кэш L2 объемом 2 МБ. Шина памяти 256 бит, стандартный объем памяти 4 ГБ.

По структуре GM204 можно рассматривать в качестве приемника GK104, у них и номерной индекс одинаков. И по некоторым характеристикам GM204 явно слабее GK110. Тем не менее, реорганизация структуры процессора и повышение быстродействия различных его блоков позволяет видеокарте GeForce GTX 980 на новом чипе быть производительнее GeForce GTX 780 Ti. В GM204 более гибкое управление ресурсами — 2048 потоковых процессора организованы в 16 SMM вместо 15 SMX с 2880 процессорами у GK110. При этом каждый мультипроцессор работает со своим кэшем, объем которого только возрос. И блоков обработки геометрии уже 16 вместо 15. Повышение рабочих частот дополнительно усиливает потенциал GM204. Базовая частота процессора GeForce GTX 980 установлена на значение 1126 МГц при Boost Clock 1216 МГц, эффективная частота памяти 7010 МГц.

Самым слабым местом кажется 256-битная шина памяти. Но это самая быстрая 256-битная шина благодаря новому методу компрессии данных, что позволяет ей быть более эффективной. А увеличенный кэш в какой-то степени уменьшает обращения к внешней памяти.

GM204 и GK110 выполнены в рамках 28-нм техпроцесса, но в первом 5,2 миллиарда транзисторов вместо 7,1 у второго. Благодаря этому новый процессор компактнее. В сочетании с более экономичной архитектурой это дает еще более значительное снижение энергопотребления и тепловыделения. Если для GeForce GTX 780 Ti заявлен термопакет TDP 250 Вт, то у GeForce GTX 980 TDP 165 Вт.

Следующим этапом развития графических решений стало появление процессора GM200. Он сохранил все особенности GM204, но стал больше, насчитывая уже 6 кластеров GPC с 24 SMX. Это дает 3072 потоковых процессора и 192 текстурных блока. Кэш L2 вырос до 3 МБ, блоков ROP 94. Шина памяти разрядностью 384 бит.

GPU GM200

Вот только вся эта мощь предлагается лишь в GeForce GTX Titan X. В рамках массового серийного производства нам предложен видеоадаптер GeForce GTX 980 Ti с 2816 потоковыми процессорами и 176 текстурными блоками при полном сохранении кэша, ROP и 384-битной шины. Частоты GPU установлены на уровне 1000/1075 МГц (Base/Boost), память объемом 6 ГБ работает на 7010 МГц.

Кристалл GM200 стал самым большим среди 28-нм продуктов NVIDIA, превысив по размерам GK110. Но заявленный уровень TDP у флагмана GeForce GTX 980 Ti вписался в знакомые рамки 250 Вт.

Для наглядности сведем все параметры топовых видеокарт двух серий в одну таблицу.

 

GeForce GTX TitanX

GeForce GTX 980 Ti

GeForce GTX 980

GeForce GTX 780 Ti

GeForce GTX Titan

GeForce GTX 780

Архитектура

Maxwell

Maxwell

Maxwell

Kepler

Kepler

Kepler

Кодовое имя GPU

GM200

GM200

GM204

GK110

GK110

GK110

Количество транзисторов, млн.

8000

8000

5200

7100

7100

7100

Техпроцесс, нм

28

28

28

28

28

28

Площадь ядра, кв. мм

601

601

398

561

561

561

Количество потоковых процессоров

3072

2816

2048

2880

2688

2304

Количество текстурных блоков

192

176

128

240

224

192

Количество блоков ROP

96

96

64

48

48

48

Частота ядра, МГц

1000–1075

1000–1075

1126–1216

876-926

836-876

863-900

Шина памяти, бит

384

384

256

384

384

384

Тип памяти

GDDR5

GDDR5

GDDR5

GDDR5

GDDR5

GDDR5

Эффективная частота памяти, МГц

7010

7010

7010

7010

6008

3072

Объём памяти, Мбайт

12288

6144

4096

3072

6144

3072

Интерфейс

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

PCI-E 3.0

Уровень TDP, Вт

250

250

165

250

250

250

Возможно, у вас вызовет вопрос, почему был сделан скачок от GeForce GTX 700 к GeForce GTX 900. Связано это с тем, что в мобильном сегменте уже были представлены видеокарты серии GeForce GTX 800, поэтому все новое поколение было решено перенести в серию в более высоким порядковым номером.

Стоит отметить, что заявленные частоты Boost Clock являются относительными значениями. Все GeForce поддерживают GPU Boost 2.0. Частота процессора варьируется в определенных рамках при условии поддержания заданных ограничений по мощности и температуре. Если эти лимиты не превышены, частота стремится к максимуму, превышая официальный Boost Clock. По мере приближения к граничным значениям частота постепенно снижается.

Кроме наращивания производительности новое поколение флагманов принесло поддержку и новых технологий. Maxwell поддерживает новый алгоритм просчета освещения Voxel Global Illumination (VXGI). Сцена разбивается на воксели, для каждого из которых просчитывается отраженный свет с учетом множества параметров.

Это позволяет добиться более реалистичной картинки с рассеянным освещением и влиянием объектов друг на друга. Ниже приведена живая видеодемонстрация VXGI на базе Unreal Engine 4.

Графические процессоры Maxwell поддерживают новое многокадровое сглаживание MFAA (Multi-Frame Antialiasing). Оно обеспечивает качественную картинку уровня MSAA при меньших потерях производительности. В MSAA используются фиксированные шаблоны выборки сэмплов. В MFAA позиции выборки программно изменяются при обработке разных кадров. Итоговое же изображение при наложении кадров получается на уровне MSAA.

По оценкам NVIDIA новое сглаживание MFAA примерно на 30% быстрее аналогичных режимов MSAA. Поскольку используются особые аппаратные возможности Maxwell, то на более старых видеокартах это сглаживание недоступно. Сам этот режим требует принудительной активации через NVIDIA Control Panel. Заходите в управление 3D параметрами, найдите пункт управления MFAA и включаете его. При этом включаете MSAA в нужной игре, а MFAA его замещает.

С появлением девятисотой серии GeForce была внедрена технология DSR (Dynamic Super Resolution), позволяющая задействовать разрешения выше возможностей вашего монитора, что обеспечивает лучшую детализацию и определенное уменьшение «гребенки» на границах объектов, как при сглаживании. Но это не эксклюзив Maxwell, такой режим работает и на GeForce GTX 700. Активируется тоже через «Панель управления NVIDIA». В качестве небольшого наглядного пособия можно рекомендовать нашу статью по улучшению графики в Metal Gear Solid V: The Phantom Pain.

Начиная с Fermi (GeForce GTX 400 и GeForce GTX 500) графические карты NVIDIA могут использовать сглаживание TXAA, сочетающее аппаратные методы обработки изображения с дополнительными фильтрами постобработки, которые используются для высококачественной графики при создании кинофильмов. Это сглаживание лишено недостатков, которые могут возникать при других методиках во время движения объектов, обеспечивая плавное изображение без зубчатых краев и «ступенек». Но TXAA немного смазывает картинку, снижая четкость.

Последние GPU Maxwell обладают более полной поддержкой DirectX 12 на уровне Feature Level 12.1. Первое поколение Maxwell в лице единственного процессора GM107 поддерживает Feature Level 12.1, а Kepler совместимы с Feature Level 11.1. DirectX 12 обеспечивает лучшее управление аппаратными ресурсами и предоставляет новые возможности визуализации. Среди них поддержка tiled resources, которые можно использовать для рендеринга с использованием карт теней разного разрешения. Более продвинутый вариант объемных тайловых ресурсов volume tiled resources позволяет работать с трехмерными объектами, разбивая их текстуры на тайлы и отображая в нужный момент времени необходимые тайлы. Этот метод позволяет улучшить визуализацию объемных эффектов дыма или огня.

Еще одна новая технологическая возможность DirectX 12 с аппаратной поддержкой Maxwell — консервативная растеризация (Conservative Raster). В обычном режиме при наложении геометрии отрисовываются только пиксели, которые попали внутрь треугольника, с консервативной растеризацией все пиксели, которые перекрывает треугольник. Это необходимая функция для работы VXGI на этапе разбиения сцены на воксели.

Еще одна сфера применения такой растеризация — высококачественные детализированные тени. Сочетание Conservative Raster и трассировки лучей дает идеальные правильные контуры.

Видеодемонстрация реализации описанных возможностей приведена ниже.

Все видеокарты Kepler имеют встроенный аппаратный видеокодер NVENC c поддержкой H.264. Благодаря этому в свое время была реализована функция записи игрового процесса силами GPU под названием ShadowPlay. В GM200 и GM204 блок-кодировщик стал быстрее, появилась поддержка H.265, что обеспечило поддержку захвата видео «на лету» в разрешении вплоть до 4K при 60 Гц.

Аппаратное ускорение видео H.264 и MPEG-2 при воспроизведении обеспечивает встроенный декодер PureVideo. Тут особой разницы между разными GeForce нет, все флагманы поддерживают формат 4K и близкие значения, но блок-декодер Maxwell быстрее.

Еще одним преимуществом Maxwell является поддержка HDMI 2.0 с возможностью вывода изображения на телевизор 4K при 60 Гц. Сами видеокарты могут выводить изображение вплоть до 5120x3200 при 60 Гц.

Все указанные GeForce поддерживают адаптивную вертикальную синхронизацию. При высоком fps могут возникать разрывы кадра (tearing) при превышении частоты обновления монитора. Вертикальная синхронизация решает эту проблему, подстраивая вывод кадров к частоте монитора. Но в тяжелых приложениях, когда видеокарта не может обработать 60 кадров, получаются серьезные просадки до 30 fps. Это решает Adaptive VSync, которая отключает синхронизацию, если видеокарта начала выдавать менее 60 fps.

Адаптивная синхронизация активируется из настроек «Панели управления NVIDIA», замещая стандартные игровые параметры.

Максимальную плавность смены кадров обеспечивает технология NVIDIA G-Sync. Она обеспечивает полную синхронизацию видеокарты и выводимого на экран изображения. Но кроме видеокарты GeForce требуется соответствующий монитор со специальным аппаратным блоком.

Программные технологии визуализации различных эффектов теперь объединены в направление NVIDIA GameWorks. Сюда относятся улучшенное глобальное затенение HBAO+, мягкие тени PCSS, улучшенные лучи света и физические эффекты PhysX. Последние активно применяются в игре Batman: Arkham Knight, а наш соответствующий материал станет хорошей их иллюстрацией. Статьи по графике Far Cry 4 и Witcher 3: Wild Hunt позволят ознакомиться с другими технологиями, среди которых NVIDIA HairWorks.

Большинство эффектов GameWorks не ограничены видеокартами NVIDIA и могут работать на любых графических устройствах, вопрос лишь в производительности. Поэтому флагманы всегда могут предложить больше, особенно, если речь о PhysX-эффектах, которые отличаются особой ресурсоемкостью.

В последнее время началось бурное развитие устройств виртуальной реальности. ИNVIDIA уже представила набор технологий NVIDIA GameWorks VR с оптимизациями для такого режима. В VR-очках используется специальная оптика для формирования нужного угла обзора. Эти линзы искажают изображение по краям, часть картинки на периферии вообще выпадет из зоны видимости.

Nvidia Multi Resolution Shading обеспечивает вывод картинки с учетом изменения геометрии при проецировании. Исходное изображение разбивается на несколько зон с разным разрешением. Это экономит ресурсы и ускоряет производительность, что весьма ценно в условиях, когда для каждого глаза нужно рендерить свое изображение.

Теперь давайте взглянем на референсные видеокарты и их охлаждение.


Страница 1 из 3

  • Комментарии: 4

Комментарии:

О проекте

Информационный портал Nvplay.ru посвящен электронным технологиям и компьютерной индустрии с акцентом на продукции NVIDIA. В центре нашего внимания видеокарты и компьютерные комплектующие, игры и игровые устройства, сопутствующее программное обеспечение и новые технологии.

Правила сайта NVPLAY.RU

Контакты

Сотрудничество, размещение рекламы и общие вопросы:

  • Email Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Для пресс-релизов и новостей:

  • Email Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

Мы в соцсетях

Следите за нами в социальных сетях