Трассировка лучей и ядра RT
Главным преимуществом архитектуры Turing является возможность трассировки лучей в реальном времени. Именно эта технология обусловила смену названия видеокарт на GeForce RTX.
При стандартной растеризации объекты проецируются на плоскость экрана, обработка пикселей происходит с учетом расстояния до плоскости проекции. Трассировка имитирует прохождение лучей света в среде к каждому пикселю, позволяя получить более реалистичное изображение. Трассировка корректно учитывает освещенность каждой точки и взаимное влияние объектов друг на друга.
Поскольку растеризация уже давно используется в индустрии, то в современной графике много методов, где достигается результат, схожий с трассировкой, но все они связаны с некоторыми упрощениями. Трассировка лучей позволяет получить наиболее достоверную картинку, особенно в сложных сценах, где надо учитывать взаимное влияние прямого и отраженного света, учитывать свойства материалов, например, для полупрозрачных предметов.
Трассировка лучей позволит создавать реалистичные динамические тени, четкость и размытость которых будет определяться направлением освещения и рассеянностью света. Кстати, можно вспомнить, что схожий эффект обеспечивает технология NVIDIA HFTS. Также будет реализовано реалистичное глобальное затенение. Трассировка позволит достичь живых отражений и бликов с учетом свойств объектов, и того, как они влияют друг на друга, отражая свет или создавая дополнительные тени. Все это хорошо показано в демонстрационном ролике от NVIDIA:
На данный момент мы имеем первый этап внедрения трассировки лучей. Никто не говорит о полном отходе от классической растеризации в сторону нового метода рендеринга. Сама NVIDIA понимает, что производительность существующих аппаратных решений этого не позволяет. Поэтому компания внедряет гибридный рендеринг, сочетающий стандартные методы формирования изображения с трассировкой, которая будет использоваться для отдельных визуальных эффектов. При помощи трассировки можно будет улучшить тени, освещение, отражения, глобальное затенение и т.п.
Первым примером практически реализации такого подхода стала шутер Battlefield V, в котором трассировка используется для более достоверных и детализированных отражений.
Разработчики Atomic Heart обещают в игре реализовать и тени, и отражения с трассировкой. Первая демонстрация выглядит весьма привлекательно, особенно там, где показаны сложные отражения с зеркалами.
Также обещаны реалистичные тени в Shadow of the Tomb Raider, но мы все еще ждем соответствующего обновления. Трассировка будет в Metro Exodus. Новую технологию обкатывают авторы шутер Enlisted от компании Gaijin. Список игр с трассировкой будет постепенно расширяться. Надо учитываться, что это абсолютно новая технология и полноценная реализация ее возможна только на видеокартах GeForce RTX. Вряд ли она станет повсеместной в ближайший год-два. Вспомните, сколь мало игр до сих пор используют DirectX 12. Вот только в случае с трассировкой вы реально получите какие-то визуальные улучшения, и это может стать хорошим стимулом для перехода на новые графические ускорители NVIDIA.
Трассировка лучей реализуется на базе DirectX 12 через расширение DXR, которое было добавлено в Windows 10. Также эта технология появится и на базе API Vulkan. DXR позволяет реализовать трассировку на любом устройстве, однако именно GeForce RTX могут обеспечить достойную производительность благодаря соответствующим аппаратным возможностям и новым блокам RT. Сочетание аппаратных возможностей и программных оптимизаций именуется NVIDIA RTX.
При просчете траектории луча идет поиск пересечения с треугольниками объекта, что реализовано через иерархию ограничивающих объемов Bounding Volume Hierarchy (BVH). Ядра RT ускоряют расчеты при работе BVH. Старые GPU без этих ядер выполняют множество дополнительных операций.
Теоретически семейство Pascal может обрабатывать трассировку, но из-за программной эмуляции BVH эффективность будет невысокой. Если GeForce GTX 1080 Ti обрабатывает до 1,1 гигалучей в секунду (GigaRays/s), то производительность GeForce RTX 2080 Ti достигает 10 гигалучей в секунду. Внушительный разрыв.
Стоит также отметить, что на финальных этапах требуется обработка изображения для удаления шумов после трассировки. И тут в дело идут интеллектуальные алгоритмы на базе глубокого обучения, используя для расчетов тензорные ядра.
На данный момент все это реализуется в режиме гибридного рендеринга. Трассировка используется наряду с растеризацией, на определенный этапах идет вызов новых функций, а GPU одновременно выполняет разные операции.
Комбинированная нагрузка, где задействованы разные блоки GPU, требует нового подхода к оценке общей производительности. По данным NVIDIA распределение нагрузки примерно такое: при активном DLSS около 20% времени формирования кадра нужно для тензорных вычислений и 80% для обычного рендеринга с вычислениями FP32 на ядрах CUDA; при активной трассировке соответствующие операции займут около 40%, а доля вычислений INT32 до 28%.
Поэтому NVIDIA вводит новую единицу измерений RTX-OPS для оценки комплексной производительности:
RTX-OPS = TENSOR * 20% + FP32 * 80% + RTOPS * 40% + INT32 * 28% (Tera-OPS)
По этому показателю разница между новыми видеокартами и старыми решениями весьма внушительная. GeForce RTX 2080 Ti обеспечивает 76-78 Tera-OPS, GeForce RTX 2080 выдает 57-60 Tera-OPS, а старый видеоадаптер GeForce GTX 1080 Ti лишь 11,3 Tera-OPS.
Виртуальная реальность VR
Устройства виртуальной реальности VR заняли небольшую нишу общего рынка, но продолжают постепенно расти. GeForce RTX станут самыми быстрыми видеокартами для VR, что связано как с банальным наращиванием вычислительной мощности, так и с рядом оптимизаций.
Описанная выше технология Texture Space Shading (TSS) имеет тут хорошие перспективы. TSS позволяет использовать одинаковые тексели для формирования изображения под каждый глаз. Вызов новых текселей идет лишь в случае обновления картинки и движения.
Поддерживается технология Multi-View Rendering, которая является улучшенным вариантом Simultaneous Multi-Projection. Позволяет отрисовывать изображение в разных проекциях с просчетом геометрии одновременно для нескольких проекций. Поддерживает до 32 проекций с большими возможностям смещения точек обзора и углом обзора до 200 градусов.
Также Turing поддерживает NVIDIA VRWorks Audio для просчета объемного звука. Данный метод использует трассировку лучей для симуляции распространения звука в окружающем пространстве. Это очень важно для эффекта погружения в виртуальной реальности. Обработка звука не столь ресурсоемка, как графические эффекты, но и тут GPU Turing оказывается в несколько раз быстрее Pascal, что немаловажно.
Вывод изображения и кодирование видео
У Turing новый блок вывода изображения с интегрированной поддержкой HDR и высоких разрешений. Появилась поддержка DisplayPort 1.4a с возможностью передавать картинку формата 8K при 60 Гц, плюс технология сжатия данных VESA Display Stream Compression (DSC) 1.2. Turing может работать с двумя дисплеями 8K при частоте 60 Гц с HDR. Рекомендуется подключать HDR-мониторы стандарта BT.2100.
Всего у видеокарт GeForce RTX три порта DisplayPort плюс один HDMI 2.0b с поддержкой HDCP 2.2. дополняет этот набор портов VirtualLink, выполненный в формате USB Type-C. VirtualLink разработан для простого подключения гарнитур VR, но также может выводить изображение на 8K-дисплей.
Не обошлось без улучшений в блоке кодирования видео NVENC. Быстрый аппаратный кодировщик x264 обеспечивает минимальное загрузку CPU при стриминге. Заявлено повышение эффективности кодирования HEVC до 25% и до 15% для H.264. Появилась поддержка кодирования видео H.265 8K при 30 кадрах. Интересно, будут ли обновления в качестве захвата для Shadowplay, пока тут доступно 4K при 60 кадрах, без новых режимов. Обновлен декодер для воспроизведения видеоконтента: поддерживается декодирование HEVC YUV444 10/12b HDR с частотой 30 кадров в секунду, H.264 8K и VP9 10/12b HDR.
SLI
Время повсеместно доступного SLI постепенно уходит. Теперь это прерогатива старших видеокарт. В новом поколении вы можете использовать лишь две видеокарты, и сам режим доступен только для GeForce GTX 2080 Ti или GeForce GTX 2080. Для передачи данных в SLI используется скоростной интерфейс NVLink второго поколения. В TU102 реализовано две линии x8 второго поколения NVLink, а в TU104 одна линия x8. Двунаправленная пропускная способность одной линии составляет 50 Гбайт/с. Благодаря новому интерфейсу SLI поддерживаются новые высокие разрешения. Для GeForce GTX 2080 в SLI доступны 8K, 4K Surround при 144 Гц или 5K при 75 Гц. GeForce GTX 2080 Ti поддерживает дополнительно 8K Surround.
Премиальный статус SLI подчеркивает даже стоимость аксессуаров. Мостик SLI NVLink оценен в 79 долларов.
GPU Boost 4.0
Новые видеокарты получили поддержку GPU Boost 4.0. С новой версией пользователю становится доступно больше настроек для регулировки Boost. Через специальные утилиты будет доступно две температурные точки, что позволит более гибко настраивать кривую частот и температур. Это может быть важно для энтузиастов, но абсолютно неважно для рядового игрока.
GeForce RTX Founders Edition
Кроме технологических изменений на уровне GPU важные изменения произошли и в референсных видеокартах Founders Edition. Такие модели всегда отличались повышенной ценой, что ранее оправдывалось ранними сроками выхода на рынок. Теперь Founders Edition могут похвастать повышенными частотами и качественным охлаждением.
Впервые за долгие годы NVIDIA отказалась от классической «турбины». Новый кулер использует популярный подход – большой радиатор и два вентилятора для обдува.
При этом радиатор лишен тепловых трубок, но занимает всю площадь над платой. Качественный отвод тепла от кристалла реализован благодаря испарительной камере в основании.
С новым охлаждением GeForce RTX тише и холоднее старых решений семейства Pascal стандартной конструкции.
Новый кулер весьма эффективен на GeForce RTX 2070/2080. А вот GeForce RTX 2080 Ti уже греется не хуже старых флагманских решений, сказывается высокий уровень тепловыделения топового процессора TU102. Подробнее о температурах и шуме мы поговорим в отдельных обзорах видеокарт.
В NVIDIA уделили особое внимание разгону. Видеокарты получили доработанную систему питания, обеспечивающую лучшую стабильность при высоких нагрузках. У GeForce RTX 2080 Ti ядро запитано от 10-фазного преобразователя напряжения.
Также в GeForce RTX появился встроенный тест для проверки на стабильность NVIDIA Scanner. Сейчас он доступен в утилите EVGA Precision X1, но будет доступен и в других специализированных программах. NVIDIA Scanner может автоматически подобрать оптимальное значение для разгона GPU, найдя стабильный потолок частот. Это безусловно удобно, но разгон памяти по-прежнему придется подбирать в ручном режиме.
Ansel RTX
В конце нужно отметить о новых функциях, которые будут доступны пользователям через GeForce Experience. Это улучшенный фоторежим Ansel RTX с уникальными возможностями для GeForce RTX.
NVIDIA Ansel RTX использует трассировку лучей в совместимых играх. Например, в Assetto Corsa Competizione вы можете остановить игру, покрутить камеру в свободном режиме и выбрать удачный ракурс. И в режиме Ansel увеличивается количество лучей в сцене, улучшая проработку отражений и теней.
Также появилась возможность делать качественные снимки повышенного разрешения благодаря AI Up-Res. Это технология использует тензорные ядра GPU для интеллектуального качественного масштабирования, что позволяет даже с монитором Full HD делать качественные четкие скриншоты вплоть до разрешения 8K.
Добавлены многочисленные фильтры и особые возможности наложения, позволяющие вырезать фон или добавлять стикеры. Это доступно владельцам всех видеокарт GeForce. В обзоре фоторежима Ansel для игры Vampyr мы подробно разбирали основные нововведения.
Выводы
Turing является самой передовой графической архитектурой, которая обладает рядом улучшений для повышения шейдерной производительности. Новые GPU заметно нарастили количество вычислительных блоков, а ядра RT и тензорные блоки обеспечивают аппаратное ускорение трассировки и применение технологий глубокого обучения для дополнительной обработки изображения. Turing является первым шагом к внедрению трассировки лучей в игры, что способно повысить уровень реализма в современной графике. Пока речь идет о гибридном рендеринге, где при помощи трассировки улучшены отдельные эффекты. И в специальном обзоре Battlefield 5 мы поговорим о том, насколько хорошо это реализовано.
Старшие GeForce RTX по факту не имеют альтернатив. Это единственные видеокарты, которые предлагают поддержку новых технологий в сочетании с максимальной производительностью. Также NVIDIA позаботилась о более качественном охлаждении, поэтому модели Founders Edition демонстрируют невысокие температуры при комфортном уровне шума. Это дополняют повышенные частоты Boost, что в целом оправдывает и более высокий ценник в сравнении с простыми версиями GeForce RTX. Детальнее о возможностях каждой видеокарты мы поговорим в отдельных материалах, где протестируем их в номинале и в разгоне и обязательно сравним с решениями прошлого поколения.