Видеокарта для видеомонтажа

Какую видеокарту выбрать для видеомонтажа? Какую видеокарту выбрать для программы Adobe Premiere Pro CC 2017? Прошло немало времени с момента написания статьи про аппаратный движок Mercury Playback Engine GPU Acceleration, и теперь он оброс новым функционалом, плюс некоторая информация уже устарела и стала не актуальной. Базовой версией для написания старой статьи была: Adobe Premiere Pro CS 5.5, а базовой версией для написания этой статьи: Adobe Premiere Pro CC 2015.1.
Также ниже будет информация о всех вариантах GPU ускорения, о том какую видеокарту выбрать для обработки видео, об актуальных графических чипсетах (на момент написания статьи, но информация будет добавляться по мере выхода новых чипсетов и при появлении нового функционала в программе Adobe Premiere Pro CC 2016), это своего рода FAQ по видеокартам.
С базовой статьей про аппаратный движок Mercury Playback Engine также можно ознакомиться, а ниже будет добавлена информация о том что изменилось в последних версиях:
- Сам движок Mercury Playback Engine - теперь поддерживает видеокарты с CUDA, OpenCL, также использует центральный процессор (поддержка многопоточности) и эффективную работу с памятью 64-битного приложения. Есть три вида работы движка: Аппаратное GPU-ускорение ядра Mercury Playback (CUDA) / Mercury Playback Engine GPU Acceleration (CUDA), Аппаратное GPU-ускорение ядра Mercury Playback (OpenCL) / Mercury Playback Engine GPU Acceleration (OpenCL) и Только программное ускорение ядра Mercury Playback / Mercury Playback Engine Software Only.
- Немного информации о поддержке видеокарт. Теперь по-умолчанию поддерживаются все видеокарты, которые соответствуют определенным требованиям, а именно: поддерживают CUDA или OpenCL и имеют от 1Гб видеопамяти (для интегрированных видеокарт Intel поддерживается использование системной памяти). Ушло в прошлое правка документов (как и сами документы): cuda_supported_cards.txt и opencl_supported_cards.txt. Но если автоматически видеокарта не определяется программой Adobe Premiere Pro CC 2016, можно попробовать создать такой документ в директории программы Adobe Premiere Pro. Для видеокарт nVidia прописываются конкретные чипсеты, как пример: GeForce GTX 950, GeForce GTX 965M, Tesla K10, Quadro M5000 и т.д. А для видеокарт AMD кодовые имена: Antigua, Bonaire, Capeverde, Cayman, Devastator, Hawaii, Oland, Pitcairn, Tahiti, Turks, Tonga (в алфавитном порядке). Но список официально поддерживаемых видеокарт до сих пор доступен в системных требованиях, но он сильно устарел.
Также для видеокарт NVIDIA можно включить OpenCL ускорение (или оно доступно по-умолчанию на платформе Mac OS X), поставив флаг GF.EnableNVIDIAOpenCL > true в настройках Debug Database View. Утилита GPUSniffer показывает что один чипсет поддерживает два типа ускорения:


GPUSniffer

Также два вида аппаратного ускорения могут быть доступны если у нас есть интегрированная видеокарта (Intel) и дискретная (nVidia).

ASUS X554LJ-XO518H (90NB08I8-M06800)

И дальше пользователь сам выбирает какой тип ускорения ему использовать в настройках проекта:

OpenCL и CUDA

- Аппаратное GPU-ускорение ядра Mercury Playback (OpenCL) официально поддерживается для интегрированной графики Intel Iris Pro процессоров Intel Core (подробнее об этом читаем здесь) начиная с версии программы Adobe Premiere Pro CC 8.0 (или Adobe Premiere Pro CC 2014). Это чипсеты: Intel Iris Graphics 5100, Intel Iris Pro Graphics 5200, Intel Iris Graphics 6100, Intel Iris Pro Graphics 6200. И неофициально поддерживается и Intel HD Graphics графика. - OpenCL и CUDA ускорения теперь поддерживают одинаковое количество GPU ускоряемых эффектов (раньше CUDA подерживал больше эффектов, например: Fast Blur, Gaussian Blur, Directional Blur и Basic 3D не стабильно работали на OpenCL).
- Расширился набор эффектов, которые поддерживают GPU ускорение: Alpha Adjust / Изменение альфа-канала, Basic 3D / Базовый 3D, Black & White / Черное и белое, Brightness & Contrast / Яркость и контрастность, Color Balance (RGB) / Цветовой баланс (RGB), Color Pass / Фильтр цвета, Color Replace / Замена цвета, Crop / Обрезать, Clip Name / Имя клипа, Drop Shadow / Тень, Extract / Извлечь, Fast Color Corrector / Быстрый корректор цвета, Edge Feather / Растушевка границ, Gamma Correction / Гамма-коррекция, Mosaic / Мозаика, Gaussian Blur / Размытие по Гауссу, Horizontal Flip / Зеркальное отражение по горизонтали, Levels / Уровни, Luma Corrector / Корректор яркости, Luma Curve / Кривая яркости, Noise / Шум, ProcAmp, RGB Curves / Кривые RGB, RGB Color Corrector / Корректор цветов RGB, Sharpen / Увеличить четкость, Three-way Color Corrector / Трехкомпонентный корректор цвета, Timecode / Тайм-код, Tint / Оттенок, Track Matte / Ключ маски дорожки, Transform / Преобразовать, Ultra Key / Ключ Ultra, Video Limiter / Видеоограничитель, Vertical Flip / Зеркальное отражение по вертикали, Fast Blur / Быстрое размытие, Directional Blur / Направленное размытие, Invert / Обратить, Warp Stabilizer / Стабилизатор деформации (GPU ускорение используется только при финальном рендеринге), SDR Conform / Согласование SDR, Lumetri Color / Цвет Lumetri.


GPU Effects

*В новой версии программы Adobe Premiere Pro CC 2017 добавлено GPU ускорение у двух эффектов: Offset / Смещение и Lens Distortion.
- Изменился набор видео переходов которые поддерживают GPU ускорение: Wipe / Вытеснение, Slide / Скольжение, Cross Dissolve / Перекрестный наплыв (видеопереход по-умолчанию), Dip to Black / Погружение в черный, Dip to White / Погружение в белый, Additive Dissolve / Аддитивный наплыв, Film Dissolve / Растворение пленки, Push / Выталкивание, Morph Cut / Монтаж морфа.


GPU Transitions

*Аппаратно ускоряемые эффекты Garbage Matte (4, 8, 16) теперь заменены на GPU ускоряемые маски которые доступны в окне Элементы управления эффектами / Effect Controls под каждым эффектом, с поддержкой GPU ускоряемого трекинга:


Adobe Premiere Pro CC 2015.2

GPU ускорение также поддерживает функция Оптический поток / Optical Flow.
- Если раньше CUDA не использовалось для: кодирования и декодирования, а только для просчетов GPU эффектов и переходов, скалирование, режимов наложения (blending modes), конвертация цветового пространства, изменение частоты кадров, изменения порядка следования полей, PAR (pixel aspect ratio), интерпретация альфа-канала, frame blending, pulldown removal, интерлейсинга и деинтерлейсинга, изменения скорости (в т.ч. time remapping). То теперь ситуация изменилась, доступны варианты аппаратного кодирования/декодирования, пусть и не связанные с движком Mercury Playback Engine GPU Acceleration:
- PureVideo это аппаратная функция, разработанная компанией nVidia для переноса нагрузки по декодированию и последующей обработке видео с центрального процессора на графический процессор (GPU). Раньше PureVideo HD для аппаратного декодирования использовали только плагины типа GPU Decoder Premiere 1.хх для Adobe Premiere Pro от DIVIDE FRAME. На данный момент только видеокарты с VP7 / PureVideo HD 7 (VDPAU Feature Sets F) могут аппаратно декодировать 4К H.265/HEVC (профили Main и Main 10) видео. VP7 поддерживает на данный момент (конец 2015 года) только чипсет GM206 (Maxwell 2.0).
Аппаратное декодирование 4К H264 (4096х4096), DCI 4K и MPEG-1/MPEG-2 с разрешением 4080х4080 видео поддерживает VP6 / PureVideo HD 6 (VDPAU Feature Sets E) и имеет улучшенную защиту от ошибок при декодировании видео потоков. VP6 это видеокарты построенные на чипсетах: GeForce GTX 745, GTX 750, GTX 750 Ti, GTX 850M, GTX 860M (GM107), GTX 970, GTX 980, GTX 970M, GTX 980M (GM204), GTX TITAN X, GTX 980 Ti (GM200).
Аппаратное декодирование 4К H264 (4032х4080) и MPEG-1/MPEG-2 (MP@HL) с разрешением 4032х4048 видео поддерживает VP5 / PureVideo HD 5 (Feature Set D). Это чипсеты Kepler: GK107, GK106, GK104, GK110, GK208 и Fermi: GF119, GF117.
- GPU.EnableGOPFormats (true) в настройках Debug Database View, это включение аппаратного декодирования H.264 видео, с помощью NVENC движка (GPU-Z утилита будет показывать загрузку в разделе Video Engine Load).
- Чипсет nVidia GM206 может аппаратно декодировать PNG (это видеокарты NVIDIA GeForce GTX 950 и NVIDIA GeForce GTX 960).
- Обновление Adobe Premiere Pro CC October 2013 Update добавило аппаратное GPU декодирование CinemaDNG видео. Включение/отключение GPU декодирования Cinema DNG видео с помощью параметра EnableRedGPUDebayer. Debayer (демозаика) – это процесс восстановления цвета пикселей в цифровой фото- и видеоаппаратуре. Цифровые камеры сохраняют изображения в специальном необработанном формате, в котором каждый пиксель изначально содержит только один компонент цвета: R, G или B. Недостающие цветовые компоненты в каждой точке результирующего изображения восстанавливают с помощью обработки цветовых значений близлежащих пикселей. Для увеличения скорости демозаики используются преимущества массивно параллельных вычислений на архитектуре CUDA от NVIDIA. По сравнению со стандартными методами, распараллеленные и оптимизированные алгоритмы демозаики HQLI и DFPD выполняют конвертирование 8-битных изображений в формат RGB 24-бит намного быстрее при таком же или более высоком качестве и с заметно меньшим муаром.
- Обновление Adobe Premiere Pro CC December 2013 Update добавило аппаратное GPU декодирование .R3D видео. Включение/отключение аппаратной дебайеризации RED RAW видео с помощью параметров: EnableRedGPUDebayer и EnableRedGPUDebayer (для видеокарт nVidia GeForce и Quadro).
- Видеокарты AMD также имеют встроенный Unified Video Decoder, блок UVD поддерживает декодирование видеоданных форматов H.264, VC-1, MPEG4, MPEG2, MJPEG и разрешение вплоть до UltraHD (4K). Видеокарты архитектуры Tonga / Antigua (AMD Radeon R9 285, AMD Radeon R9 380, AMD Radeon R9 380X) с UVD 5.0 поддерживают аппаратное декодирование 4K H.264 level 5.2 (4K@60p) видео. Предыдущая версия UVD поддерживала декодирование 4K H.264 level 5.1 (4K@30p) видео. Пример скорости декодирования видеопотоков 1080р и 4К (fps, чем больше, тем лучше):


Unified Video Decoder

- Видеокарты построенные на GPU Fiji и Carrizo (APU c GCN1.2) с UVD 6.0 поддерживают аппаратное декодирование 4k HЕVС 8-bit видео.
- При использовании бесплатного плагина NVENC-plugin v1.х.х в Adobe Premiere Pro CC 2015 доступны для аппаратного кодирования два формата: H.264 и H.265 (HEVC). А возможность кодирования в формат H.265 (HEVC) доступна только для чипсетов: GM200 / GM204 / GM206 (Maxwell 2.0).
NVENC существует два типа, версию 1.0 поддерживают все чипсеты Kepler (видеокарты серии GTX/GT 6хх и 7хх серий). Версию NVENC 2.0 поддерживают все чипсеты Maxwell, но есть отличия, Maxwell 1.0 (это видеокарты nVidia GeForce GTX 750 и nVidia GeForce GTX 750 Ti) не поддерживают кодирование в формат H.265 (HEVC). А видеокарты построенные на чипсете Maxwell 2.0 поддерживают, это десктопные чипсеты: GTX 950, GTX 960, GTX 970, GTX 980, GTX Titan X и ноутбучные чипсеты: GTX 965M, GTX 970M, GTX 980M.
Реальная разница в производительности между NVENC 1.0 и NVENC 2.0 при использовании плагина NVENC_export Version v1.07 в программе видеомонтажа Adobe Premiere Pro. Использовались видеокарты: nVidia GeForce GTX 650 (GK107-450-A2 / Kepler) и nVidia GeForce GTX750 (GM107-300-A2 / Maxwell).


NVENC 2.0

NVENC кодирование также поддерживается на мобильных чипсетах Kepler и Maxwell, так как кодированием занимается отдельный аппаратный кодек, то при экспорте видео с ноутбука, GPU эффекты будут просчитывать шейдеры CUDA, а потом кодированием займется NVENC кодек. На скрине GPU-Z будет загрузка в строках: GPU Load (CUDA) и Video Engine Load (NVENC).


NVENC

*Последняя версия драйверов которая поддерживала CUDA кодирование (а не аппаратным кодером NVENC) это NVIDIA Forceware 337.88 WHQL. Если необходимо вернуть CUDA кодирование, то надо подменить длл-ки nvcuvenc32.dll (для 32-битных версий операционных систем Windows) и nvcuvenc64.dll (для 64-битных версий операционных систем Windows) в разархивированном видеодрайвере в папке Display.Driver (либо добавляем руками эти два файла в уже установленный драйвер в папки C:\Windows\System32\nvcuvenc.dll и C:\Windows\SysWOW64\nvcuvenc.dll и регистрируем их). Так что в более свежих версиях драйверов nVidia убрана возможность использования CUDA-кодирования (NVCUVENC), осталась только возможность CUDA-декодирования (NVCUVID). NVIDIA CUDA Video Decoder (NVCUVID) – это библиотека, которая предоставляет разработчикам доступ к аппаратным возможностям декодирования видео на NVIDIA GPU с поддержкой CUDA. Аппаратное декодирование осуществляется либо на видеопроцессоре (VP), либо на аппаратном обеспечении с поддержкой CUDA, в зависимости от аппаратных возможностей и кодеков. Библиотека поддерживает следующие форматы видеопотока для платформы Windows: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC).
- Использование аппаратного кодирования с помощью технологии QSV (например: TMPGEnc Movie Plug-in for Premiere Pro или Adobe Premiere Pro/Premiere Elements Encoder plug-in) на интегрированных видеокартах в процессорах Intel (только сокеты LGA115х, на процессорах LGA2011 нет интегрированной в процессоры графики). Технология Intel Quick Sync Video упрощает и ускоряет процесс обработки мультимедиа, а также создания и преобразования видеоматериалов за счет использования выделенных ресурсов графической технологии Intel для обработки мультимедийных данных.
QuickSync это комбинация EU (исполнительных блоков) и Media Fixed Function (алгоритмические блоки «запаянные» в железо).
*Данная технология также активно используется в программах: Grass Valley EDIUS Pro (в обновлении EDIUS Version 8.10.188 добавлена возможность кодирования/декодирования видео с помощью технологии Intel Quick Sync Video / Accelerated 4K H.264 playback, на процессорах Intel Core шестого поколения Skylake), Apple Final Cut Pro X и Sony Vegas Pro. Программа Grass Valley EDIUS Pro использует технологию Intel Quick Sync Video для кодирования видео в следующие форматы: XAVC S, AVCHD, H.264/AVC и Blu-ray/iPod/iPad/PSP.
*Компания Intel "включила" функцию Quick Sync и для бюджетных процессоров: Pentium и Celeron с помощью выхода новых драйверов 10.18.10.3408. Это касается следующих моделей: Pentium 3558U, Pentium 3561Y, Pentium G3220, Pentium G3220T, Pentium G3320TE, Pentium G3420, Pentium G3420T, Pentium G3430, Celeron G1820, Celeron G1820T, Celeron G1820TE, Celeron G1830, Celeron 2957U, Celeron 2961Y и Celeron 2981U.
*Интегрированная графика Intel HD Graphics девятого поколения Gen9 которая используется в процессорах Intel Skylake, представлена GT2 которая имеет минимальное количество Media FF (Media Fixed Function) логики, и GT3 / GT3e / GT4e которые имеют ряд дополнительных аппаратных возможностей (также как было реализовано в пятом поколении процессоров Intel Broadwell). Media FF может работать на более высоких частотах, чем исполнительные блоки, это особенно важно при декодировании видео, потому как получаем повышение производительности, одновременно обеспечивая минимальное энергопотребление. В Skylake добавлены:
- Дополнительные блоки fixed function video encoder в Quick Sync engine.
- Добавлена поддержка кодирования/декодирования видео в следующих форматах: HEVC, VP8, MJPEG, поддержка обработки 16-битных RAW изображений.
Исключая programmable rate control, все другие аспекты алгоритма кодирования обрабатываются в MFX, в том числе декодирование 8-битного HEVC видео с разрешением 4Kp60 и битрейтом до 240Мбит/с. 10-битное HEVC (Main10) видео декодируется уже с помощью GPU ускорения. Quick Sync может кодировать в HEVC формат с профилем Main и разрешением 4Kp60.
Дополнительные улучшения касаются и scalar и format converter (SFC), которые работают с MFX и VQE (без использования EU или media sampler).
Как и в новых графических чипсетах nVidia Maxwell и AMD Tonga в Intel HD Graphics 9-го поколения используется сжатия памяти (что увеличивают пропускную способность памяти, а это самое узкое место интегрированной графики). Это сжатие без потерь и управляется на уровне драйвера.
Одновременная поддержка трех мониторов.
Поддержка HDMI 2.0 только через адаптер (DisplayPort - HDMI 2.0), либо производители материнских плат добавляют его поддержку через чипсет MegaChips MCDP28.
Максимальное разрешение: 4096х2304 (через DisplayPort).
Аппаратные возможности Multi-plane Overlay (MPO) которые не были реализованы в Intel Broadwell: Alpha blending (альфа-смешивание нескольких слоев), NV12 scalar, Bilinear scalar, вращение без ограничений, YUV диапазон 0-255 и 16-235 (в Broadwell только 16-235), NV12 (это видео-формат, позволяет избежать преобразования видео данных, которые перемещаются между декодером, пост-обработкой и блоками отображения, т.е. без конвертации NV12 - RGB).
Новый Skylake MPO может экономить 1.1Вт при воспроизведении 1080p24 видео на 1440p панели.
- У видеокарт AMD есть аналог NVENC это Video Coding Engine (VCE), например версия установленная в чипсете Tonga обеспечивает скорость кодирования до 12 раз быстрее реального времени для разрешения FullHD. Новый блок VCE поддерживает полностью аппаратное кодирование данных в формате H.264 профилей Baseline и Main, также поддерживается и UltraHD-разрешение.
- Основные функции повышения качества материала в программе Adobe Premiere Pro CC 2015: Render at Maximum Depth – обработка осуществляется в линейном пространстве цвета (гамма = 1,0) с максимальной глубиной цвета – 32бита. Чем больше глубина цвета, тем выше точность его передачи. В итоге мы получаем более реалистичные результаты, тонкие градации цвета и лучшие результаты для полутонов. Стандартные эффекты работают с глубиной цвета – 8бит. При работе в режиме Mercury Playback Engine GPU Acceleration эту функцию активировать не обязательно, так как просчет всегда происходит с 32-битной глубиной цвета.
Включение функции: Use Maximum Render Quality позволяет задействовать высококачественный HD/SD скалер (variable-radius bicubic). При ее выборе в настройках Sequence мы сохраняем резкие детали. Но это требует более долгого просчета и задействует большее количество оперативной памяти, также рекомендуется установить Optimize Rendering в положение “Memory”. При работе в режиме Mercury Playback Engine GPU Acceleration эту функцию активировать не обязательно, так как просчет даунскалинга производится всегда в более качественном режиме: Lanczos 2 low-pass sampled с bicubic, и работает он в разы быстрее.
При включении этой галки (Use Maximum Render Quality) может также снижать загрузку центрального процессора со 100% до 20% и ниже, даже когда она не работает, поэтому не рекомендуется ее оставлять даже при включенном движке Mercury Playback Engine GPU Acceleration "на всякий случай".
GPU масштабирование в Adobe Premiere Pro CC 2015. Когда для масштабирования в Adobe Premiere Pro СС 2015 задействуется только процессор, то используются следующие методы:
Воспроизведение: bilinear.
Пауза: Gaussian low-pass sampled с bilinear.
Высококачественный экспорт (снят флажок Maximum Render Quality): Gaussian low-pass sampled с bilinear.
Включенная функция Maximum Render Quality: variable-radius bicubic. Работает очень медленно, хотя и использует SSE инструкции.
Масштабирование посредствами CUDA (выбран Mercury Playback Engine GPU Acceleration):
Воспроизведение: bilinear.
Пауза: Lanczos 2 low-pass sampled with bicubic.
Экспорт: Lanczos 2 low-pass sampled with bicubic.
Таким образом, масштабирование с использованием CUDA работает и лучше и быстрее. На некоторых тестах GPU оказывалось в 40 раз быстрее процессора с включенной опцией Maximum Render Quality.
- Про объем бортовой памяти видеокарты при работе в программе видеомонтажа Adobe Premiere Pro CC 2015. Если есть возможность купить вариант видеокарты с удвоенным объемом памяти (например вместо 2Гб взять 4Гб, речь идет конечно не о GDDR3 вариантах), с небольшой доплатой, то это разумный выбор. Если доплата довольно приличная, то покупать 4Гб про запас нет смысла. Для работы с FullHD видео достаточно 1Гбайта, для работы с 4К и выше достаточно 2Гб варианта видеокарты. Есть задачи, где может быть загружена вся доступная оперативная память, например при работе с длинными клипами с движком Lumetri Deep Color Engine. Но это относится скорее к проблеме с "утечкой памяти" чем к реальной потребности такого объема. Для работы с 5К кадром от камеры RED с разрешением 5120x2700 требуется всего 843Мб видеопамяти, но на практике часть памяти должна быть зарезервирована для отображения других функций, поэтому конечно надо выбирать варианты с 2Гб видеопамяти и выше.
Другой момент: например при выполнении одной и той же задачи на видеокарте построенной на чипсете nVidia, при переключении движков CUDA / OpenCL, в последнем случае потребляется больше видеопамяти, опять же из-за худшей оптимизации под OpenCL. Ну и стоит помнить, что цифры используемой памяти отображаемые например в утилите GPU-Z могут висеть от предыдущих задач, так как нет функции очистки видеопамяти.
Так что стоит переплачивать за дополнительный объем видеопамяти, только если вы уверены, что для ваших задач она пригодится.
- По поводу производительности CUDA и OpenCL. Родной движок Mercury Playback Engine GPU Acceleration более быстро и стабильно работает на CUDA (т.е. на видеокартах nVIdia), но в последнее время видеокарты на чипсетах AMD (и соответсвенно использующих OpenCL ускорение), сократили этот разрыв. Если кратко (а подробно все расписано в соответствующих тестах плагинов), то OpenCL задачи как правило выполняются быстрее на чипсетах AMD. Если плагин имеет оптимизацию как под OpenCL так и под CUDA, тут видеокарты nVidia как правило показывают лучшую производительность. Отдельно про производительность nVidia для OpenCL задач, если при работе с CUDA чипсеты предыдущего поколения могут конкурировать с чипсетами нового поколения (нет например оптимизации для нового поколения чипсетов), то в OpenCL тенденция следующая, что новые чипсеты всегда прилично быстрее более старых (поэтому для OpenCL задач нет смысла покупать видеокарты на чипсетах Fermi или даже Kepler).
Также часто можно встретить утверждение, что на видеокартах Fermi (серия GeForce GTX 4хх и 5хх) "ядра" неурезанные, а на более новых видеокартах, они очень слабые и т.п. Да, в архитектуре Kepler (серия GeForce GTX 6хх) CUDA ядра более слабые, но их значительно больше, и да на них урезан блок с операциями с двойной точностью (FP64), но он не используется в видеомонтаже. В архитектуре Maxwell (серия GeForce GTX 9хх) количество ядер осталось почти как в Kepler, но они еще и вес набрали. Посмотрим тесты честной CUDA молотилки: Ray-traced 3D Renderer, которая исключает влияние платформы и почти не зависит от пропускной способности памяти (к этому вернемся позже):


Ray-traced 3D Renderer

Но при обычной работе в программе Adobe Premiere Pro CC 2015.1 с GPU эффектами, операциями и тяжелыми форматами: CinemaDNG (BlackMagic Cinema Camera), Apple ProRes 422 (HQ), RED R3D Raw File (RED MYSTERIUM-X S35), Canon DSLR, разницу между одноклассниками разных поколений (например: NVIDIA GeForce GTX 970 и NVIDIA GeForce GTX 770) заметить трудно. Это больше всего разочаровывает пользователей, так как купив новую видеокарту, они ожидают приличной прибавки в скорости рендеринга. Поэтому расставаться со своими деньгами надо только тогда когда твердо уверены, что видеокарта уже не справляется, нодо покупать более мощную. Или если надо для работы с тяжелыми GPU плагинами.
- Пропускная способность памяти. Если покупать бюджетное дискретное решение, то самое дно это GDDR5 и 128-битная шина памяти, эти показатели намного важнее, чем количество потоковых процессоров и т.д. Для программы Adobe Premiere Pro CC 2015 очень важен параметр пропускной способности памяти видеокарты.
Часто задают вопрос, а вот у той видеокарты больше разрядность шины (они могут быть: 64-бит, 128-бит, 192-бит, 256-бит, 384-бит и 512-бит для GDDR5). Сравнивать разрядность шины надо только для одного поколения, например у видеокарты GeForce GTX 960 со 128-битной шины памяти, эффективная ПСП (за счет используемой технологии сжатия) равна GeForce GTX 660 со 192-битной шиной памяти.
- При работе со сторонними плагинами, особенно OpenGL, может возникнуть проблема низкой загрузки GPU видеокарты. Ярким примером является ситуация с плагином Red Giant Magic Bullet Looks. На конкретном примере рассмотрим как меняется производительность плагина на старой видеокарте Gigabyte GV-R785WF2-2GD построенной на чипсете AMD Radeon HD 7850 / Radeon R7 265 / Pitcairn Pro (как правило некоторые пользователи не смотрят на загрузку видеокарты при работе, и когда время рендеринга становится неприемлемым, покупают новую мощную видеокарту, но время рендеринга может не сильно уменьшиться). У видеокарт на чипсетах AMD все это усугубляется тем что, драйвера могут резать производительность видеокарты при работе в OpenGL. Применяем эффект Magic Bullet Looks, выводим видео в формат H.264, в настройках экспорта сняты галки: Render at Maximum Depth (Рендеринг при максимальной глубине), Use Maximum Render Quality (Наилучшее качество визуализации), Use Frame Blending (Использовать наложение кадров), Use Previews (Предварительный просмотр).


Red Giant Magic Bullet Looks и OpenGL

- Поддержка нескольких видеокарт. Она была впервые добавлена в обновлении программы Adobe Premiere Pro CS5 5.5.2 update появилась возможность использования двух видеокарт в конфигурации NVIDIA Maximus. Она позволяет использовать графический ускоритель Tesla C2075 для CUDA обработки, в то время как видеокарта nVidia Quadro будет использована для управления дисплеем (выводом графики) и OpenGL обработки.
В версии программы Adobe Premiere Pro CC уже был задействован Multi-GPU рендеринг с поддержкой нескольких GPU (двухчиповые решения, или несколько видеокарт не обязательно одинаковых, без поддержки SLI), что позволяло значительно ускорить экспорт. Но реально эта опция заработала только после обновления программы до версии Adobe Premiere Pro CC v7.0.1, для видеокарт на чипсетах nVidia. Аппаратное декодирование и плейбек таймлайна в программе Adobe Premiere Pro CC 2015 задействует только один GPU (в виду сложности распараллеливания при использовании нескольких видеокарт).
- Также стало расширяться число плагинов от третьих производителей использующих GPU ускорение нескольких видеокарт (режим Multi-GPU), вот их список: ABSoft Neat Video v4 Pro, Digital Anarchy Beauty Box Video 4.0, RE:VisionFX Twixtor Pro AE v6.2.2, RE:VisionFX DE:Noise v3.1, RE:VisionFX ReelSmart Motion Blur Pro v5.1.2.
- При наличии в рабочем процессе достаточного количества OpenGL эффектов или их частом использовании, достаточно эффективно использовать две видеокарты, выделив одну для OpenGL просчетов, а вторую для задач CUDA / OpenCL (подробнее об этом читаем в этом материале). Так как для ряда эффектов OpenGL присуща слабая нагрузка GPU, что сказывается и на скорости работы CUDA / OpenCL.
- Интегрированный движок Lumetri Deep Color Engine, который обеспечивает простой доступ к цветокоррекции SpeedGrade CC 2015 также использует GPU ускорение, подробнее об этом читаем здесь.
- Количество сторонних плагинов использующих GPU ускорение также значительно выросло за последние время, вот список наиболее популярных: Digital Anarchy LightWrap (OpenCL), NewBlueFX ColorFast (OpenGL), GenArts Sapphire 9 (CUDA), HitFilms (OpenGL), Red Giant Magic Bullet Denoiser II (OpenCL), Magic Bullet Cosmo 2.0 (OpenGL), Magic Bullet Mojo (OpenGL), proDAD Vitascene V2 Pro (OpenGL), Red Giant Universe (OpenGL), Digital Film Tools Composite Suite Pro (OpenCL), Rubber Monkey FilmConvert Pro v2 (OpenCL), RE:VisionFX REMap AE v3.0.0 (OpenCL), Imagineer Systems mocha AE v5.0.0 (OpenCL и OpenGL) и т.д.
*Интегрированное видео Intel HD Graphics поддерживает GPU ускорение только для After Effects (нет поддержки Premiere Pro). На платформе Windows, Intel HD Graphics драйвер должен поддерживать OpenCL 1.1 (и выше).При совместной работе Adobe Premiere Pro CC 2015 и Intel HD Graphics в режиме GPU нас встретит зеленый экран.
Также появился новый класс сторонних плагинов использующих движок Mercury Playback Engine GPU Acceleration, это: Boris Continuum Complete 9 (только несколько эффектов из набора: BCC Fast Film Glow, BCC Fast Film Process и видеопереход BCC Fast Film Glow Dissolve, но уже в версии Boris Continuum Complete 10 решили кривую работу в режиме Mercury Playback Engine GPU Acceleration не исправлять, а просто улучшить обычное OpenCL/OpenGL ускорение), Red Giant Magic Bullet Colorista III, и видеопереход Accevolution Transition Designer Wipe.
- Что выбрать профессиональную или игровую видеокарту? Quadro или GeForce? FirePro или Radeon? По большому счету, выбор в сторону профессиональных видеокарт ранее был обоснован тем, что для них выпускались специализированные OpenGL драйвера (для CUDA/OpenCL такого нет), и если вам надо было использовать поддержку 30-битного цвета (AMD для текущих видеокарт Radeon уже открыла поддержку 10-бит (30-битный цвет или 1.07 миллиарда цветов) для Direct3D и OpenGL приложений). Мифы о качестве производства и стабильности профессиональных видеокарт основаны на том что они как правило работают на более низких тактовых частотах. Но в последнее время добавилась еще одна опция: NVENC на видеокартах GeForce может поддерживать не больше 2 одновременных потоков. NVENC на GRID GPU и Quadro K4000/M4000 и выше могут поддерживать столько потоков, сколько позволяет предел скорости кодировщика NVENC и объем свободной памяти. И за счет того что видеокарты последнего поколения NVIDIA GeForce и QUADRO могут кодировать видео в HEVC H.265 кодек, с помощью модуля P-Module 1.0 от Cinemartin, можно добиться паралельных вычислений, при кодировании видео в формат H.265 (и на профессиональных видеокартах может быть более двух потоков).
*HDMI 2.0 поддерживается на данный момент, только на видеокартах nVidia Maxwell 2.0. HDMI 2.0 на видеокартах nVidia поддерживает 4K@p60 (2160p), RGB444, а HDMI 1.4a - 4Kp30, RGB444 или 4K@p60, RGB420 (по HDMI могут передаваться как YCbCr 16-235, так и RGB 0-255 сигналы Full Range RGB). Поддержка HDMI 2.0a (заточен под широкий динамический диапазон HDR) у видеокарт AMD появится только у четвертого поколения Graphics CoreNext GPU с кодовым именем Polaris, и связана с 14нм техпроцессом. Также новое поколение графики AMD принесет поддержку кодирования/декодирования 4К Н.265 60fps (и декодирование профиля Main 10).
Пропускная способность интерфейса HDMI 1.4 - 10.2Гбит/с, HDMI 1.4b - 15Гбит/с, HDMI 2.0 - 18Гбит/с.
Поддерживается 32 аудиоканала (в 1.4 только 8 каналов). Поддержка стандарта кодирования аудио HE-AAC. Частота дискретизации звука в несжатом аудио увеличена с 1509 до 1536 кГц, это касается и формата DTS-HD Master Audio (DTS++). Есть динамическая синхронизация аудио и видеопотоков.
В HDMI 2.0 есть возможность транспортировки сдвоенного видеопотока для одновременного просмотра на одном дисплее двух разных клипов.
В HDMI 2.0 есть поддержка широкоугольного соотношения сторон кинотеатрального типа 21:9.
HDMI 2.0 также поддерживает цветовое пространство стандарта Rec. 2020 (неофициально оно поддерживалось и предыдущими стандартами, требуя ручной настройки дисплея для правильного отображения).
Нативная поддержка HDMI 2.0 для интегрированой графики Intel будет добавлена в процессорах Cannon Lake, а на данный момент его поддержка реализована через чипсет MegaChips MCDP28.
*Анонсирован стандарт DisplayPort 1.4 организацией Video Electronics Standards Association (VESA). Он будет поддерживать разрешение 8К (7680х4320) и Display Stream Compression 1.2 (DSC 1.2) - это visually lossless с компрессией 3:1. Пропускная способность интерфейса останется прежней: 32,4 Гбит/с. Но благодаря поддержки технологии DSC, новый стандарт позволяет выводить видео разрешением 8K с частотой обновления 60Гц, либо 4К (3840х2160) с частотой обновления 120Гц, и расширенным динамическим диапазоном (HDR).
Также поддерживаются: технология прямой коррекции ошибок (Forward Error Correction), мета-транспорт HDR, который обеспечивает поддержку стандарта CTA 861.3, и расширенная передача аудиоданных, охватывающую такие возможности, как 32 канала аудио, частота дискретизации 1536 кГц и поддержка всех известных аудиоформатов.
*Если вы активно используете программу композитинга Adobe After Effects CC 2015, то выбор видеокарты необходимо согласовывать с GPU инструментами используемыми там (оставим за скобками штатное OpenGL ускорение для поддержки прорисовки элементов интерфейса: композиции, видеоряда и панелей слоя). Основное влияение на выбор видеокарты может повлиять активное использование например: 3D-рендеринг с трассировкой лучей (это только чипсеты NVIDIA) или для использования плагина Video Copilot Element 3D v2.2 (лучшая производительность уже у чипсетов AMD).
*Всерьез рассматривать интегрированную графику (а она постоянно развивается), как замену бюджетной дискретной, можно только после того как, будет решена проблема с пропускной способностью памяти. А именно, интегрированная видеокарта в центральный процессор будет также иметь доступ к интегрированной памяти типа HBM. Такие процессоры появятся с выходом гибридных процессоров AMD с архитектурой Zen, которые будут выпускаться по 14-нм технологии компанией GlobalFoundries.
Итак, какую видеокарту выбрать для монтажа видео? AMD или nVidia? Есть программы и плагины которые используют OpenCL движок, как правило в них производительность выше у видеокарт построенных на чипсетах от AMD (Magix Vegas Pro, Apple Final Cut Pro X и т.д.), а есть программы и плагины которые используют и CUDA и OpenCL ускорение, и тут быстрее оказываются видеокарты построенные на чипсетах nVidia (Adobe Premiere Pro CC, Blackmagic Design DaVinci Resolve 12 и т.д.). Также выбор того или иного производителя чипсета, может зависеть от постоянно используемых "тяжелых" плагинов которые используют разные виды GPU ускорения (CUDA/OpenCL/OpenGL). Поэтому надо смотреть конкретные тесты по конкретным плагинам. Т.е. это все индивидуально, и нельзя не узнав какие инструменты пользователь использует в своем рабочем процессе, однозначно заявлять: только AMD или только nVidia.
*В июне 2016 года начались розничные продажи новых видеокарт архитектуры Pascal: nVidia GeForce GTX 1080 и nVidia GeForce GTX 1070 построенные на 16нм чипсете GP104. А видеокарты среднего ценового диапазона nVidia GeForce GTX 1060 обещают ближе к осени. Так же прекратилось производство чипсетов GeForce GTX 970 и GeForce GTX 980.
Основные особенности nVidia GP104:
- Более высокие тактовые частоты и обновленная технология GPU Boost 3.0.
- Еще более эффективная система сжатия данных в памяти.
- Аппаратное декодирование видео HEVC Main10 (10bit), Main12 (12bit) & VP9 (GM200 & GM204 не поддерживают HEVC Main10/Main12 & VP9 аппаратное декодирование).
- Аппаратное кодирование H.265 и H.264 видео с разрешением 4K@60Hz.
- Аппаратное декодирование 4K@120Hz H.264 видео с потоком до 240Мбит/с.
- Аппаратное декодирование 4K@120Hz или 8K@30Hz HEVC видео с потоком до 320Мбит/с.
- Поддержка кодирования и декодирования 10-битного H.265/HEVC видео.
- Поддержка декодирования 12-битного H.265/HEVC видео.
- Декодирование VP9 видео с разрешением 4K@120Hz и потоком до 320Мбит/с.
Но не спешите бежать за новыми продуктами в магазины, так как цены пока выше рекомендованных, да и как это происходит со всеми новыми продуктами, есть проблемы с поддержкой новой архитектуры, программами и плагинами. Вот первый тест программы DaVinci Resolve 12.5 Studio:


DaVinci Resolve 12.5 Studio

Видеокарта GeForce GTX 1080 не распознавалсь в режиме CUDA и поэтому работала в режиме OpenCL, в котором видеокарты nVidia особенно не блещут.
Также нет поддержки новой архитектуры nVidia Pascal в плагине: Neat Video 4.1, в движке Ray-traced 3D Renderer в программе Adobe After Effects CC 2016 и т.д. Также есть проблемы у видеокарт GTX 10x0 при работе с R3D видео на данный момент (драйвер GeForce 368.22 WHQL).
Компания AMD пошла другим путем и первыми выпустила видеокарты среднего ценового диапазона: AMD Radeon RX 480 и AMD Radeon RX 470 построенные на архитектуре Polaris и 14нм чипсете Polaris 10 (Ellesmere), а также бюджетную модель: AMD Radeon RX 460 построенную на 14нм чипсете Polaris 11 (Baffin).
Ключевые особенности AMD Polaris:
- Это четвертое поколение архитектуры Graphics CoreNext.
- Аппаратное кодирование и декодирование HEVC/H.265 видео.
- Поддержка видеовыхода HDMI 2.0a.
- Обновлен Video Coding Engine до версии 3.4.
- Обновлен Unified Video Decoder до версии 6.3.
- Обновлен System Direct Memory Access до версии 3.1.
- Обновлен Display Controller Engine до версии 11.2.
- Обновлен System Management Controller до версии 7.2.
- Обновлен Interrupt Handler до версии 3.1.
*Новая интегрированная графика Iris Pro Graphics P580 и 580, доступна в следующих десктопных процессорах: Xeon E3-1500 v5 (E3-1585 v5, E3-1585L v5, E3-1578L v5, E3-1565L v5, E3-1558L v5) и Intel Core i5-6585R, Intel Core i5-6685R, Intel Core i7-6785R.
Графическая подсистема Iris Pro 580 (GT4e) содержит 72 исполнительных блока (EU) с производительностью: 1Тфлопс (FP32), и оснащаются 128 МБ памяти типа eDRAM. Так как они имеют конструктивное исполнение BGA 1440, то будут доступны только в готовых решениях: неттопах, моноблоках, баребонах и ноутбуках.

Читаем далее.

 
Рейтинг@Mail.ru