Сравниваем турбо-память для видеокарт: GDDR5X против HBM2

01.11.2016

Графическим платам для высокопроизводительных ПК требуется большой объем высокоскоростной памяти. Самые подходящие решения — это новые технологии HBM2 и GDDR5X.

Виртуальная реальность требует графической производительности, в несколько раз превышающей таковую при использовании монитора. Количество ошибок программ по распознаванию речи методами глубинного обучения (deep learning) снижается на 40% при увеличении объемов анализируемых выборок в десять раз. И виртуальная реальность, и искусственный интеллект задействуют ресурсы графических процессоров, отлично подходящих для решения задач, хорошо поддающихся распараллеливанию, что, в свою очередь, требует памяти очень большой емкости и очень высокой скорости для обработки постоянно растущих объемов данных.

Компьютерные игры, которые становятся все более реалистичными, тоже жаждут быстрой видеопамяти. «Обычная» память типа DDR для ПК всегда была в лучшем случае слабым решением для требований видеокарт. Специально для использования в графических картах была разработана память GDDR (Graphics DDR), в настоящее время уже выросшая до пятого поколения. Однако из-за требований разрешения 4K, виртуальной реальности и ИИ даже она доходит до пределов своих возможностей. Новые технологии GDDR5X и HBM2 должны решить эту проблему.

Эволюция: GDDR5X

Новая спецификация GDDR5X была утверждена в январе этого года, а нынешним летом в продажу поступила первая видеокарта NVIDIA GeForce GTX 1080, оснащенная такой памятью.

В GDDR5X традиционная структура памяти, представленная отдельными микросхемами, соединенными с ГП линиями передачи данных, адаптирована под новые требования. При этом основная структура карты изменилась мало. Обновился техпроцесс, и в итоге все это вместе держит в узде цены на память GDDR5X. По сравнению с предыдущей, вышедшей еще в 2008 году памятью GDDR5, новая технология обладает следующими преимуществами.

Предвыборка данных (prefetch) увеличилась с 8n до 16n. Теперь благодаря оптимизации внутренних линий передачи данных за один цикл доступа к памяти контроллер может выбирать не 32, а все 64 байта на чип, в результате чего пропускная способность памяти увеличивается вдвое без необходимости повышения тактовой частоты. Благодаря улучшенному техпроцессу повысилась энергоэффективность: рабочее напряжение с 1,5 В снизилось до 1,35 В, что, в свою очередь, уменьшает тепловыделение.

Емкость отдельно взятой микросхемы новой памяти составляет 4, 8 или 16 Гбит (у GDDR5, для сравнения, — от 512 Мбит до 8 Гбит). Вместе с тем, помимо степеней двойки, спе­цификация включает два новых проме­жуточных объема — 6 и 12 Гбит, что позволяет более гибко варьировать общий объем наборной памяти, прежде всего в мобильных устройствах.

Революция: HBM2

В то время как производители GDDR пошли по пути совершенствования памяти предыдущего поколения, разработчики появившейся в 2013 году технологии HBM (High Bandwidth Memory — память с высокой пропускной способностью) используют совсем другой подход. Эта память подразумевает объединение микросхем в стек. Стеки располагаются на промежуточном слое — интерпозере. Задача интерпозера заключается в соеди­нении дорожек между памятью и видеочипом. Благодаря коротким дорожкам (чипы памяти расположены на подложке GPU) достигается невероятная скорость и энергоэффективность. Однако, поскольку плотность хранения отдельно взятого стека в первом поколении ограничена гигабайтом, а размер интерпозера – четырьмя стеками, в сумме на GPU приходится только четыре гигабайта, а этого для поддержки игры в 4K, виртуальной реальности или высокопроизводительных вычислений слишком мало.

HBM2 — память будущего
GDDR5X позволяет выпускать доступные карты с быстрой памятью большого объема

Вторая модификация HBM2, которая вышла в начале 2016 года, решает данную проблему. Возможным это становится благодаря повышению плотности размещения данных на микросхему, увеличению тактовой частоты с 500 МГц до 2 ГГц и использованию режима псевдоканалов, который разбивает один аппаратный канал памяти на два виртуальных, что, подобно гиперпоточности ЦП, приводит к более эффективному задействованию ресурсов. Samsung запустила серийное производство чипов с четырьмя стеками, а SK Hynix планирует начать его в этом квартале. Спецификация теперь позволяет использовать до восьми микросхем в стопке. Исходя из этого, оба производителя намерены еще в этом году увеличить емкость стека до восьми гигабайт.

Первые устройства, которые фактически используют память HBM2, — это ускорители NVIDIA Tesla P100 для серверов и рабочих станций. Пропускная способность ви­деокарт на архитектуре Pascal с 16 Гбайт памяти достигает 720 Гбайт/с — это в три раза больше, чем пропускная способность предыдущих топовых карточек поколения NVIDIA Maxwell. AMD же планирует выпустить первые видеокарты на HBM2 в розничную продажу в начале 2017 года.

И лавры достаются…

… с технической точки зрения памяти HBM2. Размещение нескольких слоев в трехмерной конфигурации уже сейчас позволяет достичь большей по сравнению с GDDR5X производительности, а в перспективе — получить намного более широкие возможности. Но цена тому соответствует, отчего HBM2 останется прежде всего достоянием дорогих быстрых карт для серверов и игр.

GDDR5X — это вершина обычной двумерной технологии памяти. Зато видеокарты с такой технологией общедоступны. Так что память GDDR5X для современных графических плат среднего уровня достаточно быстра и энергоэффективна. Будем ждать появления недорогих видеокарт на ее основе, поддерживающих виртуальную реальность.

ФОТО: компании-производители