Новые процессоры NVIDIA Tesla основаны на Kepler

На уходящей неделе компания NVIDIA представила новые графические процессоры семейства Tesla: K10 и K20. Как и всегда, Tesla предлагаются для решения самых сложных и требовательных к производительности задач, но кардинальное отличие новых GPU от предшественников — архитектура Kepler в качестве основы. Благодаря использованию Kepler (напомним, дебютировала на потребительской GeForce GTX 680) в новых процессорах Tesla инженерам удалось реализовать следующие нововведения:

  • Новые потоковые мультипроцессоры SMX, которые, по словам представителей NVIDIA, были переработаны фактически с нуля и теперь обладают в три раза более высокой удельной производительностью (производительность на Ватт потребляемой энергии), чем прежние Tesla, базирующиеся на архитектуре Fermi. Что делает возможным создание суперкомпьютера, в котором производительность в 1 петафлопс будет достигаться мощностью всего 10 серверных стоек (это опять-таки — заявление NVIDIA). Вместе с повышением производительности новые мультипроцессоры SMX позволяют добиться и большей энергоэффективности: здесь в четыре раза больше ядер CUDA, чем у Fermi, но они работают с меньшей частотой. При этом, неиспользуемые части GPU не получают питания, а площадь самих GPU была увеличена под ядра для параллельных расчетов.
  • Динамический параллелизм. Эта технология позволяет GPU динамически создавать новые потоки, что позволяет процессору гибко адаптироваться к типу обрабатываемых данных. В результате, параллельное программирование становится более простым процессом и GPU-ускорение уже возможно применить для широкого круга популярных алгоритмов.
  • Hyper-Q. Благодаря этой функции несколько ядер CPU могут задействовать для вычислений ядра CUDA с одного GPU, что, естественно, ведет к увеличению нагрузки на последний. Одновременно это способствует и сокращению простоя CPU и улучшает программирование. В NVIDIA полагают, что данная функция окажется наиболее эффективной в кластерных приложениях, использующих MPI.

Процессоры Tesla K10 строятся на двух GPU K104 и их суммарная производительность на операциях с одинарной точностью составляет 4,58 терафлопс. Пропускная способность памяти равняется 320 Гбайт/с, емкость — 8 Гбайт. NVIDIA адресует K10 предприятиям нефтегразовой и оборонной промышленности.

В свою очередь K20 представляет собой новое флагманское решения в семействе Tesla. Он основан на GPU GK110 и должен обеспечить в три раза более высокую производительность при операциях с двойной точностью, чем флагманские Tesla на Fermi.

В дополнение к релизу новых процессоров Tesla «Зеленой гигант» сообщил о подготовке к запуску платформы параллельных вычислений CUDA 5. Запуск намечен на третий квартал 2012 года.

ПОДЕЛИТЬСЯ


Предыдущая статья7-дюймовый планшет с ICS оценили в $65
Следующая статьяMaKey MaKey: клавиатурой может быть все, что угодно
КОММЕНТАРИИ