ПК достиг предела?

59

В скором времени закон Мура, как и прогнозировалось ранее, перестанет действовать. Что будет потом? CHIP попытался выяснить это.

 Меньше, мощнее, быстрее — сформулированный в 1965 году закон Гордона Мура не теряет актуальности и в наше время: каждые полтора-два года количество транзисторов на кристалле процессора удваивается, пропорционально растет емкость HDD, а вместительность флеш-накопителей увеличивается еще быстрее. Но «такие вещи не могут продолжаться бесконечно», признался сам Мур в 40-летний юбилей своего прогноза. Тогда, в 2005 году, он предрекал своему закону еще от 10 до 20 лет жизни. На практике же обозначенная им тенденция полностью исчерпает себя не позднее 2015-го. Точнее, данный процесс находится уже на завершающей стадии: с 2007 года тактовая частота процессоров практически не увеличивалась, в 2012-м выйдет самый вместительный жесткий диск, а уже к 2015-му разработчикам чипов придется отказаться от кремния как основного производственного материала.

Процессор в квантовом тоннеле


Через четыре года чипы будут изготавливаться уже с использованием стандартов 11-нанометрового техпроцесса. Однако именно при таком масштабе в полной мере проявляются законы квантовой механики.

Проблема. Если компания Intel сдержит свое обещание, то от внедрения 11-нанометрового техпроцесса ее отделяют всего два поколения чипов. То же самое относится и к AMD. В рамках этой технологии ширина затвора транзистора будет составлять не более 5–6 нм. Оксидный слой затвора, то есть изоляция, которая регулирует поток электронов, составит всего 0,3 нм. При такой структуре придется все чаще сталкиваться с эффектом тоннеля: согласно квантовой механике, положение элементарной частицы может быть указано не со стопроцентной точностью, а лишь приблизительно. Если толщина препятствия достаточно мала, то электрон в транзисторе сможет преодолеть даже закрытый затвор. Это внезапно приведет к тому, что «0» превратится в «1».


Решение
. В качестве временного выхода иногда можно позволять процессору делать ошибки в ходе вычислительных операций — он должен лишь вовремя проверить и исправить результат. Intel создала прототип чипа (Palisades), который способен распознавать вычислительные ошибки, возникающие, например, по причине повышения тактовой частоты. Вычисления без ошибок при техпроцессе менее 11 нм возможны только в том случае, если весь транзистор будет изготавливаться из альтернативного материала. В числе первых претендентов — графен, так как благодаря его плоской структуре, образованной слоем атомов, движение электронов может осуществляться практически без сопротивления, что идеально подходит для тактовых частот от 100 ГГц и выше.

Однако полностью заменить кремний он не сможет, так как графен является материалом, который передает электроны, а не полупроводником, который их накапливает. Более перспективным в этом отношении является молибденит, структуру которого также можно сократить до одного слоя атомов, ведь этот материал, как и кремний, является полупроводником.


Сейчас уже имеются прототипы транзисторов на основе обоих материалов. Но даже если удастся осуществить полный переход на какой-либо из них, то потребуется изменить технологии изготовления процессоров. В настоящее время структура материала формируется с помощью 193-нанометрового лазера. Предполагается, что при использовании метода иммерсионной литографии он обеспечит возможность производства даже 11-нанометровых чипов. При этом материал подвергается многократному облучению. После этого поможет только дорогая EUV (Extreme Ultraviolet Lithography) — литография жесткого ультрафиолетового излучения с лазером, длина волны которого составляет всего 13,5 нм.

Тактовая частота на пределе


Тепловыделение — это основная проблема, которая заставляет работать ядра современных процессоров на более низкой частоте. Ммногоядерная архитектура пока не способна компенсировать связанные с этим потери производительности.

Проблема. После появления Pentium 4 компания Intel обещала выпустить в 2011 году процессор с тактовой частотой 10 ГГц. Данное заявление не следует расценивать только как PR-ход, ведь на протяжении многих лет этот показатель увеличивался в геометрической прогрессии. Тактовая частота определяет, с какой скоростью способны переключаться (то есть выполнять вычисления) отдельные транзисторы.

Скорость переключения в значительной степени зависит от ширины затвора. Ввиду того что последняя постоянно уменьшается, теоретически уже сегодня должны существовать модели процессоров с очень высокой тактовой частотой. И хотя с уменьшением затвора увеличивается теряемая транзистором сила тока, использование новых материалов, например гафния, все же позволяет контролировать подобный эффект.


Все было бы уже готово для выпуска новых процессоров, выполняющих 10 млрд операций в секунду, если бы не одна проблема: с увеличением тактовой частоты растет и энергопотребление, а с ним и количество выделяемого тепла, которое должен отводить кулер.

Решение. Помимо центрального чипа практически все компьютеры оснащены видеоплатой с графическим процессором, который несет в себе огромный вычислительный потенциал. AMD и Intel разработали две новые платформы (Fusion и Sandy Bridge), в которых графический и центральный чипы располагаются на одном кристалле. Кроме того, каждое процессорное ядро и графический чип могут обращаться к совместно используемой кеш-памяти. В сочетании с кольцевой шиной это обеспечит значительно более высокую, по сравнению с современными системами, пропускную способность.


Однако объединение вычислительных ресурсов возможно только в определенных случаях — например, при одновременном выполнении схожих операций, таких как обработка изображений, воспроизведение или конвертация мультимедийных потоков, а также шифрование и расшифровка информации. И здесь графический процессор по скорости работы даст фору любому современному CPU. Однако для достижения подобной производительности разработчикам ПО приходится в значительной степени перестраиваться. В настоящее время лишь немногие из них используют соответствующие среды программирования — OpenCL и Direct Compute, позволяющие включить поддержку прямого доступа к ресурсам графического чипа. Однако, согласно заявлениям компании AMD, процессорная индустрия вступает в новую фазу развития, называемую Heterogenous Computing, то есть переходит к выпуску специализированных процессорных ядер, оптимизированных под выполнение конкретных задач — например, декодирование HD-видео или обработку 3D-изображений.

Многоядерные CPU: высокая производительность только при определенных условиях


Проблема.
В настоящее время компьютерная индустрия следует правилу: «Чем больше ядер, тем выше производительность». Когда в следующем году компании AMD и Intel представят свои процессоры нового поколения, настольные системы на базе восьмиядерных чипов уже станут обыденным явлением. Однако на многоядерные CPU распространяется уже не закон Мура, а закон Амдала. Он описывает то, насколько повысится скорость работы программ, если они будут одновременно выполняться несколькими ядрами. Из него следует, что эффективность многоядерных процессоров катастрофически снижается в случае неспособности программы выполнить распараллеливание значительной части своих инструкций.


Решение
. Все исследования в области параллельного программирования сходятся в одном: одних только программных решений недостаточно — необходимы изменения на аппаратном уровне. Компания Intel в рамках проекта Anaphase предлагает новый метод: расширенный вариант программного компилятора разделяет программы (в том числе те, которые не поддерживают параллелизацию) на различные потоки инструкций и передает их специальному вычислительному блоку, который располагается рядом с ядрами CPU и управляет доступом к памяти.

Более комплексный подход используется в вычислительной системе Explicit MultiThreading (XMT), автором которой является профессор Мэрилендского университета передовых компьютерных исследований Узи Вишкин. Он дополнил язык программирования Си командами Spawn и Join. Spawn активирует режим параллельных вычислений, в котором процессором могут обрабатываться одновременно несколько потоков. Одновременно с этим Spawn задает количество потоков, которые могут выполняться параллельно, а Join завершает работу данного режима. То, как производится обработка кода, является задачей аппаратной части. Вишкин создал прототип компьютера, все ядра которого получают доступ к большой кеш-памяти с высокой пропускной способностью. Одно из ядер берет на себя управление потоками и исполняет код, который работает в последовательном режиме.


Эффективным рычагом, позволяющим упростить управление процессами, является механизм организации очередей, основанный на аппаратном ускорении. Очередность — главный аспект программирования, ее целью является разделение кода программы на как можно большее количество потоков. Однако список очередей хранится не в самом CPU, а в кеш-памяти. Участники проекта Hardware-Accelerated Queueing (аппаратное ускорение организации очередей) университета Северной Каролины намерены внедрить блок управления потоками в CPU, что позволит ядру напрямую управлять своей очередью.

1
2
ПОДЕЛИТЬСЯ


Предыдущая статьяParagon Software Group выпустила Drive Copy 11 Professional для любых видов миграции
Следующая статьяСеть меняет наши мозги?
КОММЕНТАРИИ



    Загрузка...
    MEDIAMETRICS