ПК достиг предела?

ПК достиг предела?

В скором времени закон Мура, как и прогнозировалось ранее, перестанет действовать. Что будет потом? CHIP попытался выяснить это.

В скором времени закон Мура, как и прогнозировалось ранее, перестанет действовать. Что будет потом? CHIP попытался выяснить это.

 Меньше, мощнее, быстрее — сформулированный в 1965 году закон Гордона Мура не теряет актуальности и в наше время: каждые полтора-два года количество транзисторов на кристалле процессора удваивается, пропорционально растет емкость HDD, а вместительность флеш-накопителей увеличивается еще быстрее. Но «такие вещи не могут продолжаться бесконечно», признался сам Мур в 40-летний юбилей своего прогноза. Тогда, в 2005 году, он предрекал своему закону еще от 10 до 20 лет жизни. На практике же обозначенная им тенденция полностью исчерпает себя не позднее 2015-го. Точнее, данный процесс находится уже на завершающей стадии: с 2007 года тактовая частота процессоров практически не увеличивалась, в 2012-м выйдет самый вместительный жесткий диск, а уже к 2015-му разработчикам чипов придется отказаться от кремния как основного производственного материала.

Процессор в квантовом тоннеле


Через четыре года чипы будут изготавливаться уже с использованием стандартов 11-нанометрового техпроцесса. Однако именно при таком масштабе в полной мере проявляются законы квантовой механики.

Проблема. Если компания Intel сдержит свое обещание, то от внедрения 11-нанометрового техпроцесса ее отделяют всего два поколения чипов. То же самое относится и к AMD. В рамках этой технологии ширина затвора транзистора будет составлять не более 5–6 нм. Оксидный слой затвора, то есть изоляция, которая регулирует поток электронов, составит всего 0,3 нм. При такой структуре придется все чаще сталкиваться с эффектом тоннеля: согласно квантовой механике, положение элементарной частицы может быть указано не со стопроцентной точностью, а лишь приблизительно. Если толщина препятствия достаточно мала, то электрон в транзисторе сможет преодолеть даже закрытый затвор. Это внезапно приведет к тому, что «0» превратится в «1».


Решение
. В качестве временного выхода иногда можно позволять процессору делать ошибки в ходе вычислительных операций — он должен лишь вовремя проверить и исправить результат. Intel создала прототип чипа (Palisades), который способен распознавать вычислительные ошибки, возникающие, например, по причине повышения тактовой частоты. Вычисления без ошибок при техпроцессе менее 11 нм возможны только в том случае, если весь транзистор будет изготавливаться из альтернативного материала. В числе первых претендентов — графен, так как благодаря его плоской структуре, образованной слоем атомов, движение электронов может осуществляться практически без сопротивления, что идеально подходит для тактовых частот от 100 ГГц и выше.

Однако полностью заменить кремний он не сможет, так как графен является материалом, который передает электроны, а не полупроводником, который их накапливает. Более перспективным в этом отношении является молибденит, структуру которого также можно сократить до одного слоя атомов, ведь этот материал, как и кремний, является полупроводником.


Сейчас уже имеются прототипы транзисторов на основе обоих материалов. Но даже если удастся осуществить полный переход на какой-либо из них, то потребуется изменить технологии изготовления процессоров. В настоящее время структура материала формируется с помощью 193-нанометрового лазера. Предполагается, что при использовании метода иммерсионной литографии он обеспечит возможность производства даже 11-нанометровых чипов. При этом материал подвергается многократному облучению. После этого поможет только дорогая EUV (Extreme Ultraviolet Lithography) — литография жесткого ультрафиолетового излучения с лазером, длина волны которого составляет всего 13,5 нм.

Тактовая частота на пределе


Тепловыделение — это основная проблема, которая заставляет работать ядра современных процессоров на более низкой частоте. Ммногоядерная архитектура пока не способна компенсировать связанные с этим потери производительности.

Проблема. После появления Pentium 4 компания Intel обещала выпустить в 2011 году процессор с тактовой частотой 10 ГГц. Данное заявление не следует расценивать только как PR-ход, ведь на протяжении многих лет этот показатель увеличивался в геометрической прогрессии. Тактовая частота определяет, с какой скоростью способны переключаться (то есть выполнять вычисления) отдельные транзисторы.

Скорость переключения в значительной степени зависит от ширины затвора. Ввиду того что последняя постоянно уменьшается, теоретически уже сегодня должны существовать модели процессоров с очень высокой тактовой частотой. И хотя с уменьшением затвора увеличивается теряемая транзистором сила тока, использование новых материалов, например гафния, все же позволяет контролировать подобный эффект.


Все было бы уже готово для выпуска новых процессоров, выполняющих 10 млрд операций в секунду, если бы не одна проблема: с увеличением тактовой частоты растет и энергопотребление, а с ним и количество выделяемого тепла, которое должен отводить кулер.

Решение. Помимо центрального чипа практически все компьютеры оснащены видеоплатой с графическим процессором, который несет в себе огромный вычислительный потенциал. AMD и Intel разработали две новые платформы (Fusion и Sandy Bridge), в которых графический и центральный чипы располагаются на одном кристалле. Кроме того, каждое процессорное ядро и графический чип могут обращаться к совместно используемой кеш-памяти. В сочетании с кольцевой шиной это обеспечит значительно более высокую, по сравнению с современными системами, пропускную способность.


Однако объединение вычислительных ресурсов возможно только в определенных случаях — например, при одновременном выполнении схожих операций, таких как обработка изображений, воспроизведение или конвертация мультимедийных потоков, а также шифрование и расшифровка информации. И здесь графический процессор по скорости работы даст фору любому современному CPU. Однако для достижения подобной производительности разработчикам ПО приходится в значительной степени перестраиваться. В настоящее время лишь немногие из них используют соответствующие среды программирования — OpenCL и Direct Compute, позволяющие включить поддержку прямого доступа к ресурсам графического чипа. Однако, согласно заявлениям компании AMD, процессорная индустрия вступает в новую фазу развития, называемую Heterogenous Computing, то есть переходит к выпуску специализированных процессорных ядер, оптимизированных под выполнение конкретных задач — например, декодирование HD-видео или обработку 3D-изображений.

Многоядерные CPU: высокая производительность только при определенных условиях


Проблема.
В настоящее время компьютерная индустрия следует правилу: «Чем больше ядер, тем выше производительность». Когда в следующем году компании AMD и Intel представят свои процессоры нового поколения, настольные системы на базе восьмиядерных чипов уже станут обыденным явлением. Однако на многоядерные CPU распространяется уже не закон Мура, а закон Амдала. Он описывает то, насколько повысится скорость работы программ, если они будут одновременно выполняться несколькими ядрами. Из него следует, что эффективность многоядерных процессоров катастрофически снижается в случае неспособности программы выполнить распараллеливание значительной части своих инструкций.


Решение
. Все исследования в области параллельного программирования сходятся в одном: одних только программных решений недостаточно — необходимы изменения на аппаратном уровне. Компания Intel в рамках проекта Anaphase предлагает новый метод: расширенный вариант программного компилятора разделяет программы (в том числе те, которые не поддерживают параллелизацию) на различные потоки инструкций и передает их специальному вычислительному блоку, который располагается рядом с ядрами CPU и управляет доступом к памяти.

Более комплексный подход используется в вычислительной системе Explicit MultiThreading (XMT), автором которой является профессор Мэрилендского университета передовых компьютерных исследований Узи Вишкин. Он дополнил язык программирования Си командами Spawn и Join. Spawn активирует режим параллельных вычислений, в котором процессором могут обрабатываться одновременно несколько потоков. Одновременно с этим Spawn задает количество потоков, которые могут выполняться параллельно, а Join завершает работу данного режима. То, как производится обработка кода, является задачей аппаратной части. Вишкин создал прототип компьютера, все ядра которого получают доступ к большой кеш-памяти с высокой пропускной способностью. Одно из ядер берет на себя управление потоками и исполняет код, который работает в последовательном режиме.


Эффективным рычагом, позволяющим упростить управление процессами, является механизм организации очередей, основанный на аппаратном ускорении. Очередность — главный аспект программирования, ее целью является разделение кода программы на как можно большее количество потоков. Однако список очередей хранится не в самом CPU, а в кеш-памяти. Участники проекта Hardware-Accelerated Queueing (аппаратное ускорение организации очередей) университета Северной Каролины намерены внедрить блок управления потоками в CPU, что позволит ядру напрямую управлять своей очередью.

Жесткие диски: лимит исчерпан

1, 2, 3, 4 Тбайт — может показаться, что препятствий для увеличения емкости HDD не существует. Но эффект суперпарамагнетизма вносит свои коррективы.


Проблема.
Согласно данным консорциума ASTC, в этом году пользователи всего мира сохранят 40 000 000 Тбайт новых данных. Производители жестких дисков, такие как Seagate или Western Digital, готовятся к тому, что в скором времени, когда плотность данных станет очень высокой (1,3–1,4 Тбайт на пластину), им придется столкнуться с так называемым суперпарамагнетическим пределом. Магнитная область, хранящая один бит информации на пластине, представляет собой группу магнитных доменов — вследствие ее намагничивания изменяется значение бита. Для увеличения плотности записи можно уменьшить количество частиц, однако оно не должно быть меньше 20 — в противном случае головка чтения/записи окажется не в состоянии однозначно идентифицировать биты. В зависимости от материала даже незначительные колебания температуры могут привести к тому, что намагниченность внезапно исчезнет — этот суперпарамагнетический эффект может стать причиной того, что единица снова превратится в ноль.


Решение.
Появление такого эффекта зависит от двух факторов — количества частиц и анизотропной энергии материала. Последняя указывает на то, сколько энергии потребуется головке чтения/записи, чтобы изменить намагниченность. Только частицы сплава металла с высокой анизотропной энергией могут сохранять стабильность. Но это означает также и то, что изменение магнитной ориентации требует больших усилий, а головка чтения/записи не в состоянии справиться с этой задачей. Если же в процессе записи выполнять нагрев магнитных частиц с помощью специального лазера, то их анизотропная энергия будет уменьшаться до такого уровня, при котором головка сможет воздействовать на магнитную ориентацию. Такова суть идеи термоассистируемой магнитной записи (Heat-Assisted Magnetic Recording, HAMR). Согласно прогнозам компании Seagate, технология HAMR позволит существенно увеличить плотность данных, чего невозможно достичь с помощью используемых в настоящее время материалов.


Но суперпарамагнетический предел можно преодолеть также путем использования доменов большего размера, что позволит сократить их количество на один бит.

Уменьшения шума сигнала компании Western Digital, Hitachi и Toshiba намерены добиться путем изоляции групп частиц, которые хранят магнитный заряд каждого бита. Данный метод получил название Bit Patterned Media (BPM — технология битового массива). Магнитная поверхность HDD на основе технологии BPM состоит из многочисленных ячеек округлой формы. Toshiba представила первый прототип диска, в котором данные ячейки имеют диаметр 17 нм. Проблемой является само производство, так как ячейки, как и при изготовлении процессорных кристаллов, формируются посредством литографии. Поэтому подобный диск обходится намного дороже, чем традиционные магнитные пластины.

Накопители на основе флеш-памяти становятся менее надежными


Проблема.
Казалось бы, ничто не может остановить бурное развитие SSD — накопителей на основе флеш-памяти. Однако все чаще проявляются признаки того, что их бум близится к своему завершению. Причина кроется в конструкции ячейки флеш-памяти, которая представляет собой транзистор с плавающим затвором, через который «проталкиваются» электроны. При этом система распределения электронов определяет то, в какое состояние переключается ячейка. В обычных SSD-накопителях транзисторы MLC-ячеек (Multi-Level Cell) могут хранить четыре состояния заряда, то есть два бита. Поток электронов проходит через оксидный слой плавающего затвора. Если требуется перезаписать ячейку, необходимо освободить ее от электронов, что достигается с помощью высокого напряжения (25 В).


Однако вследствие этого ячейка теряет часть оксидного слоя затвора, за счет чего изнашивается. Это означает, что чем меньше ячейка, тем быстрее она «стареет».

Чтобы обеспечить равномерный износ, в современных SSD-накопителях имеется специальный контроллер, который управляет операциями записи.

Решение. Самым простым способом увеличения плотности данных на SSD является сохранение трех битов в одной ячейке, однако вместе с этим увеличивается вероятность возникновения ошибок.

Для комплексной системы коррекции ошибок небольших ячеек флеш-памяти производители намерены использовать отдельные микросхемы, что позволит уменьшить нагрузку на SSD-контроллер. Более прогрессивной является идея расположения ячеек флеш-памяти горизонтальными слоями. Компания Toshiba планирует в 2013 году начать производство флеш-памяти с трехмерной структурой ячеек.

Наряду с мемристором (подробнее читайте в CHIP №12 2010) первым кандидатом является Phase Change Memory (PCM — память с изменением фазового состояния). Используемые для производства PCM германий-сурьма-теллуровые (GeSbTe) пленки способны в зависимости от степени нагрева производить фазовый переход с непроводящего аморфного в проводящее кристаллическое состояние. В кристаллической фазе сопротивление минимальное, в аморфной — максимальное. Для считывания необходимо приложить напряжение.

Скорость чтения находится приблизительно на уровне оперативной памяти, а запись данных длится дольше, так как материал должен быть на мгновение разогрет до 600°C.


Второй кандидат — магнитная память — основывается на том факте, что электроны помимо заряда обладают спином, который может иметь состояние «вверх» или «вниз». Однако технология изготовления памяти с передачей спинового момента еще недостаточно отработана, поэтому первые коммерческие продукты появятся не раньше, чем через три-четыре года

Рекомендуем