Компания
311,60
рейтинг
14 ноября 2012 в 18:35

Разное → Жизнь в эпоху «тёмного» кремния. Часть 1


Другие части: Часть 2. Часть 3.

Пока продолжение рассказа о коммуникационных фабриках по не зависящим от меня причинам откладывается, хотелось бы осветить другую тему.
С 8 по 12 октября в Подмосковье проходила крупнейшая в России конференция, посвященная проблемам разработки микро- и наноэлектронных систем. И хоть сама конференция оставила скорее негативное впечатление, но одно из выступлений выделялось из общей массы и, вероятно, будет интересно уважаемым читателям. Речь об аналитическом докладе «Life with «dark» silicon. Power and termal problems in future platforms», который представлял Mike Kishinevsky (Principal Engineer, Strategic CAD Labs, Intel Corp.). Я постараюсь рассказать об основных идеях этого доклада, используя материалы конференции и сторонние источники.

Что такое «темный» кремний

Итак, как всем известно, в далеком 1965 году, Гордон Мур, один из основателей корпорации Intel сформулировал наблюдение, в дальнейшем получившее название «закон Мура». [1] Согласно этому наблюдение количество транзисторов, размещаемых на кремниевом кристалле, удваивается приблизительно каждые два года. Данная тенденция сохраняется на протяжении более чем 45 лет, благодаря появлению всё более и более сложных технологических процессов. Сейчас активно используется 22nm техпроцесс, 14nm появится в ближайшие 1-2 года, и 10nm также не за горами. [2]
Если подобная тенденция сохранится, то к 2022 году количество транзисторов внутри одной микросхемы достигнет триллиона, а число слоев металлизации (используются для формирования связей между транзисторами) достигнет 14-18 штук – это необходимо для того, чтобы эффективно объединить столь огромное число транзисторов в единую систему. [3] Но, к сожалению, не всё столь безоблачно.

Согласно зависимости, известной как закон Деннарда, при масштабировании техпроцесса в S раз, вычислительная мощность (в идеальных условиях) возрастает как S3. Кроме того, такой рост происходит без дополнительных накладных расходов энергопотребления. Это объясняется тем, что на той же площади помещается в S2 больше транзисторов выполняющих полезную работу, и такие транзисторы могут работать на большей в S раз тактовой частоте. При этом емкость и рабочее напряжение могут быть уменьшены в S раз. [4]
На практике, по мере уменьшения технологического процесса, растут токи утечки, протекающие через закрытый транзистор, что является основным фактором роста энергопотребления, которое в идеальном случае бы не менялось. В результате такого роста, в двухтысячных тепловыделение некоторых процессоров приближалось к тому, что можно наблюдать в недрах ядерного реактора, а энергопотребление ассоциировалось скорее со сварочным аппаратом, а не с высокотехнологичным устройством. [5]
Необходимость оставаться в определенных рамках энергопотребления привела к появлению ограничения называемого Utilization Wall, согласно которому с каждым новым техпроцессом и в отсутствие радикальных технологических изменений, доля площади кристалла задействованной в активной работе (буквально, где могут переключаться транзисторы) убывает экспоненциально. Причем эта площадь измеряется единицами или даже долями процентов. [6] Оставшаяся бОльшая часть кристалла, не задействованная в данный момент в работе, и получила название «тёмный» кремний («Dark» Silicon).


Utilization Wall

В результате разработчики новых микропроцессоров должны быть уверены, что в любой момент работы бОльшая часть кристалла является «темным» или «тусклым» кремнием – бездействует или работает на значительно пониженной тактовой частоте.
Майкл Тейлор в своей статье «Is Dark Silicon Useful? Harnessing the Four Horsemen of the Coming Dark Silicon Apocalypse»[7] упоминает о четырех «всадниках Апокалипсиса» — четырех основных подходах, позволяющих микроэлектронике процветать в эпоху «тёмного» кремния. Эти подходы: использование новых достижений технологического процесса, параллелизация для энергоэффективности, специализация и управление энергопотреблением. Кроме того, важную роль играет оптимизация на системном уровне. О данных подходах и пойдет речь дальше.

«The Deus Ex Machina Horseman» или прогресс технологического процесса.


“MOSFETs are the fundamental problem. “

We can switch to FinFets, Trigate, High-K,
nanotubes, 3D, for one-time improvements,
but none are sustainable solutions across
process generations.


Из всех четырех всадников кремниевого апокалиспсиса, это, безусловно, самый непредсказуемый. В литературе или театре Deus Ex Machina относится к сюжету, в котором главные герои, кажется, совершенно обречены, но затем что-то совершенно неожиданное и непредсказуемое приходит из ниоткуда, чтобы спасти ситуацию.
В случае тёмного кремния, Deus Ex Machina мог бы стать научный прорыв в полупроводниковой технологии. Однако, подобные прорывы должны быть достаточно фундаментальными. И, скорее всего, в недалеком будущем подобный прорыв потребует использования транзисторов отличных от традиционной MOSFET технологии. Причиной является то, что токи утечки определяются фундаментальными физическими принципами. Хотя такие инновации как изобретение FinFET / Tri-Gate транзисторов или использование High-K диэлектриков и т.д., представляют значительные достижения. Но являются скорее одноразовыми улучшениями, а не масштабируемыми изменениями. [8] Не буду останавливаться на преимуществах Tri-Gate, т.к. о них писалось уже не раз :)

Разработки технологий, способных прийти на смену MOSFET ведутся уже давно. Два потенциальных и (на данный момент) наиболее перспективных кандидата: это TFET-транзисторы и нано-электро-механические переключатели. Есть причины считать, что обе эти технологии могут обеспечить уменьшение токов утечки на порядки, по сравнению с используемыми сейчас решениями, но, при этом, они всё еще очень далеки от промышленного использования.

Одним источником оптимизма о существовании прорывных технологий является производительность, энергоэффективность и плотность человеческого мозга. Мозг объединяет 100 триллионов синапсов, которые работают, потребляя менее 20W, и служат живым доказательством возможности высоко параллельных и при этом в основном «темных» вычислений.
Как итог, технологические достижения всё еще продолжают удивлять, уже сейчас существует ряд интересных альтернатив традиционной MOSFET-электронике. Но предсказать когда эти альтернативы доберутся до промышленного использования, а тем более, появление новых не представляется возможным.

«The Shrinking Horseman» и параллелизация для энергоэффективности


“Area is expensive. Chip designers will
just build smaller chips instead of having
dark silicon in their designs!”


(if you work on Dark Silicon research, you will hear this a lot…)


Из-за роста токов утечки по мере масштабирования техпроцесса, многоядерность микропроцессоров не может далее масштабироваться так же, как уменьшается занимаемая одним ядром площадь кристалла. При этом «темный» или «тусклый» кремний – экспоненциально более дешевый ресурс с точки зрения энергопотребления. Это заставляет обратиться к архитектурным решениям, позволяющим «расходовать» площадь кристалла, чтобы «приобрести» энергоэффективность. Приведенный на рисунке пример, показывает, как замена одного компаратора на два, работающих параллельно, но на вдвое меньшей частоте, позволяет сократить энергопотребление в 2.5 раза! [9] На практике, далеко не все узлы можно распараллелить на близкий к идеальному манер, но выигрыш с точки зрения энергопотребления будет всё равно ощутим.


Trade-off площади и энергопотребления

Немедленной реакцией на такой подход со стороны многих разработчиков было то, что «площадь кристалла – дорогой ресурс, почему бы просто не делать микропроцессоры меньше, вместо использования «тёмного» кремния?» Однако, это самый пессимистичный сценарий. И хотя все чипы могут в конечном итоге претерпеть сокращение площади, такой взгляд упускает ряд второстепенных факторов, играющих решающую роль.

Во-первых, стоит сказать, что «темный» кремний не значит, «пустой», «бесполезный» или «неиспользуемый» кремний. Даже в лучшие дни CMOS технологии, микропроцессор и другие схемы были полны темной логики, которая используется только для некоторых задач. Например, блок выполнения SSE инструкций на x86 не используются для нерегулярных вычислений, а удвоение LLC (последнего уровня кэша) даёт выигрыш только для небольшого круга задач.

Также заслуживает внимания финансовая сторона сокращения площади кристалла. В том, что производить меньшие кристаллы выгоднее, есть некоторая правда. В конце-концов, разработчики микропроцессоров тратят массу усилий, пытаясь попасть в доступный бюджет по занимаемой площади. Меньшие по площади процессорные кристаллы линейно (или еще более) дешевле. Кроме того, для них выше показатели выхода годных при производстве. Но экспоненциально меньшие по площади процессоры не будут экспоненциально дешевле из-за затрат на разработку, изготовление литографических масок, корпусирование и т. д. А эти затраты тоже должны как-то амортизироваться, что приведет к росту стоимости за единицу площади кремния. Что, в свою очередь, сделает переход на новый техпроцесс финансово менее привлекательным и приведет к несчастливому экономическому концу закона Мура. Также существует ряд других причин, основанных на законах конкурентной экономики, объясняющих, почему сокращение площади — это крайне маловероятный сценарий, но не буду вдаваться в подробности, не слишком интересные техническому кругу читателей.

Ну и нельзя не упомянуть проблемы, связанные с корпусированием и рассеиванием тепла, возникающие при сокращении площади кристалла. Важным следствием экспоненциального сокращения площади является экспоненциальный рост удельной потребляемой мощности. Последние исследования в области анализа тепловых характеристик чипов многоядерных процессоров [10] показали, что пиковая температура горячей точки (hotspot) может быть смоделирована как Tmax = TDP * (Rconv + k/А). Где TDP — величина, показывающая, на отвод какой тепловой мощности рассчитана система охлаждения процессора, Rconv – характеристика радиатора (меньше – лучше), k – собирательная характеристика свойств микропроцессора, а A – занимаемая площадь. При экспоненциальном уменьшении площади, второе слагаемое становится доминирующим и приводит к экспоненциальному росту температуры. Необходимость же уберечь процессор от перегрева потребует пожертвовать частью его производительности.
Кроме того, сокращение площади также представляет целый ряд практических инженерных вопросов. Например, вертикальное соединение кремниевых пластин, с использованием технологий подобных Die Stacking требует наличия контактных площадок и прорезей в кремнии (TSVs), размер которых не может уменьшаться столь же легко. Кроме того, области подключения I/O также не масштабируются со скоростью закона Мура.


3-D интеграция и TSV в картинках :)

Как итог: дальше уменьшаться площадь микропроцессоров, скорее всего не будет (а если и будет, то очень медленно). Но если раньше дополнительные транзисторы, приносимые каждым новым поколением техпроцесса, использовались для повышения производительности (примерно в 1.4 раза за каждое поколение), то сейчас — для сокращения энергопотребления (примерно на 40% за каждое поколение)

Продолжение.

Источники

  1. Gordon Moore (1965). «Cramming more components onto integrated circuits»
  2. Mark Bohr, Intel, 2011
  3. Shekhar Borkar, Intel, 2010
  4. Mark Bohr, (2007) “A 30 Year Retrospective on Dennard's MOSFET Scaling Paper”
  5. Fred Pollack, (1999) “New Microarchitecture Challenges in the Coming Generations of CMOS Process Technologies”, keynote at Micro
  6. Ganesh Venkatesh et al, (2010) “Conservation Cores: Reducing the Energy of Mature Computations”, ASPLOS 2010
  7. Michael Taylor, (2012) «Is Dark Silicon Useful? Harnessing the Four Horsemen of the Coming Dark Silicon Apocalypse», DAC 2012
  8. Ian Young, Intel, 2012
  9. Anantha Chandrakasan et al, (1992) “Low-Power CMOS Digital Design”
  10. W. Huang et al, (2008) «Many-core design from a thermal perspective." DAC 2008.
Автор: @yurav
Intel
рейтинг 311,60

Комментарии (27)

  • +1
    Ну видеопроцессорные вендоры на 28нм уже начали решать эту проблему.
    Правда там и архитектура by design многоуровневая блочная с высоким уровнем параллелизма, поэтому отдельные блоки разных размеров выключать проще.
    И у AMD, и у Nvidia в последних сериях есть наметки на динамическое балансирование энергопотребления.
    В SoC всё еще прогрессивней в этом плане. Ибо в мобильных устройствах время работы довольно важно. Там и отключение отдельных блоков IP (со своими еще легче), и даже ядер процессора, как в Tegra 3/

    > Но экспоненциально меньшие по площади процессоры не будут экспоненциально дешевле из-за затрат на разработку, изготовление литографических масок, корпусирование и т. д.

    Этот довод немного не понял я.
    Часть из этих трат всё равно нужно будет предпринять (изготовление масок, к примеру), а часть уже использовалось ранее (корпусирование).
    • 0
      Похоже, мне надо срочно дописывать продолжение :), иначе его придется писать в виде комментариев.
      Там будет и про SoC и про специализированные блоки. (В данный пост не вошло еще две «лошадки» и system-level optimization)
      • 0
        Возможно, нужно учитывать, что с уменьшением размера при фиксированных затратах на разработку сравнимыми темпами возрастет и спрос, то есть потенциальное количество девайсов, в которое можно будет засунуть уменьшенные процы.

        Допустим, у нас есть стандартный стационарный процессор единичной площади. Он в целом прекрасно выполняет свою функцию управления ПК стационарного формата. Но кому-то приходит в голову сделать проц сравнимой производительности в два раза меньше, и вот уже юзер покупает не только десктоп, но и ноутбук, то есть спрос увеличивается фактически вдвое. Еще одно уменьшение формата, и к этим устройствам присоединяются смартфон и планшет, затем смартвотч, еще какие-то гаджеты и так далее; чем меньше процессор или иная микросхема, тем больше ей найдется применений и тем дешевле обойдется один ее экземпляр.
        • 0
          Дык это довод pro привели как раз за уменьшение линейных размеров чипа.
          А в статье, наоборот, утверждается что это экономически необоснованно.
          • 0
            Необоснованно может быть, если целевой функцией данного процессора является производительность стационарной вычислительной системы, т. е. от ПК и до суперкомпьютеров и датацентров; если большой «темный» проц оказывается более холодным и позволяет запихнуть больше гигагерцоядер в кубометрокельвин, более гибко конфигурировать архитектуру и т. д., будут использовать именно такой. Но производительность — это еще не все, есть еще и мобильность во все более возрастающем ассортименте применений, куда проц большего размера просто не засунешь; и вот здесь, в каком-нибудь слуховом аппарате или другом крошечном девайсе запросто пригодится не особо мощный специализированный проц размером в милли-, микро-, а затем и нанометры, который может быть не особо пригодным к масштабированию в суперкомпьютерах, серверах и ПК общего назначения, но здесь будет незаменимым. Вот что я имел в виду под экономической целесообразностью уменьшения размеров процессоров. Фактически речь идет о разных типах процессоров, но еще недавно ARM и ему подобные считались медленной и специализированной игрушкой, а сегодня они устанавливаются в большую часть приобретаемых пользователями новых устройств.
            • 0
              Ну, если говорить о крошечных устройствах и мелкосерийном производстве, то до них новый техпроцесс, как и проблемы темного кремния еще не скоро доберутся.
              Интересный факт, что большинство мелкосерийной электроники до сих пор делается чуть ли не по 100нм техпроцессу, как вы думаете почему?
              • 0
                Потому что она выполняет свои специализированные задачи и не обросла еще такой многослойной программной частью для взаимодействия с человеком — как пользователем, так и программистом. (Вспомнилась цитата о запуске «Аполлона» и птичек из рогатки.) Да и 100 нм — это всего лишь 10 лет отставания, еще недавно это были микрометры. Но, например, те же мобильные телефоны лет 15 назад были по интерфейсу сравнимы с микроволновкой, а сегодня на них почти такая же ситуация, как и на ПК: основная часть мощности уходит на поддержку инфраструктуры поддержания широты возможностей программирования. Интересный вопрос, что будет дальше, т. е. какое еще более мелкое устройство достигнет сравнимого уровня программируемости (например, очки дополненной реальности, вычислительная начинка которых весьма компактная). Или разработка и аппаратное производство таких устройств в итоге настолько упростятся, что грань между программной и аппаратной частью сотрется, т. е. какой-нибудь очень маленький девайс для специфической потребности будет проще напечатать сразу в железе на 3д-принтере или нанофабрике, чем проектировать его таким, чтобы на нем крутились всяческие тяжеловесные ОС и фреймворки для облегчения написания быдлокода.
                • 0
                  Ну, оборонная промышленность всё еще уверенно использует 1.3мкм и местами 0.8мкм :)

                  А еще дело в чем. — когда новый техпроцесс только появляется — он очень дорогостоящий. Поначалу и процент брака выше и т.д. (не случайно поначалу на новых техпроцессах делают чипы памяти, а потом за логику берутся) Кроме того, надо за 2-3 года окупить постройку самой фабрики, а это 5-10млрд долларов.
                  Со временем же производство на определенном техпроцессе дешевеет, затраты на проектирование тоже уменьшаются. ну и небольшие мелкосерийные поделки выгоднее делать на уже несколько устаревших технологиях
                  • 0
                    Это раз, да.
                    Два — военные технологии должны быть более защищёнными и надёжными, поэтому используется более отлаженный техпроцесс.

                    Я молчу про авиацию и космос, где чем больше проводник, тем меньше он страдает от пролетающих мимо высокоэнергетических частиц.
                    • 0
                      Говорить про надежность имеет смысл только четко определив, что, как, в каких условиях и по каким критериям сравнивается.
                      Будет ли надежнее 0.8мкм технология, чем 0.25мкм? а если учесть, что на более тонком техпроцессе любую схему в том же объеме кремния можно заменить на схему с тройным резервированием?
        • 0
          Во первых, продать хотя бы в два раза больше процессоров — совсем не так просто, как вы утверждаете. А в 4, 8, 16 раз? Если вы знаете секрет как — вам прямая дорога в маркетинг за миллиардами =) Даже если допустить, что процессор вообще ничего не будет стоить, люди всё равно не кинутся скупать гаджеты пачками. Стоимость процессора — лишь часть конечной стоимости изделия.

          Во вторых, а что вы собираетесь делать с тепловыделением? на часы штатный CPU кулер не поставишь. А меньшая площадь ситуацию с охлаждением только ухудшает.
          Да, один экземпляр обойдется дешевле, но не в разы,
          • 0
            См. комментарий выше. Речь не о классических процессорах для стационарного железа — они могут пойти и в другую сторону, если это будет лучше соответствовать цели — интеграции множества таких процессоров в на порядки более мощную систему с максимальным соотношением производительности вычислений к затратам. Речь о том, что самих классов процессоров и прочих кремниевых девайсов становится все больше, а сами такие девайсы продолжают уменьшаться в минимальных размерах. Это не значит, что они должны вытеснить большие ЦП во всех задачах — но это и не требуется. Просто сам круг задач, в которых используется кремний, становится все более разнообразным.

            В 4, 8, 16 раз число компьютеризированных гаджетов все же увеличивается, правда не с удвоением каждые два года, а несколько медленнее, но это происходит, а сами гаджеты дешевеют. Попробуйте посчитать, сколько у вас в доме компьютеров, если считать компьютерами не только универсальные ПК или планшеты, но и все, что встроено в бытовую технику, медиадевайсы, аксессуары и т. д.
            • 0
              Кто знает… =)
              IBM CEO в 1943м говорил: «Думаю, что на мировом рынке мы найдем спрос для пяти компьютеров». Предугадать что будет хотя бы через 10 лет очень и очень трудно.

              > Это не значит, что они должны вытеснить большие ЦП во всех задачах
              В «небольших» ЦП темного кремния тоже предостаточно.

              На самом деле, тут можно долго спорить, и это нормально. В научных кругах тоже не бывает полной солидарности во мнениях. Правда тут только одна — то, что делается сейчас и то как оно делается — наиболее экономически выгодный и востребованный подход из наблюдаемых. Если бы существовала возможность радикально увеличить прибыль — ей бы непременно воспользовались.

              >Попробуйте посчитать, сколько у вас в доме компьютеров
              Подсчет «компьютеров» дал число 5. Боюсь, я явно не представитель статистического большинства

              Согласно статистике, с 2009го года до нынешнего дня и по прогнозам до 2016го года мировой рынок умных устройств растет чуть менее чем линейно. Если, например, смартфоны и растут быстрее, то лишь за счет спада в других сегментах.
              И даже если допустить, что рост экспоненциальный, но медленнее чем удвоение каждые два года — насколько разойдутся кривые через 5 лет?

              • 0
                Ссылку на статистику не подбросите?
                • 0
                  Первое, что удалось найти в открытом доступе:
                  клик
                  и:
                  клик
                  • 0
                    Ха! Так и знал:). По второй ссылке «умными устройствами» называют планшеты, ПК и смартфоны. Ясное дело, что их никто не собирается покупать десятками в ближайшую пару лет в существующих форм-факторах. Сам же планшет как таковой (не те ноутбучные поделки начала нулевых) появился, как известно, в 2010 и уже чуть менее чем за три года достиг такого объема продаж, как ни одно устройство в истории. Посмотрим, что будет с теми же гуглоочками, когда их аналоги начнут штамповать китайцы ближе к концу десятилетия.
                    • 0
                      Согласен, посмотрим.
                      Но достиг-то планшет таких продаж потеснив другие сегменты. Не исключаю, что те же гуглоочки ростом своих продаж сократят, например, продажи смартфонов.
                      • 0
                        В краткосрочном периоде — возможно. Впрочем, вся статья собственно об относительно краткосрочных (5-10 лет) перспективах самого передового сегмента универсальных вычислений. Если же выйти за его пределы, то мы увидим Atom, всяческие SoC и другие примеры описанного мною тренда. Подождем продолжения от автора, и спасибо за дискуссию!
  • –3
    (к вопросу о 3d-интеграции)
    А слабо встроить mp3-плеер блохе в подкову?
    • +1
      а как это связано с 3d-интеграцией?
      • 0
        Пространственный монтаж электроники, нет?
        • +1
          Да. Но причем здесь блоха?
          Наверное, это какая-то очень тонкая шутка :)

          Если пытаться говорить серьезно на эту тему, сейчас вопрос скорее в том, как сделать настолько маленький mp3 плеер. Даже если брать только кристалл его микросхемы и не думать о 3d интеграции. Нога блохи — это во много порядков меньше площади типового кристалла.
  • 0
    спасибо. красиво написано.
    жду продолжения. :)
  • 0
    простите, оффтоп.

    В связи с последней лентой новостей, прочитал «Жизнь в эпоху «тёмного» кремлия».
    Осталось подписать «Средневековье, холст, масло. 2012 год».

  • 0
    >Также существует ряд других причин, основанных на законах конкурентной экономики, объясняющих, почему сокращение площади — это крайне маловероятный сценарий, но не буду вдаваться в подробности, не слишком интересные техническому кругу читателей

    а можно кратко озвучить почему-таки ?)
    • +1
      Вкратце, боюсь, не выйдет. Рассуждения аналитиков примерно следующие:
      Если существует способ использовать преимущества темного кремния, добавив преимуществ конечному продукту, то конкуренция заставит компании их использовать. Иначе компании будут вынуждены перейти в low-end, низкоприбыльный сегмент рынка с высокой конкуренцией.
      А те компании, кому удастся использовать эти преимущества, займут high-end рынок, будут наслаждаться высокой прибылью и получат превосходство на рынке.
      Уменьшение площади, конечно, сократит стоимость, но рыночную цену оно сократит гораздо сильнее.
      подробнее описано здесь:
      faculty.chicagobooth.edu/workshops/marketing/PDF/nosko_jmp.pdf
      возможно Вам будет интересно.
      • 0
        спасибо!

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Самое читаемое Разное