Хабраиндекс
319,12
13 мая 2010 в 22:27

Сорокавосьмиядерный процессор в действии, или возвращение P54

На прошлой неделе был в Брюсселе по делам. Среди прочих дел числилось лицезрение работающего компьютера на 48-ядерном процессоре с архитектурой x86, который показывали на Research@Intel. Честно говоря, посмотреть на зверя хотелось. Сорок восемь ядер! Это ж водянка, как минимум! А то и что посуровее. И блок питания на десять киловатт! И вот заходишь в комнатку, а там… обычный системный блок.

Героический вид на 48-ядерный процессор

Обычный бигтауэр, внутри вполне себе обычный пропеллер на радиаторе средних размеров. Честное слово, видывал покрупнее и на Core 2 Duo.

Радиатор 48-ядерного процессора

Какой мощности блок питания сказать не могу, потому что наклейки с него поснимали, а лишнее обмотали непрозрачным скотчем. Но на вид ничего устрашающего. И известно, что под максимальной нагрузкой процессор потребляет 125 ватт, а во время простоя — всего 25.

Системный блок с 48-ядерником, вид сзади

Так в чем же подвох?

Да в том, что ядра в процессоре не простые, а старые добрые P54. Напомню, такие использовались во втором поколении процессоров Pentium, работавших на частоте от 75 до 200 МГц. Только тогда P54 делали по технологии 0,6 мкм, а теперь перевели на 45 нм. В результате, все 48 ядер вместе с четырьмя контроллерами памяти и 24 специальными маршрутизаторами (роутерами), обеспечивающими эффективное взаимодействие с последней, занимают примерно такую площадь, как оригинальный P54 с его одним-единственным ядром.

Частота процессора не разглашается, но вряд ли она очень высока. Ведь задача его — не рекорды скорости ставить, а служить полигоном для испытаний ПО следующего поколения. Сейчас программисты ломают голову как нормально 4-6 ядер испльзовать, а тут сразу 48 в одном чипе! И, насколько знаю, это не предел — если надо можно и несколько сотен засунуть. Ну и что такое 6 ядер по сравнению с этим изобилием? Так, унылое подобие Hyper-Threading…

image

А пока все настолько сэмпловое, что даже память видеоадаптера размещается на обычном ноутбучном модуле.

Ноутбучный модуль видеоадаптера

В самой Intel процессор позиционируют, как прототип облачного компьютера в одном чипе. И тут на первое место вылезает даже не вопрос производительности, а то, какие сетевые интерфейсы это чуду будут обслуживать. По крайней мере, на прототипе обычным Ethernet даже не пахнет.

О других будущих продуктах Intel я написал довольно большую статью на 3Dnews, если интересно — добро пожаловать.

И там же раскрывается тайна — почему производители процессоров не парятся, когда маркируют дорогие кристаллы под дешевые. Любители разлочивать ядра у AMD могут спать спокойно :)
+82
23007
15
vilianov 109,5

Комментарии (60)

НЛО прилетело и опубликовало эту надпись здесь
+1
vilianov #
Уже появились :) Намудрил с линками.
НЛО прилетело и опубликовало эту надпись здесь
+1
degart #
Вот же ж технологии… Честно говоря, сейчас сложно представить куда все эти 48 ядер девать.
Интересно, а как в таком процессоре с поддержкой современных технологий типа Intel VT, SSE4 и т.п.?
+2
vilianov #
В Larrabee, из которого, собственно, и родился этот проц, были всякие расширенные наборы инструкций. А тут — насколько мне известно — честный P54 без наворотов.

Но это не значит, что таковые не появятся завтра.
+1
degart #
Хмм… Грустно.
Ну и, по традиции, ждем ответа от AMD :)
0
vilianov #
Да Intel у них, к сожалению, давно уже ничего не спрашивает…

Меня новые шестиядерники AMD просто огорошили, если честно vilianov.com/hardware/shestiyaderny-processor-amd-phenom-ii-x6/
+2
Abductio #
+4
bfDeveloper #
Куда девать представить не так уж и сложно. Если ваш алгоритм поддерживает маштабируемое распараллеливание, то хоть 100. C помощью того же OpenMP быстро и просто маштабируемо параллелится громадное колличество алгоритмов, будь то сортировка, или любой брутфорс.
+2
romx #
Как говорится: «ключевое слово — »если"
+1
TheMengzor #
Я думаю, что если нужно будет объеденить ферму таких устройств между собой для передачи огромного объема информации, будет использоваться USB 3.0. А если надо будет, то сделают специальные сетевые маршрутизаторы и свитчи на основе USB 3.0.
+3
StopKran #
С чего вдруг usb? С помощью usb нельзя объединять компьютеры, так как в нём нету сетевого стека. И в конце концов ethernet даёт гигабит в секунду. Зачем применять технологию, которая предназначена совершенно для другого, для соединения компьютеров? Бред же.
+2
krasin #
Не совсем. Есть такое направление — millicomputing. Они как раз рассматривают датацентр как мириаду мелких вычислительных модулей, каждый из которых потребляет менее ватта. Так вот оказывается, что ставить на каждый такой модуль гигабитный ethernet очень накладно, т.к. сетевой контроллер будет жрать 1-2 Вт, что уже превышает потребности всего остального модуля. Предлагается объединение таких модулей по 8-16 с помощью usb (который гораздо меньше жрет, поскольку рассчитан на короткие дистанции), а уже блоки объединять 1-50 гигабитным ethernet.
0
StopKran #
Ну в данном случае каждый компьютер можно рассматривать как перефирийное вычислительное устройство (:
0
a5b #
на усб бывают адаптеры комп-комп. С драйвером могут и сеть эмулировать. сетевой стек один фиг в ядре :)

Можно даже рассматривать такой адаптер как связку: усб-сетевушка + патчкорд + усб-сетевушка. Если возможна связка, то возможен и адаптер комп-комп с сетью.
НЛО прилетело и опубликовало эту надпись здесь
0
amarao #
Зачем USB? гигабит/сто мегабит, плюс POE, если вам уж очень хочется видеть «самопитающихся». USB просасывает ethernet'у по всем параметрам. Хотя бы потому, что я не видел ни одного USB-коммутатора, зато я видел старые и забытые ethernet-хабы, которые давно заменили на нормальные коммутаторы с flowtable. С учётом тенденций (openflow), ethernet и только.
+1
false #
А вы видели Эзернет девайсы с питанием меньше 12В? Эзернет просасывает по энергопотреблению в первую очередь.
0
andoriyu #
зачем? есть де FW, а также специальные способы для связи нод в ферме?
+3
Nico_izo #
И всё-таки всё новое — хорошо забытое старое…
+7
vlm #
Очень хорошо забытое, или даже непознанное. Пять лет назад выпускались уже 32-ядерные процессоры фирмой Cavium (Octeon), построенные на архитектуре MIPS.

Cisco использует 176-ядерный процессор собственного производства в старшей линейке своих магистральных устройств.

А тут интел подкатил.
+1
amarao #
Насчёт сети — open vsitch с маршрутизацией или gre-тунелированием до железного маршрутизатора.
0
vilianov #
Записал Ваш прогноз! :)
+1
SantaClaus16 #
Я тоже ожидал увидеть антифриз и помпу от газели)
+4
vilianov #
А зря, кстати, интеловцы не присобачили нечто такое. А потом рраз и у всех на глазах отключить, оставив только пропеллер.

Вот это был бы эффект!
+3
tonkado #
В стиле презентаций Стива )
“One More Thing”…
+2
k0ldbl00d #
Light Peak
0
non7top #
наследие эпического фейла lerabee
–1
Ex3NDR #
а где его фейл?
+2
non7top #
я наверное что-то пропустил и интел таки выпустила на рынок графические адаптеры на основе x86 чипов?
+1
FSA #
Сдаётся мне, что лучше — враг хорошего. Стоит ли увеличивать число ядер до таких масштабов? Не проще ли заменить один много-многоядерный процессор, на несколько менее многоядерных и для каждого выделить определёную задачу, которой он может заниматься самостоятельно, а с другими машинами делиться результатами своего труда только. В любом случае задача получения максимальной производительности сводится к поиску наиболее эффективного алгоритма работы. И чувствую я для каждого алгоритма даже если и потребуется много ядер, то будет оптимальным число много меньше того, что здесь демонстрировалось.
+1
saterenko #
Чем проще??? Сделать мать под несколько процессоров проще чем вставить процессор с большим количеством ядер?

Вам не кажется, что «для каждого алгоритма даже если и потребуется много ядер, то будет оптимальным число много меньше того, что здесь демонстрировалось» несколько смелое суждение? Если даже не учитывать рендеринг и математическое моделирование, найдётся множество задач где многоядерные процессоры пригодятся.
0
FSA #
Вот в том то и дело, что большинство задач можно разбить на несколько независимых задач и уж потом объединять результаты. А увеличение числа ядер упирается в пропусную способность других компонентов компьютера. Фактически с большим количество ядер придётся каждой группе ядер давать свои ресурсы — а это уже фактически второй компьютер.
Вообщем, против ничего не имею, а просто высказываю своё мнение. Вполне возможно в некоторых задачах такое число ядер и может помочь, вот только может ли дать это увеличение хоть какой-то заметный прирост?
–1
ZekMan #
/me роди ежика…

При таком росте технологий нужно иметь толстый кошелек, что бы хотя постоянно иметь машину из средней ценовой… Что уже говорить о покупки каких то новинок.

P.S. 640кб хватит всем…
0
nckma #
интересно, это пользователям хочется все большей мощности, или производителям хочется все больше денег?
0
vilianov #
Думаю, оба желания имею место быть :)
0
ZekMan #
скорее второе чем первое, нам хочется больше комфорта, и чтоб ничего не лагало, а производители вместо оптимизации предлагают все более мощное железо… Я понимаю что многие приложение требуют определенных затрат ресурсов но не так же! А из за быстрого развития еще возникают проблемы совместимости…
+1
lexa0 #
Пользователям хочется того чего им скажут производители.
0
aib #
Пора наверно сказать что-то типа «640 ядер должно хватить всем»
+1
DaemonI #
Это не ноутбучный модуль, это плата на SO-DIMM разьеме, такие часто используются в embedded, но с ноутбуками ничего общего не имеют.
0
vilianov #
Но это тоже память?
+2
DaemonI #
В данном случае — да, GDDR, но обычно SO-DIMM использует под что угодно: сопроцессоры, тач-контроллеры и т.д., просто как контактная площадка.
+1
vilianov #
Спасибо за уточнение, не знал. Смутила наклейка Kingston.
–3
GHS #
Вот теперь ясно, зачем нужно было инженерам интела сидеть в микрософте. Готовятся к новому виндовсу, без 48 ядер никак…
+3
Honeyman #
«Это ж сколько Квейков сразу запустить можно!.. Хотя нет, батя меня точно убьёт...»
0
angry_elf #
Интересно было бы посмотреть тесты производительности хотя бы даже 1-ядерного варианта. Что-то мне подсказывает, что она была бы очень даже на уровне при никаком потреблении электричества.
0
esc #
Поищите на раскладка P2 начального уровня;) Тут, правда намного лучше с энергопотреблением.
0
angry_elf #
Не очень понимать твоя русская ызыка, но догадываюсь, что имелось ввиду «скорость не ахти».

А ничего, что с уменьшением техпроцесса в 20 раз немножко можно нарастить тактовую частоту?
0
esc #
>>Частота процессора не разглашается, но вряд ли она очень высока. Ведь задача его — не рекорды скорости ставить, а служить полигоном для испытаний ПО следующего поколения.

Сложно, конечно, судить о реальной частоте по такой фразе, но думаю, что там не больше 450МГц, а скорее всего, что-то в районе 300. Частоту из-за техпроцесса нарастить можно, но, вряд ли это так просто сделать для 48 ядер, да не сильно и нужно.

Даже, если там 2ГГц, это все равно будет не очень быстрый проц.
+3
Blooderst #
48 бюджетных VPS с честной виртуализацией на одной маме =)
+1
dfayruzov #
Интересно было сравнить сей девайс вот с этими: UltraSPARC T2 and T2 Plus Processors
0
Nico_izo #
SPARC'и порвут этот процессор за один чих, 8 ядер и 64 потока(ядро 1.5 ГГц), а так как там SPARC, то что бы получить частоту x86 надо умножить частоту как минимум на 3(в x86 за один такт выполняется одна операция, а в SPARC — 3. Ну и в среднем SPARC мощней x86 на некоторых операциях.)
таким образом 4.5 ГГц.
Так-то.
+2
romx #
> что бы получить частоту x86 надо умножить частоту как минимум на 3(в x86 за один такт выполняется одна операция, а в SPARC — 3. Ну и в среднем SPARC мощней x86 на некоторых операциях.)

Ну это не так, на самом деле. То есть да, одна, три, но «действие» (не «операция», а законченное «действие») на x86 занимает меньше «операций», чем на RISC.
То есть там, где у x86 10 операций выполняют действие, у RISC запросто можно в 30 и не уложиться. Так что «арифметика» ваша не совсем верна. Она там «нелинейна».

На «некоторых операциях» он действительно «мощнее». Вот только большой вопрос, будут ли эти операции в достаточном количестве использоваться конкретной вашей задачей.

Что же касается T2, то там все еще более неоднозначно. На редкость неоднозначный процессор. Так что с «рванием» придется погодить :)
+2
dfayruzov #
Вот и мы на практике получили уж слишком неоднозначные результаты с T5140.
У вендора на тестовом стенде Xeon'ах задача выполнялсь 6 часов, а у нас на 5140 — 40.
+3
anthonio #
Дак это ж пакеты в gentoo будут ставится по времени как бинарники! :)
+3
VDG #
Даёшь каждому процессу по своему процессору!
0
WayBe #
А какую ось из существующих туда можно поставить с поддержкой пРоцов?
+1
vilianov #
Там сейчас стоит нечто юниксообразное…
0
jah #
… как нормально 4-6 ядер исплОьзовать
0
jah #
)) ну и поправлятор из меня… вы «о» забыли :)

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.