IKMC Jan 2 2019 at 13:59

Перспектива: MultiClet S1

16 min

18K

High performance*Compilers*CPUCryptocurrenciesSupercomputers

From sandbox

+50

Comments 42

VaalKIA Jan 2 2019 at 16:21

Превосходно! Прочёл на одном дыхании.

Вопрос про FIXPT MOPS / MHz 0.714 0.116
Уполовинили FP, а чем объясняется столь низкий результат в целочисленных?

Второй момент, хотелось бы так же тесты на модном нынче RayTracing, раз уж процессор может всё и позиционируется как ускоритель.

IKMC Jan 2 2019 at 20:53

Кода под рукой нет, посмотрим, как праздники кончатся. Но, возможно, в старых (или новых) измерениях ошибка, ибо у старой архитектуры нет никаких преимуществ перед новой.

Если вы подразумеваете realtime Ray Tracing, как в видеокартах NVidia, то у них аппаратное ускорение этого дела, отдельные ядра над этим работают. А мультиклеточный процессор, в том то и дело, может исполнять любой код, а не только графические задачи. Аппаратного ускорения для чего-то конкретного нет.

amartology Jan 2 2019 at 16:33

Надо заметить, что техпроцесс 28 нм – это самый низкий бытовой диапазон, не требующий специальных разрешений на использование, поэтому был выбран именно он.

WUT? Вы о чем вообще? Чьи специальные разрешения требуются, например, на 16 нм?

+11

marsianin Jan 3 2019 at 09:16

Вы сильно удивитесь. В Intel, например, чтобы работать на проектах процессоров, которые будут выпущены на 14, 10 и 7 нм, нужно получить лицензию государственного департамента США (по крайней мере, гражданам России точно).

amartology Jan 3 2019 at 10:38

Россиянин в американской компании — это одно, а не находящейся под санкциями российской компании выпустить майнинговый (или любой другой невоенный) чип на 7-10 нм TSMC организационно ничего не мешает. Более того, такие проекты вполне себе есть. Точнее, в случае с майнерами, скорее были, чем есть)

marsianin Jan 3 2019 at 11:14

Не буду спорить, хотя допускаю, что там могут быть какие-то другие подводные камни.
С другой стороны, топовые техпроцессы дороже, чем 28 нм. Может быть, в этом и есть причина? (-:

amartology Jan 3 2019 at 12:10

Вполне вероятно, что главный фактор — цена. Но это не то, что сказано в статье.
Что касается подводных камней, то они существуют, но проекты ниже 28 нм в России делаются.

IKMC Jan 3 2019 at 14:24

16 нм и более низкие топонормы требуют очень сложного и длительного процесса заключения индивидуального NDA с фабрикой с массой ограничений и подписок, контролем проекта на требования законодательства некоторых стран и, соответственно, рядом производственных рисков, которые компании в настоящее время не нужны.

datacompboy Jan 2 2019 at 17:34

А как без переноса реализовывать 128битную арифметику теперь эффективно?

arthi7471 Jan 2 2019 at 23:17

«На данный момент новый процессор находится в разработке, но уже появились первые результаты и можно оценить, на что он будет способен.»

Пока ни как.

Alexey2005 Jan 2 2019 at 17:44

А почему Google под ссылкой на официальный сайт компании «Мультиклет» выдаёт приписку «Возможно, этот сайт был взломан»?

IKMC Jan 3 2019 at 14:40

Когда-то давно взламывали сайт, сейчас всё нормально должно быть. Может с сертификатами до сих пор проблема осталась, проверим.

ineganov Jan 2 2019 at 20:28

О! Радует, что необычная архитектура получила развитие! Спасибо за статью, ждем результаты с кремния!

В новой ревизии немало архитектурных изменений.
Вот, в частности, возможность адресовать аргументы в памяти для любых команд — а как в этом случае выполняются зависимости по памяти?
Например, чтение после записи в пределах одного параграфа. А если в разных параграфах? Есть ли какая-то модель памяти, которой придерживается процессор? Является ли завершение параграфа барьером по записи?

Еще вот интересно: в первых версиях, насколько я понял, распределение инструкций по клеткам было реализовано «по модулю»: каждая n-ая команда попадает в n-ую клетку. Добавили ли хитрый планировщик, который мог бы учитывать фактическую готовность клетки?

IKMC Jan 2 2019 at 20:54

По умолчанию контроль очередности чтения и записи включен, то есть если сделать две подряд идущие команды записи и чтения по подному адресу, то чтение дождется записи и считает уже новое значение. Если контроль выключен, никаких гарантий нет, но все записи зато могут проходить параллельно. Завершение параграфа больше не влияет ни на записи, ни на установления регистров.

Второе нужно уточнить, но вроде бы да, если одна команда исполняется долго, то остальные клетки продолжают выборку.

UFO just landed and posted this here

IKMC Jan 2 2019 at 21:03

Не совсем понимаю, что вы имеете ввиду. Если вы о чем-то из предыдущих статей, то в R1 можно было реконфигурировать клетки для совместного исполнения кода: 4 клетки вместе выполняют один код, 2 группы по 2 клетки выполняют 2 разных кода, или 4 клетки отдельно выполняют разный код. В S1 только один вариант: 16 раздельных мультиклеток, в каждой 4 клетки вместе выполняют код.

lelik363 Jan 2 2019 at 21:07

Какая периферия будет на процессоре? Какие характеристики у PCI-Е?

IKMC Jan 4 2019 at 12:59

PCI-E 3.0 x4

Psychosynthesis Jan 2 2019 at 21:13

Это всё круто, но чёт очень похоже на энтузиастов, которым просто нравится сам процесс и они как-то удачно нашли инвестора.

Когда ждать в продаже?

amartology Jan 2 2019 at 22:40

Лучше! Не инаестора, а ICO!

Первые образцы сверхпроизводительного российского 28-нанометрового процессора Multiclet S1 для майнинга (добычи криптовалюты) должны увидеть свет в сентябре 2018 г. («плюс минус месяц»), а первые устройства-майнеры на его основе — в ноябре. Об этом CNews рассказал основатель проекта RMC по созданию данного «железа», а также интернет-омбудсмен, глава и владелец «Радиус груп» Дмитрий Мариничев.

Заодно наконец-то превратили девайс из очень странного процессоров общего назначения во вменяемый ускоритель.

yarston Jan 2 2019 at 21:47

Очень интересно. А видеокарту сделать не хотите? Рынок-то немаленький.

andy_p Jan 3 2019 at 01:30

Имеет ли эта архитектура что-то общее с транспьютером?

newpavlov Jan 3 2019 at 01:31

Несколько вопросов:
— Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)? На мой взгляд данная сфера намного более сладкая чем майнинг криптовалют.
— Есть ли прогресс по поддержке Rust'а? Два года назад вы писали что тестовая программа написанная на Rust'е запускалась без особых проблем. Например, сообщество вокруг RISC-V проявило весьма заметный интерес к первоклассной поддержке Rust'а.
— Сотрудничаете ли вы с университетами, либо планируете ли вы это делать? Например, вы могли бы предоставлять заинтересованным университетам во временное или постоянное использование мультиклеты для проведения исследований с их использованием. Тут, думаю, была бы обоюдная польза, вам пиар, потенциальные будущие заказчики, отзывы от пытливых исследователей (что поможет в будущем при общении с реальным бизнесом) и возможно дополнительные применения, которые вы упустили из виду, а им статьи и, если очень повезёт, хороший потенциал для создания стартапа.

IKMC Jan 5 2019 at 15:51

Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)?

По идее, всё, что имеет отношение к нейронным сетям, должно хорошо ложиться на мультиклеточную архитектуру. Но никто ещё не пробовал.

Есть ли прогресс по поддержке Rust'а?

Прогресса пока нет, но мы знаем, что есть интересующиеся. Какую-нибудь минимальную тестовую программу можно запустить, наверное, на любом языке, для которого сделан фронтенд LLVM (для Rust и C++ такое сработало). Но, как только программа усложнится, появятся конструкции, которые пока не может обработать либо бэкенд, либо ассемблер. В приоритете сейчас стоят оптимизации бэкенда, что повлияет потом на скорость работы любого языка.

Сотрудничаете ли вы с университетами, либо планируете ли вы это делать?

Пока не знаем.

IKMC Jan 7 2019 at 12:07

Уже развернуты учебные классы на R1 в УрФУ и УрГУПС. Ряд университетов в Санкт Петербурге и Москве обдумывает приобретение.

Kroligoff Jan 3 2019 at 05:45

28нм связано с тем что планируете производить на Российских площадках?

-1

amartology Jan 3 2019 at 10:34

А в России есть или в обозримой перспективе будет 28 нм?

UFO just landed and posted this here

amartology Jan 3 2019 at 12:15

Не 130 (которые по факту 250), а все же 90. Но ни о каких 28 нм, конечно речи нет, разве что в интервью одного широко известного академика, в которых нет ни слова по том, на каком оборудовании он предполагает выпускать эти 28 нм.

marsianin Jan 3 2019 at 11:28

Нельзя просто взять и перенести выпуск чипа с одной площадки на другую. У каждой компании, у которой есть фабрики, свои библиотеки элементов, на базе которых делается физический дизайн (то есть, грубо говоря, логические элементы раскладываются в транзисторы). Поэтому, чтобы перенести выпуск, скажем, с Global Foundries на TSMC, нужно переделывать физдизайн, а это некоторые затраты ресурсов. То есть, даже если в России появится производство 28 нм, не получится просто так, безболезненно на него переехать.

amartology Jan 3 2019 at 12:20

Тем не менее, переезд с фабрики на фабрику — это типовая задача, которая регулярно решается разными людьми, и которая представляет собой намного меньшую трату ресурсов, чем разработка проекта с нуля или переход с совсем других топологических норм (не говорим сейчас о скейлинге типа 45->40).

IKMC Jan 3 2019 at 14:27

Нет, выбор топонормы обусловлен тем, что это минимальная «разумно доступная» топонорма, а российских фабов для такого производства, пока, к сожалению, не предвидится.

Chugumoto Jan 3 2019 at 12:43

В этом случае, хэшрейт такой платы будет равен либо превышать хэшрейты существующих видеокарт, при этом энергопотребление платы с S1 будет в два раза меньше, даже чем у видеокарт с топонормами 16 и 14 нм.

вы забыли, что 470 можно даунвольтить, память разогнать по частоте и таймингам и получить не 25,8 а 30мх… то же самое с 1080ти. 55 достижимы при энергопотреблении меньшем, чем указано в таблице.
ну а также, что уже есть асики, которые какраз в два раза энергоэффективнее видеокарт… соотвественно для данного алгоритма уже будет вставать вопрос цены… сколько же эти ускорители будут стоить? хотя конечно в отличии от асиков данное решение будет и универсальным, вот только разработчики нужны на написание софта :) а много ли их?

плюс про 20 процессоров на одну плату, вы не забыли, что придется тогда и памяти поставить хотя бы 20*4гб (а лучше 8 для универсальности)? что и по размерам и по цене…

IKMC Jan 3 2019 at 14:39

В том то и дело, они наделают асиков, в Ethereum в итоге на proof-of-stake перейдет. А на мультиклете можно будет просто алгоритм для другой криптовалюты написать. SDK же выложено в открытый доступ, кому надо майнить — те и напишут.

Какие конкретно будут платы — этот вопрос ещё решается.

Chugumoto Jan 3 2019 at 22:25

на эфире еще есть идеи сменить алго с даггера на прогпов
а по поводу того кому надо…
так под ПЛИС тоже есть всё, только вот пишущих намного меньше, ибо сложнее. так и тут.
если будет отсутствие писателей нужного софта — ненужны они будут никому…
а отсюда я б на месте разработчиков демоплаты простенькие распространял бы бесплатно, чтобы желающие могли познакомиться с архитектурой…
а там… видно будет…

IKMC Jan 3 2019 at 22:32

Именно с архитектурой бесплатно можно познакомиться прямо сейчас. В SDK включена модель-отладчик, которая эмулирует все команды процессора. Вы, конечно же, не узнаете реального быстродействия железа, но писать и отлаживать программы можно уже сейчас, используя модель. Мы, например, этим и занимаемся.

Chugumoto Jan 4 2019 at 16:36

хм… а ссылочки есть?
так то вроде интересная архитектура :)

VaalKIA Jan 4 2019 at 16:47

Сайт мультиклет, вроде как в декабре ПО обновили, думаю это уже всё новое.

webhamster Jan 3 2019 at 23:48

А вроде бы говорили, что теоретический предел в распараллеливании алгоритма на клетки — около 12 клеток, и далее эффективность вычислений не растет, больше тратится на синхронизацию и работу с памятью. Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?

IKMC Jan 4 2019 at 11:23

Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?

Клеток то всего 64, но объединены они в группы по 4, т.е. аппаратное распараллеливание алгоритма идет на 4 клетки.

beeruser Jan 5 2019 at 04:52

оффтоп:
Я так понимаю вы работаете в MC?
Наймите (не лично вы), пожалуйста, переводчика.
Хотел дать ссылку на англоязычный форум, но что-то стало стыдно.
Англоязычная часть сайта это же «кровь из глаз». «МГИМО финишд?»
multiclet.com/index.php/en/company/about-company

IKMC Jan 5 2019 at 11:45

Руководство компании не рекомендует русскоязычным разрабам пользоваться английской частью сайта, заведомо вторичной и слабо сопровождаемой. Сейчас нет необходимости как-либо ее поддерживать, но если найдется англоязычное коммьюнити, заинтересованное в разработке или сотрудничестве, можно будет и сделать нужные переводы.

-1

Show the best of all time