Comments / Profile of keleg / Habr

Потапов Владимир Витальевич @keleg

Пользователь

Profile Publications 4Comments 291Bookmarks 7

keleg Apr 6 2011 at 09:51

Нашел на parallel.ru целый список конференций по суперкомпьютингу и около.
Там даже мой Иркутск есть!
parallel.ru/conferences/russian_conferences.html

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 5 2011 at 17:41

Принято.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 5 2011 at 13:56

Я не явавод, но гугл говорит, что очень много
Даже для ruby есть.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 5 2011 at 11:01

Доклад PITAC (The President’s Information Technology Advisory Committee) Вычислительные науки: обеспечение превосходства (конкурентоспособности) Америки

«Страна, которая хочет достичь превосходства в конкурентной борьбе, должна превосходить конкурентов в области вычислений»

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 5 2011 at 10:48

Не буду сочинять, не знаю. По идее должны запускать сразу на всем оборудовании. Возможно, именно с этим связана низкая эффективность главного китайского суперкомпа.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 5 2011 at 09:53

На конференции слышал, что часть мат. библиотек уже переписали. Т.е. просто используешь, а она, при необходимости, использует ускоритель.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 5 2011 at 09:34

По стандартной методике, теоретическая производительность, linpack, разница — эффективность.
Т.к. суперкомпов с граф. ускорителями пруд пруди, технология отработана.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 18:30

Сайт www.supercomputers.ru лег, однако хабраэффект?

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:59

Но для противоракетной обороны пришлось городить гигафлопный суперкомпьютер…

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:58

Ну почему же не будет? У pentium4 и core вполне разная оптимизация, разве что этим занимаются компилеры и мы это не видим. Так будет и для видеокарт, тем более что у OpenCL jit-компилятор.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:54

48 кб + 64 кб константной памяти.
А насчет огромных трудозатрат — это да, но кто первый это сделает, тот и будет на коне. Сейчас задача облегчается тем, что раньше для программирования Cray нужно было покупать Cray, а теперь достаточно домашней видеокарты.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:51

Насколько мне не изменяет мой склероз, там 48 кб… да, мало, сам знаю, регистров еще меньше, но у процессоров так же. Но будет еще меньше, я не написал в статье еще одну проблему — количество памяти на ядро все время уменьшается.
Вспоминаем экономию памяти, как в 60е годы.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:41

Ну, т.к. я довольно долго бился с OpenCL, я не питаю больших иллюзий, интеловская система с легкими, но не SIMD ядрами будет очень интересным решением. Однако же, чем «легче» ядра, тем больше их можно засунуть на кристалл, потому граф. ускорители при одной и той же технологии всегда будут на шаг впереди и всегда будут востребованы на своем классе задач.
Насчет 16ти потоков — скорее всего идет речь о 16 группах SIMD потоков, т.е. вы пытаетесь запустить не параллельный по данным код и он делится только на количество микропроцессоров, а не на все их ядра (там же двухуровневая организация).
На Tesla 448 ядер и соответствующим кодом их вполне можно задействовать.
Насчет OpenCL — уже сейчас Intel выпустила его реализацию для процессоров. OpenCL силен тем, что можно напрямую указывать, в каком кэше будут лежать какие данные (сейчас этим оптимизатор занимается автоматом), что позволит получать предсказуемые по производительности результаты на разных платформах. Опять же, я писал в статье, что через OpenCL уже можно управлять целым кластером, так что технология явно универсальна и жизнеспособна.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:32

1) Можно попробовать асинхронный режим, главное, чтоб памяти хватило.
2) ну, и с gcc так вполне бывает.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 17:30

В моей задаче пришлось долго подбирать, какую часть засунуть на ускоритель. В результате все-таки получилось найти участок программы, внутри которого ходили большие объемы памяти а снаружи было терпимо (несколько гигабайт за 15 минут). Скорость обмена все ж таки несколько Гб/с, что совсем не мало.
Есть идея попробовать сделать архивацию перед пересылкой, на разреженных данных возможно получить выигрыш.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 11:35

По моему опыту, профайлер не всегда правильно показывает причину замедления, я тоже долго грешил на память, оказалось — ветвление.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 11:04

Американцы вполне сейчас пользуются своим монополизмом в суперкомпьютерном софте и, понятно, зажимают наших ядерщиков и авиастроителей. Да, слава Богу это не война, но это вызов — и именно на уровне государств.
Я не принадлежу к ура-патриотам, но вполне понимаю, что технологии, затрагивающие национальную безопасность никогда не будут полностью корпоративными.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 10:48

Развитие идет по спирали.
Впрочем, мозги достаточно надежно думают на принципиально ненадежных элементах, так что, думаю, начиная с некоторой сложности все равно придется учиться программировать ненадежные системы.

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 09:56

Если перейти по ссылке, там достаточно подробно про SIMD — моя статья про OpenCL и как раз прямым текстом про замедление при ветвлениях. Ы?

Look

Суперкомпьютеры: третья мировая гонка

keleg Apr 4 2011 at 09:39

Интел уже выпустила альфу своей реализации OpenCL. Не думаю, что они идут совсем уж своим путем, ведь дело не в каких-то фишечках оптимизации, а в проблемах программирования для гетерогенной параллельной архитектуры.

Look

1 2 ...

12 13