Команда Microsoft Research побила мировой рекорд по сортировке

На сайте sortbenchmark.org ежегодно проводятся конкурсы по сортировке больших наборов данных. Один из видов соревнований — minute sort, в котором необходимо за минуту прочитать с диска и сортировать ...
+61
22 мая 2012, 16:00
30
ilya42 1025,0

Hadoop достиг версии 1.0

Известная платформа для массово-параллельной обработки данных Apache Hadoop вышла в версии 1.0.0 (release notes). Для другого проекта выпуск первой версии мог бы считаться знаменательным событием и ...
+7
30 декабря 2011, 02:21
7
alizar 2224,8

MapReduce для начинающих на Erlang'e

Я продолжаю свое погружение в Эрланг. Уже есть хитрый план переписать один из наших сервисов для мониторинга на Эрланге. Мы тут осваиваем облака Windows Azure и Amazon EC2 в качестве платформы для ...
+26
1 декабря 2011, 02:40
52
begoon 129,8

Общедоступный индекс веба (5 миллиардов веб-страниц)

Организация Common Crawl сделала щедрый подарок разработчикам и компаниям, которые работают в области поиска и обработки информации. В открытый доступ на Amazon S3 выложен индекс из 5 миллиардов веб- ...
+58
8 ноября 2011, 18:20
110
alizar 2224,8

MapReduce в трех картинках перевод

.NET*
Что такое MapReduce? Это подход, алгоритм, ну или паттерн, тут уж как кто назовет, параллельной обработки больших объемов сырых данных, например результатов работы краулеров или логов веб ...
+54
12 июля 2011, 22:34
89
Regfor 13,5

Spark: дата-майнинг до 30x быстрее Hadoop

В Калифорнийском университете в Беркли разработали фреймворк Spark для распределённых вычислений в кластерах. На некоторых задачах он превосходит Hadoop в 10-30 раз, сохраняя при этом ...
+23
23 июня 2011, 15:22
26
alizar 2224,8

Чего стоит почистить datastore от сессий при помощи Mapper API

Те, кто включил в своём приложении на GAE поддержку сессий, знают, что сессии, во-первых, записываются в datastore, а во-вторых, автоматически оттуда не исчезают. От протухших сессий надо как-то ...
+47
22 сентября 2010, 22:29
23
dbarashev 16,0

MapReduce: более продвинутые примеры, попробуем без зауми

Чтобы не откладывать в долгий ящик сразу порассказываю несколько других примеров для MapReduce, обещанные в топике "MapReduce без зауми". (Если не понимаете полностью что такое MapReduce — ...
+78
3 сентября 2010, 19:33
151
yoihj 245,1

MapReduce или подсчеты за пределами возможностей памяти и процессора (попробую без зауми)

Давно хотел рассказать про MapReduce, а то как ни взгляшешь на подобное — такая заумь, что просто ужас берет, а на самом деле очень простой и полезный подход для многих целей. И реализовать самому — ...
+125
3 сентября 2010, 17:16
211
yoihj 245,1

Вышли Java/Python SDKs 1.3.5, а также частичная реализация MapReduce для AppEngine

Сначала расскажу об изменениях в SDKs, а потом о MapReduce. Итак, — Увеличение квот TaskQueue с 50 запросов на приложение до 50 запросов на очередь, в последующих резилах ожидаются дальнейшие ...
+26
1 июля 2010, 12:29
5
mrskam 35,4