Comments / Profile of pomme / Habr

How to become an author

Андрей Федоровский @pomme

User

Profile Publications 1Comments 168Bookmarks 384

Возможности MongoDB

pomme May 21 2011 at 16:59

В рамках одного сервера она практически бесплатная при наличии индексов.

В случае с MongoDB придется либо (в хорошем случае) хранить подчиненные записи в этом же хеше, либо (как в примере со всеми комментами данного автора) делать full index scan (при наличии индекса по author_id, иначе — full table scan).
Предположение MongoDB такое: запросов второго рода у вас почти никогда не возникнет. Мой опыт работы подсказывает, что возникает, да еще как — функционал сервисов часто совсем не так прост, как хотелось бы программисту.

Но в своей нише (простая схема данных, простые запросы, очень выссокая нагрузка) MongoDB смотрится вполне достойно.

0

Возможности MongoDB

pomme May 21 2011 at 16:48

Вот это беда, конечно. Держать все базы в RAM не очень хочется — дорого.

Надеюсь, что им удастся в будущем реализовать эффективное кеширование и страниц данных, и страниц индексов.

0

Возможности MongoDB

pomme May 21 2011 at 16:44

Я сам его пока не ел :)

У него, как и у остальных NoSQL, есть ограничения, они много перекладывают на сторону приложения:
— организацию сложной схемы данных, целостности, согласованных изменений (транзакций)
— готовность к периодическим сбоям, повторный накат изменений при ошибке (причем, возможно, часть предыдущих изменений все-таки наложилась)
и т.д.
Если вы готовы к таким ограничениям — то да, есть смысл попробовать.

Можно жить и без JOIN. Но грустно:
select id from Companies where domain like '%.ru';
select name from Staff where company_id in (большооой массив интов);

Это не критично, но неудобно в больших базах: запросы в мегабайт размером долго передаются, долго парсятся, делают логи плохо читаемыми.

Главный плюс, который я увидел в MongoDB — п. 18, т.е. выход за пределы in-memory DB. Это воодушевляет.

0

Возможности MongoDB

pomme May 21 2011 at 16:27

А вот, кстати, не осветили тему в видео: как в MongoDB гарантируется уникальность _id в системах с шардингом?

0

Возможности MongoDB

pomme May 21 2011 at 16:25

Я, извините, добавлю, что не стоит забывать про стоимость ресурсов.

MapReduce распараллелит ваш fullscan, и он (один) будет выполнен сильно быстрее. Но при этом он останется фуллсканом и суммарно нагрузит дисковую подсистему вашего сервиса, как минимум, не меньше, чем раньше.
То есть итоговая нагрузка от миллионов запросов в день (что типично для веб-сайта) в лучшем случае не уменьшится, а скорее всего — несколько возрастет.

-1

Возможности MongoDB

pomme May 21 2011 at 16:17

> Да, но редко (статистика к примеру раз в сутки) — тоже делайте вложенными, map/reduse выберет вам все, что нужно без каких либо проблем.

как это — без проблем? это же full scan. такие запросы получаются очень дорогими.

Ключевой ли это функционал — часто не скажешь. Например, на Хабре это есть. Ключевой ли он тут? Вряд ли. Но если каждый запрос этой страницы будет приводить к полному сканированию всего контента сайта — это однозначно уложит систему.

Я, кстати, не вижу нормального решения для выборки всех комментов автора средствами MongoDB, кроме денормализации — хранения предгенеренной копии всех комментов автора в отдельной коллекции авторов.

0

Возможности MongoDB

pomme May 21 2011 at 16:11

Пост — да, наверное, можно организовать единым хешом со всеми комментами, проблем будет меньше, чем с целым блогом.
Но я говорил про немного другую проблему: появился популярный пост и все бросились его комментировать. В результате и сама структура (пост+комменты) получается большой, и при каждом следующем комменте она перезаписывается или полностью или, в лучшем случае, в среднем наполовину (комменты — дерево, новые не аппендятся в конец).
В результате такие записи становятся узким местом системы, чего в случае РСУБД мы не наблюдаем.

0

Полностью автономная камера наблюдения

pomme May 16 2011 at 14:51

Торренты раздавать опять же :)

0

Полностью автономная камера наблюдения

pomme May 16 2011 at 14:51

Ну как — зачем? Холодильник не размораживать каждый раз перед отпуском.

+3

Полностью автономная камера наблюдения

pomme May 16 2011 at 14:04

Интересно, а если это решение для дома, зачем делать его автономным? Версия, работающая от сети, не имеет же проблем с энергопотреблением.

0

Что нового в ICQ 7.5?

pomme May 13 2011 at 19:34

Дайте догадаюсь — заинтересованности ICQ в вашей персоне? :)

+1

Что нового в ICQ 7.5?

pomme May 13 2011 at 19:10

В ICQ — нет, написано же в посте.

0

Что нового в ICQ 7.5?

pomme May 13 2011 at 19:03

Ну раз вы помните его аж с 90-х, может, он не так и плох?

0

Что нового в ICQ 7.5?

pomme May 13 2011 at 19:02

Видеозвонков сейчас где только нет.
И в ICQ, и в Mail.ru агенте, и в QIP.

0

Почему Windows Phone станут лидером рынка в 2015 году

pomme May 13 2011 at 15:20

Видимо, потому же, почему они считают, что доля айфона вдруг передумает расти.
Вот такое у них экспертное мнение. Поди оспорь.

0

Автоматический анализ текста без модераторов

pomme May 13 2011 at 14:08

Просто замечательно, что у Вас есть желание глубже разобраться в задаче. :)
Возможно, я был излишне резок, просто мне кажется, что количество туманных анонсов о возможностях алгоритма пока что плохо соотносятся с его качеством.

Дорожки классификации РОМИПа со списками литературы, в принципе, должно быть достаточно. Также настоятельно советую взять тот же набор данных и прогнать свой алгоритм на них, чтобы объективно оценить его качество по сравнению с остальными.
Если РОМИП перерастете, вот тут есть совсем фундаментальная теория. Ваша задача — из области классификации, или обучения с учителем.

0

Почему Windows Phone станут лидером рынка в 2015 году

pomme May 12 2011 at 20:54

Кстати, как раз этот перелом объясним — WPh начнет есть Symbian.

А вот почему айфон упорно рос два года, обоглан Блекберри, а в 2011 году вдруг сдуется — это вопрос века, да.

0

Russian Code Cup: самое интересное из задач первого этапа

pomme May 12 2011 at 20:51

А остальные задачи в три строчки — слабо? :)

+1

Слово «Стартап» стало ругательным

pomme May 12 2011 at 19:50

А Вы знаете, что такое Bullshit Bingo?

+3

Почему Windows Phone станут лидером рынка в 2015 году

pomme May 12 2011 at 19:43

Всегда умиляли графики, когда одно-два последних значения экстраполируются в далекое будущее. Да еще с переломами трендов, которые почему-то должны случиться через несколько лет.

0

6