• Мы на Highload++ в этом ноябре: задай вопрос инженерам Badoo
    0
    В конце поста есть список победителей со списком вопросов.
    Чем понравились – перекрёстное субъективное мнение всех участников ответов: каждый голосовал за вопросы, которые ему понравились, в итоге образовался топ-3, это они :)
  • Мы на Highload++ в этом ноябре: задай вопрос инженерам Badoo
    0
    Привет! К сожалению, билеты уже всё, но на вопрос, конечно, отвечу.
    Наши инструменты – не серебряная пуля, не универсальны.
    Zabbix – уже позволяет много автоматизировать и кастомизировать в зависимости от окружения и потребностей.
    Насколько я могу судить – людей с такими же проблемами и задачами, как у нас – единицы.
    Чтобы открывать и выкладывать в открытый доступ – нужно либо много исправлять (времени нет), либо изначально делать с учётом на паблик (но никогда не знаешь, что получится в итоге).
    Мы же решаем задачи, а не создаём сервисы.
    Как-то так.
    Но мы постараемся!

    P.S. Оповещения для Telegram делались именно с расчётом на открытость и массовое использование, универсально для всех и каждого. Делается в свободное время и начинал его как pet project на зимних каникулах :)
  • Мы на Highload++ в этом ноябре: задай вопрос инженерам Badoo
    +2
    Привет!

    Спасибо за вопрос и пищу для размышлений – возможно, станет темой для доклада на следующем митапе :)

    Применение Zabbix возможно в современном стеке технологий.

    Теперь подробнее и по порядку.

    • Мы используем Заббикс не только для инфраструктуры: серверы, диски, сеть, память, проц; но и для приложений: работоспособность сервисов, внутренние метрики [время ответа, cpu usage per instance, свежесть данных в них, наличие бэкапов [для всех или выборочно] сервисов.
    • Сервисы – различные, как опенсорсные, так и внутренние. Например, nginx, php-fpm MySQL, Tarantool. Внутренние, понятное дело, называть не буду, смысла нет.
    • Под каждый сервис – обычно заводится мониторинг с нуля (очень-очень редко берём готовые шаблоны из паблика, да и то – сильно правим их). Во-первых, мы всегда можем и должны ответить на вопрос “что это и зачем”, во-вторых, есть правила, по которым мы всё добавляем более или менее однообразно.
    • “Заббикс ничего не умеет” – у нас очень много кастомных скриптов, которые проверяют всё подряд. Заббикс умеет запускать эти скрипты с разными шаблонными параметрами.
    • Чтобы каждый раз ручками не кликать в интерфейсе – используем API, в основном для заведения хостов, (благо, библиотек полно) и LLD (low level discovery), для заведения айтемов/триггеров.


    Как мониторим
    Обычно: идём на порт демона и опрашиваем его.
    Редко: идём в файловую систему (например, демон пишет дампы каждый час, они важны, надо проверять работоспособность), в случае с контейнерами – тяжелее добраться до файлов (пути не очевидные, либо добраться нужно через docker), но это возможно (и мы так делаем).

    Иногда: сходить в базу, населектить значения. Например, очередь в MySQL – SELECT COUNT(*). Или сходить по определённому урлу – nginx status page.

    По поводу контейнеров: контейнер для нас (мониторинга) – просто сервис. Точнее, все наши сервисы (или почти все) живут в контейнерах, поэтому нам особой разницы нет, что мы мониторим: сервис, запущенный через systemd, или сервис, который живёт в контейнере. Нам важно то, как мы его мониторим – это обсуждается, как уже говорил, для каждого сервиса отдельно (или дорабатывается в процессе эксплуатации)

    Как мы узнаём о том, что и где мониторить?
    Написали свою дискаверилку всего-всего, которая умеет добавлять хосты, писать адекватные логи, линковать с нужными шаблонами, класть их в нужные группы и выдавать необходимые права (если используете Zabbix и его внутреннюю дискаверилку хостов – точно натыкались на её непрозрачную работу). Суть работы простая – проверяем «где должно быть», смотрим в заббиксе «где уже есть», недостающие создаём и цепляем к шаблонам, лишние удаляем.
    Чаще всего дискаверим (для сервисов) из DNS и PuppetDB (если интересно об этом, тут Антон Турецкий banuchka может прокомментировать откуда Puppet знает про сервисы, да и он вроде уже рассказывал на Хайлоаде).
    Отдельно про DNS – повелось давно, чтобы можно было переносить сервисы без изменения каких-либо конфигов: перекинул сервис/контейнер, перекинул dns запись, код пошёл к новому хосту. И мониторинг – обращаемся по DNS имени, не нужно менять ничего в нашей системе. По сути, на один инстанс сервера имеется одна DNS запись.

    Далее – два варианта:
    1. цепляем целиком хост (dns алиас) к шаблону
    2. цепляем шаблон с low level discovery к имеющемуся хосту: lld приходит на хост, проверяет, какие сервисы должны быть на хосте и уже мониторит их пачками (таким образом, при переезде сервисов у нас один набор проверок удаляется на одном реальном хосте и появляется на другом, lld же)


    Очень редко – бывает, что нужно мониторить работу контейнера, но это укладывается в первый вариант «понять, где нужно проверять работоспособность и прицепить нужный шаблон к нужному хосту».

    Схема в первом случае выглядит так:
    <шаблон> –> (дискавери работает) –> <хост для сервиса> –> , , …
    Схема во втором случае:
    <шаблон> –> (дискавери работает) –> <хост, где живут сервисы/контейнеры> –> (low level дискавери работает) –> , , , , …

    Выводы
    У нас есть своя дискаверилка – прицепить туда Consul не составляет большого труда (нет, сейчас не используем, он у нас в качестве эксперимента и/или используется только для инфраструктурных сервисов)
    Контейнеры мониторить можно, разными способами. Но мы мониторим не контейнеры, а сервисы – это важно понимать (ок, если надо контейнеры – мониторим, как описал выше)

    Точно знаю, что есть много людей, которые говорят, что «заббикс не предназначен для мониторинга контейнеров!!!11 в моём прометеусе это делается из коробки!!1» (или тулзами, которые умеют взаимодействовать с ним)
    В целом – да.
    Но если у вас уже есть одна система (как у нас) и она работает давно, и вам не хочется поддерживать несколько систем мониторинга – заббикс можно научить работать с тем, что вам нужно.

    Не устану повторять, что Zabbix – это просто платформа, а не готовое решение. Ровно как и Prometheus – вам нужно будет настроить его, прежде чем катить в прод.

    P.S. Как-то рассказывал, как мы скрестили заббикс и аппликейшен/бизнес метрики: www.youtube.com/watch?v=QhFpVc_iHKA так что, возможно всё :)
  • Мы на Highload++ в этом ноябре: задай вопрос инженерам Badoo
    +2
    habrahabr.ru/company/yamoney/blog/339350, пункт номер два :)
  • Zabbix 3.4: Массовый сбор данных на примерах счетчика Меркурий и smartmontools
    +1
    Есть ли возможность использовать массовый сбор метрик, используя агенты версий 3.0.x и более ранние версии?
  • Docker meetup в Badoo
    0
    По регистрации на meetup.com
  • Docker meetup в Badoo
    0
    Трансляции не будет, но вы можете оставить список вопросов на meetup.com, думаю, ребята с радостью ответят после доклада, чтобы вопросы-ответы попали в запись.
  • Docker meetup в Badoo
    0
    Москва, м.Трубная, Цветной бульвар д.2, БЦ «Легенда Цветного», подъезд А
  • Docker meetup в Badoo
    0
    Web-трансляция не планируется. Планируется запись, после – выложим статью на Хабр с видео и презентациями.
  • Docker meetup в Badoo
    0
    Москва, м.Трубная, Цветной бульвар д.2, БЦ «Легенда Цветного», подъезд А
  • Битва за Москву: демпинг и «мертвые души» Tele2
    0
    Ещё немножко подолью масла.
    Запустились в Москве, открыли интернет-магазин.
    Ну, думаю, выберу номер, закажу, заберу.
    Выбрал, заказал.
    Приходит письмо:
    Мы получили Ваш заказ. Подтвержденные в заказе номера бронируются за клиентом на 3 календарных дня.

    Еду на следующий день (в офис на Сущевском), а мне там говорят «знаете, у нас проблемы с интернет-магазином, мы не можем выдать ваш заказ, но вы можете оставить ваш номер и имя, мы вам обязательно перезвоним, когда всё наладится».
    Оставил номер и имя.
    Было это 23 и 24 октября соответственно (дата заказа и дата похода в офис).
    Либо у них уже три недели не работает интернет-магазин (о чём на сайте они так и не написали).
    Либо они плевали на то, что кто-то что-то там заказал через него.
    Либо они потеряли листочек, куда записывали мои данные.
    Собственно, три дня давно прошло, а значит я потерял номер, который выбирал. Ну и они так и не перезвонили и не написали.
    Что там с мобильной связью, так же всё плохо?

    Alex_Morozov – возможно, будет интересно.
  • Уязвимость «большого пальца»: я твой палец по фотографии взломаю
    +3
    Но почему у парня из первого видео так жестоко трясутся руки? :)
  • Бюджетное решение для бэкапа целого офиса
    0
    Да, пользователи бэкапятся, и тестировали несколько раз, как бэкап, так и рестор. Всё было в порядке, по-моему.
  • Бюджетное решение для бэкапа целого офиса
    –2
    Нет. Решение расчитано на то, что это и проще настраивать и проще в будущем поддерживать. Чуть выше про ребилд уже написал. Потерять на время малую часть данных, которая восстановится вполне быстро, оптимальнее, чем потерять большую часть.
  • Бюджетное решение для бэкапа целого офиса
    –1
    В данном случае нам не нужен рейд, о чём и было сказано. Если будет рейд — мы дольше будем ребилдиться, чем начинать процесс бэкапа пользователей на новый диск.
  • Adobe бесплатно раздает Creative Suite 2 (или же не раздает?)
    0
    Не только это. Как с Адобом, например. :)
  • Мониторинг коммутаторов Cisco, D-Link, 3Com, Zyxel в системе Zabbix
    0
    Это вы мне сейчас что описали?
    Часто нужных трапов в документации нет, тогда

    А зачем? У меня есть MIB (конвертится оттуда) для моих устройств, и заполнять ничего не нужно — трапы должны приходить сами. Путаете понятия?
  • Мониторинг коммутаторов Cisco, D-Link, 3Com, Zyxel в системе Zabbix
    0
    Написано хорошо, да, спасибо. Но на эту тему есть много статей, это делается несложно, если человек давно работает с Zabbix'ом. — имелся в виду мониторинг оборудования.
    За «Мониторинг состояния портов» — отдельный плюс!
    Куда более интересно раскрыть тему мониторинга snmp-трапами в заббиксе: в официальной документации что-то есть, но чтобы от и до (начиная с конфигурации устройств, заканчивая отображением триггеров на события, в промежутке рассказав детально, как конвертируются oid'ы и в каком виде они еду в заббикс) — нет нормальных статей.
    Не интересовались, случайно, этой темой? У меня такое предложение — осветить этот момент :)
  • Обратная сторона блокировок
    +2
    Не всё так печально:



    Прогнулись? Судя по профилю пользователя, удалившего статью, это какой-то «хелпер» русской викии.
  • Фотографии рабочих мест хабровчан
    –10
    Многие, конечно, потянутся минусовать, но… какой вообще смысл этого поста? Выложить пару фоточек обычного айтишного срача (a.k.a беспорядка)? Где здесь креатив, чем здесь можно похвалиться?
    Да, одно дело — оригинальное рабочее место, хорошо пристроенное на балконе или в туалете. Другое — ничем не отличающиеся друг от друга столы с беспорядком.
  • GoDaddy.com лежит
    0
    Не сочтите за троллинг и простите за оффтопик, но, по-моему, там каждый день проблемы.
    Особенно посмеялся сегодня с этого: webcache.googleusercontent.com/search?q=cache:http://bnw.im/p/F3ZCW3 (FYI: bnw как раз на хенцнере хостится), не успели обсудить, снова улетели.
  • Дважды прямой. Одинаковый городской телефон для Питера и Москвы
    0
    Я думаю, что Вы ошибаетесь. Приходилось работать в месте, в которое поступают звонки со всей России — многие интересовались, есть ли у нас бесплатный номер на 8-800, и возраст и пол их был различный.

    А если они не знают правды о 8-800, одной фразы «звонок бесплатен» будет достаточно для того, чтобы они им воспользовались :)
  • Дважды прямой. Одинаковый городской телефон для Питера и Москвы
    0
    Поддерживаю. Но это уже как настроить. Некоторые скупые компании умудряются закрыть свою «восьмисотку» для москвичей. С мобильного в банк приходится звонить на городской и ждать на линии…
  • На Chrome Webstore распространяются вредоносные расширения
    +2
    Наверное, и правда случайности. Неудача, прям одна за одной, сочувствую (без сарказма и издевательства). А время покажет, случайно ли совпало, или нет, спасибо.
    Надеюсь, откатитесь на предыдущую версию и выложите хорошее и годное расширение ;)
  • На Chrome Webstore распространяются вредоносные расширения
    +7
    Окей, я извиняюсь за то, что назвал Вас плохим. Тогда, пожалуйста, постарайтесь внятно рассказать, как так получилось?
    Получается, кто-то украл телефон и узнал, что почта связанна именно с этим телефоном? Вы забыли пароль от аккаунта гугла? Вы не пользуетесь собственным расширением (или оно не обновляется тогда)? Что, вообще никак не заметили, что что-то не то?
    Не обвиняю во лжи, но выглядит очень странно :) прямо вот совпало, что магическим образом получили доступ к маркету (КАК?) и нет возможности восстановить, и разработчик узнал спустя двое суток после случившегося.
  • На Chrome Webstore распространяются вредоносные расширения
    0
    Ведь как-то это расширение попало в проверенные. Не просматривать же мне исходный код каждого расширения, которое я собираюсь загрузить.
  • На Chrome Webstore распространяются вредоносные расширения
    +1
    Ну, да. Видимо, я не ошибся, когда сразу написал «о плохих людях» :)
  • На Chrome Webstore распространяются вредоносные расширения
    0
    Одно дело сайт, на котором творится что угодно, другое дело — расширение у тысяч пользователей для крупнейшей соц.сети рунета.
  • На Chrome Webstore распространяются вредоносные расширения
    0
    Спасибо, добавил негодяя в первопост.
  • На Chrome Webstore распространяются вредоносные расширения
    –4
    Так, эээ, запускал-то в двух линуксах, и просил двух ведоюзеров — у меня работало оно, у них нет.
  • Яндекс.Диск как файловая система
    0
    Добавил в первопост, спасибо :)
  • Яндекс.Диск как файловая система
    +4
    Диск — наше, русское, очень близкое (по расстоянию), и интегрировано в почтовик и мобильный почтовик. Хотя бы эти преимущества позволят человеку обычному хранить фоточки в бесплатном и несложном диске :)
  • 100 доменов РФ в подарок
    0
    Я тоже по началу)
  • 100 доменов РФ в подарок
    0
    С видео. Ибо сперва подумал про одно, а оказалось другое.
    И с героем тупанул — начал из двух подбирать (но крылась в видео ошибка).
    Так что с видео — сложнее всего было.
  • 100 доменов РФ в подарок
    0
    Интересно, спасибо, кажется приняли)
  • Музыка из Vkontakte в Exaile
    0
    Актуально? При прослушивании не скроблит в Last.FM
  • Открытое тестирование XMPP
    –9
    Скажем так, в моём «контакт-листе» нет школоты. Это не отменяет тысячи дебильных групп вконтакта.
    Если мсье не использует jabber.ru и их конференции, то ему, естественно не очень будет понятна эта фраза.
    И да, после qip.ru наплыва было много :) квипо-эффект, наверное.
    На личности переходить не буду, до такой низкоты опускаться не собираюсь, вроде какого-то Tiradoira
  • Открытое тестирование XMPP
    –1
    Статус жаббера передается на сайт. Значит, видят. Плохо.
  • Открытое тестирование XMPP
    +1
    Там не только кутим. Gajim туда же, Psi+ в ту же кучу. Вообще не совсем понятно. Jabber-сервер писался с нуля?
  • Открытое тестирование XMPP
    –11
    Ну, естественно, серверу вконтакта нечем заняться, кроме как через жабберо-клиент грабить все Ваши пароли.
    P.S. Если уж и хочется показаться грамотным, Вы/Вас/Ваш пишется с заглавной буквы.