Pull to refresh

Мониторинг активного сетевого оборудования средствами The Dude. Part1. Установка и настройка

По долгу службы много и плотно работаю с активным сетевым оборудованием. В частности, одна из задач — мониторинг >7000 устройств различных вендоров: Cisco, Juniper, D-Link, Huawei, Edge-core, etc.

У каждой компании, имеющей в своем арсенале парк серверов + активное сетевое оборудование стоит задача отслеживать его работоспособность, минимизировать время простоя при аварии и решать прочие моменты. Помимо хорошего сетевого инженера, а если компания большая, то и СПД, нужен удобный инструмент для автоматического траблшутинга большинства стандартных проблем и их решения, эскалации.

В связи с этим, хочу рассказать вам (А возможно и начать цикл статей, если хабрасообщество одобрит) о бесплатном и полнофункциональном решении для мониторинга от компании Mikrotik — The Dude. Или как ее называют в русскоязычном сегменте — Дуда.

Какие задачи могут выполняться посредством The Dude? Да любые, которые подразумевают под собой мониторинг и траблшутинг оборудования. Это могут быть обычные win и nix хосты, сервера, оргтехника, коммутаторы, рутеры… Список можно продолжать бесконечно. Мониторинг сервисов согласно SLA, если вы (I)SP? Не вопрос! Оповещение по почте, или SMS? Тоже не проблема. Обычный ICMP-поллинг, или алгоритмы, направленные на выявление какой-то особой проблемы? Не вопрос.

Основные возможности


  • ICMP-polling
  • TCP/UDP-polling
  • Syslog-server
  • Syslog-sender
  • SNMP-polling
  • Карты сети
  • Распределенный мониторинг
  • Встроенный язык для написания функций опроса
  • Запуск программ на удаленной машине с передачей контекстных параметров.


Почему не Nagios, Zabbix, NetView, Cacti, или Enterprise решение? (как пример — Equipment Manager от компании Orange Systems).

Простота первоначальной настройки, интуитивный интерфейс, минимум временнЫх и денежных затрат на внедрение(для офиса в полсотни компов и пары-тройки коммутаторов затраты вообще минимальны как по времени, так и по деньгам), кроссплатформа, расширяемый функционал, масштабируемость, типизация устройств на основе автоопроса и нетребовательность к ресурсам. Для сетки в 200-300 устройств будет достаточно p3-800MHz 512Mb RAM.

В качестве примера приведу случай из жизни:
Физически вышел из строя сервер с TheDude, который мониторил 2 с лишним тысячи устройств. За 10(!) минут был развернут бекап на моей виртуальной машине с Win2k, ограниченной 512Mb оперативной памяти и дежурные службы, после того как перебили IP в клиенте, продолжили работу в штатном режиме до момента восстановления (~4ч).
Сервер даже не подтормаживал.

Кто заинтересовался — добро пожаловать под хабракат


Установка:


Поддерживаемые ОС

  • Windows(клиент, сервер)
  • RouterOS(сервер)
    Это также означает, что TheDude устанавливается на RouterBoard'ы
  • Linux(клиент, сервер). Только через wine. Работу из под wine в качестве сервера не тестировал, но он запускается и поллит. Если кому-то интересно, могу протестировать и предоставить подробный отчет.


Последовательность действий при установке:

Для начала скачиваем бинарник для нашей платформы на оффсайте
  • RouterOS:
    Я рассмотрю здесь вариант, когда у нас нет машины с windows, чтобы для установки пакета на RouterOS воспользоваться графической утилитой winbox. Она, конечно, работает под wine, но не дает возможности из под wine установить пакет на RouterOS. Воспользуемся для этого SCP и RouterOS CLI.

    Копируем .npk в корень(sic!) сервера с RouterOS
    your.comp>scp path/to/binary/dude.npk admin@dude.server:/

    После завершения копирования коннектимся на сервер и смотрим есть-ли файл.
    your.comp>ssh admin@dude.server
    [admin@dude]> file print
    # NAME TYPE SIZE CREATION-TIME
    0 dude.npk ... ... ...

    Увидев что он есть — ребутаем сервер, он автоматически установит пакет перед ребутом.
    [admin@dude]> system reboot
    Y/N
    Installing package dude.npk
    [####################]
    connection closed.

    Опять заходим на сервер, проверяем, нормально-ли он установился и создалось-ли хранилище данных, активно-ли оно.
    your.comp>ssh admin@dude.server
    [admin@dude]>system package print
    # NAME VERSION SCHEDULED
    0 dude ...
    [admin@dude]>store print
    # NAME TYPE DISK STATUS
    0 dude dude ... active

    После этого смело коннектимся к серверу из клиента и приступаем к конфигурации. При первом запуске будет предложено просканировать сеть на предмет устройств.
  • WINDOWS:
    Запускаем бинарник и устанавливаем в нужную нам директорию. В диалоге конфигурации обязательно отмечаем чекбоксом Server Files.
    Запускаем PATH_TO_DUDE/dude.exe
    PROFIT! Сервер запущен и вы автоматически попадаете клиентом в режиме «local» к конфигурации The Dude. При первом запуске предлагается просканировать сеть в которой вы находитесь на предмет устройств (icmp, snmp, netbios, dns). При первом запуске демон прописывается в автозагрузку. После ребута запускать клиент уже не обязательно.
  • LINUX:
    Все то же самое, за исключением того, что все действо совершается из под wine и демон в автозагрузку не прописывается.


Основные настройки (Глобальные)

Когда мы установили наш сервер с The Dude — нам его нужно настроить.
Для этого в клиенте есть кнопка… Правильно, «Настройки».
image
Вкладки:
  • Общий
    Здесь указываются DNS сервера, которые могут/будут резолвить адреса устройств, а так же SMTP-сервер, через который будут посылаться оповещения о событиях, при необходимости
  • SNMP
    Здесь мы указываем профили SNMP, с помощью которых будут поллится наши устройства. Профиль включает комьюнити, порт и версию
  • Опроc
    Настройки поллинга устройств (интервал, таймаут, количество циклов), настройки оповещений, логирования при изменении статуса сервиса, повешенного на устройство( для заббикса аналогом будет «триггер»)
  • Сервер
    Здесь мы конфигурим файрволл. Также здесь включается WEB-интерфейс мониторинга, натраивается время обновления информации в нем, таймаут сессии, указывается SSL-сертификат.
  • Агенты
    Распределенный мониторинг. В качестве агента указывается Dude-сервер с такой же версией, как и настраиваемый.
  • Syslog
    Здесь все банально. настройка syslog-сервера.
  • Карта
    Настройка визуального отображения объектов (размер, шрифт, форма, время обновления текстовой информации, цвет).
  • Диаграмма
    Настройка RDD-хранилища и цветов на графиках
  • Отчет
  • Обнаружение
    Настройка автообнаружения и расположения устройств на карте в автоматическом режиме
  • RouterOS
    Настройки сессий для устройств на базе RouterOS, находящихся на мониторинге в The Dude
  • Разное
    Здесь находятся настройки коммита в базу, прыжков отмены, определение вендора по найденному маку, интервал сканирования мак-адресов устройств.


Wiki: http://wiki.mikrotik.com/wiki/Main_Page
Forum: http://forum.mikrotik.com/index.php

IP демо-сервера 159.148.147.209
Тип коннекта: Защищенный
Логин: admin
Tags:
Hubs:
You can’t comment this publication because its author is not yet a full member of the community. You will be able to contact the author only after he or she has been invited by someone in the community. Until then, author’s username will be hidden by an alias.