Observium — больше, чем система мониторинга

Network monitoring with intuition

Уже давно являюсь читателем Хабра, но написать статью заставило желание ответить на вопросы и, вероятно, диалог из первых уст. Прошу простить за возможную спутанность статьи — «чукча не писатель».

На Хабре уже есть несколько статей, посвященных данной системе («Мониторинг сетевого оборудования Cisco в системе Observium», «Observium — установка системы мониторинга») и мне хотелось бы их дополнить. В статье нет инструкций по установке или настройке, все это есть в официальной документации и по ссылкам, указанным выше.

В статье много картинок, некоторые спрятаны под спойлерами.

Observium, как гласит слоган на основном сайте, является системой мониторинга и наблюдения за сетевыми устройствами и серверами. При этом список поддерживаемых устройств огромен и не ограничивается только сетевыми устройствами, главное условие — чтобы устройство поддерживало работу SNMP. Но и кроме SNMP собираемая информация может быть дополнена другими способами и протоколами, например, syslog, rancid, unix-agent.

Немного истории. Изначально система создана «подданным его величества» Адамом Армстронгом примерно в 2005-2006 году (к сожалению, точную дату он и сам уже не помнит). В последствии к проекту присоединились еще разработчики, в том числе и ваш покорный слуга. Сначала система называлась Kikker (2005-2006), потом Project Observer (2006–2008), ObserverNMS (2008–2010) и, наконец, в 2010 году обрела текущее название Observium. Основным логотипом является хомяк индустриального вида.

Hamster

Основной целью создания являлось создание системы с максимально простым управлением и наблюдением за устройствами, каковая остается и по сей день.

Модель распространения системы поделена на Community (выпускается раз в 6 месяцев) и Subscription (доступна подписчикам через непрерывные обновления stable/rolling).

Многим знакомы такие системы, как cacti, prtg, mrtg, но ни одна из них не сравнится по удобству добавления устройств и количеству поддерживаемых датчиков (по умолчанию).

Как выглядит процесс добавления нового устройства в систему:

1. Добавляем имя устройства (в командной строке или веб-интерфейсе).
2. Ждем 5-10 минут пока завершаться процессы discovery и первый poller, на этом всё.

Практически для добавления нового устройства достаточно настроек по умолчанию, необходимо только указать параметры авторизации, но и их можно добавить в общую конфигурацию и система будет автоматически проверять все заданные параметры авторизации.
Добавление устройства см. под спойлером
Добавление нового устройства:

Добавление устройства

Устройство добавлено, ждем завершения discovery/poller:

Устройство добавлено

Обзор устройства:

Linux device

Кроме того, добавление новых устройств возможно в автоматизированном режиме из файла со списком устройств и/или через обнаружение устройств по протоколам CDP/LLDP и BGP/OSPF.

После того, как устройство было добавлено в систему, весь его «жизненный» цикл будет отслеживаться в автоматическом режиме. Например, если будет увеличена память или добавится новый датчик или добавтся/удалится порт — это все будет обнаружено без ручного вмешательства.

Весь сбор статистики поделен на 2 основных процесса:
  • discovery, где выполняется основное обнаружение поддерживаемых на данном устройстве датчиков или счетчики;
  • poller, где обнаруженные датчики опрашиваются каждые 5-ть минут;

Есть еще также 2 дополнительных процесса, работающих совместно с poller процессом, но они идут только в версии для подписчиков:
  • bill, подсчет биллинговой информации на отдельных портах для пользователей;
  • alert, это относительно недавно появившийся процесс для генерации уведомлений по практически любому собираемому системой параметру.


Процессы, в свою очередь, поделены на модули, соответствующие собираемой информации. Модулей много, основные — это os, system, ports, mempools, processors, sensors и другие. На снимке страницы выше можно заметить, что собираются такие параметры, как ОС, версия, начинка устройства.

И, наконец, модули поделены на MIBы, список который берется из файла определений для различных ОС.

Информация разнится в зависимости от производителя устройства, типа и доступных датчиков для конкретного устройства. Под спойлером несколько примеров:
Различные устройства
Cisco 7606
Cisco 7600
Cisco 2960C
Cisco 2960C
APC PDU
APC PDU
Olivetti printer
Printer


Обзорная страница:

Обзорная страница

Еще несколько спойлеров
Обзор всех устройств:

image

Быстрый поиск:

image

Поиск по IP/MAC/ARP/FDB:

image

BGP:

image

RANCID и история изменений конфигурации:

image
image


Система интегрируется с различными внешними утилитами, такие как syslog, rancid (в том числе показ последних изменений), collectd, smokeping, nfsen.
Поддерживается мониторинг датчиков по протоколу IPMI.
Есть мониторинг сервисов таких как Apache, Nginx, Mysql, Bind и других, через unix-agent.
Поддерживается мониторинг некоторых систем виртуализации.

Как упомянул выше, в платной версии имеется процесс для активных уведомлений. Он не заменит такие системы, как nagios/icinga или zabbix, так как на данный момент ограничен 5-ти минутными интервалами опроса устройств, но 60% потребностей по уведомлениям он способен обеспечить. А для систем с небольшим (<50) количеством устройств он полностью готов заменить любую другую систему. Под спойлером еще несколько картинок для него.
Активные уведомления
Правила проверки:
image
Текущие уведомления:
image
Лог уведомлений:
image


С картинками, наверно, хватит, всего не показать. Большинство возможностей можно увидеть на демо-странице (ох, только просьба не создавать хабраэффект) тут.

В остальном прошу задавать вопросы и пожелания, если надо чем-то дополнить статью.
Поделиться публикацией
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама
Комментарии 53
  • 0
    Больше спасибо за обзор :)
    • +1
      а что у вас только svn репо для установки, git клона нету?: evil :)
      • 0
        Только svn (для подписчиков), community распространяется как tar.gz
        • 0
          спасибо, это была шутка. Я как-то задал этот вопрос на вашем irc-канале — и получил очень, я бьі сказал, очень-очень експрессивньій ответ от adama лично. Думал вьі вспомните :)

          А по теме — как насчет алертов, они уже достаточно рабочие?
          • 0
            Да, Адам любитель крепкого словца :)

            Алерты вполне рабочие, я бы сказал полностью рабочие. Но пока их добавление не очень интуитивное. Но один из активных пользователей написал хорошеее руководство по добавлению: примеры уведомлений.
            • +1
              Почему у вас такая странная буква Ы?
        • +1
          Не совсем понятно из статьи, какие всё таки у Observium «киллер-фичи». Например, я использую Zabbix — чем таким мог бы Observium меня заманить, чтобы я на него перешёл кроме «удобства»?
          • +1
            Заманивать не стану, это выбор каждого, но попробую пояснить о «киллер-фичах».

            Во-первых, как написал в статье, это добавление устройства — вы добавляете устройство, обо всем остальном система «позаботиться сама». Не надо заходить «в такое то меню», добавлять такие то OID, присваивать им какое то имя и так далее. Система сделает все за вас. Конечно возможна ситуация, что вы хотите «наблюдать» за сверхважным датчиком дыма, который «пока» не поддерживается системой. Вот тут конечно придется включить умение программирования (если хотите сделать самостоятельно) или обращаться к разработчикам.
            А вторая фича, фактически дополняющая первую — любые изменения на устройстве (и это не только изменение портов), например добавился новый датчик или наоборот удалился или изменилась версия прошивки и т.д., все это будет обнаружено автоматически.

            Ну а другие киллер-фичи, их на самом деле много, я просто не уверен (не знаю), что в zabbix есть, например, отслеживание протоколов маршрутизации BGP/OSPF/EIGRP/CEF. Есть сбор IP и MACадресов, ARP и FDB и по ним всем есть поиск, сбоор VLANов, просмотр логов с устройств, просмотр конфигураций устройств и их изменений.
            Могу сказать на примере себя, т.к. основной род деятельности у меня администрирование сетей. 90% действий которые раньше я выполнял исключительно в консоли устройств, теперь я делаю из единого места.
            • +1
              все это в Zabbix можно прикрутить, только надо чуть чуть раскурить MIB. Автоматическое определение модулей, портов и прочего решается через LLD. Но все это конечно требует настройки «изкаропки» этого нет. Вот конфиги Zabbix не собирает, да, но и тут для этого ransid.
              • 0
                ну для честности будем говорить, что конфиг observium тоже не собирает, но он интегрируется с rancid и показывает как саму конфигурацию, прямо со страницы устройства, так и последние изменения.

                А вот это чуть-чуть раскрутить, там то прикрутить шаблон и так далее — это то что меня всегда останавливало :)
                • 0
                  Чего это он логи не собирает? Парсит как миленький с syslog.
                  У меня даже температуру с самодельного датчика на ардуино собирает :)
                  • 0
                    Конфиги же. Логи он прекрасно собирает, в том числе и текстовые из любого файла. Теоретически так можно собирать и конфиги, построчно. Но это не удобно и совершенно не практично.
                    • 0
                      Врядли какой либо продукт будет повторять функционал rancid, разве что захотят сделать нечто более функциональное, но и это мне кажется практически нереально.
                      Сбор конфигов с оборудования не самая тривиальная задача, у каждого вендора и/или моделей свои особенности. Как по авторизации в консоль (для копирования конфига), так и по «пост-обработке» этого конфига, т.к. зачастую в конфигах имеются изменяющиеся данные (время например).
                  • +1
                    Вот тут есть оч хорошие cisco-шаблоны для zabbix с LLD.
                • 0
                  Могу сказать на примере себя, т.к. основной род деятельности у меня администрирование сетей. 90% действий которые раньше я выполнял исключительно в консоли устройств, теперь я делаю из единого места.


                  Как верно подметил EvilMause — всё это умеет Zabbix. Только это немного сложнее в настройке. Другой вопрос, что последние версии Zabbix прекрасно справляются с большим количество устройств. Как с этим дела у Observium? Скажем, если я поставлю на 16 ядерный сервер с 128 Гб RAM — вытянет ли он примерно 25к устройств, с опросом с каждого в среднем 20 OID или загнётся?
                  • 0
                    Единственное узкое место, как и любой другой системы в том числе zabbix — это дисковая подсистема.

                    SSD (или ram-disk) + rrdcached + rrd version >= 1.4.8 и да сможет, причем опрос скорее всего будет больше числа OIDов.
                    На данный момент, пользователи отписывались об инсталляциях с более скромными параметрами и опросом 1-2к устройств.
                    • 0
                      Вы меня как минимум заманали «на попробовать». Благодарю за ответы! :)
                    • 0
                      Насчет «все умеет zabbix», я попытался найти информацию по сбору FDB и ARP таблиц с его помощь, не нашел ни одного руководства… так можно или нет?
                      Так же не нашел информацию как собирать информацию о BGP пирах. Не просто количество, а отдельные пиры и обновления по ним.
                      (уточню, это не киллер фичи, но этими инструментами я регулярно пользуюсь)

                      Я абсолютный профан в zabbix и если вы мне тыкните ссылками, буду признателен :)
                • 0
                  К сожалению «Демо» сделано не лучшим образом. В «Демо» нужно не блокировать открытие определённых страниц, а просто заблокировать кнопку «применить», т.к. в данной ситуации вы прячете часть функционала…

                  Теперь к минусам самой системы:
                  1. Не смог найти импорта MIB и собственно MIB-браузера.
                  2. Не увидел профилей дискаверинга. Т.е. назначение заданий на периодическое сканирование подсетей с определёнными Community String.
                  3. Не увидел конструктора дашбордов, без этого невозможно сделать так называемый «интерфейс оператора», а так-же нет конструктора отчётов.

                  Без этих вещей коммерческое использование системы мониторинга видится мне весьма спорным.

                  Так-же коммерческая версия должна обладать средствами интеграции(SNMP-Trap, syslog, SOAP, REST) с другими системами(инвентаризация, сервис-деск, другие системы мониторинга).

                  В качестве «фичи» хотел бы предложить вам добавить возможность построения сервисно-ресурсной модели.
                  Т.е. берём один из сервисов (например один из интернет сайтов компании), работа которого зависит от определённых ресурсов(веб-сервера, БД, лоад-балансера, серверов, коммутаторов и ИБП от которых это всё питается, датчиков и т.п.) после чего следим и делаем отчёты о состоянии сервисов, а не «железок в вакууме».

                  Как это не печально, но системы мониторинга приобретаются в первую очередь для создания отчётов, т.к. именно они отображают качество работы людей и оборудования.
                  • 0
                    Стоп, зачем вы применяете принципы работы одной системы, вероятно к которой привыкли, к принципам другой?
                    1. Не смог найти импорта MIB и собственно MIB-браузера.

                    Что именно вам надо импортировать?
                    Все уже «встроено» в модулях, если вы хотите узнать какие конретно MIB-ы используются для данного устройства, можно посмотреть definitions и/или посмотреть отладочный вывод discovery/poller процесса.
                    2. Не увидел профилей дискаверинга. Т.е. назначение заданий на периодическое сканирование подсетей с определёнными Community String.

                    Сканирования подсетей именно в понимании списка адресов нет, есть сканирование по обнаруженным устройствам через протоколы CDP/LLDP, OSPF и BGP. Но то что вы имеете ввиду организуется простым shell-скриптом с генерацией списка адресов.
                    3. Не увидел конструктора дашбордов, без этого невозможно сделать так называемый «интерфейс оператора», а так-же нет конструктора отчётов.

                    Ну с этим пока соглашусь, но это будет.

                    Так-же коммерческая версия должна обладать средствами интеграции(SNMP-Trap, syslog, SOAP, REST) с другими системами(инвентаризация, сервис-деск, другие системы мониторинга).

                    Не отразил в статье, поправлю. Есть интеграция и с syslog и snmp traps, есть API.

                    По поводу отчетов я вас понял, обязательно будет.
                    • 0
                      Стоп, зачем вы применяете принципы работы одной системы, вероятно к которой привыкли, к принципам другой?

                      Моя работа заключается в построении систем мониторинга и управления из различных подсистем(мониторинг доступности, мониторинг производительности, системы контроля качества каналов связи, сервис-деск, инвентаризация и т.п.) на базе продуктов от различных вендоров(из мониторинга это IBM, HP, CA Technologies, SevOne, а так-же пара «отечественных вендоров»).

                      К сожалению я говорю о принципах работы большинства коммерческих систем мониторинга, а не об одной…

                      Что именно вам надо импортировать?

                      Например появляется необходимость мониторить железки из серии BTI 7000, проблема в том что информация о сетевых интерфейсах у них идёт из Enterprice ветки OID-ов, а не из ветки MIBv2. Связываться каждый раз с разработчиками не очень удобно.

                      Наличие средств интеграции это отлично.
                      Я правильно понимаю что SNMP-Trap и syslog используются для передачи данных из Observium во внешние системы, а API для двухсторонней интеграции?
                      • 0
                        Например появляется необходимость мониторить железки из серии BTI 7000, проблема в том что информация о сетевых интерфейсах у них идёт из Enterprice ветки OID-ов, а не из ветки MIBv2.

                        У нас есть несколько примеров устройств, которые тоже используют не стандартный IF-MIB. Это тоже поддерживаемо, но конкретно для BTI еще не сталкивались.
                        Если удастся найти такое устройство с доступом, обязательно постараюсь добавить.

                        Я правильно понимаю что SNMP-Trap и syslog используются для передачи данных из Observium во внешние системы, а API для двухсторонней интеграции?

                        Trap, syslog — только на прием, т.е. они анализируются и добавляются в базу. Например по сислогу потом можно искать по сообщениям, времени, приоритету через веб интерфейс. Также хотим в скором времени добавить активные нотификации по нахождению ключевых фраз в syslog сообщениях.
                        API — для внешней интеграции.
                  • 0
                    Перебровал все опенсосрные системы, в том же Observium графики и данные храняться в RRD(соотвественно угрубление данных, скалинг и тд ограничены — из-за этого ушли от mrtg).
                    Самой нормальной считаю netxms — есть все это, очень быстра, правда настройка немного нестандратна, но все же есть еще встроенный syslog, обещают еще побольше готовых шаблонов, и поддержку nfsen из коробки
                    • 0
                      По началу очень понравился observium в той части, что сразу строит графики по протоколам маршрутизации…
                      Что не понравилось — алерты только по подписке, причем именно подписка, а не покупка. Не понятно как добавить мониторинг по своим мибам, которые не добавились автоматически =((

                      Кстати, у Observium есть форк — LibreNMS, но больших отличий в функционале там пока не увидел.
                      • 0
                        У меня какая то стойкая неприязнь к мониторингу на похапе. Ну вот зачем?
                        • 0
                          Я думаю у вас просто неприязнь к php, мониторинг тут не при чем.
                          У меня например неприязнь к Java :)
                          Это к слову о NetXMS…

                          Но я не стану холиварить, по поводу PHP. «Вы просто не умеете его готовить» ;)
                          В плане производительности настоящие проблемы это snmp queries и disk IO.
                          • 0
                            Вот в cacti для SNMP написали свой поллер на Си. Потому что похапе быстрее не может. Можно ли отсюда сделать вывод что похапе для таких задач не очень подходящий язык?
                            К жабе есть свои претензии, но для мониторинга она подходит гораздо лучше.
                            • 0
                              А вы уверены в причинах, почему cacti написали поллер на Си?
                              For this reason it is written in native C, makes use of POSIX threads
                              Spine Information.

                              Т.е. производительность увеличена за счет использования тредов.
                              И в observium это тоже есть, для этого у нас вместо прямого вызова poller-а запускается wrapper (на python), который также запускает несколько (настраиваемо) поллеров одновременно.
                              Кстати, когда мы добавили этот враппер, скорость опроса всех устройств сократилась в разы.

                              Но суть в том, что не язык сам по себе причина написания отдельного поллера, а ускорение за счет увеличения одновременных запросов.

                              С одним устройством вы ускорения не получите.
                              • 0
                                Я уверен. Небыло бы смысла писать поллер на Си, если бы похапе мог делать эту работу сам. Как, например, питон.
                                И если в observium есть враппер на питоне, чего сразу было не написать на нем весь мониторинг? Я бы тогда точно купил. :)
                                За одно прикрутить graphite, fluentd, riemann, etc…
                                • 0
                                  А вы можете не покупать, просто попробуйте community версию и представьте что написано оно на «ла-ла-ла» :)

                                  Почему не сразу… потому что разные причина и следствие. Код написан на PHP изначально и достаточно оптимизирован, единственное чего не хватало это мультиплексирование. Никто не будет ломать то что работает, ради желания просто не использовать какой либо язык программирования.

                                  Небыло бы смысла писать поллер на Си

                                  Кстати, насколько я помню, на тот момент когда в какти начали писать поллер на Си (а это где-то 2003 год или раньше), питон просто был в зачаточном состоянии и не было никаких тредов в нем. Про похапе в то время я вообще молчу… Поэтому оставался только Си.
                                  • 0
                                    Я обычно покупаю софт не для того что бы пользоваться, а для того, что бы поддержать разработчиков.
                                    Пробовать не буду, так как все равно захочется что-нибудь дописать, а делать это на похапе ну вот не хочется :)
                                    Как показывает практика, программы на похапе со временем поддерживать становится все сложнее и сложнее, что неотвратимо сказывается на фичах.
                                    А про питон Вы не правы, Twisted был выпущен в 2002 году, в 2003 сам питон был уже версии 2.3.х.
                            • 0
                              В плане производительности настоящие проблемы это snmp queries и disk IO.

                              1. В чём заключается проблема с snmp queries?
                              — Проблема с отправкой множества запросов?
                              — Проблема с получением множества ответов?
                              — Проблема с обработкой ответов?
                              Не справляется железо или софт?
                              2. disk IO — т.е. проблема в выборе или настройке СУБД?
                              Есть ли какие либо цифры говорящие с какого кол-ва оборудования нужно переходить HDD->SSD->CХД?
                              • 0
                                В чём заключается проблема с snmp queries?

                                В том, что невозможно обработать запрос пока не получите ответ от опрашиваемого устройства.
                                У меня могут быть 2 одинаковых устройства расположенных в разных концах света, но один я опрошу за 5 секунд, а второй за 30.
                                Или может опрашиваемое устройство оказаться «слабым» и это тоже увеличивает время его «ответов».

                                disk IO — т.е. проблема в выборе или настройке СУБД?

                                Как бы там ни было, основное средство хранения информации для графиков в observium это RRD. Опрашиваемых счетчиков огромное количество и все они производят операции чтения/записи на используемый диск и без оптимизации используемого дискового пространства, скорость опроса устройств также снижается.
                                Что использовать в качестве дисковой подсистемы решает пользователь, мы лишь даем рекомендации по увеличению производительности. Конечно это желательно SSD или если есть такая возможность RAM-disk (с последующей синхронизацией). Но даже на обычных дисках мы рекомендуем использовать rrdcached, это существенно сокращает общее время опроса устройств.
                          • 0
                            Честно говоря, код системы довольно-таки не очень. Захардкоженные пути до /opt, например.
                            Я давно еще собрал .deb для агента, нужно кому?
                            • 0
                              Где вы нашли захардкоженные пути к /opt?
                              Единственная опция — в конфигурации по умолчанию указывается путь к основному каталогу. По умолчанию он конечно /opt/observium
                              Все остальное идет относительно этого пути.
                              Соответственно этот путь меняется единственной строчкой в конфигурации.
                              • 0
                                Прошу прощения, в новых версиях почти ничего не осталось, но все же нашел два: scripts/mailscanner.php, scripts/watchmaillog/watchmaillog.pl.
                                • 0
                                  да, там могут быть, но каталог scripts/ содержит скрипты которые не содержат основной функциональности и служат только для каких то редких ситуаций. Например там есть скрипты удаления пиков на графиках или автоматического переименования мибов.
                                  Честно говоря даже не знаю кем и зачем используются указанные вами скрипты, вероятно они как то связаны со старой системой «сервисов» которые уже заменены на unix-agent.
                                  Проверю их и если они не несут полезной нагрузки удалю :)
                            • 0
                              Подключил rancid с хранением данных в svn, конфиги в веб-морде появились, также видит номера ревизий, но самих изменений не видит, пишет: No Difference
                              Хотя rancid успешно diff шлет на почту.
                              Не подскажете куда капнуть?
                              • 0
                                community версия, ubuntu 14.10 или выше?

                                добавьте в includes/definition.inc.php в начале, сразу за предупреждением:
                                // Always set locale to EN
                                setlocale(LC_ALL, 'C');
                                putenv('LC_ALL=C');
                                


                                В последних версиях ubuntu/debian svn неожиданно начал выдавать сообщения с учетом локали.
                                • 0
                                  Не помогло… Детальная информация по инсталяции:

                                  Ubuntu 12.04.5 LTS

                                  $ locale
                                  LANG=ru_UA.UTF-8
                                  LANGUAGE=ru_UA:ru
                                  LC_CTYPE=«ru_UA.UTF-8»
                                  LC_NUMERIC=«ru_UA.UTF-8»
                                  LC_TIME=«ru_UA.UTF-8»
                                  LC_COLLATE=«ru_UA.UTF-8»
                                  LC_MONETARY=«ru_UA.UTF-8»
                                  LC_MESSAGES=«ru_UA.UTF-8»
                                  LC_PAPER=«ru_UA.UTF-8»
                                  LC_NAME=«ru_UA.UTF-8»
                                  LC_ADDRESS=«ru_UA.UTF-8»
                                  LC_TELEPHONE=«ru_UA.UTF-8»
                                  LC_MEASUREMENT=«ru_UA.UTF-8»
                                  LC_IDENTIFICATION=«ru_UA.UTF-8»
                                  LC_ALL=

                                  $ svn --version
                                  svn, version 1.6.17 (r1128011)
                                  compiled Aug 13 2014, 20:41:52

                                  Observium CE 0.14.11.6000

                                  Только у нас файл называется: /opt/observium/includes/definitions.inc.php

                                  вставка выглядит следующим образом:

                                  /////////////////////////////////////////////////////////
                                  // NO CHANGES TO THIS FILE, IT IS NOT USER-EDITABLE //
                                  /////////////////////////////////////////////////////////
                                  // YES, THAT MEANS YOU //
                                  /////////////////////////////////////////////////////////

                                  // Always set locale to EN
                                  setlocale(LC_ALL, 'C');
                                  putenv('LC_ALL=C');

                                  // Include OS definitions
                                  include($config['install_dir'].'/includes/definitions/os.inc.php');

                                  // Include Graph Type definitions
                                  include($config['install_dir'].'/includes/definitions/graphtypes.inc.php');
                                  • 0
                                    А, это старая версия svn, неподдерживаемый ключ в этой версии, используйте патч: svn_diff.patch
                                    • 0
                                      спасибо, работает.
                              • 0
                                Еще небольшой вопрос:
                                в routing -> all bgp sessions адреса пиров показываются верно, а вот наши адреса показывает как:
                                21.105.55.136
                                21.105.52.200
                                Что это за адреса — понятия не имеем… Еще и на карте мы находимся в Ponta Delgada в Атлантическом океане вместо Киева.
                                • 0
                                  в принципе эти вопросы можем в личке обсудить :)
                                  по bgp, знакомая ситуация, но точно не помню как решать — надо смотреть дебаг вывод (если будете отправлять, то в личку):
                                  ./discovery.php -d -m bgp-peers -h имя_сервера
                                  


                                  По нахождению на карте: ну во первых в community редакции сейчас немного устаревший код, в новых ревизиях добален яндекс api и возможно увидеть детально как были найдены конкретные координаты.
                                  Но если в кратце, основной принцип поиска координат по sysLocation строке. По умолчанию используется mapquest api, в настройках можно поменять на google (объективно точнее определяет положение) или osm. Соостветсвенно чтобы проверить какие координаты определятся, можно в соответствующем MAPS API ввести строку sysLocation. sysLocation Configuration.
                                • 0
                                  Смотрел обсервиум довольно давно, но это уже точно был обсервиум.
                                  Первое, с чем я столкнулся из проблем в работе, это потеря управления десятком коммутаторов доступа от zte после скармливания их обсервиуму. На тот момент найти\отредактировать дерево оидов для конкретных штук не вышло у меня.
                                  Первое, с чем я столкнулся при добавлении девайсов, система просила имена хостов. Выходит, мне нужно в биндике все коробки заводить?
                                  Второе, что не то, что бы непривычно, но вызывает спорные чувства, это разнесение ап и довн относительно 0. Из коробки. Нуу… ну.
                                  Третье- как там с детализированным мониторингом (чаще 5 минут) отдельных устройств?
                                  Возможно, уже тогда я что-то недоглядел, но как с этими аспектами на сегодня? Спасибо
                                  • 0
                                    Первое, с чем я столкнулся из проблем в работе, это потеря управления десятком коммутаторов доступа от zte после скармливания их обсервиуму.

                                    Можно конкретнее о каких устройствах речь (модели)?
                                    Вообще, сам observium не может никого «повесить», но многие производители совершенно безалаберно относятся ко внутреннему SNMP стеку и обращение к какой то отдельной специфичной таблицы может намертво «заморозить» его.

                                    Честно, лучше было сразу написать в багтреккер или в лист (информация есть на основном сайте).

                                    На тот момент найти\отредактировать дерево оидов для конкретных штук не вышло у меня.

                                    В настройках устройств есть вкладка с модулями или MIBами которые можно отключить, а какой модуль стал «причиной» можно увидеть на странице производительности устройства (кнопочка с часиками).

                                    Первое, с чем я столкнулся при добавлении девайсов, система просила имена хостов. Выходит, мне нужно в биндике все коробки заводить?

                                    /etc/hosts как самое простое.

                                    Второе, что не то, что бы непривычно, но вызывает спорные чувства, это разнесение ап и довн относительно 0. Из коробки. Нуу… ну.

                                    не совсем понял что имели ввиду…

                                    Третье- как там с детализированным мониторингом (чаще 5 минут) отдельных устройств?

                                    Что именно вы хотите мониторить чаще (на каждом устройстве)?
                                    В том смысле что такой мониторинг может быть нужен для отдельных OIDов, но не всего устройства.

                                    Если вопросы не праздные и холиварные, то обращайтесь напрямую. Контакты мои доступны :)
                                    • 0
                                      Можно конкретнее о каких устройствах речь (модели)?

                                      zte 2928-si.
                                      /etc/hosts как самое простое

                                      если у меня нет имен сотни-другой-тысячи устройств, то, согласитесь, это костыль на пороге входа перед использованием продукта. Возможно, контролируемый объект сам является днсом, а вы предлагаете использовать имена в хостах или hosts. Зачем? Может этот сервис мне и нужно мониторить. Ерунда получается. Нужны визуальные рюшечки — заберите название хоста по снмп у коммутатора, да обзовите устройство этим именем; Предлагаете добавить за раз в мониторинг стопку устройств из списка — дайте возможно подгрузить ип-адреса устройств из этого списка. Дайте мне выбор, а не предлагайте мне новую религию, ставя тем самым преграду.
                                      Я высказался.
                                      не совсем понял что имели ввиду…



                                      Что именно вы хотите мониторить чаще (на каждом устройстве)?
                                      В том смысле что такой мониторинг может быть нужен для отдельных OIDов, но не всего устройства.

                                      Идеально иметь возможность самостоятельно принимать решение о частоте опроса. Если речь о коммутаторе — я хочу снимать данные счетчиков трафика чаще.
                                      Если вопросы не праздные и холиварные, то обращайтесь напрямую

                                      По сути, все эти вопросы холиварные, но в моём случае они сложились в результат не иметь с продуктом дела дальше. Писанина здесь может дать ответ на вопрос «есть ли ещё те, кому это тоже важно».
                                  • 0
                                    Коллеги советую взглянуть также на свободный форк observium — librenms
                                    • 0
                                      Как в эту систему добавить устройство?
                                      При любой попытке — Could not resolve…
                                      Через веб и через консоль, ничего не помогает.
                                      При этом, в консоле snmpget нормально получает инфу.
                                      Никакой информации на официальном сайте нет, никаких форумов, ничего.
                                      В общем, разочарован. Одна реклама.
                                      • –1
                                        А вот, кстати, librenms с обсолютно такой же конфигурацией встал нормально и устройства корректно добавляются.
                                        В общем, к черту этот observium…
                                        Пол дня потратил на этот кусок…
                                        • –1
                                          оно там с доменами именами связано, советую посмотерть в сторону librenms
                                          • 0
                                            Использовать hostname по умолчанию это просто хороший тон для систематизации ваших же устройств.
                                            Если у вас сеть изменилась так, что изменились IP адреса, то не придется переименовывать каждое/все устройства.

                                            Но в любом случае, у вас устаревшая информация, т.к. привязка к доменам по умолчанию убрана (опционально можно вернуть к старому поведению в конфигурации).

                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.