Хотел бы поделиться описанием одной малоизвестной в России системой мониторинга — ITRS GENEOS. Не хочу, чтобы эту статью сочли рекламой, просто я не нашел в рунете упоминаний об этой системе.
Должен отметить, что до знакомства с ITRS GENEOS не сталкивался с системами мониторинга напрямую, лишь слышал про NAGIOS и его возможности. Поэтому я не могу сравнивать между собой NAGIOS, GENEOS или ZABBIX, однако хотел бы поделиться описанием его возможностей. Возможно это поможет кому-то из читателей при выборе системы мониторинга для компании.
Стоит отметить, что GENEOS позиционируется как решение, в первую очередь, для крупных финансовых организаций, занимающихся торгами на бирже, клирингом, а так же для компаний с большой инфраструктурой. О чем и говорит нам список компаний-партнеров ITRS. Помимо этого, изучив их сайт, не нашел никакой информации о стоимости его лицензии и внедрения. На сколько я понимаю, стоимость зависит от размера организации, сложности ИТ системы и рассчитывается индивидуально.
С GENEOS я работаю уже около полутора лет, занимаюсь в основном настройкой мониторинга (работаю техподдержке, Level 3), получением и реагированием на алерты занимается в основном L2. За это время я более или менее освоил его возможности и решил парочку нетривиальных задач по мониторингу.
Список технологий, с которыми может быть интегрирован GENEOS:
— *nix based OS (Linux, Sun OS)
— Windows based OS
— Различные БД: DB2, MySQL, Oracle, Sybase, MS SQL Server, PostgreSQL
— Java (JMX, JMS)
— IBM WebSphere
— VMWare
— Control-M
— Мониторинг ОС. Это всевозможный мониторинг нагрузки на сервер — CPU, RAM, наличие свободного места на дисках, мониторинг запущенных процессов и так далее;
— Мониторинг доступности страниц веб-сайтов, доступных по протоколам HTTP/HTTPS. Поддержка прокси;
— Мониторинг файлов. Здесь подразумевается мониторинг создаваемых/изменяемых файлов, система может проверять появление файла заданного размера в нужный момент времени по заданному пути — применимо для различных вариантов джобов по доставке файлов-отчетов, клиентских файлов и так далее;
— StateTracker плагин. Данный плагин позволяет мониторить настроенный лог на наличие заданных паттернов, которые сигнализируют о начале или окончании какого-либо процесса, например о начале/завершении работы GC, инициализации какого-либо компонента и так далее;
— SQL плагин. Плагин позволяет выполнять заданный SQL на удаленной базе даных и выводить результаты в окно мониторинга. Второй по популярности плагин в нашей работе, поскольку позволяет решать множество задач по мониторингу работы приложений, использующих БД;
— Мониторинг логов (FKM плагин) — позволяет грепать файлы логов по заданным паттернам в определенный период времени. Здесь полет фантазии практически не ограничен, можно использовать как PlainText, так и регулярные выражения. Поддерживается многострочный режим, то есть задание паттернов начала — конца выражений, применимо, например, к стек трейсам в логах. Работать плагин может как в режиме SingleString (первое совпадение), так и MultipleString (множество совпадений за проход) с вариантами группировки ошибок. В моей работе это наиболее ходовой плагин, позволяющий оперативно реагировать на различные ошибки в логах;
— Возможность подключения к Java приложениям по JMX для снятия статистики;
— Мониторинг JMS, IMB WebSphere MQ;
— Мониторинг рынков;
— Сбор статистики, построение графиков с исторической информацией;
— Алертинг — здесь поддерживается различные варианты алертинга по электронной почте, SMS, так же возможна интеграция с другими системами. Так же есть система эскалации, то есть алертинг на различных уровнях, например сначала по почте, потом SMS;
— Возможность создать web Dashboard, который собирает и отображает общую статистику работы системы;
— Мониторинг Control-M jobs (задач).
В общем полный список плагинов, которые позволяют работать с различными технологиями, можно прочитать в официальной документации.
Сам GENEOS состоит из трех базовых компонентов: Gateway (сервер), NetProbe (клиент) и Geneos Active Console — консоль для мониторинга и настройки гейтвея.
Каждый демон (служба) NetProbe устанавливается на сервера, на которых предполагается вести мониторинг локально, либо на удаленной базе данных. Консоль — на клиентскую машину администратора, либо инженера команды мониторинга.
(скриншот официальной документации)
Так же структура позволяет использовать различные гетвеи для мониторинга тестовых и продакшн сред. Сначала настраивается мониторинг на тестовом гейтвее, тестируется, а затем промоутится на продакшн гейтвей, который настроен на продакшн среду.
Скриншот консоли мониторинга с официального сайте
Пример дашборда из презентации.
Затрудняюсь выделить достоинства GENEOS в сравнении с другими аналогами, поскольку, как я уже упомянул, не имел опыта использования других систем. Могу лишь поделиться небольшим сравнением с сайта ITCentralStation и своими впечатлениями:
— Обширный список технологий.
— Гибкая настройка алертинга.
— Отличная работа технической поддержки.
Недостатки:
— Несколько замороченная система конфигурации мониторинга. В целом решается чтением документации.
— Бывают проблемы с зависанием/падением NetProbes. Решается патчингом либо перераспределением нагрузки между пробами.
— Полагаю высокая стоимость интеграции и поддержки.
Все картинки взяты из открытых источников — Google Images помог. Ссылки в тексте.
Спасибо за внимание.
Должен отметить, что до знакомства с ITRS GENEOS не сталкивался с системами мониторинга напрямую, лишь слышал про NAGIOS и его возможности. Поэтому я не могу сравнивать между собой NAGIOS, GENEOS или ZABBIX, однако хотел бы поделиться описанием его возможностей. Возможно это поможет кому-то из читателей при выборе системы мониторинга для компании.
Стоит отметить, что GENEOS позиционируется как решение, в первую очередь, для крупных финансовых организаций, занимающихся торгами на бирже, клирингом, а так же для компаний с большой инфраструктурой. О чем и говорит нам список компаний-партнеров ITRS. Помимо этого, изучив их сайт, не нашел никакой информации о стоимости его лицензии и внедрения. На сколько я понимаю, стоимость зависит от размера организации, сложности ИТ системы и рассчитывается индивидуально.
С GENEOS я работаю уже около полутора лет, занимаюсь в основном настройкой мониторинга (работаю техподдержке, Level 3), получением и реагированием на алерты занимается в основном L2. За это время я более или менее освоил его возможности и решил парочку нетривиальных задач по мониторингу.
Список технологий, с которыми может быть интегрирован GENEOS:
— *nix based OS (Linux, Sun OS)
— Windows based OS
— Различные БД: DB2, MySQL, Oracle, Sybase, MS SQL Server, PostgreSQL
— Java (JMX, JMS)
— IBM WebSphere
— VMWare
— Control-M
Возможности GENEOS
— Мониторинг ОС. Это всевозможный мониторинг нагрузки на сервер — CPU, RAM, наличие свободного места на дисках, мониторинг запущенных процессов и так далее;
— Мониторинг доступности страниц веб-сайтов, доступных по протоколам HTTP/HTTPS. Поддержка прокси;
— Мониторинг файлов. Здесь подразумевается мониторинг создаваемых/изменяемых файлов, система может проверять появление файла заданного размера в нужный момент времени по заданному пути — применимо для различных вариантов джобов по доставке файлов-отчетов, клиентских файлов и так далее;
— StateTracker плагин. Данный плагин позволяет мониторить настроенный лог на наличие заданных паттернов, которые сигнализируют о начале или окончании какого-либо процесса, например о начале/завершении работы GC, инициализации какого-либо компонента и так далее;
— SQL плагин. Плагин позволяет выполнять заданный SQL на удаленной базе даных и выводить результаты в окно мониторинга. Второй по популярности плагин в нашей работе, поскольку позволяет решать множество задач по мониторингу работы приложений, использующих БД;
— Мониторинг логов (FKM плагин) — позволяет грепать файлы логов по заданным паттернам в определенный период времени. Здесь полет фантазии практически не ограничен, можно использовать как PlainText, так и регулярные выражения. Поддерживается многострочный режим, то есть задание паттернов начала — конца выражений, применимо, например, к стек трейсам в логах. Работать плагин может как в режиме SingleString (первое совпадение), так и MultipleString (множество совпадений за проход) с вариантами группировки ошибок. В моей работе это наиболее ходовой плагин, позволяющий оперативно реагировать на различные ошибки в логах;
— Возможность подключения к Java приложениям по JMX для снятия статистики;
— Мониторинг JMS, IMB WebSphere MQ;
— Мониторинг рынков;
— Сбор статистики, построение графиков с исторической информацией;
— Алертинг — здесь поддерживается различные варианты алертинга по электронной почте, SMS, так же возможна интеграция с другими системами. Так же есть система эскалации, то есть алертинг на различных уровнях, например сначала по почте, потом SMS;
— Возможность создать web Dashboard, который собирает и отображает общую статистику работы системы;
— Мониторинг Control-M jobs (задач).
В общем полный список плагинов, которые позволяют работать с различными технологиями, можно прочитать в официальной документации.
Структура
Сам GENEOS состоит из трех базовых компонентов: Gateway (сервер), NetProbe (клиент) и Geneos Active Console — консоль для мониторинга и настройки гейтвея.
Каждый демон (служба) NetProbe устанавливается на сервера, на которых предполагается вести мониторинг локально, либо на удаленной базе данных. Консоль — на клиентскую машину администратора, либо инженера команды мониторинга.
(скриншот официальной документации)
Так же структура позволяет использовать различные гетвеи для мониторинга тестовых и продакшн сред. Сначала настраивается мониторинг на тестовом гейтвее, тестируется, а затем промоутится на продакшн гейтвей, который настроен на продакшн среду.
Скриншот консоли мониторинга с официального сайте
Пример дашборда из презентации.
Достоинства и Недостатки
Затрудняюсь выделить достоинства GENEOS в сравнении с другими аналогами, поскольку, как я уже упомянул, не имел опыта использования других систем. Могу лишь поделиться небольшим сравнением с сайта ITCentralStation и своими впечатлениями:
— Обширный список технологий.
— Гибкая настройка алертинга.
— Отличная работа технической поддержки.
Недостатки:
— Несколько замороченная система конфигурации мониторинга. В целом решается чтением документации.
— Бывают проблемы с зависанием/падением NetProbes. Решается патчингом либо перераспределением нагрузки между пробами.
— Полагаю высокая стоимость интеграции и поддержки.
Все картинки взяты из открытых источников — Google Images помог. Ссылки в тексте.
Спасибо за внимание.