Блог Monit IT




Как узнать больше о причине ошибки?

В Monit-IT появилась возможность получения расширенной информации о проведенной проверке. Это позволяет больше узнать, как о самой проверке объекта мониторинга, так и точнее выяснить причину возникшей проблемы.

Расширенная информация о проверках доступна на текущий момент для SSH, HTTP HEAD и HTTP типов проверок. Получить ее можно в Журнале проверок в Карточке проблемы — просто кликните на строку с интересующей вас проверкой.

0 комментариев

Как зарегистрироваться и добавить свой сайт на проверку.

Видео о том как зарегистрироваться в сервисе, как добавить свой сайт на проверку и настроить SMS уведомления о проблемах.

0 комментариев

Визуализация метрик или как бьется сердце вашего сервера.

В прошлом посте я описал, что из себя представляют метрики и как именуются метрики собираемые Monit IT. Сейчас мы попробуем превратить все эти цифры в понятную картину.

 

Для этого заходим в раздел Отчеты и выбираем график Метрики:

 

Справа располагается панель управления, на которой отображены:

1. Список объектов

Нажимая на треугольный маркер вы раскрываете список метрик, который был собран для этого объекта.

 

2. Два параметра конвертирования данных времени и размера в нужную размерность:

С помощью этого контрола вы сможете делать данные сопоставимыми по их математическому порядку.

 

3. Контролы выбора проверочных точек и периода времени за который вам нужно построить отчет.

Контролы выбора проверочных точек мониторинга и периода отчета

Вы можете отображать данные собранные со всех проверочных точек, как с разделением этих данных по точкам, так и объединением их и выбора среднего значения со всех проверочных точек или вы можете указать конкретную интересующую вас проверочную точку.

Ну и стандартным контролом выбора периода отчета вы выбираете время за которое вы хотите получить график.

 

Для вывода графика вы можете отметить метрики у разных объектов и они будут все отображены на графике.

Вот пример графика полученного мной с помощью этого отчета:

 

 

Если хотите узнать подробнее и увидеть, как был построен этот график, посмотрите видео:

 

0 комментариев

Эскалация уведомлений: что это и как сделать?

Обычно управление интернет сервисами разделено на уровни. Скажем это могут быть менеджеры сервиса, которые занимаются в большинстве своем управленческой работой и техническая служба, которя может состоять из людей упраляющих рядовыми сисадминами и сами сисадмины.

Логично, что при наступлении каких-то перерывов в работе какой-то функциональной части сервиса, например серверов электронной почты, первыми должны получать уведомления дежурные системные администраторы. Они должны провести ряд оперативных мер по нахождению и исправлению неисправности. Данные работы, по регламенту, должны выполняться не дольше определенного периода времени. Естественно, что если сервис не работает дольше, то об этом должно быть извещено техническое руководство, для того, чтобы понять почему работы не выполнены в срок.

Так же и руководство может захотеть узнавать о проблемах сервиса, которые длятся скажем более нескольких часов, чтобы предпринять по этому поводу какие-то свои действия, например принять решение об объявлении о проблеме публично.

Этот процесс называется эскалированием уведомлений и он может быть выполнен средствами Monit IT.

Эскалирование уведомлений можно настроить на уровне уведомлений для отдельных объектов. Еще это можно сделать для всех уведомлений уходящих на те или иные контакты или группы контактов.

 

Например, создадим два контакта: Администратор и Руководитель.

У Администратора мы поставим опцию Уведомлять, если проблема длится больше, чем: в значение Уведомлять немедленно (опция задается для каждого вида связи отдельно):

 

А у Руководителя поставим значение 120 минут (два часа):

 

Теперь, если мы в объекте создадим два уведомления о проблемах, один для Администратора, а другой для Руководителя, то Администратор будет получать сообщения о всех проблемах незамедлительно, а Руководитель, только о тех проблемах, которые не были исправлены за два часа.

 

0 комментариев