Блог Monit IT




Эскалация уведомлений: что это и как сделать?

Обычно управление интернет сервисами разделено на уровни. Скажем это могут быть менеджеры сервиса, которые занимаются в большинстве своем управленческой работой и техническая служба, которя может состоять из людей упраляющих рядовыми сисадминами и сами сисадмины.

Логично, что при наступлении каких-то перерывов в работе какой-то функциональной части сервиса, например серверов электронной почты, первыми должны получать уведомления дежурные системные администраторы. Они должны провести ряд оперативных мер по нахождению и исправлению неисправности. Данные работы, по регламенту, должны выполняться не дольше определенного периода времени. Естественно, что если сервис не работает дольше, то об этом должно быть извещено техническое руководство, для того, чтобы понять почему работы не выполнены в срок.

Так же и руководство может захотеть узнавать о проблемах сервиса, которые длятся скажем более нескольких часов, чтобы предпринять по этому поводу какие-то свои действия, например принять решение об объявлении о проблеме публично.

Этот процесс называется эскалированием уведомлений и он может быть выполнен средствами Monit IT.

Эскалирование уведомлений можно настроить на уровне уведомлений для отдельных объектов. Еще это можно сделать для всех уведомлений уходящих на те или иные контакты или группы контактов.

 

Например, создадим два контакта: Администратор и Руководитель.

У Администратора мы поставим опцию Уведомлять, если проблема длится больше, чем: в значение Уведомлять немедленно (опция задается для каждого вида связи отдельно):

 

А у Руководителя поставим значение 120 минут (два часа):

 

Теперь, если мы в объекте создадим два уведомления о проблемах, один для Администратора, а другой для Руководителя, то Администратор будет получать сообщения о всех проблемах незамедлительно, а Руководитель, только о тех проблемах, которые не были исправлены за два часа.

 



You must be logged in to post a comment.