Блог Monit IT




Метрики.

В прошлой статье я упомянул о том, что Monit IT собирает метрики и позволяет строить по ним графики и с их помощью сопоставлять графически влияние одних процессов, происходящих на ваших серверах с другими. Например, как влияет объем занятой памяти на сервере, на загрузку процессора и на скорость работы веб-сервера. Интересно?  Тогда читайте дальше!

 

Что такое метрика в Monit IT? Это числовое значение какого-либо параметра, которое может иметь свою размерность ( например миллисекунды или байты ), полученное в результате проведения проверки.

 

До недавнего времени в Monit IT была доступна только одна метрика — время затраченное на проверку объекта. Она измеряется в милисекундах и показывает сколько времени заняла проверка объекта тестером. В целом для проверки веб-сайта это, наверное, вполне достаточная метрика, но даже у ответа веб-сайта есть интересные нюансы, о которых интересно было бы знать. Эти нюансы вы могли видеть при проверке своего веб-сервера в разделе Инструменты на нашем сайте. Вот, например, как выглядит результат проверки сайта lenta.ru:

Здесь вы можете видеть, кроме уже упомянутой метрики Всего есть еще много интересной информации, например, как долго происходило соединение с сервером и отправлялся запрос (Запрос), как долго сервер обрабатывал запрос и после этого выдал заголовки ответа (Заголовки) и сколько байт было в теле ответа сервера и как долго он принимался (Данные).

 

Или возьмем SSH проверку в режиме NAGIOS PLUGIN. Вы например проверяете загрузку процессора: сам плагин возвращает вам три метрики load1, load5 и load15 (текущая загрузка процессора, средняя за 5 минут, средняя за 15 минут) и вас конечно же не устроит, если Monit IT покажет вам только, сколько времени у него заняло запустить этот плагин и получить статус ошибки или предупреждения, вам хотелось бы наверняка видеть изменения загрузки процессора в течение времени и сопоставлять это изменение, например, с тем, как быстро ваш сайт обрабатывает запросы посетителей. Теперь это возможно! Monit IT научился получать и сохранять значения разнообразных метрик и также графически представлять их.

 

Для начала рассмотрим то, как именуются метрики. Названия метрик в Monit IT состоят из цифр, латинских букв, а так же могут содержать символы минус «-«, подчеркивание «_», точка «.» и прямой слэш «/».  Все символы в названиях метрик, которые не входят в этот набор, автоматически заменяются на символы подчеркивания «_».  Само название метрики состоит из именной части и размерности. Например стандартная метрика «Общее время затраченное на проверку» выглядит, как mitest.total.ms (здесь mitest.total именная часть, а ms — единицы измерения, миллисекунды).

 

Стандартные метрики имеют интуитивно понятные названия. Например так выглядят метрики для HTTP проверки ( .us в названиях метрик  — сокращение от микросекунды ) :

Метрика mitest.total.ms вам уже знакома (total.us — здесь то же самое, только в микросекундах).  body.bytes — размер тела ответа веб-сайта в байтах.  Остальные метрики это время затраченное на соединение с проверямым сайтом (connect.us), отправки запроса (send.us), время затраченное на ожидание и получение заголовков (headers.us) и время на получение тела ответа, т.е. самого содержимого веб-страницы (body.us).

 

Метрики для проверки PING выглядят так:

min.us, max.us и avg.us — минимальное, максимально и среднее время пинга. ping.lost, ping.ok, ping expected  — количественные характеристики: сколько пинг пакетов потеряно, сколько вернулось и сколько пакетов всего было отправлено. ping.lost.percent — процент потерянных пинг пакетов от ощего числа отправленных.

 

Теперь о метриках собираемых  Nagios плагинами.  Названия этих метрик преобразуются для хранения в базе данных Monit IT. Сначала имя приводится в соответствие с требованиями именования метрик (неподдерживаемые символы заменяются на символ подчеркивания). И потом к названию добавляется размерность метрики.

Например, если плагин вернул такую метрику ‘GigabitEthernet1/0/26_in_error’=771c  , то она будет преобразована в  _GigabitEthernet1/0/26_in_error_.counter  и в базу будет записано значение 771 для этой метрики.

 

Подробнее о плагинах Nagios, как ими пользоваться, как установить, о том какие типы значений они возвращают ит.д. мы расскажем в дальнейших статьях нашего блога.

Подпишитесь на RSS канал нашего блога и присоединяйтесь к нам в твиттере @atlexru

0 комментариев

Новый тип проверки: SSH

Возможно вы уже заметили анонс в твиттере  на прошлой неделе, о том, что мы добавили новый тип проверки в Monit IT — SSH. Сейчас мы расскажем о нем подробнее.

SSH —  позволяющий производить удалённое управление операционной системой и туннелирование TCP-соединений (например, для передачи файлов).  (Это цитата из википедии, если хотите узнать больше о протоколе SSH прочитайте эту статью). Нас в этом протоколе интересует именно удаленное управление операционной системой. Используя этот протокол SSH тестер будет подключаться к вашей операционной системе, запускать необходимую команду и проверять возвращаемый код ошибки и обрабатывать выходные данные.

SSH тестер имеет три типа проверки:

 

1. Самый простой: AUTH

 

Тестер подключается к удаленному серверу по указанному адресу и порту, аутентифицируется и отключается от удаленного хоста. В данном режиме тестер проверяет саму возможность подсоединения к удаленному серверу по протоколу SSH.

 

2. Тип проверки: EXEC

Этот метод уже подразумевает запуск какой-либо команды на удаленном сервере и возможную проверку возвращаемого значения на соответствие заданным параметрам

На скриншоте вы можете видеть, какие параметры имеет данный тип проверки. Вы должны ввести команду, которую необходимо выполнить на удаленном сервере (заметьте, что Monit IT не проверяет команды на деструктивность или побочные эффекты, так что если вы введете команду удаления  всей файловой системы на сервере… ну что ж, вы сами в этом виноваты, вы ведь не вводите такие команды в консоли своего сервера, значит и в Monit IT такие команды использовать не нужно :) )

 

Если вы оставите поля  Ожидаемый код возврата и Проверка строки или регулярного выражения  пустыми, то Monit IT просто запустит введенную вами команду ничего более не проверяя.

 

В поле Ожидаемый код возврата вы можете ввести число, и Monit IT сравнит  код возврата запускаемой команды с числом в этом поле. Если они не совпадут, тестер вернет ошибку.

 

В поле Проверка строки или регулярного выражения можно ввести строку или регулярное выражение. После запуска команды тестер сравнит объедененное содержимое вывода команды в stdout и stderr на соответствие регулярному выражению или наличию строки в этом выводе. Как замечение: тестер примет только 4 килобайта вывода команды.

 

3. Третий и, наверное, самый интересный тип проверки NAGIOS PLUGIN 

 

Как видите настроек у этого типа проверки даже меньше, чем у предыдущего, но это не делает его менее интересным.

От вас требуется ввести только выполняемую команду и тестер проверит вывод данной команды в соответствие с правилами NAGIOS плагинов.

 

Что такое Nagios? Nagios это одна из систем мониторинга с открытым исходным кодом, которая широко используется системными администраторами. Плюсы и минусы ее мы обсуждать в данной статье не будем, скажем лишь то, что Nagios мощный продукт, но требует усилий в установке и настройке, а также  оборудование на которое эта установка производится.

 

Чем же интересна данная проверка? — спросят люди, незнакомые с Nagios. Мы ответим: количеством проверочных скриптов, написанных огромным сообществом системных администраторов использующим Nagios. Вы можете проверять любые параметры вашего сервера: загрузка процессора, свободное место на диске… да вобщем все что угодно! Вам нужно только установить плагины Nagios на свой сервер и потом их запускать с помощью Monit IT.

 

Например на скриншоте показана команда проверки загрузки процессора. Она собирает данные о загрузке процессора на текущую минуту и за последние 5 и 10 минут.  Ключами -w и -c задаются пороги предупреждения и ошибки. Так если текущая загрузка будет равна 5, то тестер выставит флаг предупреждения, а если загрузка превысит порог 10, то флаг ошибки.

 

Но и это еще не все: самое вкусное я приберег на последок. :) Monit IT теперь умеет автоматически собирать все проверенные метрики и хранить их. Впоследствии вы сможете наглядно представить эти метрики в виде графиков и сопоставить их с другими метриками. Например вы сможете наглядно  узнать, как загрузка процессора влияет на скорость ответа вашего сервера! Подробнее об этом в следующей статье.

 

В нашем блоге мы подробно расскажем, как установить плагины Nagios на ваш сервер, а также остановимся на конкретных примерах тестирования серверов с помощью этих плагинов. Если вам это интересно, подпишитесь на RSS канал нашего блога и присоединяйтесь к нам в твиттере @atlexru 

 

 

0 комментариев

Открытая статистика объектов мониторинга.

Мы уже объявляли на днях в твиттере, что скоро в Monit IT появится возможность размещения кнопок доступности объектов на ваших веб страницах, а так же предоставления вашим посетителям открытой статистике о состоянии и доступности проверяемых объектов. Спешим сообщить, что сегодня данная возможость стала доступна пользователям сервиса Monit IT на всех типах аккаунтов, в том числе и бесплатных!

 

Для того чтобы разместить кнопку доступности на вашем сайте, вам нужно зайти в экран редактирования проверяемого объекта, для которого вы хотите сгенерировать кнопку и экран публичной статистики. В правой колонке снизу вы увидите бесцветную кнопку:

 

Кликните на нее мышкой.  Откроется экран редатирования публичной статистики:

Включите чекбокс для того, чтобы создать кнопку доступности для объекта. После того как вы включите этот чекбокс вам будет предложено выбрать изображение кнопки, а так же решить, хотите ли вы, чтобы ваши посетители могли видеть более полную статистику по объекту мониторинга:

В данном случае мы выбрали картинку и разрешили доступ к странице подробной публичной статистике. Теперь скопируйте HTML код, который и установите его на свой сайт, а в экране редактирования доступа к статистике нажмите Применить.

После этого бесцветная кнопка, которую вы кликали в самом начале будет показывать актуальную информацию прямо на странице редактирования объекта. Так вы сможете видеть, создана ли кнопка для данного объекта:

 

Ну а тот код, который вы видите на скриншоте мы установили на наш сайт monit-it.ru. Вы можете увидеть эту кнопку в самом низу сайта.

Вообще эту кнопку можно разместить не только на вашем сайте, но и например в блоге, как я сделал это тут:

Monit IT

Вы можете кликнуть на эту кнопку и посмотреть текущую статистику по сайту monit-it.ru.

1 комментарий

С весенними праздниками!

Monit IT поздравляет вас со всеми майскими праздниками: с прошедшим праздником труда и солидарности и наступающим Днем Победы!

Мы тоже решили сделать небольшой подарок нашим пользователям и помочь вам провести свои выходные качественно: на нашем бесплатном тарифе теперь доступно пять бесплатных SMS оповещения о проблемах. Теперь вам не нужно даже проверять свою электронную почту, чтобы знать, что с вашими сайтами и серверами всё в порядке. Вы сможете качественно отдохнуть, а ваши клиенты получат полноценный сервис, даже в праздники.  :-)

Пять бесплатных SMS оповещений теперь всегда будут доступны на бесплатном тарифе и будут пополняться раз в месяц при продлении тарифа. Бесплатные SMS оповещения не добавляются при переходе с платного на бесплатный тариф, если переход на платные тарифы был осуществлен менее двух недель назад.

 

 

0 комментариев

Новое: Прием платежей по банковской карте

 

Сегодня в боевом режиме заработал прием платежей по банковской карте. Процессинг осуществляется компанией Assist и происходит на сайте компании Assist. Мы не получаем и не храним никаких сведений о ваших банковских картах.

Пополнить счет вашего аккаунта в системе мониторинга серверов Monit IT по бакнковской карте, вы можете на странице Пополнить баланс в разделе управления вашим аккаунтом.

 

И плюс, появилось небольшое, но очень важное изменение в дизайне на страницах редактирования объектов и контактов:

Это кнопка Сохранить и остаться на странице, которая значительно повышает удобство пользования интерфейсом системы.

1 комментарий

Новое: многопользовательская работа и ICQ и Jabber уведомления

Мы обновили версию мониторинга (#109).

Появилось много новых возможностей, некоторые из которых хотелось бы упомянуть отдельно.

 

1. Мультипользовательская работа.

Теперь вы можете добавлять в свой аккаунт пользователей со своими индивидуальными параметрами доступа и назначать им права доступа. Например вы можете запретить рядовым администраторам доступ в финансовые параметры аккаунта.

Управление правами сейчас находится в активном тестировании, поэтому будем рады любым сообщениям об ошибках :)

 

2. ICQ и Jabber уведомления.

Теперь вы можете получать уведомления о проблемах с вашим сайтом или сервером в ваш ICQ или Jabber мессенджер. Не забывайте, что вам необходимо активировать ваш ICQ или Jabber контакт в форме редактирования контакта.

Если будут какие-то проблемы с получением данного вида уведомлений — пишите в службу поддержки, будем разбираться. Особенно, конечно, привередлива аська, с её постоянно меняющимся протоколом.

 

3. Дедупликация уведомлений.

Очень важное изменение. Как вы знаете, в Monit IT вы можете настроить уведомления большим количеством способов: уведомления на контакт, на группу контактов, в объекте или в теге. Не совсем аккуратная настройка уведомлений могла привести к тому, что на один и тот же телефонный номер могло приходить большое количество SMS или на один и тот же адрес E-mail падало большое количество писем об одном и том же событии.

Сейчас для одного назначенного периода уведомлений (например сразу или уведомлять о событии длящимся более пяти минут) на один и тот же контактный адрес вам придет только одно сообщение о проблеме.

 

0 комментариев

Эскалация уведомлений: что это и как сделать?

Обычно управление интернет сервисами разделено на уровни. Скажем это могут быть менеджеры сервиса, которые занимаются в большинстве своем управленческой работой и техническая служба, которя может состоять из людей упраляющих рядовыми сисадминами и сами сисадмины.

Логично, что при наступлении каких-то перерывов в работе какой-то функциональной части сервиса, например серверов электронной почты, первыми должны получать уведомления дежурные системные администраторы. Они должны провести ряд оперативных мер по нахождению и исправлению неисправности. Данные работы, по регламенту, должны выполняться не дольше определенного периода времени. Естественно, что если сервис не работает дольше, то об этом должно быть извещено техническое руководство, для того, чтобы понять почему работы не выполнены в срок.

Так же и руководство может захотеть узнавать о проблемах сервиса, которые длятся скажем более нескольких часов, чтобы предпринять по этому поводу какие-то свои действия, например принять решение об объявлении о проблеме публично.

Этот процесс называется эскалированием уведомлений и он может быть выполнен средствами Monit IT.

Эскалирование уведомлений можно настроить на уровне уведомлений для отдельных объектов. Еще это можно сделать для всех уведомлений уходящих на те или иные контакты или группы контактов.

 

Например, создадим два контакта: Администратор и Руководитель.

У Администратора мы поставим опцию Уведомлять, если проблема длится больше, чем: в значение Уведомлять немедленно (опция задается для каждого вида связи отдельно):

 

А у Руководителя поставим значение 120 минут (два часа):

 

Теперь, если мы в объекте создадим два уведомления о проблемах, один для Администратора, а другой для Руководителя, то Администратор будет получать сообщения о всех проблемах незамедлительно, а Руководитель, только о тех проблемах, которые не были исправлены за два часа.

 

0 комментариев

Отчет о доступности проверяемых объектов.

Сегодня мы выпустили очень важное обновление сервиса Monit IT, которое позволяет анализировать доступность  сайтов или сервисов находящихся под наблюдением, а так же наглядно представлять как изменяется доступность вашего сайта или сервиса в зависимости от времени и понимать, когда больше всего происходит ошибок или возникает больше всего предупреждений в течении дня.

Это стало возможно с использованием нового средства отчетов «Доступность объектов»

Постройте график доступности сайта или сервера. Подсчитайте их uptime и узнайте сколько раз сайт был недоступен.Данный вид отчета, позволяет строить графики доступности объектов, а так же наглядно представляет, количество переключений в статусы Ошибка и Предупреждение в определенные промежутки времени (по часам или по суткам).

Вы можете получать отчет сразу по всем объектам, которые вы контролируете или выбрать объекты находящиеся на одном или нескольких серверах. Вы можете выбрать для отчета отдельные объекты, один или несколько. Или можете выбрать объекты отмеченные теми или иными тегами.

Вы можете получить отчет с разбивкой по часам за один или два дня или получить посуточную картину, например за месяц.

Вот пример полученного отчета:

График доступности серверов в мониторинговой системе Monit IT

Здесь пользователь построил график средней доступности всех своих почтовых серверов.

 

Здесь представлен отчет по всем почтовым серверам, которые отслеживает владелец этого аккаунта. Слева представлена шкала в процентах для значений доступности серверов, справа шкала ошибок и предупреждений.

Вы можете сразу увидеть, насколько доступны были эти почтовые серверы, когда происходили сбои и сколько их было за эти 24 часа, какое было суммарное значение доступности у этих серверов за весь выбранный период.

На наш взгляд, очень удобный инструмент, который обязательно пригодится всем, кто предпочитает знать всё о правильности работы своих интернет-сервисов.

 

1 комментарий

Периоды техобслуживания

Каждый сервер или сайт  нуждаются в проведении технического обслуживания: обновление программного обеспечения, замена дисков ит.д. При проведении ТО сервер либо выключается, либо перезагружается, либо отключаются какие-то сетевые сервисы, при этом мониторинг начинает сигнализировать вам об ошибках, о которых вы и так прекрасно знаете и тем самым просто отвлекает от работы. Более того, потом в логе мониторинга вы будете видеть ошибки, но не будете знать причины, по которой они произошли.

Для того чтобы этого избежать, системные администраторы должны будут постоянно отключать мониторинг тех или иных объектов. Даже если таких объектов единицы, техники скорее всего будут забывать это делать. А что делать, если на техобслуживание закрывается несколько хостов да еще каждую неделю. Просто с ума сойти!

В Monit IT теперь вы можете легко настроить одиночные или повторяющиеся еженедельные периоды технического обслуживания, как для отдельных объектов, так и для всего хоста. В указанный период времени, при получении очередного результата проверки, объект получит статус Техобслуживание. Все проверки будут записываться в журнал, но не будут генерировать ошибок.

Можно настроить отдельное уведомление на статус Техобслуживание, которое может быть использовано, как напоминание тех.персоналу, а уведомление по окончанию периода техобслживания, даст вам четкое понимание о состоянии объекта после проведенных технических работ.

0 комментариев

Можно ли присылать свои предложения по развитию сервиса?

К предыдущему посту важно добавить, что вы, как пользователи Monit IT, можете еще и предлагать свои идеи о тех возможностях сервиса, которые бы вам хотелось видеть в нем в будущем! Вы можете это сделать написав письмо в техническую поддержку: с сайта или из вашего аккаунта в системе Monit IT, или просто написав письмо на support@monit-it.ru.

Так же мы открыли раздел на сайте reformal, для того чтобы вы могли обсудить ваши идеи с другими пользователями сервиса.

Наша страничка на сервисе Reformal находится по адресу monit-it.reformal.ru

0 комментариев