- Главная
- Документация
- Работа с инцидентами
Создание инцидента
Процесс создания инцидента и таймлайн событий
В Statuser инцидент создается автоматически, когда отслеживаемый сервис становится недоступным.
Инцидент позволяет собрать в одном месте всю информацию о проблеме, а также отслеживать ее статус и прогресс решения.
На дашборде инцидента можно увидеть причину ошибки, время начала и длительность инцидента, а также его статус и полную историю событий.
В Statuser все ошибки мониторинга имеют свой код, который позволит быстро понять, что произошло. Все коды ошибок и их описание можно посмотреть в отдельной статье.
История инцидента
В истории инцидента можно увидеть все события, которые обработал или выполнил Statuser:
-
Ошибка мониторинга - с этого события начинается любой инцидент. Это событие показывает время провалившейся проверки, локацию, откуда проверка выполнялась и причину ошибки.
-
Начало инцидента - время создания инцидента.
Сейчас время начала инцидента совпадает с временем получения ошибки мониторинга, но в будущем появится возможность установить задержку между провалившейся проверкой и созданием инцидента, чтобы дать сервису время на восстановление и не запускать цепочку действий.
-
Отправка уведомления - когда инцидент создан или завершен, Statuser отправляет уведомление на емейл, в телеграм и в вебхук (если каналы включены в настройках) со статусом инцидента. Для каждой отправки уведомления создается отдельное событие в истории, которое позволяет увидеть, когда и куда было отправлено уведомление и статус доставки этого уведомления.
-
Изменение ошибки проверки - если во время инцидента произошла ошибка проверки, которая отличается от предыдущей ошибки, то это также отразится в истории. Это особенно полезно, когда первоначальная проблема решена, но сервис продолжает выдавать ошибки по другим причинам.
-
Успешная проверка - первая успешная проверка после недоступности сервиса. Это событие показывает, что сервис восстановлен и проверки из каждой локации проходят успешно.
-
Завершение инцидента - когда сервис восстановлен и проверки проходят успешно, инцидент завершается.
-
Комментарий к инциденту - к каждому инциденту можно оставить комментарий или написать постмортем. Комментарии позволяют зафиксировать все действия, которые были сделаны для решения проблемы и сохранить полученный опыт. Подробнее о работе комментариев в статье Комментарии к инцидентам.
PDF-отчёт по инциденту
В Statuser можно скачать PDF-отчёт по каждому инциденту. Это удобно, если нужно отправить итоговый отчёт клиенту, провайдеру или сохранить материалы для внутреннего постмортема.
Чтобы скачать отчёт:
- Откройте нужный инцидент в разделе Инциденты.
- Нажмите кнопку Отчёт.
- Выберите, какие разделы включить в PDF.
- Подтвердите скачивание.
В отчёт всегда включается основная информация об инциденте. Дополнительно можно выбрать остальные доступные разделы.
Автоматическая приостановка серверов
Если инцидент остаётся активным более 30 дней, Statuser автоматически приостанавливает мониторинг сервера.
Одновременно с этим инцидент автоматически закрывается со статусом таймаута.
Это помогает:
- исключить забытые или выведенные из эксплуатации серверы,
- сохранить чистоту интерфейса и точность отчётов,
- снизить ненужную нагрузку на систему.
Проверки приостанавливаются, но сервер остаётся доступным — мониторинг можно включить вручную в любой момент.