Ложные срабатывания
Механизм проверки при недоступности сервиса и обработка ложных срабатываний
При мониторинге серверов и сервисов могут возникать ложные срабатывания — ситуации, когда система сообщает о проблеме, хотя на самом деле всё работает корректно. Statuser использует различные механизмы для минимизации таких ситуаций в зависимости от типа мониторинга.
Проверки доступности (HTTP/HTTPS, Ping, TCP)
При проверке сервиса на доступность могут возникать ложные срабатывания. Например, сервис может быть недоступен из-за проблем с сетью или сервер единоразово ответил с ошибкой.
Чтобы минимизировать такие ошибки, Statuser выполняет проверки из нескольких регионов — сейчас это Москва, Алматы и Амстердам. При добавлении сервера вы можете выбрать, из каких регионов выполнять мониторинг.
Не рекомендуется выполнять проверки только из одного региона — это может привести к ложным срабатываниям при кратковременных проблемах в конкретной локации. Для надёжности рекомендуется выбрать хотя бы два региона.
Кроме географического распределения, для повышения надёжности используется механизм повторных попыток. Если первая проверка завершилась с ошибкой, Statuser выполнит ещё две повторные попытки с увеличивающимся интервалом:
- После 1-й неудачной попытки — повтор через 700 мс
- После 2-й — ещё одна попытка через 1500 мс
Сервис будет считаться недоступным, только если все 3 попытки в каждом из выбранных регионов завершились неудачно.
Пример поведения
Москва →
1. Первая проверка → ✅ Успешно → [Доступен]
↘ ❌ Неудачно → Через 700 мс →
2. Вторая проверка → ✅ Успешно → [Доступен]
↘ ❌ Неудачно → Через 1500 мс →
3. Третья проверка → ✅ Успешно → [Доступен]
↘ ❌ Неудачно → [Недоступен]
Алматы →
...
Амстердам →
...
Общее время проверки складывается из времени выполнения трёх попыток и интервалов между ними.
Мониторинг DNS-записей
При мониторинге DNS-записей важно учитывать, что изменения в DNS могут быть временными или связаны с переносом записей между серверами. Чтобы избежать ложных уведомлений о таких изменениях, Statuser использует систему отложенных уведомлений.
Как это работает:
- При обнаружении изменения в DNS-записях (добавление, удаление или модификация) система не отправляет уведомление сразу
- Вместо этого запускается таймер ожидания на 15 минут
- По истечении этого времени система сравнивает текущее состояние DNS-записей с тем, что было зафиксировано в начале
- Уведомление отправляется только в том случае, если изменения сохранились
Этот механизм позволяет отфильтровать временные изменения, которые могут возникать:
- При обновлении DNS-записей с коротким TTL
- Во время миграции между DNS-серверами
- При балансировке нагрузки с динамическими записями
- При временных сбоях в DNS-инфраструктуре
Если за 15-минутный период DNS-записи вернулись к исходному состоянию, уведомление не будет отправлено. Это помогает избежать ложных тревог при кратковременных флуктуациях DNS.
Благодаря этому подходу вы получаете уведомления только о действительно важных и устойчивых изменениях в DNS-конфигурации вашего домена.