Мониторинг сетевой инфраструктуры с SNMP и Telegraf

8 минут чтения
Средний рейтинг статьи — 4.9

Сеть — один из самых критичных компонентов любой инфраструктуры. Проблемы с маршрутизаторами, коммутаторами или каналами связи часто проявляются как «медленный сервис», хотя на самом деле причина в сети.

Чтобы это видеть, нужен мониторинг сетевой инфраструктуры. Один из классических подходов — SNMP + Telegraf.

Что такое SNMP

SNMP (Simple Network Management Protocol) — это протокол, через который устройства отдают метрики.

Поддерживается почти всеми:

  • маршрутизаторы
  • коммутаторы
  • серверы
  • сетевые устройства (UPS, firewall)

Через SNMP можно получить:

  • загрузку интерфейсов
  • количество пакетов
  • ошибки и дропы
  • CPU и память устройств

Как устроены SNMP-метрики

SNMP использует OID (Object Identifier) — уникальные идентификаторы метрик.

Пример:

  • трафик интерфейса
  • количество ошибок

Обычно используют готовые MIB (Management Information Base), чтобы не работать напрямую с OID.

Что такое Telegraf

Telegraf — это агент для сбора метрик.

Он умеет:

  • опрашивать SNMP
  • преобразовывать метрики
  • отправлять их в систему хранения (InfluxDB, Prometheus и др.)

Фактически это «сборщик» данных.

Как это работает вместе

  1. Устройства отдают метрики по SNMP
  2. Telegraf опрашивает их
  3. Метрики отправляются в хранилище
  4. Grafana визуализирует данные

Схема:
Network devices → SNMP → Telegraf → InfluxDB / Prometheus → Grafana

Настройка SNMP на устройстве

На большинстве устройств нужно:

  • включить SNMP
  • задать community (например, public)
  • ограничить доступ по IP

Пример (условно):

snmp-server community public RO
snmp-server host 192.168.1.10

Важно: не используйте public в продакшене без ограничений.

Настройка Telegraf

В конфиге добавляем input:

[[inputs.snmp]]
  agents = ["192.168.1.1:161"]
  version = 2
  community = "public"
 
  [[inputs.snmp.field]]
    name = "ifInOctets"
    oid = "IF-MIB::ifInOctets"
 
  [[inputs.snmp.field]]
    name = "ifOutOctets"
    oid = "IF-MIB::ifOutOctets"

Это позволит собирать входящий и исходящий трафик.

Какие метрики важно отслеживать

1. Трафик

  • входящий/исходящий трафик
  • скорость передачи

Важно:

  • выявление перегрузки каналов

2. Errors и drops

  • packet drops
  • CRC errors

Это часто сигнал проблем с сетью или оборудованием.

3. Utilization

  • загрузка интерфейсов

Если интерфейс постоянно близок к 100% — это узкое место.

4. CPU и память устройств

  • нагрузка на маршрутизаторы
  • использование памяти

5. Latency и jitter (косвенно)

Через SNMP напрямую не всегда доступны, но можно дополнить ping-мониторингом.

Grafana

Для визуализации используют Grafana.

Типичные графики:

  • трафик по интерфейсам
  • ошибки
  • загрузка устройств

Это позволяет быстро увидеть аномалии.

Где здесь место Statuser

SNMP и Telegraf показывают, что происходит внутри сети.

Но пользователю важен внешний результат:

  • доступен ли сервис
  • есть ли задержки

Здесь можно использовать Statuser:

  • мониторинг доступности сервисов
  • фиксация деградации
  • уведомления при проблемах

Таким образом:

  • SNMP → внутренняя диагностика
  • Statuser → внешний взгляд

Практические советы

  1. Ограничивайте доступ к SNMP
    • whitelist IP
    • используйте SNMPv3 при возможности
  2. Не опрашивайте слишком часто
    • нагрузка на устройства
  3. Следите за трендами
    • рост трафика важнее разовых пиков
  4. Комбинируйте с другими метриками
    • приложения
    • базы данных

Итог

Мониторинг сети — ключ к пониманию инфраструктуры.

  • SNMP даёт доступ к метрикам устройств
  • Telegraf собирает и отправляет данные
  • Grafana визуализирует

А инструменты вроде Statuser помогают увидеть влияние сетевых проблем на пользователей.

Вместе это даёт полную картину: от железа до пользовательского опыта.

8 минут чтения
Средний рейтинг статьи — 4.9

Настроить мониторинг за 30 секунд

Надежные оповещения о даунтаймах. Без ложных срабатываний