Dohledové systémy – Zabbix, Grafana a The Dude
Proč monitorovat infrastrukturu?
Slaboproudé a IT systémy v budovách jsou živé organismy – switche, NVR, PBX, NTP servery, EPS ústředny, přístupové kontroléry, přijímače SAT a desítky dalších zařízení. Každé z nich může selhat, přetížit se nebo být napadeno. Bez monitoringu zjistíte problém až ve chvíli, kdy si uživatel nebo technik všimne výpadku – hodinty nebo dny po skutečné poruše.
Dohledový systém sleduje dostupnost, výkon a stav každého zařízení v reálném čase, posílá notifikace při anomáliích a uchovává historii pro analýzu trendů.
SNMP – základ síťového monitoringu
SNMP (Simple Network Management Protocol) je standardní protokol pro monitorování a správu síťových zařízení. Každé zařízení s podporou SNMP obsahuje MIB (Management Information Base) – strukturovanou databázi proměnných popisujících stav zařízení (vytížení CPU, teplotní čidla, provoz na portech, stav disků).
Monitoring systém (SNMP manager) pravidelně dotazuje zařízení (polling) nebo přijímá proaktivní SNMP traps – zprávy zasílané zařízením při události (přechod portu dolů, překročení teploty, přihlášení uživatele).
Verze SNMP:
- SNMPv1/v2c – nešifrované, autentizace pouze community stringem (heslem v čistém textu). Stále hojně používané
- SNMPv3 – šifrování AES, autentizace SHA. Standard pro bezpečné prostředí
Zabbix
Zabbix je open source monitorovací platforma s bohatou funkcionalitou, schopná sledovat tisíce hostů a miliony metrik.
Architektura
Zabbix Server je centrální proces zpracovávající data, vyhodnocující triggery a odesílající notifikace. Ukládá data do databáze (MySQL, PostgreSQL, Oracle).
Zabbix Proxy je distribuovaný kolektor. Nasadí se do vzdálené lokace nebo za NAT – proxy shromáždí data a pošle je na server. Snižuje zatížení serveru a umožňuje monitorovat nedostupné segmenty sítě.
Zabbix Agent běží na monitorovaném hostu (Linux, Windows) a sbírá lokální metriky (CPU, RAM, disk, procesy, log soubory). Agent2 přidává asynchronní kontroly a pluginy.
Zabbix Frontend je webové rozhraní pro konfiguraci, zobrazení dashboardů, grafů a správu alertů. Napsán v PHP, typicky na Nginx/Apache.
Šablony (Templates)
Templaty obsahují sadu položek, triggerů, grafů a dashboardů pro konkrétní typ zařízení (Cisco switch, Linux server, Windows server, MikroTik router). Zabbix má obrovskou knihovnu komunitních šablon – stáhnout, importovat a okamžitě monitorovat.
Položky (Items)
Každá měřená veličina je Item – například net.if.in[eth0] (příchozí bajty na eth0), system.cpu.load (zatížení CPU), SNMP OID .1.3.6.1.2.1.2.2.1.10.{#SNMPINDEX}. Zabbix sbírá hodnoty v definovaném intervalu (30 s, 1 min, 5 min) a ukládá do DB.
Triggery (Triggers)
Trigger je podmínka spouštějící alarm – například: avg(/hostA/system.cpu.load,5m)>3 (průměrné zatížení CPU za 5 min > 3). Triggery mají severity (Information, Warning, Average, High, Disaster) a mohou obsahovat hysterezi.
Alerting a notifikace
Při spuštění triggeru Zabbix odešle notifikaci přes e-mail, SMS, Telegram, Slack, PagerDuty nebo vlastní skript. Eskalační pravidla určují, kdo dostane zprávu a v jaký čas.
Autodiscovery a Low-Level Discovery (LLD)
Zabbix umí automaticky objevovat nové hoste v síti (ping sweep, SNMP sweep) a přiřadit jim šablony. LLD dynamicky vytváří Items a Triggery pro proměnné počty entit – porty switche, disky serveru, NVR kamery – bez ruční konfigurace každé instance.
Grafana
Grafana je open source platforma pro vizualizaci metrik a logů. Sama data nesebírá – čte je z datových zdrojů (Zabbix, Prometheus, InfluxDB, Elasticsearch, MySQL a desítky dalších) a zobrazuje v customizovatelných dashboardech.
Datasources
Grafana se připojí k Zabbix přes plugin (alexanderzobnin/grafana-zabbix) nebo přes Zabbix API. Každý panel v dashboardu definuje query na datasource – například: „Zobraz průměrný příchozí provoz na portu Gi1/0/1 switche za posledních 24 hodin."
Panely a vizualizace
Grafana nabízí:
- Time series – časový průběh metrik (zatížení, teplota, provoz)
- Stat / Gauge – aktuální hodnota s prahovými barvami
- Table – tabulkový přehled
- Geomap – geografická mapa s overlay bodů
- Bar chart, Heatmap, Histogram – statistické přehledy
- Alertlist – přehled aktivních alarmů z Zabbixu nebo jiného zdroje
Alerting v Grafaně
Grafana má vlastní alertovací engine – definuje se podmínka na grafu, při splnění odešle notifikaci. Integruje se s PagerDuty, OpsGenie, Slack, e-mail, webhook. Grafana Unified Alerting (od v8) umožňuje centrální správu alertů z více datasource.
Dashboardy
Dashboardy se sdílí v organizaci nebo veřejně na grafana.com/dashboards. Existují stovky hotových dashboardů pro MikroTik, Cisco, Linux, Windows, Docker, Kubernetes, Zabbix – stažení a import za minuty.
The Dude (MikroTik)
The Dude je bezplatný nástroj pro monitoring sítě od MikroTiku. Oproti Zabbixu je výrazně jednodušší – ideální pro menší instalace, firmy s MikroTik zařízeními nebo jako doplněk k Zabbixu.
Funkce
Autodiscovery – The Dude automaticky prohledá zadanou IP síť, objeví všechna zařízení a zakreslí je na mapu s fyzickými vazbami.
Mapa sítě – přehledný topologický diagram. Zařízení mění barvu dle dostupnosti (zelená/červená). Kliknutím na zařízení se otevře detail – porty, provoz, uptime.
Monitoring dostupnosti – ICMP ping, TCP port check, SNMP. Při nedostupnosti pošle notifikaci (e-mail, zvuk).
MikroTik integrace – přes RouterOS API čte detailní informace o MikroTik zařízeních – stav portů, přiřazení VLAN, wireless klienti, CPU, RAM.
Grafy provozu – jednoduché grafy provozů na rozhraních.
The Dude běží jako aplikace na Windows nebo přímo na MikroTik RouterOS (v7) jako balíček.
Jak na praktické nasazení
Pro střední instalaci (50–200 zařízení) doporučuji:
- Zabbix na dedikovaném Linux serveru nebo VM (4 vCPU, 8 GB RAM, SSD) pro sběr metrik a alerting
- Grafana jako vizualizační vrstva nad Zabbixem – pěkné dashboardy pro prezentaci zákazníkovi
- The Dude pro rychlý přehled topologie a MikroTik specifické metriky
Klíčové kroky:
- Importovat SNMP šablony pro všechny typy zařízení
- Nastavit community string (SNMPv2c) nebo SNMPv3 credentials na zařízeních
- Definovat triggery pro: nedostupnost hostu, vysoké vytížení CPU/RAM, přeplněný disk, výpadek portu, vysoká teplota
- Nastavit notifikace na e-mail nebo Telegram
- Vytvořit dashboard pro zákazníka (Grafana) s přehledem SLA a dostupnosti