Serwer Zabbix wysyła zbyt wiele powiadomień

9

Niedawno zainstalowałem serwer Zabbix na VPS i jestem z niego bardzo zadowolony. Zainstalowałem klienta na appr. 6-7 innych VPS i wszystko działa dobrze. Interfejs jest płynny i generuje bardzo ładne wykresy.
Moim jedynym problemem związanym z oprogramowaniem jest to, że skonfigurowałem go do wysyłania powiadomień o problemach, ale codziennie otrzymuję od 30 do 60 wiadomości e-mail. Zawsze coś wzdłuż „Serwer XXX jest nieosiągalny: PROBLEM”, a minutę później: „Serwer XXX jest nieosiągalny: OK”. Oczywiście, Zabbix rozpoznaje również, kiedy występują prawdziwe problemy, i np. Kiedy serwer został zrestartowany. Po prostu wydaje mi się, że Zabbix bardzo szybko „poddaje się”, a może upływa czas szybciej niż to, co odpowiada moim potrzebom. Próbowałem google kilka razy, ale zrezygnowałem, więc teraz próbuję tego podejścia.

Czy ktoś wie, jak dostosować wierność tych powiadomień / wyzwalaczy?

anselmdk
źródło
czy używasz domyślnych przykładowych szablonów? jeśli tak, najprawdopodobniej jest to pozycja „status”, która tak naprawdę nie jest sugerowana :) - zamiast tego należy zmienić na agent.ping, aby sprawdzić dostępność hosta
Richlv,

Odpowiedzi:

9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications Korzystam z funkcji eskalacji Zabbix do tłumienia częstych komunikatów On / Off. Ogólnie:

  • pierwsze wiadomości uruchamiają łańcuch eskalacji, bez wysyłania wiadomości e-mail
  • następnie Zabbix czeka 5 minut (lub cokolwiek skonfigurujesz) przed wysłaniem powiadomienia.
  • jeśli w ciągu tych 5 minut wyzwolą się zmiany stanu wyzwolenia, nie otrzymasz powiadomienia i wszystko wróci do normy.
  • Fajne jest to, że deshboard wciąż pokazuje

Oleg

OlegBrrr
źródło
Dzięki! Wygląda na to, czego szukałem. Zmieniłem ustawienia i daję teraz systemowi trochę czasu na sprawdzenie wpływu wysyłania powiadomień.
anselmdk
Po cierpliwym oczekiwaniu (i rozluźnieniu niektórych wyzwalaczy internetowych), e-maile Zabbix wreszcie działają poprawnie. Dzięki za wskazówkę!
anselmdk
5

Możesz także dostosować wyzwalacze. Przydała mi się metoda count ().
Zamiast wyzwalania ostatniego (0) spróbuj policzyć (300,0, „eq”)}> 5 zamiast tego. Powoduje to wyjątek, jeśli 5 ostatnich testów (zakładając 60 sekund między kontrolami) nie powiodło się.

http://www.zabbix.com/documentation/1.8/manual/config/triggers

Możesz także wyłączyć komunikaty OK, dodając warunek „Wartość wyzwalacza =„ PROBLEM ”. Tej zmiany należy dokonać w konfiguracji działań.

http://www.zabbix.com/documentation/1.8/manual/config/actions

serverSentinel
źródło
2
W rzeczywistości twój przykład zliczania zwróci liczbę wartości w ciągu ostatnich 300 sekund równą 0. Następnie porównujesz ją z 5. Ogólnym efektem jest wywołanie zdarzenia, jeśli 5 lub więcej wartości „0” wystąpiło w ciągu ostatnich 300 sekund.
G-Wiz