Jak mogę anulować zaplanowane przestoje w Nagios?

12

Mam monitor Nagios 3.5.1 dla wielu serwerów. Wykonując czynności takie jak uaktualnienie rdzenia Drupal lub Wordpress, zrzuciłem strony i ustawiłem Nagios na zaplanowane wyłączenie.

Czasami kończę poniżej 2 godzin domyślnych i nie chcę ignorować awarii. Jak mam powiedzieć Nagiosowi, że skończyłem, i anulować zaplanowane przestoje?

wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj

Stóg
źródło

Odpowiedzi:

19

W lewej kolumnie interfejsu Nagios (pod „Systemem”) wybierz „Przestój”. To prowadzi do strony z listą wszystkich zaplanowanych przestojów i pozwala je usuwać indywidualnie.

Paul Haldane
źródło
2

Po lewej stronie, pod „Systemem”, znajduje się link „Przestój”; idzie do /cgi-bin/extinfo.cgi?type=6. Tam kliknij ikonę kosza na śmieci, o której mowa.

Nawiasem mówiąc, możesz chcieć zbadać różnicę między „zaplanowanym” a „elastycznym” przestojem, lub jeszcze lepiej, biorąc pod uwagę twoją przypadek użycia, „potwierdzenie” brzmi jak to, czego naprawdę chciałeś.

BMDan
źródło
Jeśli śledzisz przestoje, potwierdzenie wpłynie na raporty inaczej niż zaplanowane przestoje, więc ponieważ jest to naprawdę zaplanowane przestoje, jest to bardziej odpowiednie działanie.
lsd
Uczciwy punkt. Usunięcie przestoju ma jednak znacznie większy wpływ na raporty, prawda?
BMDan
Dokumentacja sugeruje, że przestaje kończyć przestoje tylko wcześniej niż pierwotnie zaplanowane zakończenie, ale przestoje są nadal zgłaszane. „Jeśli przestój obowiązuje, usługa wyjdzie z zaplanowanego przestoju”.
lsd
Patrząc dalej, więcej dokumentacji mówi, że raportowanie nie liczy planowanych przestojów, chyba że wyłączysz również kontrole. Dobrze.
lsd
1

Pomyślnie usunąłem / anulowałem „identyfikator przestoju” z 251 do 348 na moim serwerze Centos za pomocą tego polecenia:

for i in `seq 251 348`; do 
  /bin/printf "[%lu] DEL_SVC_DOWNTIME;$i\n" `date +%s` > /var/spool/nagios/cmd/nagios.cmd; 
done
Samuel Recebov
źródło
Ścieżka do printF i nagios.cmd różni się w zależności od systemu, ta odpowiedź pokazuje, jak anulować WIELU przestojów w sposób masowy, którego nie widać w interfejsie internetowym. +1
cde