Rozwiązania graficzne Nagios vs Munin / Cacti / Ganglia

9

Mam konfigurację serwera nagios do monitorowania ~ 30 serwerów Windows. Chcę dodać kilka popularnych trendów. Czytałem, że wtyczki graficzne nagios są proste i wiele osób korzysta z oddzielnych, niezależnych narzędzi do tworzenia wykresów / trendów.

Jakie są ograniczenia wtyczek graficznych nagios w porównaniu do samodzielnych produktów, takich jak ganglia / munin / kaktusy?

Interesują mnie określone funkcje i zalety, które oferują samodzielne pakiety i wtyczki do grafik nagios.

sumek
źródło
Powinieneś także rozważyć Zabbix ... serverfault.com/q/109595/2039
wrzesień
Wypróbuj wersję społecznościową opsview opartą na nagios. Możesz zainstalować w różnych wersjach linuksowych lub pobrać VM. opsview.com/downloads/download-opsview-community
Matias Dominoni
Dla przypomnienia: wypróbowałem nagiosgraph, a potem się go trzymałem. Jestem całkiem zadowolony z tego, co oferuje
sumek

Odpowiedzi:

7

biorąc pod uwagę, że masz już instalację nagios, rozważ nagiosgraph lub pnp4nagios.

nagiosgraph i pnp4nagios wykonują całkiem niezłą robotę, wykreślając dane dotyczące wydajności nagios. nagiosgraph ma podejście oparte na parametrach do konfiguracji, pnp4nagios ma podejście oparte na szablonie.

  • oba automatycznie wykrywają nowe hosty / usługi przy każdej zmianie konfiguracji nagios
  • oba wykonują powiększanie wykresu
  • oba zapewniają wykresy po najechaniu myszką na określone hosty / usługi
  • oba zapewniają wiele sposobów dzielenia i krojenia danych
  • wykrywają i wykreślają poziomy krytyczne i ostrzegawcze, które już zdefiniowałeś w nagios
  • oba mogą być osadzone bezpośrednio w ramce nagios, zapewniając płynną i uporządkowaną nawigację od aktualnego stanu do historii i wstecz

krojenie i krojenie danych są dość ważne, imho. na przykład możesz przeglądać wszystkie usługi na jednym hoście lub przeglądać wszystkie hosty z określoną usługą lub przeglądać dowolne zbiory wykresów dla dowolnych hostów i usług.

instalacja nie jest łatwa, ale nie trudna. wiele zależy od tego, ile chcesz dostosować. na przykład nagiosgraph to „install.pl” lub „rpm -i nagiosgraph.rpm” lub „dpkg -i nagiosgraph.deb”. pnp4nagios to './configure; robić; dokonaj instalacji ”.

n2rrd potrafi również niektóre z tych rzeczy, ale nie jest tak dopracowany i wymaga więcej pracy, aby go skonfigurować.

rrdtool ma dziwne zapisy danych, a każdy system będzie miał problemy z próbkowaniem. rrdtool domyślnie wygładza niektóre dane, ale w razie potrzeby można uchwycić (i wykreślić) maksima i / lub minimum.

każde podejście oparte na rrdtool cierpi z powodu stagnacji danych / wykresów, ponieważ schemat w każdym pliku rrd jest statyczny, a większość systemów używa nazwy pliku rrd do identyfikacji danych. dane zazwyczaj nigdy nie są tracone, gdy zmienia się nazwa hosta lub nazwa usługi; pliki rrd nadal istnieją na dysku. ale niektóre interfejsy użytkownika zapewniają sposoby wyświetlania „starych” plików rrd, inne wymagają ręcznego sprzątania za pomocą wiersza polecenia. w wielu instalacjach jest to problem tylko przy początkowej konfiguracji systemu, ale w środowiskach dynamicznych (np. monitorowanie maszyn wirtualnych, których żywotność wynosi tylko kilka miesięcy) może być nudny.

ostatnia uwaga. trendy składają się z dwóch części: gromadzenie danych i wyświetlanie danych. jeśli korzystasz z autonomicznego systemu graficznego zamiast rozszerzać istniejącą instalację nagios, być może będziesz musiał zainstalować dodatkowe komponenty na komputerach z systemem Windows w celu zebrania danych.

Matthew Wall
źródło
13

Zgadzam się z Lynxmanem. NAGIOS służy do natychmiastowych danych jakościowych (czy X jest w porządku czy nie?); Munin jest dla historycznych danych ilościowych (jak pełny jest teraz X i jak pełny był w tym roku?). Wszystkie moje instalacje NAGIOS, z których niektóre monitorują kilkaset usług, są połączone z systemami Munin w celu monitorowania ilościowego.

Zauważ też, że munin ma specjalne haki do podawania danych do NAGIOS. Rozumie koncepcję progów OSTRZEŻENIE i KRYTYCZNE, a tam gdzie wymagane jest powiadomienie (i widok na „dużą tablicę” NAGIOS), bardzo łatwo jest mieć jedną zmienną Munin informującą o stanie pojedynczej usługi NAGIOS.

Zwykle przepływ pracy polega na tym, że nikt nie patrzy na wykresy Munina, dopóki NAGIOS nie powiadomi o przekroczeniu progu, ale wtedy wykresy Munina stają się nieocenione, aby dowiedzieć się, czy coś powoli rośnie z czasem, czy jest to nie na miejscu -niebieski wzrost, albo mamy cotygodniowy cykl w górę i w dół, który powoli zwiększa amplitudę, czy co.

Jak mówi Lynxman, UNIX to „jedno zadanie, jedno narzędzie”. Tworzenie zestawu narzędzi Munina i NAGIOS działa bardzo dobrze, zapewniając monitorowanie ilościowe i jakościowe oraz powiadomienia. Ma także wyraźną zaletę polegającą na utrzymaniu czystości interfejsów: gdy spojrzysz na NAGIOS, zobaczysz prosty widok tego, jak dobrze działa teraz , bez żadnych danych historycznych zaśmiecających widok; kiedy patrzysz na Munina, widzisz informacje historyczne związane z problemem gotowe do analizy, bez błędów „host nie działa” lub „sshd nie chce ze mną rozmawiać” zaśmiecających widok.

Szalony Kapelusznik
źródło
3

Wtyczki graficzne Nagios, jak mówisz, są bardzo ograniczone, oferują bardzo prosty interfejs rrdtool, a interfejs użytkownika jest nieco sprzeczny z intuicją, jest to w zasadzie hack ponad nagios, próbował użyć tego tylko dla zabawy, ale zepsuł się kilka razy bez ostrzeżenia.

Wybór samodzielnego produktu (zwłaszcza Munina lub zwojów) oferuje szeroką gamę usług, których nagios nie są w stanie zrealizować, ponieważ mantra unixowa lepiej być dobra tylko w jednej rzeczy niż starać się być dobra w wielu, nagios jest niesamowita dla monitorowanie i munin / zwoje / kaktusy są niesamowite w grafice.

Lynxman
źródło
Więc co kryje się w tym szerokim zakresie usług, których nagios nie są w stanie zrealizować ? To mnie interesuje.
sumek
W nagios bardzo łatwo jest stracić dane wykresu, wtyczka może też zatrzymać dane wykresu w dowolnym momencie, nie daje żadnej możliwości powiększenia określonego czasu (co robią wszyscy inni), to nie daje możliwości robienia skomplikowanych wykresów agregacyjnych, a to tylko na początek :)
lynxman 21.01.11
Co masz na myśli mówiąc, że łatwo stracisz dane wykresu ? Szybkie google pokazuje, że wszystkie 5 wymienionych rozwiązań (zwoje, Munin, kaktusy, pnpgraph, nagiosgraph) używają rrdtool do przechowywania danych graficznych.
sumek
Tak, sumek, mam na myśli to, że ponownie narzędzie do tworzenia wykresów w nagios to hack, a gdy pojawia się rozbieżność między nazwą pliku rrd a informacją na wykresie, łamie się, jeśli chcesz spróbować, cierpię z powodu bólu zrobił, a następnie przeniósł się do prawdziwego rozwiązania, takiego jak munin :)
lynxman,
2

W Stack Overflow używamy n2rrd, który jest wtyczką Nagios do tworzenia wykresów danych dotyczących wydajności. W pewnym stopniu zgodziłbym się z lynxmanem, że ma on charakter hackish.

Jednak:

  • Za pomocą n2rrd możesz zlecić kaktusom tworzenie wykresów na podstawie danych zamiast rrd2graph.cgi, który jest dostarczany z n2rrd
  • n2rrd z plikiem rrd2graph.cgi obsługuje powiększanie
  • Jeśli chodzi o skomplikowane wykresy zbiorcze - zasadniczo manipulujesz wykresami rrd ręcznie i możesz z nimi robić, co chcesz.

Wykresy rrd są przechowywane zgodnie z nazwami serwerów, więc jeśli zmienisz nazwę czegoś, stracisz trochę dane ... Zawsze możesz po prostu zmienić nazwę plików, ale łącz je symbolicznie i nie stracisz danych.

Mam kilka przykładów tych wykresów w moim niedawnym wpisie na blogu dotyczącym porad na temat lepszych wykresów RRD . Ponadto strona n2rrd zawiera zarówno demo kaktusów, jak i rrd2graph.

Myślę, że sedno jest takie, że na trasie Nagios może brakować jednej lub dwóch funkcji, ale jest całkiem ukończona, jeśli nie masz nic przeciwko brudzeniu sobie rąk szczegółami pisania szablonów rrd *. Prawdopodobnie zajmie to więcej czasu, ale zachęci do rozwijania większej wiedzy specjalistycznej w rrd.

Kyle Brandt
źródło
1
* [nieprzypisany błąd przypisu]: co zamierzasz tam dodać, Kyle; pytające umysły muszą wiedzieć!
MadHatter
0

Żądam dokładnych danych, a wyświetlanie danych rrd nie jest dokładne - jest znormalizowane! Dla większości użytkowników jest to w porządku, ponieważ na początku nie używają bardzo dokładnych danych. Korzystają z danych, których częstotliwość próbkowania często wynosi minutę lub dłużej, co nie da ci dokładnego opisu tego, co się dzieje. Oznacza to również, że jeśli masz gdzieś skok danych, możesz go nigdy nie zobaczyć.

Zastanów się nad tym - powiedz, że Twoja sieć Gb brzęczy z prędkością około 10 MB / s, a przez kilka minut nagle następuje wzrost o 100 MB / s. Zauważ też, że jeśli był to tylko 30-sekundowy skok, możesz go nawet nie zobaczyć przy częstotliwości próbkowania wynoszącej kilka minut. Jeśli spojrzysz na dane z dnia, ten „skok” może pojawić się tylko jako 15 MB / s, chociaż rzeczywista wartość zależy również od wielu innych czynników. Istnieje również bardzo duże prawdopodobieństwo, że założysz, że Twoja sieć jest szczęśliwa, gdy nie jest!

Jeszcze bardziej frustrujące są dla mnie dane znormalizowane do fizycznej szerokości wykresu i zakresu osi X. Co to oznacza, że ​​kolec, o którym wspomniałem, że nie widziałeś? Jeśli powiększysz, pojawi się magicznie! Będę trzymać się gnuplot - wykresy mogą nie być tak ładne, ale są solidne i gnuplot nigdy nie modyfikuje danych przed ich wyświetleniem.

-znak

mark seger
źródło
0

Uważam, że używanie pnp4nagios działa całkiem dobrze do tworzenia wykresów. Obsługuje również zoom. Nie jest to najłatwiejsze do wdrożenia, ale nic z nagios nigdy nie jest.

Matthew Thode
źródło