Monitorowanie serwera produkcyjnego [zamknięte]

18

Mamy 3 dedykowany serwer, podzielony na kilka VPS przy użyciu openVZ. Używamy munina do monitorowania VPS w zakładach produkcyjnych i monitorujemy na jednym z VPS, aby upewnić się, że restartuje usługę w przypadku awarii.

Chodzi o to, że potrzebujemy znacznie lepszego sposobu monitorowania wszystkich naszych serwerów, ponieważ mamy do 14 VPS, chcielibyśmy mieć centrum, w którym moglibyśmy zobaczyć nie tylko dane zebrane przez Munina, ale także dodatkowe statystyki w sieciach i wydajności naszych usług.

Niektóre z naszych wymagań:
- Powiadomienie SMS o niepowodzeniu (możliwość skonfigurowania określonej weryfikacji niestandardowej)
- Analizator dzienników dla dziennika błędów Apache_log i niektórych innych.
- Musi być centralny (tzn. Jeden serwer i kilka węzłów gromadzących dane).
- Nie musi być łatwy w instalacji, ale łatwy w utrzymaniu.
- Musisz być wolny

Zostałem wskazany na nagi i splunk, co myślisz? Dzięki,

Adam Benayoun
źródło

Odpowiedzi:

17

Mam podobną konfigurację, z wyjątkiem Xen na miejscu. Byłem bardzo zadowolony z połączenia:

  • Nagios do powiadamiania (użycie PNP do niektórych grafik Lite i Nagviz do pulpitu stanu usługi)
  • Ganglia do historycznego grafowania systemów
  • OSSEC jako HIDS i równie ważny jak kolektor do scentralizowanego logowania
    • sidenote: Istnieje wtyczka Splunk dla OSSEC, która bardzo dobrze integruje te dwa narzędzia , czekam jednak na przeniesienie ich do Splunk v4.
  • Splunk Na koniec, po migracji niektórych wtyczek Splunk, planujemy używać Splunk z pewnym wstępnym filtrowaniem dzienników (aby uniknąć przekroczenia limitu bezpłatnych edycji)

Mam nadzieję, że udostępnienie naszej konfiguracji monitorowania pomoże ci :-)

Oto kilka przydatnych linków:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

aktualizacja:

Zapomniałem wspomnieć, że korzystamy również z układu konfiguracji Matt Simmons Nagios, który można znaleźć tutaj http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Ten układ sprawił, że nasza konfiguracja Nagios była rozsądna i znacznie łatwiejsza w utrzymaniu (Dzięki Matt!)

wadliwy serwer
źródło
2
+1 dla OSSEC + splunk. działają bardzo dobrze razem.
sucuri
5

Odniosłem wielki sukces z Zabbix , który spełnia wszystkie twoje punkty w jednym pakiecie.

alternatywny tekst
(źródło: zabbix.com )

Najtrudniejsze będzie monitorowanie dzienników apache, ale Zabbix jest rozszerzalny, więc możesz użyć LogWatch lub innego skryptu perla, aby pobrać dane dla ciebie.

Dave Drager
źródło
2

Podoba mi się OpManager i jest darmowy do pewnej liczby węzłów. Wykonuje wszystkie powyższe czynności i jest dość łatwy w instalacji i utrzymaniu.

ChickenMilkBomb
źródło
1

Nagios powinien być dobrym wyborem. Przede wszystkim - jest modułowy i spełnia prawie wszystkie Twoje oczekiwania. Poza tym otrzymał kilka fajnych nagród .

EDYCJA: Nie zapomnij sprawdzić tej odpowiedzi .

opiekun
źródło