Idealnie, przy możliwie jak najprostszej instalacji i bez konieczności ponownego uruchamiania serwerów. Głównie DL380 G5's
jeśli, jeśli to pomaga.
hardware
storage
hp-proliant
hp-smart-array
alerts
DrZaiusApeLord
źródło
źródło
Odpowiedzi:
Zależy to nieco od systemów operacyjnych uruchomionych na serwerach, ale ogólnie możliwe jest uzyskiwanie alertów z serwerów HP ProLiant i kontrolerów RAID Smart Array.
Pełna lista sterowników i wsparcia dla oprogramowania dla systemów DL380 G5 znajduje się tutaj .
SNMP i rozwiązanie do monitorowania to najlepsze podejście ... Ale możesz to zwiększyć za pomocą niektórych narzędzi HP. HP oferuje HP Systems Insight Manager , który jest dostępny do pobrania, a także jest dostarczany z serwerami. Jest to idealne rozwiązanie do kolekcji serwerów. Jeśli szukasz jednorazowych alertów bez budowania infrastruktury zarządzania lub monitorowania, możesz po prostu zainstalować HP Management Agent (aka ProLiant Support Pack ).
W przypadku samodzielnych systemów Linux agenci będą wysyłać pułapki pocztą e-mail. Zazwyczaj konfiguruję pakiet wsparcia z ustawieniami domyślnymi lub niestandardowym pakietem , a następnie edytuję
/opt/hp/hp-snmp-agents/cma.conf
i zmieniamtrapemail
wiersz, aby wskazywał adres odbiorcy:Jeśli korzystasz z systemu Linux i nie chcesz instalować pełnego pakietu zarządzania HP, możesz opracować skrypt wokół narzędzia cciss_vol_status w celu zapytania o status kontrolera / dysku. Zobacz także: Instalowanie agentów HP w OpenFiler
źródło
ProLiant DL360 G7
serwerów i zestaw HP SIM do monitorowania.Sprawdź HP Insight Manager
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
Wierzę, że powinno działać z twoimi serwerami.
źródło
Użyłem lekkiego programu, o którym @ewwite wspomniał w swojej odpowiedzi: cciss_vol_status
Jeśli zastosujesz się do instrukcji INSTALL, skrypt zostanie umieszczony w
/usr/local/bin/cciss_vol_status
.Oto skrypt opakowania, którego używam do grepowania danych wyjściowych cciss_vol_status i wysyłania wiadomości e-mail, jeśli jakakolwiek tablica ma status FAILED.
Wywołaj powyższy skrypt w cron. Sprawdzam co dwie minuty:
Używamy HP System Insight Manager, aby sprawdzić, czy nasze HP są uruchomione, ale nic poza tym. Stwierdziłem, że agent Linuksa jest dla nas przesadny, ponieważ mamy inne rozwiązania monitorujące, więc powyższy skrypt dobrze służy swojemu konkretnemu celowi.
AKTUALIZACJA
Tylko wskazówka dotycząca rozwiązywania problemów na wypadek, gdybyś na to wpadł. Ten skrypt okazał się pomocny dziś rano, gdy otrzymałem wiadomość e-mail o uszkodzonej tablicy z:
Urządzenie przeszło tylko do odczytu i nie było widoczne w
/proc/partitions
. Uruchomiłem ponownie serwer i zobaczyłem te komunikaty przy starcie:Wybrałem F2, a RAID był w porządku i zamontowany przy rozruchu.
źródło
zainstaluj smartmontools. E-maile PRZED awarią dysku.
źródło