Procesor ProCurve na poziomie 100% przez kilka minut po ponownym uruchomieniu

9

Robiłem aktualizacje oprogramowania układowego przełączników HP. Ulepszono dwa różne modele:

  • Przełącznik ProCurve 5406zl Intelligent Edge (J8697A): zaktualizowano z K.15.06.0008 do K.15.12.0012
  • Przełącznik HP 2520-24G-PoE (J9299A): zaktualizowano z wersji J.14.54 do wersji J.15.09.0021

Sprawdzając każdy przełącznik zaraz po uruchomieniu nowego obrazu, zauważyłem coś:

  1. Przełączniki załadowały nowy obraz oprogramowania układowego bez błędów, a łączność została odzyskana, gdy tylko przełącznik się uruchomił. W tym momencie zużycie procesora było niskie (poniżej 10%)
  2. Kilka sekund później zużycie procesora wzrosło do 100% i utrzymywało się przez kilka minut. Nie mogłem wykryć w tym momencie żadnego problemu poza CLI poprzez SSH, który jest trochę powolny: normalna łączność, brak komunikatów w dzienniku ...
  3. Po pięciu do dziesięciu minutach na 100% procesor wrócił do normy bez żadnych zmian z mojej strony.

Oba modele miały takie zachowanie. Wycofałem jedną jednostkę każdego modelu do poprzedniego obrazu oprogramowania układowego i działały one w ten sam sposób.

Mimo tego gwałtownego wzrostu CPU zaraz po starcie nie spowodowałem żadnego problemu, zastanawiam się czy normalne zachowanie sieci może być przyczyną tego gwałtownego wzrostu, ale nie sądzę. Rozważyłem następujące aspekty:

  1. Zaraz po uruchomieniu STP uruchamia się, generując jednostki BPDU i cyklicznie wszystkie porty w przełączniku przez stany blokowania, słuchania, uczenia się i przekazywania. Jednak nawet w przypadku 802.1D proces ten nie trwa dłużej niż 1 minutę przy domyślnych licznikach czasu. Ponadto sprawdzałem przełączniki przez SSH, więc wszystkie obliczenia STP były już wykonane, zanim mogłem połączyć się z przełącznikiem.

  2. Tuż po uruchomieniu tablica adresów MAC jest pusta i do przesłania pierwszych ramek potrzebna jest rozgłoszenie. Ale wątpię, aby ta transmisja zajęła 100% procesora, a tym bardziej mniej przez 5 minut, w przełączniku 24-portowym.

  3. Wszystkie przełączniki działające jako urządzenia L2, brak funkcji L3, więc odrzucam routing i inne procesy L3.

Czy brakuje mi czegoś „normalnego” w operacjach sieciowych, które mogą wyjaśnić to użycie procesora przez 5 minut po ponownym uruchomieniu, zachowując łączność? Może jest to jakiś proces w tle, który przełącza się zaraz po restarcie?

Daniel Yuste Aroca
źródło

Odpowiedzi:

8

Zajęło to mniej niż 2 sekundy w portalu sieciowym Google: HP

Seria przełączników HP ProCurve 5400zl - wysokie wykorzystanie procesora (99–100%) po problemie z uruchomieniem

Zaraz po uruchomieniu przełącznika obserwuje się wysokie (99–100%) wykorzystanie procesora. Rozwiązanie

Podczas uruchamiania przełącznika jednym z zadań inicjujących jest tworzenie kluczy szyfrowania. Utworzenie kluczy z wyprzedzeniem oznacza, że ​​później, gdy funkcja taka jak SSL lub SSH, która korzysta z kluczy, jest skonfigurowana lub używana, dostępność jest minimalna. To zadanie trwa kilka sekund, zanim się zwiększy, w zależności od modelu przełącznika, ładowanej konfiguracji i wersji oprogramowania. Mimo że zadanie zużywa do 100% procesora, ma bardzo niski priorytet. Dlatego jeśli uruchomione zostanie kolejne zadanie wymagające cykli procesora, to zadanie o niskim priorytecie zostanie wycofane. Jeśli to zadanie inicjowania / generowania klucza działa nieprzerwanie przez zadania o wyższym priorytecie, jego ukończenie zajmuje około 10 minut. Jeśli procesor jest zajęty innymi zadaniami, czas realizacji zostanie wydłużony.

Aby sprawdzić, czy widoczny jest podniesiony procesor, jest opisanym tutaj, a nie czymś innym, co wymaga rozwiązywania problemów, użyj poleceń opisanych poniżej.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

Dane wyjściowe będą wyglądać następująco.

Przełącznik # zadanie-monitor procesor Przełącznik # pokaż czas pracy 0000: 00: 01: 42.36 Przełącznik # pokaż procesor

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services
Ron Trunk
źródło
Zgadzam się, że to wydaje się opisywać problem, którego doświadczyłem. Ale potem przychodzi mi do głowy nowe pytanie. Jak powiedziałem, sprawdzałem przełączniki przez połączenie SSH. Jeśli klucze SSH są generowane kilka sekund po zalogowaniu: jak mogę rozpocząć sesję SSH, zanim klucze będą gotowe?
Daniel Yuste Aroca
2
Z podręcznika Procurve Access Security Guide: Po wygenerowaniu pary kluczy hosta na przełączniku przełącznik umieszcza parę kluczy w pamięci flash (a nie w uruchomionym pliku konfiguracyjnym). Ponadto przełącznik utrzymuje parę kluczy podczas restartów, w tym cykli zasilania. Usunięcie (zerowanie) pary kluczy publiczny / prywatny przełącznika powoduje, że przełącznik nie może włączyć się w działanie SSH i automatycznie wyłącza SSH IP na przełączniku.
Daniel Yuste Aroca