Mam konfigurację monitorowania na kilku urządzeniach w naszym biurze. Czas odpowiedzi ping na małe przełączniki dostępu wynosi zwykle 1-4 ms ... Od 3 rano dziś rano gwałtownie wzrosło do 300 ms.
Gdzie zaczyna się szukać w takiej sytuacji? Jakie rzeczy mogę zaobserwować w przełączniku, aby znaleźć źródło opóźnienia?
UWAGA: Nie ma to związku z obciążeniem. Wykorzystanie przepustowości łączy jest normalne i nie ma na nie wpływu, większość łączy jest bardzo słabo wykorzystywana. Ponadto - monitorowanie jest lokalne dla urządzeń zgłaszających opóźnienie, więc nie ma tutaj współczynnika WAN.
show proc cpu history
przełącznika z wysokim czasem pingowania. Jeśli ten procesor jest stale na wysokim poziomie lub regularnie osiąga wysoki poziom, uruchomshow proc cpu sort
Odpowiedzi:
Po pierwsze, opóźnienie nie jest bezpośrednio związane z przepustowością. Istnieje wiele powodów, dla których urządzenie opóźnia pakiet inny niż przeciążone łącze.
Czy próbowałeś traceroute? To pokaże ci opóźnienie między przeskokami, jeśli szukasz granicy L3 jako podejrzanego.
Możesz także sprawdzić, czy którekolwiek z urządzeń na ścieżce mają znaczne wykorzystanie procesora / pamięci RAM.
źródło
jeśli jest to oparte tylko na sieci LAN, możesz zrobić kilka rzeczy, aby spróbować dowiedzieć się, co to powoduje:
Pokaż polecenie procesora historii procesora : jeśli użycie procesora jest bardzo wysokie, musisz zobaczyć, który proces to powoduje, i być może trafiłeś w Google z procesem obrażającym.
polecenie debugowania : częstą przyczyną jest to, że ludzie pozostawiają polecenia debugowania uruchomione na przełączniku. Powszechnym faworytem było rozliczanie adresów IP na urządzeniach, które były już nadmiernie wykorzystywane. Użyj „cofnij debugowanie wszystkich”, aby pozbyć się debugowania.
Uruchom ponownie : prawdopodobnie nie w ciągu dnia, ale użyj polecenia „przeładuj”, aby ustawić czas w nocy lub w weekend. Byłbyś zaskoczony, jak wiele problemów można rozwiązać przy pomocy szybkiego restartu.
zamknij porty trunk - jeśli jest to przełącznik L3, innym częstym problemem, jaki widziałem, jest zbyt duży ruch przy użyciu tego urządzenia do routingu między sieciami VLAN. Jeśli to możliwe, tymczasowo zamknij niektóre porty magistrali, aby sprawdzić, czy to zmniejszy opóźnienie.
Warto pamiętać, że pingi mają niski priorytet, zarówno pod względem opóźnień, jak i przetwarzania przez procesor. Dobrym pomysłem może być również dwukrotne sprawdzenie ustawień QoS i upewnienie się, że nie powodują tego żadne głupie błędy, o ile jest to mało prawdopodobne.
źródło
Używam kaktusów do monitorowania przepustowości, a openNMS do monitorowania opóźnień. Jeśli monitorujesz wszystkie urządzenia podłączone do tego przełącznika, możesz zobaczyć następstwo między użytkowaniem a opóźnieniem. (Wiem, że powiedziałeś, że to nie jest problem z przepustowością, ale nigdy nie teraz). Widziałem, jak dolne przełączniki zwisają przy dużym obciążeniu, co powoduje wiele opóźnień. Czy masz jakieś „głupie” urządzenia zasilające ten przełącznik, które mogą być źródłem zapadu, nawet jeśli ten przełącznik nie przepuszcza dużego ruchu. Również w przypadku kaktusów możesz sondować użycie procesora i możesz zobaczyć skok w czasie opóźnienia.
Jak wspomniano powyżej, MTR lub neotrace są również przydatne do monitorowania sytuacji i możesz zobaczyć, gdzie zaczyna się opóźnienie, co może nie być samym tym przełącznikiem.
źródło
Jeśli tak się nie dzieje w sieci LAN, możesz ograniczyć przepustowość „portu wan”, wymusi to lepszą TDM. Spróbuj czegoś około 80% maksymalnej wydajności i przekonaj się, czy to pomoże. Konieczne może być dostosowanie w zależności od liczby terminali.
źródło