Mamy niedawno miał mały problem z sieci, gdzie będzie wiele serwerów przerwami stracić łączność z siecią w dość bolesny do zdecydowania sposób (wymagany twardy restart). Trwało to około dwóch tygodni, na pozór losowych, na różnych serwerach. Żaden szczególny wzorzec, który moglibyśmy rozpoznać.
Po kilku zagłębieniach w nim zauważyliśmy, że przełącznik zgłasza 100 Mb / s dla problematycznego portu:
Brzmi to niezwykle podobnie do tego, co wydarzyło się w artykule Joela Spolsky'ego Five Whys
Michael poświęcił trochę czasu na sekcję zwłok i odkrył, że problemem był prosty problem z konfiguracją przełącznika. Istnieje kilka możliwych prędkości, za pomocą których przełącznik może się komunikować (10, 100 lub 1000 megabitów na sekundę). Możesz ustawić prędkość ręcznie lub pozwolić przełącznikowi automatycznie wynegocjować najwyższą prędkość, z którą mogą współpracować obie strony. Przełącznik, który zawiódł, został ustawiony na automatyczną negocjację. To zwykle działa, ale nie zawsze, a rano 10 stycznia tak się nie stało.
Wyłączyliśmy teraz automatyczne negocjacje na naszym sprzęcie sieciowym i ustawiliśmy stałą prędkość 1000 Mb / s (gigabit).
Moje pytania do osób posiadających większą wiedzę na temat sprzętu sieciowego do serwerów:
- Jak często występują problemy z automatycznymi negocjacjami z nowoczesnym sprzętem sieciowym?
- Czy uważa się za dobrą, standardową praktykę sieciową, aby wyłączyć automatyczne negocjowanie i ustawić stałe prędkości podczas konfigurowania sieci?
źródło
Odpowiedzi:
Nie widziałem jeszcze problemu z autonegocjacją prędkości sieci, który nie jest spowodowany ani (a) niedopasowaniem instrukcji na jednym końcu łącza i auto na drugim końcu, ani (b) wadliwym komponentem łącza ( kabel, port itp.).
Zależy to od administratora, ale moje doświadczenie pokazało mi, że jeśli ręcznie określisz prędkości łącza i ustawienia dupleksu, z pewnością spotkasz się z niedopasowaniem prędkości. Dlaczego? Ponieważ prawie niemożliwe jest udokumentowanie różnych połączeń między przełącznikami a serwerami, a następnie przestrzeganie tej dokumentacji podczas wprowadzania zmian. Większość niepowodzeń, które widziałem, są spowodowane przez 1 (a), a do tej sytuacji dochodzi tylko wtedy, gdy zaczniesz ręcznie ustawiać ustawienia prędkości / dupleksu.
Jak wspomniano w dokumentacji Cisco :
O ile nie jesteś przygotowany do skonfigurowania systemu zarządzania zmianami dla zmian w sieci, który wymaga weryfikacji prędkości / dupleksu (i nie zapomnij o kontroli przepływu) lub nie jesteś w stanie poradzić sobie z okazjonalnymi niezgodnościami wynikającymi z ręcznego określania tych ustawień na wszystkich urządzeniach sieciowych, następnie trzymaj się domyślnej konfiguracji auto / auto.
W przyszłości rozważ monitorowanie błędów portów przełączników za pomocą MRTG, aby móc wykryć te problemy, zanim wystąpią problemy.
Edycja: Widzę wiele osób odnoszących się do niepowodzenia negocjacji na starym sprzęcie. Tak, to był problem dawno temu, kiedy powstawały standardy i nie wszystkie urządzenia je przestrzegały. Czy twoje karty sieciowe i przełączniki mają mniej niż 10 lat? Jeśli tak, to nie będzie problem.
źródło
Bardzo często, przez lata miałem wiele problemów z różnego rodzaju sprzętem.
Moim zdaniem, jeśli konfiguracja jest statyczna (tj. Szafa na serwery) i nie sądzisz, że nastąpią zmiany, dobrym pomysłem jest ręczne ustawienie prędkości i dupleksów. Tak długo, jak jest dobrze udokumentowany, aby można było uniknąć problemów w przyszłości.
EDYTOWAĆ:
Dla wyjaśnienia, nie zalecam używania ręcznych prędkości w całej sieci, powiedziałbym, że 95% czasu to auto / auto. Mówię tylko, że miałem problemy z dupleksem / szybkością i że w mojej sieci jest niewielka część (tj. Jeden z naszych szaf serwerowych), które mają w większości ustawienia ręczne. Obsługujemy bardzo ściśle kontrolowaną sieć LAN z wyłączonymi nieużywanymi portami i filtrami MAC na większości portów, więc śledzenie prędkości nie jest bardzo trudne.
źródło
Uważam, że jeśli autonegocjacja działała przez godzinę dziennie lub miesiąc, a następnie z jakiegoś powodu „coś się dzieje”, że ustawienie linku na stałą prędkość „naprawia”, istnieje problem, który nie został rozwiązany, ale został obchodzony. Wydaje mi się, że widzę ustawienie linku na naprawione jako rozwiązanie tymczasowe, dopóki prawdziwy problem nie zostanie naprawiony.
źródło
Więc kroki rozwiązywania problemów (zakładamy, że zatrzymujesz się po każdym z nich i czekasz na ponowne pojawienie się problemu):
W tym momencie wyeliminowałeś konfigurację, fizyczne porty, do których jesteś podłączony, okablowanie między nimi. Jeśli nadal tak się dzieje, mogą być inne przyczyny:
Tło / dlaczego moja odpowiedź jest najbardziej niesamowita: pracuję jako inżynier sieci / systemów w branży finansowej, a oto moje doświadczenie z naszą małą globalną siecią (15 oddziałów, 8 centrów danych):
Wszystkie nasze porty LAN są autonegowane, ponieważ kontrolujemy sprzęt na obu końcach i mamy pewien dostęp do obu stron --- co może być tak proste, jak skontaktowanie się z kimś przez telefon i sprawdzenie ustawień. Przez trzy lata tylko jeden z naszych wewnętrznych portów uległ awarii z powodu awarii autoneg, a to z powodu złego kabla --- zniknął po wymianie kabla.
Mieliśmy o wiele więcej problemów, gdy poprzednicy zakodowali na stałe 100 / full na swoich kartach sieciowych i nie udokumentowali tego. Zresetuj wszystko do auto / auto w następnym oknie konserwacji i od tego czasu nie miałem z nimi żadnych problemów.
W kilku miejscach, w których mamy przekazanie miedzi od operatora dla naszej sieci WAN? Powinieneś raczej oczekiwać, że połączenie miedziane WAN / Internet będzie zassane przez cały czas --- częściowo, ponieważ nie masz pojęcia, co jest po drugiej stronie. Jakiś starożytny przełącznik Extreme, który akurat ma wadliwe oprogramowanie do autonegowania, ale czy tagowanie MPLS? Jakiś konwerter mediów za 5 USD, ponieważ urządzenie brzegowe Ciena twojego dostawcy usług internetowych o wartości 200 000 USD jest po prostu zbyt niesamowite, aby zapewnić Ethernet za pomocą skrętki? Zdecyduj z wyprzedzeniem, jak to będzie obsługiwane i trzymaj się tego, a następnie spodziewaj się, że jakiś twit wewnątrz przewoźnika zmieni go o 22:00 w sobotę, ponieważ uzgodniona konfiguracja nigdy nie została udokumentowana i mają pewne zasady, których należy przestrzegać.
Poważnie jednak uzyskaj przekazanie światłowodu od swojego usługodawcy internetowego.
źródło
Sieć, za którą jestem odpowiedzialny (wraz z kilkoma innymi facetami) składa się z ~ 40 serwerów, ponad 1000 stacji roboczych (rozproszonych na dość dużym kampusie) i ~ 1000 WAP również na dużym obszarze o różnym typie i wieku sprzętu sieciowego.
Jak powiedział dimitri.p, gdy coś nagle nie przestaje się negocjować automatycznie, zwykle wskazuje to na inny problem. Ręczne ustawienie portu jest podobne do nakładania bandaidy na kogoś, kto został dźgnięty w jelito - może zatrzymać krwawienie, ale na pewno są szkody pod spodem.
Moja zwykła lista kontrolna:
Z reguły nigdy nie wyłączamy autonegowania na serwerach (lub cokolwiek innego w centrum danych), chyba że jest to sytuacja, w której wszystkie inne możliwe przyczyny zostały wyeliminowane, przenieśliśmy porty przełączników, zmieniliśmy kable, przetestowaliśmy kartę sieciową itp. I nie ma inny wybór. W takim przypadku zostaje udokumentowane na śmierć. Zdarza się to bardzo rzadko i zwykle w przypadku urządzeń, do których nie możemy uzyskać dostępu, aby sprawdzić ustawienia BIOS i systemu operacyjnego.
Z drugiej strony stacje robocze i punkty dostępowe to inna historia. Nieudana autoneg jest klasyczną oznaką złego przebiegu kabla i wiele razy musimy ręcznie ustawić prędkość i dupleks, aż nadejdzie letni sezon z nowymi kablami w ścianach.
źródło
To mit sieci. Nasi koledzy z sieci przysięgają na ten nonsens, ponieważ w 1998 r. Przełączniki Bay nie negocjowały z Cisco ani nic takiego. Zamiast więc używać domyślnej wartości 99,999% sprzętu na ziemi, mamy to śmieszne ćwiczenie zarządzania konfiguracją i świetny kozioł ofiarny w czasach, gdy aktualizacja sterownika karty sieciowej resetuje ustawienia do auto-negocjacji i wszystko się dzieje.
Stało się to bardziej zabawne, ponieważ wiele naszych serwerów korzysta z podejrzanych funkcji, takich jak łączenie NIC, które zapobiegają utracie dostępu do sieci w mało prawdopodobnym przypadku awarii przełącznika, jednocześnie narażając Cię na znacznie bardziej prawdopodobne awarie oprogramowania. (Kierowcy zawsze są do dupy)
W obronie facetów z sieci wiele serwerów działa z domyślnymi sterownikami NIC systemu Windows, które zwykle są do bani. Jeśli masz problemy z automatyczną negocjacją, a Twój sprzęt nie pochodzi z administracji Clintona, zaktualizuj sterowniki NIC.
źródło
Powinieneś automatycznie negocjować. Jeśli masz przełącznik, który nie będzie automatycznie negocjował niezawodnie, kup lepszy przełącznik.
Gigabit ma się automatycznie negocjować, co obejmuje wykrywanie automatycznego krzyżowania (MDI-X).
100baseT jest gwarantowana na niepowodzenie, jeśli jeden koniec jest ustawiony na auto, a drugi do zestawu instrukcji, a to za specyfikacjach. Jeśli jeden koniec zmusić do 100 / full następnie drugi koniec będzie auto-negocjacji 100 / połowę, co daje niedopasowania dupleksu.
źródło
Zazwyczaj ustawiam serwery na naprawę, ponieważ widziałem, jak sprzęt sieciowy negocjuje 10 / pół zamiast 1000 / pełny.
Również niektórzy CoLos ustawiają swoje przełączniki nie na negocjacje, ale na utworzenie linku tylko na 1000 / pełny.
źródło
Wyłączenie autonegocjacji w niesprawdzonej konfiguracji początkowej jest podobne do programowania voodoo - zmieniasz coś bez uzasadnionego powodu. Jeśli po przetestowaniu zauważysz niedopasowanie dupleksu lub prędkości lub nadmierne błędy w porcie, włącz inne rozwiązywanie problemów i na końcu napraw konfigurację, jeśli to konieczne.
Po uaktualnieniu sterownika lub wymianie sprzętu nie ma gwarancji, że ustawienia zostaną zachowane po stronie serwera.
Ustaw obie strony linku do negocjacji lub napraw obie strony. Po naprawieniu ustawień prędkości i dupleksu na niektórych urządzeniach nie ogłaszają już swoich możliwości swoim rówieśnikom. Nie wiem, co mówi standard Ethernet o tym, co robić, gdy jedna strona ogłasza możliwości, a druga nie, a to prawdopodobnie oznacza, że wielu implementatorów też nie wie. Niektórzy wybiorą najniższy wspólny mianownik, który wynosi 10, a inni założą, że wszystko jest w porządku i wybiorą najszybszą możliwą prędkość.
Istnieje kilka współczesnych urządzeń, które nie obsługują automatycznych negocjacji gigabitowej miedzi Ethernet, jak (przynajmniej niektóre) przełączniki Cisco z miedzianymi SFP.
źródło
Wiele lat temu spędziłem trochę czasu pracując dla 3com, zapewniając wsparcie techniczne dla prawie całego sprzętu sieciowego. To niesamowite, jak często pojawiał się ten problem i ustawianie wszystkiego ręcznie było prawie standardową procedurą.
źródło
Miałem wiele problemów z automatycznymi negocjacjami. Wiele oczywiście oznacza jeden raz na kilka miesięcy, ale w mojej książce jest to o jeden problem za dużo.
Trudno znaleźć problemy z automatycznymi negocjacjami, szczególnie gdy osoby obsługujące sieć, serwery, aplikacje i bazy danych to cztery różne zespoły. Zazwyczaj dwa ostatnie spędzają dużo czasu w kółko, oskarżając się nawzajem o złej wydajności i kłamając na temat pomiarów, a czasem kopiąc to serwerom, którzy należycie przyjrzą się wynikowi „góry” i powiedzą, że wszystko jest dobrze z serwerem.
Dzieje się tak, dopóki sprawa nie wzrośnie do tego stopnia, że „ekspert” (właściwie ktoś, kto jest generalistą, a zatem rozumie sieci, sprzęt, systemy operacyjne, bazy danych, frameworki i aplikacje), zostaje przydzielony do problemu i znajduje problem w ciągu pięciu lub dziesięciu minut.
Tak więc moją własną zasadą jest, że gdy tylko mogę coś z tym zrobić, ZAWSZE ustawiam stałe prędkości na serwerach produkcyjnych, przełącznikach i routerach. Serwery nieprodukcyjne również, jeśli są wystarczająco segregowane, aby ludzie, którzy go używają, nie mieli w nim dostępu do roota.
Przełączniki obsługujące dostęp do komputera stacjonarnego / notebooka można pozostawić do automatycznej negocjacji, a są wyjątki od reguły. Wystarczy wspomnieć o jednym, jeśli w sieci dzieje się wiele zmian, lepiej pozostawić je w trybie automatycznym i mieć wszystko na oku.
Kolejną kwestią, która może się przydać, niezależnie od tego, jaki wybierzesz wybór w zakresie auto-negocjacji , jest monitorowanie tego. Wystarczy skonfigurować Nagios lub what-have-you, aby mieć oko na stan każdego ważnego portu. W każdym razie już monitorujesz ten sprzęt sieciowy, prawda?
źródło
Szorstki. Widziałem karty sieciowe 3com 100Mb, które nie łączyłyby się z niczym powyżej 10 Mb, gdybyś narzucił prędkość lub dupleks. Możesz uzyskać pełną prędkość, pozwalając im na automatyczną negocjację, mimo że kierowca miał ustawienia 100 Mb pełne i Połowa 100 Mb.
Wiele sterowników karty sieciowej nie pozwala określić 1000 Mb. Jedyne opcje to 10, 100, Auto. Ponownie zmuszając cię do zrobienia Auto, jeśli chcesz pełnej prędkości. na przykład tak zachowuje się sterownik Broadcom netXtreme 57xx Gigabit.
Możesz łatwo zmusić Gigabit do przełączenia, ale myślę, że będziesz zmuszony pozwolić większości NIC na automatyczne negocjowanie.
źródło
Z mojego doświadczenia (głównie sprzęt 3Com i HP, niewiele Cisco), automatyczne negocjowanie nie powoduje wielu problemów.
Podobnie jak mrdenny, zwykle ustawiam serwery na ich najwyższą prędkość (wciąż mamy ich na 100), pełny dupleks, a potem zostawiam przełącznik na auto. Ponieważ mamy mieszankę prędkości zarówno na serwerach, jak i stacjach roboczych, zdecydowanie wolę pozostawić przełączniki w pozycji auto i pozwolić im dostosować się do punktu końcowego.
źródło
Miałem pewne problemy z autonegocjacją w konfiguracji domowej i problemem było okablowanie, w szczególności kable sieciowe zwinięte w pętlę o zbyt małej średnicy lub zbyt blisko kabli zasilających.
Ale uważam, że te sugestie są zbyt trywialne dla twojej konfiguracji. ;)
źródło
Ostatnio czytałem o tym w Network Warrior Gary'ego Donahue. W oparciu o tę książkę, aby automatyczne negocjowanie działało poprawnie ZARÓWNO przełącznik i karta sieciowa muszą być ustawione na automatyczne negocjowanie. Ustawienie karty sieciowej na określoną prędkość i tryb dupleks i pozostawienie serwera na automatycznej negocjacji nie będzie działać poprawnie - automatyczna negocjacja jest protokołem i obie strony muszą mówić, aby ustawienia działały poprawnie.
Jeśli chcesz jawnie ustawić tryb prędkości i dupleks, musisz to zrobić na obu końcach połączenia.
źródło
Podczas korzystania z urządzeń zabezpieczających PIX / ASA Cisco omawia niektóre przypadki, w których możesz chcieć ręcznie skonfigurować szybkość portu i dupleks zamiast używać automatycznej negocjacji: http://www.cisco.com/en/US/products/hw/vpndevc/ps2030/ products_tech_note09186a008009491c.shtml # Rozwiązywanie problemów
źródło
Moją ogólną zasadą jest używanie automatycznej negocjacji do wszystkiego oprócz łączy routera, chyba że masz konkretny problem (jak ostatnie karty Broadcom ... BAH!)
Jeśli masz na przykład dwa routery połączone przez Ethernet, ręcznie ustaw prędkość na obu końcach.
źródło