Jednokierunkowa utrata pakietów

8

Niedawno po aktualizacji kilku obwodów MetroE (łączność L2) ze 100 Mb / s do 1 Gb / s zauważyłem, że duże transfery plików nie udają się między niektórymi stronami; jednak transfer nie powiedzie się tylko w kierunku. Rozważmy na przykład następujący przykład.

Od -> Do

A -> B = Błąd

B -> A = Sukces

A -> C = sukces

C -> A = Sukces

B -> C = sukces

C -> B = Sukces

Każda witryna jest trasowanym segmentem za przełącznikiem L3 znajdującym się w witrynie. Przełącznik L3 łączy się z konwerterem mediów CPE dostawcy, który z kolei łączy się z siecią dostawcy za pośrednictwem światłowodu. Trasowanie statyczne jest używane między przełącznikami L3.

            *Site A*                      *Site B*
    L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
                               |
                              CPE
                               |
                           L3 Switch
                            *Site C*

Dostawca przeprowadził kompleksowe testy obwodów z CPE i nie zgłosił żadnych strat. Jednak widzę wiele zduplikowanych ACK w przechwytywaniu pakietów na hostach, zanim transfer się nie powiedzie.

Jeśli usunę przełączniki L3 z równania i podłączę dwa hosty bezpośrednio do urządzenia CPE w każdej witrynie, przesyłanie plików zakończy się pomyślnie.

    Host A <-> CPE <--- Provider ---> CPE <-> Host B

Jeśli umieszczę hosty po obu stronach przełącznika L3, routing InterVLAN działa bez żadnych problemów, a przesyłanie plików kończy się pomyślnie.

    Host A1 <-> L3 Switch <-> Host A2

Problem wydaje się występować tylko wtedy, gdy dane przechodzą przez dostawcę między dwoma trasowanymi segmentami.

    Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B

Zweryfikowałem wiele rzeczy - statystyki interfejsu są czyste (bez błędów), niskie zużycie procesora i pamięci, dopasowanie prędkości i dupleksu (klient i CPE), prawidłowe tabele MAC i ARP itp.

Co może być problemem?

Aktualizacja 1

Przechwytywanie pakietów z hostów A i B można znaleźć pod następującym adresem URL:

https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa

Problem pierwotnie występował przy użyciu przełączników Juniper EX3200 z systemem 12.3R6.6. Następnie obniżyłem przełączniki do wersji 11.4R6.6, ale to nie rozwiązało problemu.

Udało mi się zreplikować problem przy użyciu przełączników Juiper EX2200 z systemem 12.3R6.6 i 11.4R6.6. Byłem także w stanie replikować problem za pomocą przełączników Dell 6224 z systemem 3.3.11.2.

Obecnie tylko CPE (ge-0/0/0) i pojedynczy host (ge-0/0/1) są podłączone do Juniper EX3200 w każdej lokalizacji. Podczas rozwiązywania problemu usunąłem konfigurację wszelkich obcych parametrów, więc konfiguracja jest dość podstawowa. Konfiguracja jest zasadniczo taka sama dla każdego, ale z różnymi adresami IP. Poniżej znajduje się fragment kodu.

    # show interfaces
    ge-0/0/0 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members WAN;
                }
            }
        }
    }
    ge-0/0/1 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members LAN;
                }
            }
        }
    }
    vlan {
        unit 10 {
            description WAN;
            family inet {
                address 192.168.X.X/27;
            }
        }
        unit 100 {
            description LAN;
            family inet {
                targeted-broadcast;
                address 172.X.X.1/22;
            }
        }
    }

    # show vlans
    WAN {
        vlan-id 10;
        l3-interface vlan.10;
    }
    LAN {
        vlan-id 100;
        l3-interface vlan.100;
    }

Aktualizacja 2

Dzisiaj zauważyłem, że jeśli scpuję plik z przełącznika L3, Juniper EX3200, w miejscu A do przełącznika L3, Juniper EX3200, w miejscu B, problem dotyczy również transferu scp.

Uważam to za szczególnie interesujące, ponieważ przesyłanie pochodzi z interfejsu CPE w sieci WAN VLAN, ponieważ jeśli połączę sieć VLAN z magistralą między dotkniętymi witrynami za pomocą przełączników EX3200, przełączone przesyłanie plików zakończy się pomyślnie między hostami w witrynach A i B.

Paul Garrett
źródło
1
Cześć Mike, dziękuję za sugestię. Wiem z rozmowy z moim dostawcą, że konfigurują one MTU powyżej 9000. Jestem w stanie przekazać 1472 bajtów w obu kierunkach, czego oczekiwałbym od defacto 1500 MTU. Korzystanie z mturoute potwierdziło to. Każde pingowanie powyżej 1472 kończy się niepowodzeniem z ustawionym bitem nie fragmentowania.
Paul Garrett
Wąchaj przesyłanie plików, które nie powiodło się z obu stron jednocześnie, i opublikuj wyniki w cloudshark. Potrzebujemy również szczegółowych informacji na temat części pytania dotyczącej „przełącznika L3”. Rzeczy takie jak producent, model, wersja oprogramowania układowego, konfiguracja, numery portów podłączone itp.
Mike Pennington
Do czasu niepowodzenia transferu plików przechwytywanie wynosiło około 19 MB, co jest zbyt duże dla Clouldshark, więc przesłałem je do Dropbox i udostępniłem link. Zaktualizowałem post, aby zawierał dodatkowe informacje, o które prosiłeś.
Paul Garrett
Proszę rozważyć dodanie więcej szczegółów do pytania
Mike Pennington
Wystąpił problem z siecią dostawcy. Żadne dodatkowe szczegóły nie były dostępne.
Paul Garrett,

Odpowiedzi:

1

Jeśli korzystasz z SRX na zaporze, sprawdź, jakie są ustawienia sesji przepływu zabezpieczeń i czy osiąga limit.

#show security flow session summary 
Albert Klinaku
źródło