1

Temat: EdgeRouter X

TL;DR: ER-X gubi LAN przy braku internetu

Czy jest na forum (chyba nawet Cezary?) jakiś posiadacz EdgeRoutera-X (bez SFP)?
Mam internet po LAN-ie ze stałym IP od dostawcy, a na wszystkich 4 portach routera mam zestawiony switch na LAN w prywantej adresacji, bez vlanów.

Do wczoraj wszystko śmigało jak trzeba, ale nastąpiła awaria internetu i mimo połączenia do najbliższego swticha infrastruktura nie odpowiada nawet na ARP-y.

I tu dzieje się magia, bo router po restarcie 'gubi' LAN - przestaje odpowiadać na pingi, nie da się do niego zalogować, udaje że działa. Żeby naprawić tą sytuację wystarczy wypiąć kabel z eth0, gdzie wpięty jest kabel idostawcy. Wteyd router wraca do żywych, w logach nic dziwnego się nie dzieje.
Wpięcie kabla z powrotem pozwala na kontrolę nad urządzeniem jeszcze przez kilka minut po czym bez żadnej interakcji z routerem znowu gubi cały LAN.

Jakieś pomysły/porady z czego to może wynikać? Router serwuje DHCP do całej sieci, więc ta automatycznie bez niego też leży...

Ewentualnie, gdyż próbowąlem w telefonie pogooglać - jest opcja wgrania LEDE dla testów i powrotu do EdgeOS w razie ich oblania?

2

Odp: EdgeRouter X

Lede wgrywasz tak normalnie - możesz wersję rozwojową bezpośrednio z gui ew później upgrade do wersji stabilnej. Jak chcesz stabilną od razu to przez serial.

Nigdy nie wracałem do oryginału, wg niektórych "się nie da".

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

3

Odp: EdgeRouter X

Chciałem to traktować jako ostateczność, ale sytuacja w której ER-X 'wylatuje' tylko dlatego, że nie ma połaczenia z dostawcą mnie smuci. O dziwo wszystko jest ok gdy wraca połączenie z internetem.

Kojarzysz z czego takie zachowanie może wynikać? Firewall, któremu brakuje 'WAN'a?
Tylko dlaczego mając static IP na interfejsach.

4

Odp: EdgeRouter X

Nie wiem. Miałem dostęp do niego przez jakiś czas do zabawy, więc normalką było podłączanie, odłączanie, statyczne dhcp adresy w dowolnej kombinacji i kolejności. Nic złego nie zauważyłem wtedy. U Ciebie dziwne to się zachowuje prawdę mówiąc.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

5

Odp: EdgeRouter X

Mam jedną jeszcze teorię poza firewallem (którego praktycznie nie dotykałem) - podobno w tym urządzeniu switch sprzętowy jest na portach eth2,3,4, a ja 'dopiąłem' do tego jeszcze eth1 (w konfiguracji), aby mieć 1WAN+4LAN.
Szczerze mówiąc nawet nie wiem od czego zaczynać diagnostykę, a jest ona utrudniona w momencie gdy wyrzuca mnie ze wszystkich sesji i przestaje odpowiadać na PING chwilę po wpięciu (i tak nie działającego) kabla od internetu. :-)

6

Odp: EdgeRouter X

Cóż, faktycznie zostaje Ci podłączenie seriala i obserwowanie konsoli...

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

7 (edytowany przez andrut 2018-01-29 09:58:03)

Odp: EdgeRouter X

Urządzenie jest relatywnie nowe i nie chciałbym tracić gwarancji (rozbierając je) :-/
Przed wrzuceniem LEDE powstrzymuje mnie brak pełnej znajomości bebechów i pewności, że wszystko będzie ładnie śmigało (wspierwanie hw-switcha etc.) + brak powrotu.

8

Odp: EdgeRouter X

Dostawca poinformował, że usunęli usterkę, cytuję: "Ktoryś z klientów na osiedlu zrobił tak zwaną pętlę na łączach co powodowało brak sygnału".
Nie wiem o jaką pętlę chodzi (pewnie ktoś chciał dołożyć router), ale skoro był w stanie wywalić ER-X...  to nadal mnie to martwi. :-)

9

Odp: EdgeRouter X

Wystarczy uruchomić na wanie serwer dhcp lub ustawić taki sam ip jak ma gateway smile

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

10

Odp: EdgeRouter X

Ale żeby to wywaliło komunikację na ER-X?
Chyba, że ktoś wystawił... prywatną adresację? Chyba dorwę jakieś padło i przetestuję.

11

Odp: EdgeRouter X

Na gorąco, z telefonu: sytuacja znowu ma miejsce. Nie ma internetu, tcpdump -i eth0 pokazuje tylko zapytania ARP routera, po 5 minutach router znika.i zaczyna odpowiadać ponownie dopiero po wypięciu kabla WAN.

Co sprawdzić, żeby zdiagnozować problem?

12

Odp: EdgeRouter X

Masz w logach jaki adres ip dostał na wanie?

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

13

Odp: EdgeRouter X

Adres IP mam na stałe przypisany (i jest on jednocześnie zewnętrznym), więc nie odpytuje DHCP.
tcpdump jedynie pyta przez ok 5 minut ARP o gateway i po tych 5 minutach dostęp ze strony LAN do routera pada. Zajmuje to +/- dokładnie 5 minut i jedyna opcja przywrócenia łączności/pinga do routera to wypięcie kabla ze strony WAN.
Ułamek sekundy później router odpowiada na pingi, pozwala zalogować się do ssh etc.

14

Odp: EdgeRouter X

Dla mających podobny problem: obecnie moje jedyne domysły (wynikające z doświadczeń także z OpenWRT), które mogą prowadzić do takich zachowań:
- ktoś na 'końcówce' switchowej od operatora wpiął router, który operuje w tej samej klasie adreoswej co ja (192.168.1.1). Routery w takich chwilach zachowują się co najmniej dziwnie, a najczęściej tracą łączność z każdej ze stron.

Dla testu przemigrowałem wszystkie hosty w sieci na inną klasę adresową, raczej nie popularną - teraz pozostaje czekać na awarię. Wrócę z informacją, jeśli diagnoza się powiedzie (tylko skąd wtedy będę wiedział, że na sieci jest 'pętla'? ;-))

15

Odp: EdgeRouter X

Wytnij na firewallu na interfejsie wejściowym wszystko co ma adres źródłowy taki jak siec lokalna. Nie ma prawa się pojawić tam taki pakiet.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

16

Odp: EdgeRouter X

Nie mam dowodów na to, że ten pakiet się tam pojawił, ale profilaktycznie dodam te reguły.
Moje skojarzenia wywołała próba podłączenia kiedyś-kiedyś routera świeżo po flashu do openwrt, gdzie ten router swoim WAN-em podpięty był do innego routera także z adresacją 192.168.1.1

Finał był taki, że nie dao się 'dobić' do routera do czasu wyjęcia kabla LAN.
Tutaj niestety na końcówce (mojej) WAN mogą pojawiać się takie pakiety, na chwilę obecną infrastruktura opiera się na zwykłych switchach (niezarządzalnych), a sąsiedzi potrafią być kreatywni jeśli chodzi o podpięcie routerów, jak widać.

17 (edytowany przez andrut 2018-02-06 23:58:12)

Odp: EdgeRouter X

Taki kwiatek właśnie szybki tcpdump pokazał na WANowym interfejsie:

23:53:41.868392 ARP, Request who-has 192.168.1.110 tell 192.168.1.252, length 46
23:55:59.044815 ARP, Request who-has 192.168.1.105 tell 192.168.1.252, length 46
23:55:58.343804 ARP, Request who-has 192.168.0.254 tell 192.168.0.252, length 46

i tak dalej. Jednak DROP na publiczne klasy powinien pomóc. :-)

18

Odp: EdgeRouter X

Drop hostów BOGON nie pomógł, 'awaria' dziś się powtórzyła - brak pakietów na interfejsie.
Kończą mi się pomysły. ;-)

19

Odp: EdgeRouter X

Ok, udało się ustalić przyczynę - sieć działa na niezarządzalnych switchach i jeden z klientów (podobno) robił loopa.
Próbowałem zreplikować ten błąd, tj. zapętliłem niezarządzalny switch na WAN-ie routera - nie udało się, ale miałem tylko 'jeden' pakiet. W tcpdump widziałem wszystkie te dziesiątki zapytań ARP, w odróżnieniu od sytuacji kiedy pada sieć providera.

Nadal nie potrafię zrozumieć jakim cudem pada i odcina wszystkie podsieci routera do czasu wypięcia kabla.
Ponadto przetestowałem - WT3020 z najnowszym LEDE także 'wykrzacza' się po kilku minutach bycia podpiętym do 'zawieszonej' sieci. Oczywiście do czasu wypięcia kabla.

Jakieś pomysły jak uratować LAN przed podobną sytuacją w przyszłości?