1 (edytowany przez r43k3n 2017-03-28 15:34:07)

Temat: Pilna pomoc w diagnostyce.

Router: WR1043NDv4
OS: LEDE 17.01-SNAPSHOT od Cezarego.

Problem: LAN po kablu nie działa (znowu).
WiFi działa normalnie, mogę dostać się po SSH i LuCI do routera, mogę pingować inne komputery w sieci ale nic po kablu nie działa, komputery nie dostają IP po DHCP, WAN też nie działa. ifup wan nie działa. Restart dnsmasq nie pomaga. Syslog i dmesg czysty, dosłownie jakby nic się nie działo. Nic w logach nie ma.

Co jeszcze mogę sprawdzić?
Na pewno /etc/init.d/network restart pomaga, bo już kiedyś sprawdzałem ale w żaden sposób nie mówi mi jak naprawić usterkę.

PS. eko ma jakieś irc czy jakiś inny "instant messaging" komunikator?

2

Odp: Pilna pomoc w diagnostyce.

Restart networku restartuje switcha. Możesz ręcznie przez swconfig to zrobić i zobaczyć czy coś da.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

3 (edytowany przez r43k3n 2017-03-28 15:37:17)

Odp: Pilna pomoc w diagnostyce.

Nigdy swconfig nie używałem. Da się jakoś tam sprawdzić co się dzieje?

root@WR1043NDv4_LEDE:~# swconfig dev switch0 show
Global attributes:
        enable_vlan: 1
        enable_mirror_rx: 0
        enable_mirror_tx: 0
        mirror_monitor_port: 0
        mirror_source_port: 0
        arl_age_time: 300
        arl_table: address resolution table
Port 0: MAC b4:74:9f:73:59:3f
Port 0: MAC 84:16:f9:9b:ca:17
Port 0: MAC 84:16:f9:9b:ca:16
Port 0: MAC 34:e6:ad:d7:bc:bb
Port 2: MAC b8:70:f4:52:0a:65
Port 4: MAC f0:76:1c:d7:81:53
Port 5: MAC 00:17:10:82:71:40

        igmp_snooping: 0
        igmp_v3: 0
Port 0:
        mib: MIB counters
RxBroad     : 9933
RxPause     : 0
RxMulti     : 13888
RxFcsErr    : 0
RxAlignErr  : 0
RxRunt      : 0
RxFragment  : 0
Rx64Byte    : 22109776
Rx128Byte   : 108218208
Rx256Byte   : 10490226
Rx512Byte   : 2857183
Rx1024Byte  : 6512880
Rx1518Byte  : 73120543
RxMaxByte   : 71685816
RxTooLong   : 0
RxGoodByte  : 232285280012 (216.3 GiB)
RxBadByte   : 0
RxOverFlow  : 0
Filtered    : 1124567
TxBroad     : 1594966
TxPause     : 318523
TxMulti     : 329432
TxUnderRun  : 0
Tx64Byte    : 318730
Tx128Byte   : 134681194
Tx256Byte   : 11142086
Tx512Byte   : 2891138
Tx1024Byte  : 6111742
Tx1518Byte  : 76481872
TxMaxByte   : 54744629
TxOverSize  : 0
TxByte      : 211680334288 (197.1 GiB)
TxCollision : 0
TxAbortCol  : 0
TxMultiCol  : 0
TxSingleCol : 0
TxExcDefer  : 0
TxDefer     : 0
TxLateCol   : 0

        enable_eee: ???
        igmp_snooping: 0
        pvid: 0
        link: port:0 link:up speed:1000baseT full-duplex txflow rxflow
Port 1:
        mib: MIB counters
RxBroad     : 2254
RxPause     : 0
RxMulti     : 34104
RxFcsErr    : 0
RxAlignErr  : 0
RxRunt      : 0
RxFragment  : 0
Rx64Byte    : 463179
Rx128Byte   : 10223881
Rx256Byte   : 648918
Rx512Byte   : 27392
Rx1024Byte  : 50346
Rx1518Byte  : 2154143
RxMaxByte   : 0
RxTooLong   : 0
RxGoodByte  : 4306352686 (4.0 GiB)
RxBadByte   : 0
RxOverFlow  : 0
Filtered    : 5209
TxBroad     : 12734
TxPause     : 0
TxMulti     : 308338
TxUnderRun  : 0
Tx64Byte    : 255418
Tx128Byte   : 1099398
Tx256Byte   : 898291
Tx512Byte   : 76676
Tx1024Byte  : 663893
Tx1518Byte  : 34705911
TxMaxByte   : 0
TxOverSize  : 0
TxByte      : 52356946618 (48.7 GiB)
TxCollision : 0
TxAbortCol  : 0
TxMultiCol  : 0
TxSingleCol : 0
TxExcDefer  : 0
TxDefer     : 0
TxLateCol   : 0

        enable_eee: 0
        igmp_snooping: 0
        pvid: 1
        link: port:1 link:up speed:100baseT full-duplex auto
Port 2:
        mib: MIB counters
RxBroad     : 2996
RxPause     : 0
RxMulti     : 293715
RxFcsErr    : 0
RxAlignErr  : 0
RxRunt      : 0
RxFragment  : 0
Rx64Byte    : 8619539
Rx128Byte   : 44465069
Rx256Byte   : 2628764
Rx512Byte   : 1134936
Rx1024Byte  : 3133954
Rx1518Byte  : 70189473
RxMaxByte   : 0
RxTooLong   : 0
RxGoodByte  : 111455395900 (103.8 GiB)
RxBadByte   : 0
RxOverFlow  : 0
Filtered    : 0
TxBroad     : 11014
TxPause     : 0
TxMulti     : 46899
TxUnderRun  : 0
Tx64Byte    : 13190957
Tx128Byte   : 61640646
Tx256Byte   : 5265920
Tx512Byte   : 1638954
Tx1024Byte  : 2762183
Tx1518Byte  : 52472741
TxMaxByte   : 0
TxOverSize  : 0
TxByte      : 86345474820 (80.4 GiB)
TxCollision : 0
TxAbortCol  : 0
TxMultiCol  : 0
TxSingleCol : 0
TxExcDefer  : 0
TxDefer     : 0
TxLateCol   : 0

        enable_eee: 0
        igmp_snooping: 0
        pvid: 1
        link: port:2 link:up speed:100baseT full-duplex auto
Port 3:
        mib: No MIB data
        enable_eee: 0
        igmp_snooping: 0
        pvid: 1
        link: port:3 link:down
Port 4:
        mib: MIB counters
RxBroad     : 876
RxPause     : 0
RxMulti     : 1621
RxFcsErr    : 0
RxAlignErr  : 0
RxRunt      : 0
RxFragment  : 0
Rx64Byte    : 1482
Rx128Byte   : 2514
Rx256Byte   : 401
Rx512Byte   : 151
Rx1024Byte  : 284
Rx1518Byte  : 131
RxMaxByte   : 0
RxTooLong   : 0
RxGoodByte  : 773319 (755.1 KiB)
RxBadByte   : 0
RxOverFlow  : 0
Filtered    : 1
TxBroad     : 4599
TxPause     : 0
TxMulti     : 13456
TxUnderRun  : 0
Tx64Byte    : 3994
Tx128Byte   : 5385
Tx256Byte   : 9261
Tx512Byte   : 390
Tx1024Byte  : 796
Tx1518Byte  : 488
TxMaxByte   : 0
TxOverSize  : 0
TxByte      : 3927796 (3.7 MiB)
TxCollision : 0
TxAbortCol  : 0
TxMultiCol  : 0
TxSingleCol : 0
TxExcDefer  : 0
TxDefer     : 0
TxLateCol   : 0

        enable_eee: 0
        igmp_snooping: 0
        pvid: 1
        link: port:4 link:up speed:1000baseT full-duplex txflow rxflow auto
Port 5:
        mib: MIB counters
RxBroad     : 1588845
RxPause     : 0
RxMulti     : 0
RxFcsErr    : 0
RxAlignErr  : 0
RxRunt      : 0
RxFragment  : 0
Rx64Byte    : 15040986
Rx128Byte   : 59801672
Rx256Byte   : 5584867
Rx512Byte   : 1729648
Rx1024Byte  : 2945534
Rx1518Byte  : 63522256
RxMaxByte   : 0
RxTooLong   : 0
RxGoodByte  : 101978565314 (94.9 GiB)
RxBadByte   : 0
RxOverFlow  : 0
Filtered    : 0
TxBroad     : 1007
TxPause     : 0
TxMulti     : 754
TxUnderRun  : 0
Tx64Byte    : 8910341
Tx128Byte   : 48667857
Tx256Byte   : 2350908
Tx512Byte   : 1138864
Tx1024Byte  : 3093757
Tx1518Byte  : 61703560
TxMaxByte   : 0
TxOverSize  : 0
TxByte      : 98898768817 (92.1 GiB)
TxCollision : 0
TxAbortCol  : 0
TxMultiCol  : 0
TxSingleCol : 0
TxExcDefer  : 0
TxDefer     : 0
TxLateCol   : 0

        enable_eee: 0
        igmp_snooping: 0
        pvid: 2
        link: port:5 link:up speed:1000baseT full-duplex txflow rxflow auto
Port 6:
        mib: No MIB data
        enable_eee: ???
        igmp_snooping: 0
        pvid: 0
        link: port:6 link:down
VLAN 1:
        vid: 1
        ports: 0t 1 2 3 4
VLAN 2:
        vid: 2
        ports: 0t 5

Czemu Port 6 jest down?
To nie jest czasem CPU?

4

Odp: Pilna pomoc w diagnostyce.

Zobaczyć to nie bardzo.

swconfig dev switch0 set reset 1

Zrób, czy jak tam się switch nazywa. I pamiętaj że może to vlany rozwalić.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

5

Odp: Pilna pomoc w diagnostyce.

swconfig dev switch0 help zrób żeby zobaczyć który jest cpu.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

6 (edytowany przez r43k3n 2017-03-28 15:47:18)

Odp: Pilna pomoc w diagnostyce.

swconfig dev switch0 set reset 1
Bez różnicy. Dalej nie działa.

root@WR1043NDv4_LEDE:~# swconfig dev switch0 help
switch0: ag71xx-mdio.0(Atheros AR8337), ports: 7 (cpu @ 0), vlans: 128
     --switch
        Attribute 1 (int): enable_vlan (Enable VLAN mode)
        Attribute 2 (none): reset_mibs (Reset all MIB counters)
        Attribute 3 (int): enable_mirror_rx (Enable mirroring of RX packets)
        Attribute 4 (int): enable_mirror_tx (Enable mirroring of TX packets)
        Attribute 5 (int): mirror_monitor_port (Mirror monitor port)
        Attribute 6 (int): mirror_source_port (Mirror source port)
        Attribute 7 (int): arl_age_time (ARL age time (secs))
        Attribute 8 (string): arl_table (Get ARL table)
        Attribute 9 (none): flush_arl_table (Flush ARL table)
        Attribute 10 (int): igmp_snooping (Enable IGMP Snooping)
        Attribute 11 (int): igmp_v3 (Enable IGMPv3 support)
        Attribute 12 (none): apply (Activate changes in the hardware)
        Attribute 13 (none): reset (Reset the switch)
     --vlan
        Attribute 1 (int): vid (VLAN ID (0-4094))
        Attribute 2 (ports): ports (VLAN port mapping)
     --port
        Attribute 1 (none): reset_mib (Reset single port MIB counters)
        Attribute 2 (string): mib (Get port's MIB counters)
        Attribute 3 (int): enable_eee (Enable EEE PHY sleep mode)
        Attribute 4 (none): flush_arl_table (Flush port's ARL table entries)
        Attribute 5 (int): igmp_snooping (Enable port's IGMP Snooping)
        Attribute 6 (int): pvid (Primary VLAN ID)
        Attribute 7 (unknown): link (Get port link information)

CPU jest na 0.
Jakieś pomysły co jeszcze mogę spróbować?

7

Odp: Pilna pomoc w diagnostyce.

r43k3n napisał/a:

Jakieś pomysły co jeszcze mogę spróbować?

Masz tak na czystym obrazie czy po jakichś zmianach w konfiguracji/instalacji dodatkowego softu?

8

Odp: Pilna pomoc w diagnostyce.

Obraz od Cezarego ale oczywiście wgrałem swoje rzeczy:

luci-ssl-openssl, luci-app-commands, kmod-usb-core kmod-usb2 kmod-usb-ohci kmod-usb-printer p910nd luci-app-p910nd, ntpdate, curl, wget, dnscrypt-proxy-resolvers dnscrypt-proxy hostip iodine libsodium, dnsmasq-full, ekooneplstat luci-app-ekooneplstat, vnstat vnstati luci-app-vnstat, sqm-scripts luci-app-sqm, ddns-scripts luci-app-ddns, bcp38 luci-app-bcp38, etherwake luci-app-wol, openvpn-openssl openvpn-easy-rsa luci-app-openvpn, samba36-server luci-app-samba

Jednak taką samą konfigurację miałem na poprzednim routerze i problemów ze switchem nie było.

9

Odp: Pilna pomoc w diagnostyce.

r43k3n napisał/a:

Obraz od Cezarego ale oczywiście wgrałem swoje rzeczy:

luci-ssl-openssl, luci-app-commands, kmod-usb-core kmod-usb2 kmod-usb-ohci kmod-usb-printer p910nd luci-app-p910nd, ntpdate, curl, wget, dnscrypt-proxy-resolvers dnscrypt-proxy hostip iodine libsodium, dnsmasq-full, ekooneplstat luci-app-ekooneplstat, vnstat vnstati luci-app-vnstat, sqm-scripts luci-app-sqm, ddns-scripts luci-app-ddns, bcp38 luci-app-bcp38, etherwake luci-app-wol, openvpn-openssl openvpn-easy-rsa luci-app-openvpn, samba36-server luci-app-samba

Jednak taką samą konfigurację miałem na poprzednim routerze i problemów ze switchem nie było.

Jak rzeczywiście chcesz znaleźć przyczynę problemu, to najpierw go powtórz na czystym obrazie. Za dużo zmiennych przy tylu dodatkowych pakietach.

10

Odp: Pilna pomoc w diagnostyce.

I nie moim tylko bieżącej wersji rozwojowej.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

11

Odp: Pilna pomoc w diagnostyce.

Mały update dla osób, które mogą tu trafić w przyszłości.

Więc była to najprawdopodobniej usterka hardware. Od 2 tygodni używam nowego egzemplarza i zero problemów. Wszystko działa idealnie na tym samym firmware i tym samym confingu.

12

Odp: Pilna pomoc w diagnostyce.

Na wymienionej jednostce problem również występuję. Tym razem router pracował prawie miesiąc bez incydentu. Wczoraj był pierwszy, dzisiaj drugi.

Dzieje się to samo. Tak jakby switch przestawał działać. WAN i LAN nie działa, WAN nie może nawet wykryć sieci. Natomiast co było dziwne to dzisiaj podczas incydenty kopiowany był plik między komputerami podłączonymi kablem do routera. Kopiowanie się nie przerwało, szło dalej mimo tego, że nie mogłem pingować żadnego komputera podłączonego kablem ani z poziomu routera ani z poziomu laptopa podłączonego do WiFi.

Jakieś pomysły? Mogę wrzucić moje confingi jeżeli to pomoże.

13

Odp: Pilna pomoc w diagnostyce.

Masz na nim dostęp do konsoli szeregowej?

14 (edytowany przez r43k3n 2017-04-23 20:44:52)

Odp: Pilna pomoc w diagnostyce.

Nie sądzę, żeby piny były wlutowane a ponieważ to model nadal na gwarancji to nie jestem pewien czy chce go rozbierać i grzebać w środku.

Jeżeli to jakaś wskazówka to ifup wan oraz swconfig dev switch0 set reset 1 nie pomaga, natomiast /etc/init.d/network rozwiązuje problem. W czym dokładnie te dwie komendy się różnią?

15

Odp: Pilna pomoc w diagnostyce.

Dużo jest userów v4. Ciekawe że nikt się na to nie skarżył.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

16

Odp: Pilna pomoc w diagnostyce.

Cezary napisał/a:

Dużo jest userów v4. Ciekawe że nikt się na to nie skarżył.

Czy ja wiem.
Według twoich statystyk, tylko 7.

Teoretycznie może to byś problem z moją konfiguracją DHCP ale co to ma do niedziałającego WANu?
Jak wspomniałem, komenda /etc/init.d/network naprawia usterkę. Może mi ktoś powiedzieć, które pakiety są wtedy restartowane? Mam włączone przyznawanie adresów IPv6 i czas dzierżawy jest "unlimited". Widziałem również, że są jakieś problemy w LEDE z właśnie DHCPv6. Czy to może być potencjalną przyczyną? Chodzi mi o ten bug: https://bugs.lede-project.org/index.php … ask_id=668

config dnsmasq
    option domainneeded    '1'
    option boguspriv    '1'
    option filterwin2k    '0'  # enable for dial on demand
    option localise_queries    '1'
    option rebind_protection '1'  # disable if upstream must serve RFC1918 addresses
    option rebind_localhost '1'  # enable for RBL checking and similar services
    #list rebind_domain example.lan  # whitelist RFC1918 responses for domains
    option local    '/lan/'
    option domain    'WR1043NDv4_lan'
    option expandhosts    '1'
    option nonegcache    '1'
    option cachesize '1500'
    option authoritative    '1'
    option readethers    '1'
    option dnssec         '1'
    option leasefile    '/tmp/dhcp.leases'
    #option resolvfile    '/tmp/resolv.conf.auto'
    option noresolv     '1'
    #list server        '/mycompany.local/1.2.3.4'
    list server '127.0.0.1#5353'
    list server '127.0.0.1#5454'
    list server '127.0.0.1#5555'
    list server '127.0.0.1#5656'
    list server '/pool.ntp.org/208.67.222.222'
    list server '/time.coi.pw.edu.pl/194.29.130.252'
    list rebind_domain 'free.aero2.net.pl'
    #option nonwildcard    '1'
    #list interface        'br-lan'
    #list notinterface    'lo'
    #list bogusnxdomain     '64.94.110.11'
    option localservice    '1'  # disable to allow DNS requests from non-local subnets

config dhcp lan
    option interface    'lan'
    option start     '100'
    option limit    '150'
    option leasetime    '12h'
    option dhcpv6     'server'
    option ra     'server'
    list dhcp_option '44,192.168.2.1'
    list dhcp_option '45,192.168.2.1'
    list dhcp_option '46,8'
    list dhcp_option '47'

config dhcp wan
    option interface    'wan'
    option ignore    '1'

config odhcpd 'odhcpd'
    option maindhcp '0'
    option leasefile '/tmp/hosts/odhcpd'
    option leasetrigger '/usr/sbin/odhcpd-update'

17

Odp: Pilna pomoc w diagnostyce.

Statystyki statystykami, nie wszyscy je uruchamiają. Teoretycznie jest ze 3x więcej.

Generalnie wołany jest netifd doi całego podsystemu sieci. Pomaga, więc problem nie jest z uszkodzenie sprzętu tylko coś na poziomie programowym.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

18

Odp: Pilna pomoc w diagnostyce.

Chętnie bym się dowiedział co. Najbardziej mnie dziwi, że logi są czyste. Spodziewałbym się chociaż jednego wpisu, że WAN nie działa a tam pusto. Jakbym chociaż wiedział czego szukać jak się pojawi problem, jakie polecenia wrzucać to bym wkleił co tam wyskakuję.

Wiesz może czy jakieś inne urządzenia wspierane przez LEDE korzystają z tego SoC? Qualcomm Atheros QCA9563
Wiem, że Archer C7 w wersji 4.0(?) ma korzystać z tego chipu ale ta wersja chyba jeszcze nie weszła na rynek.

Jak na ironię kupiłem tego WR1043ND bo chciałem, żeby wszystko działało i mieć spokój.

19

Odp: Pilna pomoc w diagnostyce.

Wg lede:  D-Link DIR-869 A1, TP-Link TL-WPA8630, Ubiquiti UniFi AP AC PRO to samo cpu, ten sam switch.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

20

Odp: Pilna pomoc w diagnostyce.

Znalazłem podobny temat:
https://forum.lede-project.org/t/ubiqui … oblem/3078

21

Odp: Pilna pomoc w diagnostyce.

Inna platforma, inny chipset...

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

22

Odp: Pilna pomoc w diagnostyce.

Wiem ale opis bardzo podobny.
Zauważyłem również , że co jakiś czas jak włączam komputer (podłączony kablem) to nie działa sieć. Mam albo "sieć niezidentyfikowana" albo w ogóle jakby nie był kabel podłączony. Zazwyczaj odłączenie i ponowne podłączenie kabla albo restart karty sieciowej rozwiązuje problem.

Może to byś powiązane?
BTW używam dnsmasq-full a nie tego wbudowanego. Być może dlatego nikt z użytkowników v4 nie zauważył problemu? Na forum.lede-project.org ktoś właśnie wspominał, że może to być problem z serwerem DHCP lub ogólnie paczką dnsmasq, dlatego krążę wokół tego tematu.

23

Odp: Pilna pomoc w diagnostyce.

Niestety problem nadal występuję. Byłem w stanie potwierdzić, że switch sam w sobie działa, bo sieć lokalna między dwoma komputerami pracowała poprawnie.

Jakieś pomysły?
Może ktoś zechce zerknąć na pliki konfiguracyjne?

24

Odp: Pilna pomoc w diagnostyce.

Obawiam się, że bez dostępu do konsoli szeregowej ciężko będzie to zdiagnozować.

25

Odp: Pilna pomoc w diagnostyce.

Wczoraj zauważyłem, że moje maszyny wirtualne (VirtualBox) w trybie bridge mają problem z pobraniem adresu IP z mojego routera. W logach mam dhcpoffer itd. jednak nie ma przypisanego adresu IP tylko podany adres bramy (routera). Po jakimś czasie problem ustąpił sam. Nie była to również wina VirtualBoxa, bo na poprzednich wersjach, które na pewno działały też problem się pojawiał. Bardzo podobne lub wręcz takie samo zjawisko mam na jednym z moich komputerów podłączonych fizycznie kablem.

Używam dnsmasq-full, zamiast tego okrojonego dostępnego domyślnie ze względu na funkcję DNSSEC. Ktoś z Was może używa tego pakietu?