Temat: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Uważajcie na dyski podpięte do LEDE na kernelu 4.9 / 4.14. U mnie problem wystąpił na Xiaomi 3G, ale problem chyba dotyczy też innych routerów. Przy zapisie większych plików (u mnie >200 MB?) na dysk (u mnie usb2) do routera występuje niespójność danych. I przy kopiowaniu na dysk sieciowy afp i przy ściąganiu bezpośrednio na routerze (np. wgetem). SHA się nie zgadzało.

Jedyne co pomogło to przejście na kernel 4.4. Nie wiem tylko czy inne rzeczy się nie wywalą.

2

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Wspominałem już o tym błędzie tutaj. Zdaje się, że dotyczy tylko architektury ramips. Było już kilka nieudanych prób jego poprawienia.

@Cezary, może dałoby radę w kolejnych buildach dla Xiaomi R3G przejść tymczasowo na kernel 4.4 do czasu poprawienia tego błędu? Póki co wszyscy testujący potwierdzają, że na 4.4 jest OK.

Qui vit sans folie, n'est pas si sage qu'on croit

3

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Nie, nie mogę. ramips nie ma łatek od kernela 4.4, zostały tylko 4.9/4.14. Mógłbym przeportować to do lede, ale nie chciałem tego robić bo raz pojawi się jeszcze więcej głosów że wifi źle działa.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

4

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Można to zrobić samemu i wziąć za ewentualne fuckupy odpowiedzialność ;-).

Ludzie niestety jak coś dostaną "od tak" - to nawet mimo ostrzeżeń - jak coś pójdzie nie tak, mają pretensje do dobroczyńcy (rozumiem Cię, Cezary :-). U mnie jak na razie działa, ale jak coś się wywali to przepnę tymczasowo modem do kompa i nic wielkiego się nie stanie. Bardziej mi zależy na bezpieczeństwie danych na dysku.

Cezary, a widziałeś ten wpis?
http://blog.csdn.net/qidi_huang/article … s/78110438

Choć w trakcie komilacji w różnych wariantach wyszło mi, że w jednym przypadku ustawienie optymalizacji -O3 na 4.9 poprawiło o tyle sytuację, że czasem dawał radę zapisać plik. Oczywiście dalej jest to rozwiązanie niestabilne, wiec nieakceptowalne. Niestety przy kolejnych próbach kernel1.bin robił się większy niż 2MB i bootloader odmawiał rozpakowania go (LZMA Error) i musiałem wrócić do -Os. Ale z tego może być wniosek, że kernel/moduł/sterownik się nie wyrabia z zapisem, a brakuje kontroli, która by go zatrzymała... Jakiś wyścig może.

5

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Zachęcony informacjami, że przejście na GCC 7 może poprawić ten błąd wygrzebałem z szuflady Xiaomi 3G i testuję na najnowszym (r6427) obrazie Cezarego. Póki co zassało się 6 GB i dane nie są uszkodzone. Może będzie dobrze.

Qui vit sans folie, n'est pas si sage qu'on croit

6

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Próbowałem zanim oficjalnie przeszli na 7-kę i nie zadziałało. Poprawili też obsługę DMA (a właściwie przywrócili patch, który wcześniej przestał działać - co by wyjaśniało dlaczego kiedyś było lepiej), ale w opisie commitu piszą o sieciach, nie dyskach, wiec nie wiem czy to jest to.

Przerzuciłeś 6GB w dużych czy małych plikach? U mnie mały piki (nawet w dużych ilościach) szły problemy. Stawiały się dopiero 200MB+. Daj znać, bo chętnie wrócę o kernela 4.14/4.9. A nie mam teraz czasu na eksperymenty z
kompilacją (wybacz Cezary, potrzebuję FPU emulation smile, więc trzymam się 4.4 na razie.

7

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

marcinw788 napisał/a:

Przerzuciłeś 6GB w dużych czy małych plikach?

2 x 3 GB. Jak zaciągnę więcej to dam znać. Poprzednio przy tej wielkości plików błąd był średnio w co drugim. To było zwykle kilka kolejnych bajtów różnicy.

Qui vit sans folie, n'est pas si sage qu'on croit

8

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

To już jest podstawa, żeby spróbować. Też często przerzucam kilku-gigowe pliki (wideo z kamery). Dzięki. Dawaj znać, a ja dziś zapuszczę kompilację.

9

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Ok, sprawdziłem. Jest lepiej, ale nie różowo. Przy dużym obciążeniu (plik ok 10GB lub zapis z dwóch kompów na dysk sieciowy) dalej się wywala. Podejrzewam, że poprawili wydajność cache'u, ale nie rozwiązali problemu. Wracam z bólem do 4.4.

10 (edytowany przez valdi74 2018-03-25 12:30:30)

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

U mnie jak na razie przeciągnięte 20 GB w plikach po 2-3 GB. Strumień niezbyt szybki, bo równolegle 6x200 KB/s. Póki co wszystko bez błędów. Poprzednio sypało się już na jednym pliku przy 200 KB/s. Reasumując - ruter na razie nie wraca do szuflady ale zachowuję czujność.

EDIT:
44 GB (1,2 MB/s) i nadal bez błędów.

Qui vit sans folie, n'est pas si sage qu'on croit

11

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Dawaj znać. Moje lokalne repo może być zabałaganione przez wcześniejsze eksperymenty. Mam w tej chwili u siebie wa branche 4.9 i 4.4.
1200 kB/s to rzeczywiście niezbyt szybko. U mnie zapis 10 MB/s, odczyt 30MB/s (przez afp). To się pokrywa z moją teorią, że nie wytrzymuje dużego przepływu danych. Router jak najbardziej używam dalej, tyle, że na niespieranym oficjalnie kernelu (co może powodować problemy), ale wiarygodność zapisu na dysku jest dla mnie kluczowa, zwłaszcza, że o ile nie zrobimy tego sami - system nie zgłosi rzanych błędów.

12

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Hej wszystkim,
Widzę że Cezary wrzucił nowa kompilacje z r6501 - jak tam mają się w niej opisywane problemy z dyskiem?
Nie ściągnąłem sobie wersji r6427.

13 (edytowany przez c#Hunter 2018-03-24 12:52:24)

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

marcinw788 napisał/a:

Dawaj znać. Moje lokalne repo może być zabałaganione przez wcześniejsze eksperymenty. Mam w tej chwili u siebie wa branche 4.9 i 4.4.
1200 kB/s to rzeczywiście niezbyt szybko. U mnie zapis 10 MB/s, odczyt 30MB/s (przez afp). To się pokrywa z moją teorią, że nie wytrzymuje dużego przepływu danych. Router jak najbardziej używam dalej, tyle, że na niespieranym oficjalnie kernelu (co może powodować problemy), ale wiarygodność zapisu na dysku jest dla mnie kluczowa, zwłaszcza, że o ile nie zrobimy tego sami - system nie zgłosi rzanych błędów.

Swoje zdanie o X3G i Lede już wyraziłem (że do pracy 24/7 się na razie nie nadaje) ale zastanawia mnie do czego jeszcze wykorzystujesz router, że dalej się męczysz? Powrót do kernela 4.4 jest jak pisał Cezary krokiem wstecz. WiFi działa jeszcze gorzej jak działało a zapis na HDD masz taki, że szkoda gadać. Coś jeszcze na routerze robisz czy męczysz go LEDE dla zasady?

Ze swojej strony gorąco polecam rozważyć zakup jakiegoś NAS bo opcja używania w tym charakterze routerka jest mocno dyskusyjna. pracujący na USB 3.0 dysk twardy tak sieje EM że zagłusza odbiór WiFi 2,4GHz  w routerze (i nie ważne jaki router).  Z tego powodu nie widzę dla tego pomysłu żadnej przyszłości.

14

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Mi tak HUB siał po 2.4. Polecam obłożyć folią aluminiową, albo wsadzić w metalową puszkę. Jak jeszcze słabo to podłączyć ekran do uziemienia.

15

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Jak już chyba pisałem, moja sieć jest najprostsza z możliwych: dwa kompy (jeden na kablu, drugi na wifi), tablet, ewentualnie komórka (choć głownie do podłączenia się do zasobów, bo net w niej mam niezależny). Wszystkie urządzenia działają na 5GHz, więc 2.4 w ogóle wyłączyłem. Na usb modem, dysk (usb2) i drukarka. Na router chce przenieść większość usług (choćby synchronizacja z chmurami), jako, że główny komp jest dość prądożerny. Mam jeszcze parę pomysłów na wykorzystanie, ale pewnie będę musiał sam coś napisać, albo przynajmniej pogrzebać w źródłach.

Na transfery z dysku nie narzekam. Zapis, rzeczywiście słaby  - 10 MB/s, ale odczyt - 30 MB/s (przy dużych plikach oczywiście, bo czasy dostępu są tragiczne) to chyba i tak górna granica usb2 (na 4.9 transfery były takie same). Ten dysk jest tylko o zasobów do których chce mieć dostęp z dowolnego urządzenia. Hint: krótkie testy wykazały, że afp (netatalk) działa dużo lepiej niż samba.

Większych problemów, jak dotąd, mi ten system nie sprawia (na 4.4, bo 4.9/4.14 - wiadomo). Jak w końcu sprawię sobie hub usb 3.0 i/lub dysk usb 3.0 - zobaczymy. Do pracy i tak mam RAIDa na dyskach wewnętrznych. NAS - fajna rzecz, ale droga (bo jeśli w to isć to tylko na 4xHDD).

16

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Kolejne podejście do rozwiązania problemu. Wygląda obiecująco. Tylko nie znam się na tyle na architekturach w OpenWrt aby stwierdzić czy poprawka trafi też do gałęzi ramips?

Qui vit sans folie, n'est pas si sage qu'on croit

17

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Tak, plik który poprawiają jest kompilowany dla mt7621.

Masz niepotrzebny router, uszkodzony czy nie - chętnie przygarnę go.

18

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Super, dzięki Cezary za rozjaśnienie. To będzie można niedługo się przekonać czy poprawka zadziała. Choć akurat u mnie już od ponad miesiąca nie było uszkodzonych plików i ruter działa "produkcyjnie" 24/7 no ale ja nie testowałem na poważniejszych transferach.

Qui vit sans folie, n'est pas si sage qu'on croit

19

Odp: Uważajcie na LEDE kernel 4.14/4.9 - hdd corruption bug!!!!

Wygląda na to, że działa!!! przekopiowany plik 12 GB po afp i jednocześnie ściągnięte dwa pliki z sieci. Wczesniej przy takiej operacji się wykładał. Potwierdza się moje przypuszczenie, że nawaliła obsługa wielowątkowości.

Dzięki za cynk. Przeoczyłem ten commit.