Czy te błędy SATA są niebezpieczne?

36

Dostaję te błędy ramdomly i nie wiem, czy to normalne, czy nie.

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

Jestem również wklejenie smartctl -ado sda , sdb i SDC .

Z góry dziękuje za twoją pomoc.

Marcos Junior
źródło

Odpowiedzi:

16

Chociaż zasadniczo zgadzam się z odpowiedzią Geppettvsa D'Constanza , sugerowałbym, że niektóre z pierwszych rzeczy, których możesz spróbować, to

  1. Sprawdzanie, czy kabel SATA jest bezpiecznie podłączony i podłączony do gniazd na płycie głównej i dysku twardym.

  2. Wymiana kabla SATA. Kable SATA są (względnie) niedrogie i czasami dostajesz „ zły ”. Często po prostu wymiana kabla jest najprostszym sposobem na zdiagnozowanie i rozwiązanie takiego problemu.

(Chociaż jest nieco nieoczekiwane, że oba kable byłyby jednocześnie złe. Mimo to łatwo jest to sprawdzić, więc moim zdaniem prawdopodobnie warto to zrobić.)

Właśnie widziałem was pastbiny zawierające dane SMART dla waszych dysków. Zwróć uwagę na nieoczekiwanie dużą liczbę błędów CRC dla napędów sdbi sdc. Radzę zacząć od sprawdzenia kabli i połączeń tych napędów.

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

DOBRZE. Więc nie jest to latpop. ;-)
Oczywiście, jeśli dzieje się to na laptopie, żadne z powyższych nie ma zastosowania i nie jestem pewien, jaką radę zaoferować. Może usunąć i ponownie zainstalować dysk twardy? Być może po prostu trzeba go ponownie umieścić w gnieździe, aby poprawić połączenie?


sbdi sdcsą podłączone tym samym zewnętrznym kablem e-sata (stacja dokująca HDalt Thermakeake Duo). wymienię kabel e-sata.

Może to być spowodowane wadliwym lub niskiej jakości kablem. Może się również zdarzyć, że kabel zostanie w jakiś sposób poruszony, zderzony lub w inny sposób przepchnięty podczas używania napędu.

irracjonalny John
źródło
1
sbdi sdcoba są podłączone tym samym zewnętrznym kablem e-sata (stacja dokująca do dysku twardego Thermaltake Duo). wymienię kabel e-sata.
Marcos Junior
9

Wygląda na to, że masz złej jakości / uszkodzony kabel SATA Power / Data. Co może powodować złe CRC. Nie są wcale szkodliwe i możesz z nimi żyć, ale wkrótce stracisz dużo danych.

Raport SMART z twoich dysków twardych wygląda rozsądnie, więc jestem z powodu problemów z zasilaniem w oparciu o moje doświadczenia z ustawieniem 5 dysków twardych w tej samej obudowie / źródle zasilania. Skończyłem używać zewnętrznego źródła zasilania (475 W) dla 2 dysków i 600 W obudowy dla wszystkich obudów, w tym GPU, dysków optycznych i dysków twardych.

W każdym razie sugeruję, abyś uruchomił pełną kopię zapasową, zanim zrobisz cokolwiek innego. Jeśli to możliwe, należy sklonować dysk twardy, po czym należy sprawdzić kable i napięcia źródła zasilania.

Geppettvs D'Constanzo
źródło
Z ciekawości, czy ta karta graficzna była dużą, cholernie wymagającą mocy kartą graficzną?
irracjonalny Jan
1
nVidia Quadro 4000, wcale nie taka głodna.
Geppettvs D'Constanzo
1
Ciekawy. Mam zasilacz Antec (Neo-Eco) o mocy 400 W, 5 dysków twardych, 2 napędy optyczne i kartę graficzną NVIDIA GeForce 9500 GT i nie sądzę, żebym miał problemy z zasilaniem. Mam błędy CRC związane z dyskiem , ale myślę, że pochodzą one od głupich błędów użytkownika, które popełniłem jakiś czas temu. (Wpadam na kabel itp.) Nie zauważyłem żadnych dzienników ostrzegawczych w komunikatach jądra . Mimo to wydaje mi się, że powinienem uważniej na to uważać, aby zachować bezpieczeństwo.
irracjonalny Jan
1
Napędy optyczne 1xIDE DVD-RW, 1xSATA DVD-RW i 1xSATA Blu-Ray ROM po tej stronie. 4 dyski twarde SATA i 1 IDE, procesor graficzny ma zużycie energii 142 W. Nie mogę powiedzieć, że jestem absolutnie pewien, że chodziło o problemy ze źródłem zasilania, ale kiedy dodałem nowe źródło zasilania, problemy zniknęły. BTW, moje dyski wydają się zdrowe. Ale dziękuję, że kazałeś mi to zobaczyć. Twoja opinia jest naprawdę doceniona w tej dziedzinie. Dziękuję Ci!
Geppettvs D'Constanzo
1
Uh, 142 waty dla GPU to ... coś. Cały mój system (zwykle) zużywa mniej niż to. Gdy piszę, moje okno na pulpicie pobiera ~ 117 watów. (Według Kill-A-Watt , o którym zapomniałem, wciąż go podłączam. ;-)
irracjonalny John
4

Wydaje się, że istnieje problem między niektórymi wersjami jądra a niektórymi kontrolerami SATA.

Niedawno zacząłem odczuwać bardzo podobny problem (nie jestem pewien, czy jest taki sam) na serwerze WWW z systemem naukowym Linux.

Najdokładniejsze i najbardziej kompletne informacje, które znalazłem na temat takiego problemu, to błąd startera .

Krótko mówiąc: wyłączenie NCQ wydaje się najlepszym rozwiązaniem dla użytkowników mających ten problem.

jap1968
źródło
3
Wyłączanie NCQ jest powszechnym obejściem błędnego sprzętu. Wygląda na to, że nie występuje błąd jądra.
psusi
Holy $ #! + To działało! Wszystkie moje komunikaty o błędach zniknęły, a mój system przestał się zawieszać! Całkowicie nie zgadzam się z żadnym błędem jądra, ponieważ mogę używać starszej wersji jądra (aż do co najmniej serii 2.6) bez żadnych awarii. Nie mogę uwierzyć, że nie znalazłem tego wcześniej!
reukiodo,
1

To prawie zawsze zły dysk, mam tysiące dysków, których używamy i chociaż te błędy nigdy nie powodują awarii dysku, powodują uszkodzenie systemu plików. Myślę, że to naprawdę ma związek z problemem z płytą kontrolera na dysku.

Próbowałem już wszystkiego, aby rozwiązać ten problem, poprawka polega na wymianie napędu i rzeczy działają na tych samych kablach i kontrolerach.

Powodzenia

użytkownik209235
źródło
Po ponad 30 latach rozwiązywania tych problemów, zapewniam cię, że z mojego doświadczenia wynika, że ​​prawie zawsze jest to podejrzany kabel. A ponieważ są tanie, spróbuj tego najpierw.
Starszy Geek
0

Wiem, że ten wątek jest stary, ale ostatnio napotkałem ten sam problem na nowo kupionej maszynie z 6 gniazdami SATA. Zainstalowałem cdrom i dysk twardy na 2 gniazdach SATA blisko siebie, a następnie przystąpiłem do instalowania Ubuntu bez błędów, dopóki nie zrestartowałem, a następnie zobaczyłem błąd łącza ata8: twardy resetowanie. Maszyna zatrzymuje się do tego momentu nigdy nie wyzdrowieje. Próbowałem kilka razy uruchomić się ponownie i to nie zadziałało. A potem próbowałem wymienić dysk twardy na jednym z 4 dostępnych gniazd i zadziałało dobrze bez żadnych problemów.

ultrajohn
źródło
Masz na myśli zmianę portu SATA, do którego podłączony był dysk twardy, prawda? Czy masz na myśli zamianę całego dysku twardego na inny? Myślę, że to pierwsza, ale po prostu podwójna kontrola
Xen2050,
To ten pierwszy.
ultrajohn
0

Miałem ten sam problem - w moim przypadku było to spowodowane niepoprawnym podłączeniem 4-pinowego zasilacza SATA.

Andrei Pokrovsky
źródło
0

Miałem ten sam problem. Próbowałem wszystkiego, ale tylko na porcie J-mikron na moim asusie p5k nie miałem błędów.

Ale kiedy podłączyłem napęd do innego zasilacza, zadziałało i błędy zniknęły. Potem przywróciłem dysk do pierwotnego źródła zasilania, ale nowe złącze zasilania również zadziałało.

Martin Van Der Meulen
źródło
0

Wiem, że ten wątek jest stary, ale właśnie napotkałem ten sam problem, przyszedł tutaj z Google.

  • uzyskiwanie ata3.01: failed command: READ FPDMA QUEUEDna bootowanie Kubuntu 16,04 livecd.
  • WINDOWS 7 będzie się zachowywał niepoprawnie, działa przez chwilę ok, ale zawiesza się po obejrzeniu youtube.

Wymiana kabla SATA nic nie zrobiła.
Wymieniłem zasilacz i problem zniknął.

marco_roboto
źródło
0

Ten błąd prawdopodobnie nie uszkodzi dysku twardego, ale bardzo prawdopodobne jest uszkodzenie systemu plików. Rozpocznij od ustalenia, który dysk generuje błędy. Zwykle można to łatwo ustalić za pomocą szeregu podejść, takich jak:

1) Wydanie polecenia dmesg | grep ata3i poszukiwanie marki i modelu dysku twardego. (ponieważ ata3 to port zgłaszający błąd w twojej sytuacji. Dostosuj odpowiednio), to zapewni dane wyjściowe podobne do tego:

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

Szybki rzut oka wskazuje, że napęd podłączony do ata3 to SAMSUNG HD103SJ

2) Wydaj poniższe polecenie:

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

Zapewni to nazwy portów i urządzeń podświetlonych w tym samym wierszu, jak pokazano poniżej:

wydajność

Łatwo zauważyć, że urządzeniu podłączonemu do ata3 przypisano nazwę urządzenia sdb

3) zainstaluj lsscsi sudo apt install lsscsii wydaj polecenielsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

Zauważ, że pierwszym wpisem w każdej linii powyżej jest scsi_host, kanał, numer_celu i LUN. Jest umieszczony w nawiasach, a każdy element jest oddzielony dwukropkiem. W przypadku wielu urządzeń SCSI ich wpisy są sortowane w porządku rosnącym.

Po prostu dodanie 1 do pierwszej liczby w każdym wierszu wyniku daje port ATA. Możesz znaleźć więcej szczegółów lsscsi tutaj i tutaj.

Ponieważ w twoim przypadku widzimy błędy zgłaszane zarówno na 3.00, jak i 3.01, masz więcej niż jeden dysk podłączony do tego samego portu ATA. Będziesz chciał dokładnie sprawdzić łączność zarówno z ata3.00, jak i ata3.01. Może to być obudowa z wieloma wnękami podłączona do tego samego kabla. Ponieważ oba napędy zgłaszają błędy, wymiana kabla do wyżej wymienionej wnęki na wiele napędów powinna wyeliminować problem dla obu napędów. Urządzenia te zwykle mają zewnętrzne źródło zasilania, które może być również winowajcą i należy je wymienić, ale kabel (będący najsłabszym ogniwem) jest zdecydowanie najbardziej prawdopodobną przyczyną problemu.

Źródła:

Doświadczenie

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

Starszy Geek
źródło