Automatyczna resynchronizacja RAID?

11

Raczej losowo sprawdziłem stan moich macierzy RAID cat/proc/mdstati zdałem sobie sprawę, że jedna z moich macierzy wydaje się resynchronizować:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

Dlaczego tak jest i co to oznacza? Najwyraźniej mogę uzyskać dostęp do punktu montowania w porządku z r/wuprawnieniami.

EDYCJA 1 (w odpowiedzi na ODPOWIEDŹ SLM )

Naprawdę nic nie widzę, jeśli grepprzejdę, dmesga --detailprzełącznik też niewiele mi mówi, tj. Pokazuje, że resynchronizacja jest w toku ... ale nie ma żadnej wskazówki z tego powodu lub dlaczego nie mogła zostać zsynchronizowana ... - Chyba potrzebuję mieć to na oku, zanim zacznę wymieniać sprzęt.

stdcerr
źródło

Odpowiedzi:

10

Wydaje się to wskazywać, że synchronizacja między dwoma członkami RAID nie pozostaje ze sobą w synchronizacji.

1. Sprawdź dzienniki

Sprawdzę twoje dmesgdzienniki i sprawdzę, czy są jakieś komunikaty informujące, że któryś z fizycznych dysków twardych tworzących tę macierz ma awarie sprzętowe.

2. Sprawdź mdadm

Możesz także skorzystać mdadmz --detailprzełącznika, aby uzyskać więcej informacji na temat ponownej synchronizacji:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Jeśli oba urządzenia wydają się w porządku i nie możesz wskazać, które urządzenie ma problem, możesz tymczasowo uruchomić narzędzie diagnostyczne, takie jak HDAT2 lub SpinRite na każdym dysku twardym, aby potwierdzić ich stan.

3. Okablowanie

Jeśli dyski twarde się sprawdzą, zacznę analizować okablowanie, zwykle wymieniam je.

4. Kontroler

Następnie przyjrzałbym się samemu kontrolerowi, albo usuwając dyski z systemu, którego dotyczy problem, i diagnozowałem je w systemie dodatkowym, albo dodawałem kartę kontrolera innej firmy do systemu, którego dotyczy problem, aby dalej diagnozować problem.

5. Zasilacz

Wierzcie lub nie, w przeszłości miałem problemy z dyskami twardymi i macierzami RAID, w których zamiana zasilacza powodującego awarię lub zbliżająca się do awarii rozwiązała problemy ze zdrowiem macierzy RAID.

slm
źródło
@ cerr - tak, jeśli ponowna synchronizacja odbywa się w przypadkowych odstępach czasu, prawdopodobnie jeden z dysków twardych jest w drodze wyjścia, czyli 3,4 lub 5. Opisana przez ciebie manifestacja kilka razy ja i to były sytuacje, które rozwiązały te niepowodzenia w przeszłości.
slm
8

Sprawdź swoje pliki cron, wiele dystrybucji wykonuje zaplanowaną ponowną synchronizację / ponowną kontrolę raz w tygodniu.

W CentOS 7.1 znajduje się w /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Aby skonfigurować zachowanie, edytuj / etc / sysconfig / raid-check

Sergio
źródło
Chociaż zwykle jest to tylko czek, a nie
ponowna
2
@frostschutz ... chyba że jest to pierwsza niedziela miesiąca: serverfault.com/a/255549/299551 W takim przypadku wymuszona jest resynchronizacja.
Dan
2

W Debianie odbywa się to z:

/etc/cron.d/mdadm

Wyłączyć:

chmod -x /usr/share/mdadm/checkarray

Zobacz też.

sanmai
źródło