Jak często powinienem szorować moją macierz RAID?

13

Ogólnie chciałbym wiedzieć, jak często macierz RAID wymaga szorowania. Co przyczynia się do potrzeby częstszego szorowania (odczytywanie danych?, Zapisywanie danych ?, nieoczekiwane wyłączenia ?, wiek dysku ?, rozmiar dysku ?, liczba użytkowników? Itd.)?

Czytałem tutaj wiki Arch i wszystko, co naprawdę mówi, to to, że szorowanie powinno odbywać się regularnie. Zastanawiałem się, jak regularnie wystarczy. Oczywiście to by zależało, ale jaki jest rozsądny zasięg? Rocznie? Miesięczny? Co tydzień? Codziennie? Wielkie dzięki za wszelkie informacje.

mrfred
źródło
1
Jak duża jest twoja tablica? Jak długo trwa szorowanie twojej tablicy? Większe tablice mogą zająć całe godziny lub dni. Oczywiście nie można szorować częściej niż zajmuje to jedno szorowanie. Pakiet Debian zawiera skrypt cron, który uruchamia się w pierwszą niedzielę każdego miesiąca.
Zoredache
Zależy od tego, jak jest brudny :)
metacom
@Zoredache: To jest dokładnie to, czego szukałem. Ponieważ większe tablice zajmują więcej czasu, czy zmniejszyłoby to częstotliwość, którą powinieneś szorować? Czy zwiększenie liczby użytkowników zwiększyłoby tę częstotliwość? Czy musisz szorować, jeśli tak naprawdę nie piszesz zbyt dużo nowych danych?
mrfred
Oprogramowanie RAID? Sprzętowa macierz RAID? ZFS?
ewwhite

Odpowiedzi:

15

Częstotliwość skanowania zależy od wielu rzeczy.

  • Wiek dysków. Im są starsi, tym bardziej prawdopodobne jest, że powstrzymają zło .
  • Oryginalna jakość danych dysków. Rzeczy sprzedawane jako „korporacyjne” najprawdopodobniej przetrwają bezbłędnie, a dyski o rozmiarze 1 + TB z 2014 r. Są znacznie bardziej niezawodne niż ich odpowiedniki z 2009 r., Kiedy były wysyłane.
  • Jak wrażliwy jest proces produkcji we / wy na operacje we / wy szorowania.
  • Jaką część zestawu danych uważasz za zestaw roboczy.

Z tego właśnie powodu dostawcy sprzętowych macierzy RAID często wykorzystują proces czyszczenia w tle, niektórzy nawet pozwalają dostroić priorytet operacji we / wy procesu czyszczenia, co pozwala uniknąć (lub znacznie zmniejszyć) karę produkcyjną we / wy za czyszczenie. Oczywiście, jeśli twój priorytet jest niski, a twoje produkcyjne We / Wy uruchamiają dyski w większości płaskie, prawdopodobnie nigdy nie dokończysz szorowania i nawet go nie zauważysz, dopóki nie wystąpi awaria.

Niestety nie wiem, czy jądro Linuksa zmienia priorytety operacji szorowania we / wy, czy nie. Tak czy inaczej, dobrym pomysłem jest przetestowanie go z mnóstwem produktów, aby upewnić się, że wszelkie trafienia w wydajność są dopuszczalne. Jeśli jest to do przyjęcia, dobrze! Jeśli tak nie jest, musisz zdecydować, czy dodać wrzeciona, aby umożliwić szorowanie + prod I / O, czy po prostu zaakceptować ryzyko możliwych awarii tablicy na drodze.

Kolejną rzeczą, która wpływa na częstotliwość szorowania, jest wzorzec użycia We / Wy. Jeśli obciążenia produkcyjne uderzą tylko w niewielką część dysków, jedynym wejściem / wyjściem, które normalnie znajdowałyby zły blok w części bezczynnej, byłby twój peeling; w takim przypadku chcesz częściej szorować. Jeśli twoje obciążenia produkcyjne rutynowo odczytują cały zestaw dysków (np. Codzienne pełne kopie zapasowe), wtedy produkcyjne operacje wejścia / wyjścia natkną się na problemy wcześniej i będziesz mógł rzadziej szorować.

Dobrym planem działania byłoby:

  1. Przeprowadź kilka testów, aby sprawdzić, czy szorowanie przeszkodzi w produkcji.
    1. Dowiedz się, ile czasu zajmuje pełny peeling, gdy jesteś przy nim.
  2. Sprawdź, jaki procent zestawu dysków uzyska wiele dostępów w danym tygodniu (w tym obliczeniu uwzględnij zapasowe operacje we / wy, jeśli takie istnieją).
  3. Na podstawie 1 i 2 zdecyduj, czy jesteś w rzadziej, czy częściej w obozie.

Po uzyskaniu tych danych ...

  • Jeśli pełny skan zajmuje niecały dzień i nie ma zauważalnego wpływu na produkcję, możesz iść tak często, jak raz w tygodniu.
  • Jeśli pełny skan zajmuje niecały dzień i wpływa na produkcję, dowiedz się, która część tygodnia / miesiąca jest najmniej dotknięta, i spróbuj go uruchomić.
  • Jeśli pełne skanowanie zajmuje dzień, ale krócej niż tydzień i nie wpływa na produkcję, uruchamiaj je tak często, jak co drugi tydzień lub raz na dwa miesiące.
  • Jeśli pełne skanowanie zajmuje dzień, ale krócej niż tydzień i ma wpływ na produkcję, rozważ dodanie zasobów, aby umożliwić jego uruchomienie, wymagaj uruchomienia skanów podczas ustalonych okien konserwacji lub skorzystaj z możliwości bezczynności / sprawdzania czyszczenia pasuje i zaczyna się bez przerwy.
  • Jeśli pełne skanowanie zajmuje tydzień, często wystarczy raz w miesiącu. Ale jeśli wpływa to na produkcję, musisz dodać zasoby, aby umożliwić jej ukończenie.
sysadmin1138
źródło