Zarządzanie cyklami ponownego uczenia się baterii w LSI i podobnych kontrolerach RAID

12

Jak inżynierowie radzą sobie z cyklami „ponownego uczenia się” kontrolera RAID?

Jak zauważono w: Co to jest „ponowna nauka baterii” w LSI MegaRaid? , cykl ponownego uczenia się rozładowuje baterię kontrolera RAID (BBWC lub BBU), usuwając w ten sposób przyspieszenie pamięci podręcznej zapisu. Żywotność baterii jest sprawdzana, a po naładowaniu pamięć podręczna zapisu zostaje ponownie włączona. Ma to oczywisty wpływ na wydajność I / O serwera na czas cyklu ponownego uczenia się. Myślę, że dzieje się to co miesiąc.

Zauważono spadek wydajności, szczególnie w systemach baz danych:

Wolna baza danych? Sprawdź baterię RAID!

Dowiedz się więcej o swojej baterii

Moje doświadczenie pochodzi z serwerów HP ProLiant, których kontrolery Smart Array nie przechodzą tego ćwiczenia ( lub przynajmniej mają bardziej proaktywne monitorowanie żywotności baterii ). To wydaje się być okropną funkcją ( maksymalna niedogodność, niewielki zysk ), ale jestem w środowisku z wieloma kontrolerami LSI (na sprzęcie Supermicro ) i chciałbym sprawdzić, czy do odpowiednich systemów można zastosować ogólne zasady.

  • Jaki jest domyślny harmonogram cyklu ponownego uczenia się na kontrolerze LSI?
  • Czy te cykle uczenia się są przydatne?
  • Czy tę funkcję należy wyłączyć?
  • Jeśli zdecydujesz się pozostawić tę funkcję włączoną w swoim środowisku, jak poradzisz sobie z planowaniem? Czy planujesz to ręcznie czy zezwalasz kontrolerowi na ustawienie własnego harmonogramu?
  • Czy dotyczy to kontrolerów Dell Perc w ten sam sposób? ( LSI to OEM )
ewwhite
źródło
Nie mogę rozmawiać z resztą pytania, ale PERC ponownie się uczą.
MDMarra,
Nowsze kontrolery LSI powinny mieć opcję „przezroczystego uczenia się”. W praktyce (na sprzęcie Dell C) nie widziałem tej pracy.
toppledwagon,

Odpowiedzi:

13

Niedawno przeczytałem artykuł jednego z inżynierów Godaddy na ten właśnie temat: Nauka radzenia sobie z uczeniem się

Na ich sprzęcie (karty Dell PERC) cykl uczenia się baterii odbywa się co 90 dni, ale nie ma sposobu, aby wiedzieć, kiedy dokładnie to nastąpi, tj. W godzinach szczytu lub poza godzinami szczytu.

Rozmawiali o różnych rozwiązaniach:

  • Całkowicie wyłącz uczenie się baterii. Problem z tą opcją polega na tym, że nie wiesz, jaki jest stan baterii, jak długo i ile może ona utrzymywać ładunek, więc w przypadku awarii możesz ryzykować utratę danych.

  • Użyj innego sprzętu. Niektóre kontrolery mają 2 baterie i przełączają się między nimi podczas takich cykli uczenia. Ponadto istnieją kontrolery RAID (takie jak Dell H710), które nie potrzebują baterii, ale zamiast tego używają nieulotnej pamięci NVRAM do przechowywania nieprzydzielonych danych.

  • Wymuś zapisywanie (buforowanie) niezależnie od stanu baterii. Podobnie jak w przypadku pierwszego rozwiązania, ryzykujesz utratę danych.

Ostatecznie ustawiają crony na godziny poza szczytem, ​​które monitorują następny cykl uczenia się, a jeśli nastąpi to w ciągu najbliższych 24 godzin, zmuszają to do natychmiastowego działania. W ten sposób zachowują korzyści płynące z używania akumulatorów bez uruchamiania ich w szczytowym czasie użytkowania.

Mxx
źródło