Rozmiar dysku jest różny - MooseFs

1

Mam 4 porcje moosefs z 8 2,7 TB miejsca na każdym, montuję je za pomocą mfsmount, a następnie eksportuję za pomocą nfs. Niedawno zauważyłem wysoki poziom iowait na moich porcjach, a następnie ogromne spadki wielkości montażu, patrz wykresy. wprowadź opis zdjęcia tutaj

Edik Mkoyan
źródło
jakiej wersji MooseFS używasz? Dlaczego ponownie udostępniasz MFS przez NFS? Czy naprawdę tego potrzebujesz? Twoje wykresy są bardzo skompresowane, trudno zobaczyć cokolwiek w legendzie. Czy możesz zamieścić większy obraz?
tlenek94

Odpowiedzi:

1

Przyczyną tego problemu była pamięć RAM na serwerze mfs, zaczął używać 50% wymiany, kiedy zwiększyłem pamięć RAM, wszystko zaczęło działać zgodnie z oczekiwaniami, ale nadal istnieje duża iowait na serwerze porcji, myślę, że powinniśmy się przenieść Jod do jakiegoś nalotu.

Edik Mkoyan
źródło
1

O stronie JBOD moosefs.com napisano w następujący sposób (w „Najlepsze praktyki”): ( https://moosefs.com/documentation/best-practices.html#jbod )

JBOD i XFS dla Chunkservers

Zalecamy połączenie z JBOD Chunkserver (s). Po prostu sformatuj dysk jako XFS i podłącz np. /mnt/chunk01, /mnt/chunk02, ...I włóż te ścieżki /etc/mfs/mfschunkserver.cfg. To wszystko.

Zalecamy taką konfigurację głównie z dwóch powodów:

MooseFS ma mechanizm sprawdzania, czy dysk twardy jest w dobrym stanie, czy nie. MooseFS może wykrywać uszkodzone dyski, replikować dane i oznaczać takie dyski jako uszkodzone. W przypadku macierzy RAID sytuacja wygląda inaczej: algorytmy MooseFS nie działają z macierzami RAID, dlatego uszkodzone macierze RAID mogą być fałszywie zgłaszane jako zdrowe / prawidłowe.

Drugim aspektem jest czas replikacji. Załóżmy, że masz ustawiony cel na 2 dla całej instancji MooseFS. Jeśli jeden dysk 2 TiB ulegnie awarii, replikacja (z innej kopii) potrwa około 40–60 minut. Jeśli jedna duża macierz RAID (np. 36 TiB) ulegnie uszkodzeniu, replikacja może trwać nawet przez 12-18 godzin. Do czasu zakończenia procesu replikacji niektóre dane są zagrożone, ponieważ masz tylko jedną prawidłową kopię. Jeśli inny dysk lub macierz RAID ulegnie awarii w tym czasie, niektóre dane mogą zostać nieodwracalnie utracone. Dłuższy okres replikacji naraża Twoje dane na większe niebezpieczeństwo.

tlenek94
źródło