Dlaczego systemy plików ext nie wypełniają całego urządzenia?

8

Właśnie zauważyłem, że żaden z systemów plików {2,3,4}, które próbuję utworzyć na dysku 500G, nie używa całej dostępnej przestrzeni (466G). Próbowałem także reiser3, xfs, jfs, btrfs, a nawet vfat. Wszystkie tworzą fs o rozmiarze 466G (jak pokazano na df -h ). Jednak ext * tworzy fs z 459G. Wyłączenie zarezerwowanych bloków zwiększa przestrzeń dostępną dla użytkownika, ale rozmiar fs nadal wynosi 459G.

To samo dotyczy HDD 1 TB: reiserfs 932G, 917G ext4.

Co to za różnica 1,5%? Dlaczego tak się dzieje i czy istnieje sposób na wypełnienie całego tomu ext?

UPD: Wszystkie testy wykonywane na tej samej maszynie, na tym samym dysku twardym itp. Nie ma znaczenia, w jaki sposób 466G różni się od marketingu 500G. Problem polega na tym, że różni się dla różnych FS ”.

O df - pokazuje całkowity rozmiar FS, używany rozmiar i wolne miejsce. W tym przypadku mam:

dla reiserfs:

/ dev / sda1 466G 33M 466G 1% / mnt

dla ext4:

/ dev / sda1 459G 198M 435G 1% / mnt

Jeśli wyłączę rezerwację bloków root, 435G zmieni się na 459G - pełny rozmiar fs (minus 198M). Ale fs to wciąż 459G dla ext4 i 466G dla reisera!

UPD2: Wypełnianie woluminów rzeczywistymi danymi przez dd:

reiserfs:

fs:~# dd if=/dev/zero of=/mnt/1
dd: запись в «/mnt/1»: На устройстве кончилось место
975702649+0 записей считано
975702648+0 записей написано
 скопировано 499559755776 байт (500 GB), 8705,61 c, 57,4 MB/c

ext2 z wyłączoną rezerwacją bloków (mke2fs -m 0):

fs:~# dd if=/dev/zero of=/mnt/1
dd: запись в «/mnt/1»: На устройстве кончилось место
960356153+0 записей считано
960356152+0 записей написано
 скопировано 491702349824 байта (492 GB), 8870,01 c, 55,4 MB/c

Przepraszam za rosyjski, ale uruchomiłem go w domyślnych ustawieniach regionalnych i powtarzanie go jest za długie. Nie ma znaczenia, wyjście dd jest oczywiste.

Okazuje się więc, że mke2fs naprawdę tworzy mniejszy system plików niż inne mkfs.

Ineu
źródło
2
Z każdym FS jest pewna ilość narzutu ... Nie wiem, który z nich pozwoli ci uzyskać dostęp do całej dostępnej przestrzeni fizycznej na dysku.
prodigitalson
Zalecam zmianę nazwy wyświetlanej i umieszczenie tego, co wydaje się być Twoim blogiem w polu witryny swojego profilu, aby uczynić go mniej rażącym.
Hello71
1
Witaj71, dzięki za radę. Strona nie ma znaczenia, jest tylko dla openida.
Ineu
Uwaga: jeśli szybko chcesz, aby program wyświetlał w języku angielskim, użyj LANG=C foo lub LC_ALL=C foo
Alan Pearce
Alan, racja, dziękuję. Może to być nawet LANG = lub LANG = POSIX. Ale, jak już powiedziałem, proces ten zajmuje dużo czasu, więc ponowne uruchomienie go z różnymi ustawieniami lokalnymi tylko dla kilku linii jest nierozsądne :) W obu przypadkach okazuje się problem z rozmiarem FS dla ext2 :(
Ineu

Odpowiedzi:

19

Istnieją dwa powody, dla których to prawda.

Po pierwsze, z jakiegoś powodu lub innego twórcy systemu operacyjnego nadal zgłaszają wolne miejsce w systemie bazowym 2, a producenci dysków twardych zgłaszają wolne miejsce w systemie bazowym 10. Na przykład pisarz systemu operacyjnego wywoła 1024 bajty (2 ^ 10 bajtów) na kilobajt, a produkcja dysków twardych wywoła 1000 bajtów na kilobajt. Ta różnica jest dość niewielka w przypadku kilobajtów, ale po osiągnięciu terabajtów jest to dość znaczące. Twórca systemu operacyjnego wywoła 1099511627776 bajtów (2 ^ 40 bajtów) terabajt, a producent dysku twardego wywoła 1000000000000 bajtów na terabajt.

Te dwa różne sposoby mówienia o rozmiarach często powodują wiele zamieszania.

Istnieje spottily obsługiwane Prefiks ISO dla wielkości binarnych . Interfejsy użytkownika zaprojektowane z myślą o nowym prefiksie będą pokazywać TiB, GiB (lub bardziej ogólnie XiB) podczas wyświetlania rozmiarów z systemem prefiksów bazowych 2.

Po drugie, df -h informuje, ile miejsca jest dostępne do użycia. Wszystkie systemy plików muszą zapisywać informacje porządkowe, aby śledzić rzeczy dla ciebie. Te informacje zajmują część miejsca na dysku. Na ogół nie bardzo, ale niektóre. To również tłumaczy część widocznych strat.

Po edycji posta, aby było jasne, że żadna z moich odpowiedzi nie odpowiada na twoje pytanie, spróbuję odpowiedzieć na twoje pytanie ...

Różne systemy plików wykorzystują różne ilości miejsca na informacje dotyczące sprzątania i zgłaszają wykorzystanie przestrzeni na różne sposoby.

Na przykład ext2 dzieli dysk na grupy cylindrów. Następnie wstępnie przydziela przestrzeń w każdej grupie cylindrów dla i-węzłów i map wolnej przestrzeni. ext3 robi to samo, ponieważ zasadniczo jest to księgowanie ext2 +. A ext4 robi dokładnie to samo, ponieważ jest to dość prosta (i prawie wstecznie kompatybilna) modyfikacja ext3. Ponieważ ten narzut meta-danych jest naprawiony podczas tworzenia systemu plików lub zmiany rozmiaru, nie jest on zgłaszany jako przestrzeń „używana”. Podejrzewam, że dzieje się tak również dlatego, że metadane grupy cylindrów znajdują się w ustalonych miejscach na dysku, a więc jest po prostu implikowane jako używane, a zatem nie jest oznaczone ani uwzględnione w mapach wolnej przestrzeni.

Ale reiserfs nie przydziela wstępnie żadnych metadanych. Nie ma limitu i-węzła, który jest ustalony na tworzenie systemu plików, ponieważ przydziela wszystkie jego i-węzły w locie, tak jak w przypadku bloków danych. Co najwyżej potrzebuje pewnych struktur opisujących katalog główny i pewnego rodzaju wolną mapę przestrzeni. Używa więc znacznie mniej miejsca, gdy nie ma w nim nic.

Oznacza to jednak, że podczas dodawania plików reiserfs zajmie więcej miejsca, ponieważ będzie przydzielać metadane (jak i-węzły), jak również rzeczywistą przestrzeń danych dla pliku.

Nie wiem dokładnie, jak jfs i btrfs śledzą wykorzystanie przestrzeni danych metadanych. Ale podejrzewam, że śledzą to bardziej, jak robi to reiserfs. vfat w szczególności nie ma żadnej koncepcji i-węzła. Jego mapa wolnej przestrzeni (której rozmiar jest ustalany w tworzonym systemie plików (niesławna tabela FAT)) przechowuje wiele danych, które miałby i-węzeł, a wpis katalogu (który jest dynamicznie przydzielany) przechowuje resztę.

Omnifarious
źródło
2
Istnieje norma ISO dla tego: en.wikipedia.org/wiki/Binary_prefix
Bobby
@Bobby - Tak, i zaczęło się pojawiać na wyświetlaczach. Dodam to do mojej odpowiedzi. Dzięki!
Omnifarious
8

Oprócz zagadnień, o których wspomina Omnifarious, z ext2 / 3/4 zarezerwowana jest pewna ilość miejsca dla roota - ta zarezerwowana przestrzeń nie pojawia się na wyjściu df.

Na przykład utworzenie małego systemu plików (~ 100mb) z domyślnymi opcjami, używając ext2 zamiast 3 lub 4, aby zignorować przestrzeń, która w innym przypadku byłaby zajęta przez dziennik:

swann:/tmp# dd if=/dev/zero of=./loop.fs bs=10240 count=10240
swann:/tmp# mkfs.ext2 loop.fs
swann:/tmp# mkdir loop
swann:/tmp# mount -text2 -oloop loop.fs loop
swann:/tmp# df loop
Filesystem           1K-blocks      Used Available Use% Mounted on
/tmp/loop.fs             99150      1550     92480   2% /tmp/loop

Dostosowywanie opcji zarezerwowanych bloków ( tune2fs jest -m opcja ustawia zarezerwowane bloki w procentach, a -r opcja ustawia zarezerwowane bloki jako prostą liczbę bloków):

swann:/tmp# umount loop
swann:/tmp# tune2fs -m 25 loop.fs
swann:/tmp# mount -text2 -oloop loop.fs loop
swann:/tmp# df loop
Filesystem           1K-blocks      Used Available Use% Mounted on
/tmp/loop.fs             99150      1550     72000   3% /tmp/loop

swann:/tmp# umount loop
swann:/tmp# tune2fs -m 0 loop.fs
swann:/tmp# mount -text2 -oloop loop.fs loop
swann:/tmp# df loop
Filesystem           1K-blocks      Used Available Use% Mounted on
/tmp/loop.fs             99150      1550     97600   2% /tmp/loop

Jak widać w powyższym przykładzie, nawet po zalogowaniu się jako root df nie pokazuje zarezerwowanego miejsca w liczbie „Dostępne”. Zarezerwowane miejsce nie jest wyświetlane w liczbie „Używane”, niezależnie od tego, czy jest zalogowany jako użytkownik root, czy mniej uprzywilejowany. Może to czasami powodować zamieszanie, gdy system plików jest prawie pełny, jeśli nie spodziewasz się tych dwóch faktów.

Zwróć również uwagę na to tune2fs, pomimo swojej nazwy, jest odpowiedni dla systemów plików ext3 i ext4, jak również dla systemów ext2.

David Spillett
źródło
Dziękuję za odpowiedź. Nie, nie chodzi o zarezerwowane bloki. Zaktualizowane pytanie.
Ineu
0

O różnicy między systemami plików, różne systemy plików organizują bloki różnie i potrzebują więcej lub mniej danych do identyfikacji i śledzenia bloków. Rozmiar bloku również ma znaczenie, ponieważ jeśli masz więcej lub mniej bloków na to samo miejsce, masz mniej lub więcej „zagubionej” przestrzeni. Ponadto, bloki grup systemów plików, aby uniknąć fragmentacji plików, a każdy klaster bloków ma identyfikator o pewnym rozmiarze, więc mniej lub więcej klastrów bloków będzie używać innego fizycznego miejsca na dysku. Różnica polega na tym, jak system plików organizuje przestrzeń fizyczną.

Tutaj jest opis dla ext2 i prawdopodobnie znajdziesz coś podobnego dla reiserfs, ale nigdy go nie użyłem, więc go nie mam.

laurent
źródło
2
Reiserfs i btrfs są niezwykłe, ponieważ prawie wszystkie informacje księgowe są przydzielane dynamicznie. Tylko konfiguracje superbloków i bitmapy wolnej przestrzeni są przydzielane podczas konfiguracji systemu plików. Oczywiście oznacza to, że rzeczywista ilość dostępnej przestrzeni dla danych jest mniej deterministyczna dla tych systemów plików.
Omnifarious
@Omnifarious +1 - Więc jeśli dobrze rozumiem reiserfs i btrfs, dostępne miejsce na początku jest większe na początku, ale będzie używane zarówno z danymi, jak i informacjami księgowymi, a nie tylko danymi, prawda?
laurent
@ laurent-rpnet - Tak, to prawda. W przypadku btrfs jest to jeszcze bardziej interesujące. btrfs może zaimplementować RAID na podstawie pojedynczych plików, więc raportowanie dostępnej wolnej przestrzeni jest jeszcze trudniejsze do przypięcia, ponieważ nie może po prostu założyć, że na blok będzie wykorzystywana pewna ilość dodatkowej przestrzeni dla danych. Dodatkowo pozwala na bardzo tanie kopie oparte na COW, więc zapisanie bloku w środku istniejącego pliku może przydzielić miejsce.
Omnifarious
A co z XFS, JFS i VFAT? Trudno uwierzyć, że takie prymitywne fs jak FAT32 są bardziej dynamiczne niż ext4.
Ineu
FAT32 ma również bloki zarezerwowane dla organizacji. Jakie jest znaczenie dynamiki? Jeśli alokacja dynamyc, FAT32 nie ma alokacji dynamicznej, jak ext, a także nie pokazuje wszystkich bloków na dysku dostępnych dla danych. Ma także pewne ograniczenia. System plików ext4 nie ma żadnego systemu uprawnień, podczas gdy ext4 ma uprawnienia POSIX, a listy ACL i maksymalny rozmiar pliku to 4 GB na FAT32 i 2 TB na ext3 (nie jest pewien co do ext4, ale powinien być przynajmniej taki sam).
laurent