Jak mogę zduplikować moje dane za pomocą BTRFS?

15

Zainstalowałem Lubuntu 15.04 na moim EEE PC 701 z systemem plików BTRFS. Chcę zduplikować moje dane, ale nie wiem jak.

wb9688
źródło

Odpowiedzi:

14

Zacznij od wykonania pełnej kopii zapasowej, aby w razie awarii nic nie stracić.

Wierzę, że szukasz duperemove -d

„Duperemove to proste narzędzie do znajdowania zduplikowanych zakresów i przesyłania ich do deduplikacji. Po otrzymaniu listy plików będzie mieszać ich zawartość blok po bloku i porównywać te skróty ze sobą, znajdując i kategoryzując pasujące do siebie zakresy. Gdy podano opcję -d, duperemove prześle te zakresy do deduplikacji za pomocą bocfs-scope-same ioctl.

Duperemove ma dwa główne tryby działania, z których jeden jest podzbiorem drugiego.

Tryb tylko do odczytu / bez deduplikacji

Po uruchomieniu bez -d (domyślnie) duperemove wydrukuje jedną lub więcej tabel pasujących zakresów, które według niego będą idealnymi kandydatami do deduplikacji. W rezultacie tryb tylko do odczytu jest przydatny, aby zobaczyć, co może zrobić duperemove, gdy zostanie uruchomiony z opcją -d. Dane wyjściowe mogą być również wykorzystane przez inne oprogramowanie do przesłania zakresu do deduplikacji w późniejszym czasie.

Należy zauważyć, że ten tryb nie drukuje wszystkich wystąpień pasujących zakresów, tylko te, które wziąłby pod uwagę przy deduplikacji.

Zasadniczo duperemove nie zajmuje się podstawową reprezentacją zakresów, które przetwarza. Niektóre z nich mogą być skompresowane, przechodzą operacje we / wy, a nawet zostały już zduplikowane. W trybie dedupe jądro obsługuje te szczegóły i dlatego staramy się nie powielać tej pracy.

Tryb Deduping

Działa to podobnie do trybu tylko do odczytu, z tym wyjątkiem, że zduplikowane zakresy znalezione w kroku „czytaj, mieszaj i porównuj” zostaną faktycznie przesłane do deduplikacji. Szacunkowa liczba wszystkich deduplikowanych danych zostanie wydrukowana po zakończeniu operacji. Oszacowanie to jest obliczane poprzez porównanie całkowitej liczby bajtów współdzielonych w każdym pliku przed i po deduplikacji.

Zobacz stronę podręcznika duperemove, aby uzyskać dodatkowe informacje na temat uruchamiania duperemove. ”

wydaje się, że nie pojawia się to w pakiecie btrfs-tools, ale dostępna jest tutaj strona git hub . Najnowsze otwarte i zamknięte problemy (znane również jako puls) dostępne tutaj.

Pakiety dla wszystkich obecnie obsługiwanych wersji Ubuntu można znaleźć w tym PPA

Muszę powtórzyć, że tworzenie kopii zapasowych jest wysoce zalecane . Zobacz: https://github.com/markfasheh/duperemove/issues/50

Cytowane źródło: https://github.com/markfasheh/duperemove

strona podręcznika : https://manpages.debian.org/testing/duperemove/duperemove.8.en.html

Starszy Geek
źródło
Kiedy wpisuję duperemove -d, dostaję stronę pomocy
wb9688
1
Co otrzymujesz po wpisaniu „man duperemove”? Uważam, że musisz wyznaczyć pliki, aby je uruchomić. jak wduperemove [options] files...
Starszy Geek
/ me właśnie wczoraj zostały wykorzystane - FTR, polecenie to duperemove -rdh path1 path2 pathn, gdzie -rrekurencyjnej, -daby rzeczywiście deduplikuj i -hnumerów czytelnych dla człowieka.
Cześć Anioł
@ Hi-Angel zaktualizowana odpowiedź - dodano link do strony man
Elder Geek
3

Zawsze korzystałem z łóżka . Jest bardzo szybki i niezawodny. To narzędzie jest również wspomniane na oficjalnej stronie btrfs . Nigdy nie korzystałem z duperemove (bedup jest starszy).

Adam Ryczkowski
źródło
2
W tym momencie bedup nie jest już aktywnie rozwijany i jest bardzo nieaktualny.
Perkins
3
@Perkins Nie zgadzam się. Właśnie otrzymałem opinię na temat problemu, który opublikowałem dzisiaj github.com/g2p/bedup/issues/75 i dzięki tej pomocy po prostu „wyłożyłem” ponad 7 GB miejsca na nowym serwerze 16.04.
Adam Ryczkowski
3
Może wtedy ktoś go podniósł. Zrezygnowałem z niego po około roku, ponieważ nie był w stanie nawet właściwie skanować w poszukiwaniu duplikatów. To powiedziawszy, o ile nie zaktualizują go, aby używać nowego ioctl, duperemove będzie bezpieczniejszy, ponieważ deduplikacja atomowo w przestrzeni jądra zamiast nukania jednego z duplikatów i tworzenia kopii z odnośnikiem drugiego. Ale wtedy bedup faktycznie sprawi, że pliki będą wystarczająco małe, aby mogły być przechowywane w drzewie, czego duperemove obecnie nie może z powodu braku obsługi jądra.
Perkins