To, jak długo trwa kopiowanie 1,5 TB danych, zależy w dużej mierze od rodzaju danych. Jeśli masz kilka 1500 plików 1 GB, prawdopodobnie zajmie to tylko kilka godzin, ale jeśli masz półtora miliarda plików 1KB, prawdopodobnie zajmie to kilka dni.
Wynika to z dwóch sprzecznych specyfikacji na dyskach: przepustowości i średniego czasu dostępu. Tradycyjny dysk o przepustowości 100 MB / s i czasie dostępu 10 ms jest dość powszechny. Jeśli możesz przesyłać dane sekwencyjnie, możesz uzyskać 100 MB / s. Jeśli jednak musisz przeskoczyć w inne miejsce, zajmie to 10ms. Gdybyś przesyłał strumieniowo, mógłbyś zapisać 1 MB danych w czasie, który zajmuje przejście do innej lokalizacji.
Utworzenie pliku może zająć kilka prób, dlatego utworzenie pliku o wielkości 1 KB może kosztować tyle samo, co przesłanie strumieniowe kilku MB danych.
Tak więc w niektórych przypadkach lepiej jest wykonać kopię surowego dysku urządzenia blokowego niż kopiowanie w systemie plików za pomocą czegoś takiego jak rsync. Jeśli masz dużo plików, w systemie plików, który jest, powiedzmy, wypełniony w 50% lub więcej, często lepiej jest po prostu skopiować całe urządzenie blokowe za pomocą „dd”, o ile zajmie to czas. Oczywiście nie można tego zrobić, gdy system plików jest zamontowany, więc ma to również wady.
Dyski SSD mogą pomóc złagodzić ten problem, ponieważ ich czasy dostępu są około 100 razy szybsze, ale dyski SSD MLC mają skomplikowane problemy z dostępem w zależności od dostępności puli wstępnie usuniętych bloków. Dyski SSD SLC mogą w tym pomóc.
Kontrolery RAID z wbudowaną pamięcią podręczną mogą pomóc w wyszukiwaniu, podobnie jak moduł jądra flashcache, który pozwala buforować urządzenie blokowe za pośrednictwem dysku SSD.
Systemy RAID mogą umożliwiać wiele równoległych prób, skutecznie zmniejszając średni czas dostępu, a także równoległość w celu zwiększenia przepustowości. Ale ogólna wydajność często zależy od liczby zaangażowanych plików.