Muszę skopiować 20 TB danych do tablicy piorunów. Skrzynka, w której istnieją dane, nie ma połączenia z piorunem, więc będę musiał do tego wykorzystać lokalną sieć 1 GB. (Tak, to potrwa wieczność).
Próbowałem użyć Filezilla / sftp, ale zawiesił się, gdy kolejka stała się bardzo duża. Czy rsync lub scp to najlepsza droga?
data-transfer
thunderbolt
rsync
Lacinda
źródło
źródło
Odpowiedzi:
rsync to dobra droga (scp jest prawie taki sam z mniejszą liczbą funkcji). Możesz skorzystać z
-Z
opcji, która pozwoli na kompresję zlib. W zależności od prędkości dysków / komputera może to być szybsze niż wysyłanie nieskompresowanego, tj. Jeśli twoje łącze sieciowe jest nasycone. Możesz także chcieć skorzystać z opcji trybu archiwizacji,-a
która zachowa dowiązania symboliczne, uprawnienia i czasy tworzenia / modyfikacji, a także rekurencyjne kopiowanie katalogów. W zależności od tego, co kopiujesz, możesz chcieć-E
zachować atrybuty rozszerzone i rozwidlenia zasobów mac. Wreszcie--progress
pokaże informacje o postępach.źródło
Chociaż nie był tak wszechobecny jak rsync, w przeszłości użyłem wywołania narzędzia „mpscp” - http://www.sandia.gov/MPSCP/mpscp_design.htm
Sandia National Labs to narzędzie do kopiowania plików działające na SSH, które jest specjalnie zoptymalizowane do nasycania szybkich sieci między zamkniętymi systemami (takich jak kopiowanie terabajtów danych między dwoma superkomputerami w tej samej witrynie, połączonych przez 10Gb + lub Infiniband). Działa dobrze, ale jego konfiguracja może być trochę uciążliwa. W testach z łatwością zauważyłem, że działa 2x-3x szybciej niż rsync.
źródło
Użyj rsync i rozważ użycie go z rsyncd. Jeśli używasz rsync bez rsyncd, utknąłeś przy użyciu ssh, co oznacza użycie pewnego rodzaju szyfrowania. Prawdopodobnie kopiujesz dane ze starszej maszyny na nowszą maszynę, a starsza maszyna może nie mieć wbudowanego procesora do szyfrowania danych do transmisji wystarczająco szybko, aby nasycić łącze Gigabit Ethernet. Przetestuj przesyłanie partii plików przy użyciu obu metod i sprawdź, która droga jest szybsza.
Z tego samego powodu radzę przetestować użycie opcji kompresji rsync przed przystąpieniem do jej używania. Kompresja jest kolejną intensywną pracą procesora, która może nie być w stanie nadążyć za gigabitowymi prędkościami Ethernet przy próbie na starszych urządzeniach. rsync to piętnastoletni program napisany, gdy większość ludzi nawet w krajach pierwszego świata uzyskała dostęp do Internetu za pośrednictwem modemu telefonicznego. Przepustowość sieci a kompromisy procesora były wtedy znacznie różne.
źródło
-e
opcji. Za pomocą tej samej opcji możesz zmienić opcje ssh, aby używać mniej intensywnego szyfrowania procesora:-e 'ssh -c arcfour,blowfish-cbc'
lub podobnego. Nie wiem, czy ma to wpływ na szybkość w przypadku nowoczesnej maszyny, ale szybki test porównawczy może być opłacalny, szczególnie w przypadku plików o pojemności 20 TB.Czy to 20 TB jest zapakowane w niewielką liczbę dużych plików (takich jak wideo, baza potworów) czy miliony mniejszych plików?
Jeśli jest dużo małych plików, wybrałbym rsync w celu ponownego uruchomienia lub potokowy strumień tar dla wydajności (jedno połączenie sieciowe dla partii, zacznij od początku, jeśli się nie powiedzie)
folder zdalny musi być zamontowany.
Czy możesz bezpośrednio dołączyć nową tablicę z innym interfejsem? Lokalny rsync nie używa ssh, więc usuwasz ten punkt awarii. Tak, Firewire 800 jest wolniejszy niż Gigabit Ethernet, ale nie można załadować Ethernetu do 100% - może być szybszy przez Firewire. Do twojej wiadomości możesz także podłączyć firewire do sieci, jeśli pudełka są wystarczająco blisko. Dodaj interfejs w preferencjach systemowych -> sieć.
źródło
Inną opcją byłoby wypróbowanie Bittorrent Sync ( http://www.bittorrent.com/sync ). Użyłem go do synchronizacji zdjęć i filmów rodzinnych między członkami naszej rodziny w sieci WAN, ale nie ma powodu, dla którego nie będzie działać w sieci lokalnej. Korzysta z połączeń peer-to-peer, więc dane nie przechodzą przez serwer, tak jak w przypadku próby użycia czegoś takiego jak Dropbox (nie sądzę, że masz 20 TB miejsca na Dropbox lub chcesz czekać tak długo, aby przesłać tyle dane!)
Jest także obsługiwany na wielu platformach, więc ma większą elastyczność niż rsync i tar.
źródło