Synchronizuj z listą katalogów serwera WWW

14

Czy istnieje prosty sposób na synchronizację folderu z listą katalogów przez HTTP?

Edytuj :

Dzięki za wskazówkę z wget! Utworzyłem skrypt powłoki i dodałem go jako zadanie cron:

remote_dirs=( "http://example.com/" "…") # Add your remote HTTP directories here
local_dirs=(  "~/examplecom" "…")

for (( i = 0 ; i < ${#local_dirs[@]} ; i++ )) do
cd "${local_dirs[$i]}"
wget -r -l1 --no-parent -A "*.pdf" -nd -nc ${remote_dirs[$i]}
done

# Explanation:
# -r            to download recursively
# -l1           to include only one directory depth
# --no-parent   to exclude parent directories
# -A "*.pdf"    to accept only .pdf files
# -nd           to prevent wget to create directories for everything
# -N            to make wget to download only new files

Edycja 2: Jak wspomniano poniżej, można również użyć --mirror( -m), co jest skrótem od -r -N.

Lenar Hoyt
źródło
Cieszę się, że pomogło. Czy możesz zaakceptować odpowiedź, która według ciebie najlepiej pomogła ci rozwiązać twoje pytanie?
George M

Odpowiedzi:

16

wget jest doskonałym narzędziem.

Posługiwać się wget -m http://somesite.com/directory

-m
--mirror
    Turn on options suitable for mirroring.  This option turns on
    recursion and time-stamping, sets infinite recursion depth and
    keeps FTP directory listings.  It is currently equivalent to 
    -r -N -l inf --no-remove-listing.
George M.
źródło
7

Jak rsync, ale użyj zsync, aby uzyskać z serwera httpd.

gogatorzy
źródło
W Internecie nie ma dużo dokumentacji dotyczącej zsync. Byłoby naprawdę miło, gdybyś mógł rozwinąć swoją odpowiedź. Dziękuję Ci.
Behrooz
3
Behrooz - faktycznie używam teraz lftpi jego mirrorpolecenia.
gogatorzy