Mam problem z następującą komendą wget:
wget -nd -r -l 10 http://web.archive.org/web/20110726051510/http://feedparser.org/docs/
Powinien pobierać rekurencyjnie wszystkie połączone dokumenty w oryginalnej sieci, ale pobiera tylko dwa pliki ( index.html
i robots.txt
).
Jak mogę uzyskać rekurencyjne pobieranie tej strony?
10
do niższej liczby, ale trudno zgadnąć. Teraz znajduje się plikintroduction.html
,introduction.html.1
,introduction.html.2
a ja raczej zakończony proces.--mirror
opcja łączy do systemu plików?-nd
, więc różneindex.html
s są umieszczane w tym samym katalogu, a bez tego-k
nie będziesz mieć przepisywania linków.Pobiera rekurencyjnie treść adresu URL.
Inne przydatne opcje to:
źródło
-l 0 - remove recursion depth (which is 5 by default)
+1