Czy istnieje przenośny sposób pobierania lub buforowania wszystkich stron witryny w celu przeglądania offline? Jutro odbieram lot przez cały kraj i chciałbym mieć możliwość buforowania kilku stron internetowych (w szczególności strony doc Python ( http://docs.python.org/ ) i odnośnika pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).
Idealnie chciałbym mieć dodatek do Firefoksa lub coś w tym rodzaju, ale wszystko będzie działać dobrze, dopóki będę mógł go uruchomić w systemie Linux.
Odpowiedzi:
Używam HTTrack .
źródło
Korzystam z wget z tymi opcjami do tworzenia kopii lustrzanej witryny do użytku offline
gdzie
-m włącza opcje dublowania dla dublowania strony lokalnie
-c kontynuuje poprzednie pobieranie w przypadku, gdy już pobrałem niektóre strony
-k konwertuje absolutny href na lokalny w celu przeglądania w trybie offline
-E zapewnia, że pliki mają rozszerzenie .html po pobraniu.
-np pobiera tylko obiekty z katalogu / a / section / i / i nie buforuje całej witryny.
Na przykład chciałem pobrać dokumentację południową, ale nie bilety południowe itp.
Używam Windowsa i uruchamiam wget na cygwin, ale jest też natywny port wget dla Windows .
Chociaż w twoim przypadku możesz pobrać dokumenty Pythona offline z sekcji Dokumenty Pythona
źródło
Wypróbuj http://www.downthemall.net/ wtyczkę Firefox. Użyłem go do pobrania 250 stron plików PDF w ponad 20 osobnych plikach. Jest niezwykle potężny. Ma składnię wieloznaczną / zapytania, która pozwala chirurgicznie uzyskać tylko te pliki, które chcesz, i żadnych niepotrzebnych plików, których nie chcesz.
źródło
Niektóre rozszerzenia Firefoksa, które znam:
Album na wycinki
ScrapBook Plus
UnMHT
Kieszeń (nie rozszerzenie; wbudowana funkcja Firefox)
Uwaga:
źródło
Możesz pobrać całą stronę internetową lub jej część za pomocą wget.
Sprawdź instrukcję wget pod kątem innych opcji, które możesz chcieć przekazać, np. Aby ograniczyć wykorzystanie przepustowości, kontrolować głębokość rekurencji, konfigurować listy wykluczeń itp.
Innym podejściem do przeglądania w trybie offline jest użycie buforującego serwera proxy. Wwwoffle to taki, który ma wiele funkcji ułatwiających przechowywanie podczas przeglądania w trybie offline, takich jak zastąpienie określonych przez serwer dat wygaśnięcia i możliwość cyklicznego pobierania z wyprzedzeniem. (Używam wwwoffle od moich dni dial-up).
źródło