Jak zmienić plik Safari Webarchive w folder?

16

Rozumiem, że archiwum Safari to pojedynczy plik z kodem źródłowym i innymi zasobami ze strony internetowej połączonymi w jeden plik. Znalazłem artykuł Macworld z 2006 roku opisujący program, który właśnie to robi, ale link do programu nie jest już aktualny.

Czy jest obecnie dostępne oprogramowanie, które może przekonwertować plik archiwum Safari na bardziej standardowy format?

Daniel
źródło

Odpowiedzi:

7

WebArchiveExtractor

Polecam WebArchiveExtractor. Możesz przeciągnąć pliki .webarchive do tej aplikacji, która wyodrębni plik do poszczególnych plików w folderze.

Możesz dostosować dane wyjściowe w Preferencjach, w tym ustawić niestandardową nazwę pliku indeksu:

WebArchiveExtractor jest open source na GitHub

grg
źródło
Extractor WebArchive nie działa dla mnie od 9 grudnia 2019 r. Używam macOS 10.14.4 (18E226) Mojave na pliku .webarchive z Safari.
Merchako,
11

Czy jest obecnie dostępne oprogramowanie, które może przekonwertować plik archiwum Safari na bardziej standardowy format?

Jeśli nie masz textutilproblemów z wierszem poleceń, w systemie Mac OS dostępne jest narzędzie do konwersji pliku webarchive na txt, html, rtf, rtfd, doc, docx, wordml lub odt.

Przykład:
textutil -convert html /Users/USERNAME/NAME.webarchive


Aby przekonwertować plik webarchive na pdf, wypróbuj „Wondershare PDF Editor dla komputerów Mac”. http://www.wondershare.com/pdf/how-to-convert-webarchive-to-pdf.html

Ivan Chau
źródło
4
textutilNarzędzie wiersza polecenia wydobywa tylko plik HTML najwyższego poziomu, a nie CSS lub skryptów, które są również częścią webarchive. (Co tak naprawdę jest celem całego webarchive.) Nie znalazłem dobrego alternatywnego sposobu, aby to zrobić z wiersza poleceń.
Stephen Harrison
1
@Stephen WebArchiveExtractor ma akcję Automatora, która może być skryptowana przez powłokę.
grg
Pomimo ostrzeżeń, tego szukałem. Rozwiązanie bazowe GUI jest dość bezużyteczne, gdy chcesz przekonwertować setki webarchiwów na serwerze.
Siedem
To nawet nie wyodrębnia oryginalnego pliku HTML, ale konwertuje go. To naprawdę bardziej przypomina otwieranie pliku HTML w TextEdit i ponowne jego eksportowanie.
sam