Zapisywanie stron internetowych w Firefoksie jako pliki tekstowe lub RTF, które zachowują podstawowe formatowanie i pozycjonowanie

0

Czy w Firefoksie można zapisywać strony zawierające tekst, zachowując podstawowy formatowanie i pozycjonowanie, ale nie zapisywanie kodu wykonywalnego (JavaScript)?

Nie musi być doskonały, tylko przybliżenie.

Potrzebuję tekstu do przeszukiwania, więc zrobienie zrzutu ekranu nie wystarczy.

Preferowane są odpowiedzi dotyczące systemu Windows.

Co próbowałem:

  1. Skopiuj i wklej do notatnika.
    Wynik: Utracono całe formatowanie tekstu i pozycjonowanie (zgodnie z oczekiwaniami).
  2. Skopiuj i wklej do OpenOffice, LibreOffice i Wordpad.
    Wynik: Nie utrzymywałem wystarczającego pozycjonowania tekstu. W szczególności tekst wyrównany do lewej i prawej strony został wyrównany do lewej.
  3. Zapisz jako plik tekstowy w przeglądarce Firefox.
    Wynik: Tak samo jak # 1.
  4. Zapisz jako plik HTML tylko w Firefoksie.
    Wynik: Tak samo jak # 2.
  5. Zapisz jako kompletny plik HTML z poziomu przeglądarki Firefox.
    Wynik: Z jakiegoś powodu Firefox zgłasza awarię wielu stron, prawdopodobnie z powodu sposobu, w jaki strony są obsługiwane przez HTTPS.

Moje obecne obejście to PITA. Pobieram HTML strony i CSS. Następnie ręcznie edytuję każdy plik HTML, aby wskazać lokalną kopię plików CSS. Wreszcie usuwam wszystkie odwołania do JavaScript. Zajmuje to sporo czasu i wysiłku i powoduje zależność od plików CSS zamiast pojedynczego czystego tekstu lub pliku RTF.

Rozważałem Rozszerzenie formatu archiwum Mozilli , ale myślę, że zawsze zapisuje cały JavaScript w archiwum. Wolę płaski tekst lub plik RTF (bogaty tekst) bez zależności i zdecydowanie bez JavaScript.

RockPaperLizard
źródło
Uważam, że zwykłym procesem jest wykonywanie pracy ręcznej. Przepraszam. Domyślam się, że nie zobaczysz bardzo satysfakcjonującej odpowiedzi. Jak jednak usunąć wszystkie odwołania do JavaScript? To powinno być dość zautomatyzowane. Na przykład, zamień & lt; SCRIPT na & lt; SCRdisabled (i / SCRIPT) ..., który sprawiłby, że HTML byłby technicznie nieważny, ale prawdopodobnie sprawiałby wrażenie dobrze / akceptowalnie.
TOOGAM
@TOOGAM Tak, dokonuję edycji w ten sposób lub po prostu edytuję wszystko <SCRIPT> i </SCRIPT> tagi. Nie lubię trzymać wszystkich plików CSS w pobliżu, więc czasami skopiuję i wkleję ważne style CSS do HTML, aby zastosować je bezpośrednio. Jest to raczej czasochłonne. Cięcie i wklejanie do edytora tekstu jest tak blisko, ale utrata justowania po lewej i prawej stronie powoduje utratę ważnego pozycjonowania, zwłaszcza w przypadku transkrypcji tekstu.
RockPaperLizard
Czy chcesz korzystać z Firefoksa? Czy możesz użyć innego skrobaka internetowego, takiego jak cURL?
TOOGAM
@TOOGAM Dobre pytanie. Zdecydowanie wolę Firefox, ale nie musi go używać. Aby wyjaśnić, potrzebuję tylko sporadycznych stron internetowych (zazwyczaj 1-5 na dzień) i potrzebuję tylko tekstu na pojedynczej stronie (nie muszę zeskrobywać całej witryny ani niczego). Strony są zazwyczaj obsługiwane przez HTTPS. Zwykle jestem w pudełku Windows, kiedy muszę to zrobić.
RockPaperLizard