Zrobić tekstowych przeglądarek opartych takie jak rysie , linki i elinks zużywa mniej pasma niż przeglądarce opartej GUI (IE, Firefox, Chrome itd.)?
Domyślam się, że nie ma ograniczenia ruchu.
Uzasadnienie: Myślę, że przeglądarka tekstowa pobiera całą stronę, tak jak jest oferowana przez serwer. Wszelkie usprawnienia lub ograniczenia widżetów stron są wykonywane lokalnie.
Być może nastąpił pewien spadek ruchu, ponieważ większość przeglądarek tekstowych nie uruchamia skryptów stron ani plików SWF, które mogą powodować większy ruch.
Odpowiedzi:
Serwer WWW nie wysyła „całej witryny”, ale dokumenty żądane przez przeglądarki.
Na przykład, gdy uzyskasz dostęp do https://www.google.com/, przeglądarka zapyta o dokument
https://www.google.com/
. Serwer przetwarza żądanie i odsyła trochę kodu HTML.Następnie przeglądarka sprawdza, co serwer wysłał. W tym przypadku jest to strona HTML, więc analizuje dokument i wyszukuje skrypty, arkusze stylów, obrazy, czcionki itp.
Na tym etapie przeglądarka zakończyła pobieranie tego dokumentu, ale nadal nie pobrała dokumentów, do których istnieją odniesienia. Może to zrobić lub pominąć je. Zwykłe przeglądarki będą próbowały pobrać wszystkie dokumenty, do których istnieją odniesienia, w celu uzyskania najlepszej jakości oglądania. Jeśli masz bloker reklam (jak Adblock) lub wtyczkę prywatności (Ghostery, NoScript), może również blokować niektóre zasoby.
Następnie przeglądarka pobiera dokumenty referencyjne jeden po drugim, za każdym razem prosząc serwer wprost o pojedynczy zasób. W naszym przykładzie Google przeglądarka znajdzie następujące odniesienia, żeby wymienić tylko kilka z nich:
(rzeczywiste pliki mogą być różne dla różnych użytkowników, przeglądarek i sesji i mogą się zmieniać z czasem)
Przeglądarki tekstowe nie pobierają obrazów, plików Flash, filmów HTML5 itp., Więc pobierają mniej danych.
@NathanOsman ma rację w komentarzach: czasami małe obrazy są osadzane bezpośrednio w dokumentach HTML i w takich przypadkach nie można ich pobrać. To kolejna sztuczka używana do zmniejszenia liczby żądań. Są jednak bardzo małe, w przeciwnym razie narzut związany z kodowaniem pliku binarnego w base64 będzie zbyt duży. Na Google.com jest kilka takich obrazów: ( rozmiar zakodowany base64 / rozmiar zdekodowany )
źródło
data:
).Podejrzewałbym, że tak. Nie wierzę, że przeglądarki tekstowe (domyślnie) nawet pobierają zasoby, takie jak obrazy lub elementy zewnętrzne, takie jak czcionki (w razie potrzeby), skrypty itp.
Zrobiłem podstawowe testy z tcpdump, próbując uzyskać tę stronę IANA ( http://www.iana.org/domains/reserved ) za pomocą zarówno rysia, jak i następnie wget, i oto moje wyniki (tylko polecenia HTTP, mogę dostarczyć resztę Jeśli potrzebne).
lynx http://www.iana.org/domains/reserved
wget -p http://www.iana.org/domains/reserved
Zdaję sobie więc sprawę, że nie jest to świetny test, ponieważ
wget
może pobierać zasoby, których przeglądarka może nie pobrać, ale przykład, który - jak sądzę - zawiera wiele innych żądań do renderowania treści w przeglądarce GUI. W związku z tym przeglądarki GUI będą generować większy ruch w sieci niż przeglądarki tekstowe.źródło
wget
można to uznać za przeglądarkę. Lepiej spróbuj zelinks
czymś podobnym.wget
po prostu do zademonstrowania wszystkich żądań i odpowiedzi HTTP, które zostaną wykonane.-p
Parametr jest zdefiniowana jako:-p, --page-requisites get all images, etc. needed to display HTML page.
. Nie chciałem używać rzeczywistej przeglądarki GUI, ponieważ mają tendencję do wysyłania innych żądań, których nie chciałem odfiltrowywać.Myślę, że przeglądarki tekstowe znacznie zmniejszą ilość przesyłanych danych, ponieważ nie będą żądać wszystkich tych rozdętych zdjęć, filmów i materiałów interaktywnych wysokiej rozdzielczości web 2.0 (Flash i inne).
Sugeruję przetestowanie tego poprzez skonfigurowanie reguły IPtables, która będzie liczyć ilość ruchu uderzającego w określoną regułę IPtables.
Na przykład utwórz regułę dla portu 80 + 443 z liczeniem ruchu i przeglądaj sieć w zwykłej przeglądarce, zresetuj licznik IPtables i zrób to samo z przeglądarką tekstową.
Pamiętaj, że nie można porównywać obu przebiegów w 100%, ponieważ dynamiczna zawartość internetowa (reklamy i inne) może się różnić w zależności od dostępu.
źródło