wget
Strona człowiek stwierdza to, w sekcji dla --random-wait
parametru:
Some web sites may perform log analysis to identify retrieval
programs such as Wget by looking for statistically significant
similarities in the time between requests. [...]
A 2001 article in a publication devoted to development on a popular
consumer platform provided code to perform this analysis on the
fly. Its author suggested blocking at the class C address level to
ensure automated retrieval programs were blocked despite changing
DHCP-supplied addresses.
Chcę uzyskać kopię tego artykułu do czytania i próbowałem wielu wyszukiwań w Internecie, aby ustalić artykuł. Jednak wszystko, co mogę znaleźć dzięki tym wyszukiwaniom, to strona podręcznika użytkownika wget
hostowana na różnych stronach internetowych; i niektóre inne prace badawcze, które nie mają żadnego związku z tym tematem.
Czy ktoś wie, do którego artykułu się odwołuje i gdzie mogę uzyskać kopię?
wget
man
documentation
user2064000
źródło
źródło
Odpowiedzi:
Chociaż nie jest to bezpośrednia odpowiedź,
git blame
igit log
ujawniam, że sekcja ta została wprowadzona w zatwierdzeniu 2c41d783 przez dzwoniącegohniksic
, który okazuje się być Hrvoje Niksic. Jego adres e-mail można znaleźć wChangeLog
pliku wget (nie podam go tutaj z oczywistych powodów). Sugerowałbym, aby zapytać go bezpośrednio, ponieważ może on najlepiej udzielić bardziej adekwatnej odpowiedzi. Będąc przy tym, możesz zastanowić się, czy nie zapytać go, czy miałby coś przeciwko aktualizacji strony podręcznika. ;)źródło
Myślę, że może to być ten artykuł:
Tworzenie znaczących danych z dzienników sieciowych przy użyciu podstawowego SAS
Jest akapit omawiający blokowanie zakresów klasy C:
I jedna wzmianka o
wget
blokowaniu ciągów agenta użytkownika:Był to piąty wynik Googlinga za „wget analizy logów” za rok 2001 .
źródło