Pytania oznaczone «web-crawlers»

Program komputerowy, który uzyskuje dostęp do stron internetowych w różnych celach (do pobierania treści, dostarczania wyszukiwarkom informacji o Twojej witrynie itp.)

18
Jaki klient użytkownika powinienem ustawić?

Istnieje bot bot, który ustawia ten nagłówek: Mozilla/2.0 (compatible; Ask Jeeves/Teoma) Biorąc to pod uwagę, mam następujące pytania: Jeśli piszę przeszukiwacz sieciowy o nazwie Goofy, jakiego klienta użytkownika powinienem użyć? Jaka jest różnica, jeśli wstawię Mozilla/2.0lub...

15
Jak blokować pająki Baidu

Większość moich wizyt pochodzi od pająków baidu. Nie wydaje mi się, żeby to w ogóle pomogło wyszukiwarkom, więc myślę o tym, jak je zablokować. Czy można to zrobić za pomocą iptables? Używam nginx jako mojego

12
Dlaczego baidu indeksuje moją stronę jak szalona

Kiedy sprawdzam dziennik apache, widzę, że baidu indeksuje moją witrynę 10 razy dziennie przez ostatnie 2 tygodnie. Nie zależy mi na tym, ale jestem naprawdę ciekawy, dlaczego on to robi. To naprawdę niewielka, jednostronicowa strona internetowa z niewielką liczbą linków przychodzących. Czy kryje...

12
Status przeszukiwalnego Ajaxa?

Widziałem, że Google ma fajną propozycję / standard umożliwiający indeksowanie aplikacji Ajax za pośrednictwem #! (hash bang). http://googlewebmastercentral.blogspot.com/2009/10/proposal-for-making-ajax-crawlable.html Moje pytania to: Czy obecnie używają już tej „propozycji” w prawdziwym...