Jeśli nie chcę ustawiać żadnego specjalnego zachowania, czy jest w porządku, jeśli nie przejmuję się plikiem robots.txt?
A może brak jednego może być szkodliwy?
źródło
Jeśli nie chcę ustawiać żadnego specjalnego zachowania, czy jest w porządku, jeśli nie przejmuję się plikiem robots.txt?
A może brak jednego może być szkodliwy?
Brak pliku robots.txt nie będzie szkodliwy. Ze strony internetowej robotstxt.org :
Aby umożliwić wszystkim robotom pełny dostęp
Klient użytkownika: *
Zabroń:(lub po prostu utwórz pusty plik „/robots.txt” lub nie używaj go wcale)
Jednak nawet jeśli nie podajesz niczego w pliku robots.txt, jest to dobry sposób na poinformowanie wyszukiwarek o lokalizacji mapy witryny XML . Możesz to zrobić, dodając wiersz u góry pliku robots.txt, który wygląda mniej więcej tak:
Mapa strony: http://www.example.com/sitemap-host1.xml
Należy również pamiętać, że jego brak spowoduje utworzenie 404 wpisów w dziennikach internetowych.
Jeśli nie masz pliku „robots.txt”, w dzienniku błędów pojawi się 404 plików, co może być pewnego rodzaju irytacją, podobnie jak w przypadku braku favicon.
źródło
robots.txt
plik, który dodatkowo będzie rzadziej pobierany z powodu wyszukiwarek stosujących odpowiednią kontrolę pamięci podręcznej HTTP .Myślę, że to ma być OK, w przeciwnym razie ogromne połacie internecie byłoby un-indeksowane przez roboty internetowe.
Nie
robots.txt
jestrobots.txt
prawie tak samo jak „zezwalaj na indeksowanie przez wszystkich” prawie z definicji.źródło
Brak pliku robots.txt pozostawia robotowi podjęcie decyzji, co może, a czego nie może zrobić. Ponieważ uniknięcie niejasności zajmuje tylko kilka sekund, dlaczego nie stworzyć takiej, która pozwoli wszystkim agentom na dostęp do wszystkiego?
źródło
Cóż, ponieważ
robots.txt
zawiera adres mapy witryny , brak jej jest potencjalnie szkodliwy.źródło
W zależności od treści nie powinno być problemów z brakiem pliku robota, o ile wszystkie strony w Twojej witrynie są indeksowane przez wyszukiwarki.
źródło