Co to jest minimalny prawidłowy plik robots.txt?

14

Nie podoba mi się to, że widzę dużo błędów 404 w access.log mojego serwera. Otrzymuję te błędy, ponieważ roboty indeksujące próbują otworzyć plik robots.txt , ale nie mogą go znaleźć. Chcę więc umieścić prosty plik robots.txt , który zapobiegnie pojawieniu się błędów 404 w moim pliku dziennika.

Jaki jest minimalny prawidłowy plik robots.txt , który pozwoli na indeksowanie wszystkiego w witrynie?

Besarabow
źródło

Odpowiedzi:

17

Jak wskazano tutaj , utwórz plik tekstowy o nazwie robots.txt w katalogu najwyższego poziomu serwera WWW. Możesz zostawić to puste lub dodać:

User-agent: *
Disallow:

Jeśli chcesz, aby roboty indeksowały wszystko . Jeśli nie, zobacz powyższy link, aby uzyskać więcej przykładów.

dan
źródło
Po co dodawać „Disallow:”, a nie tylko „Allow: *”?
Athoxx
2
@Patrik „Zezwól” służy do zastępowania wszelkich poprzednich dyrektyw „Zabroń”. Nie ma znaczenia, jeśli nie ma „Zabroń”. Szczerze mówiąc najlepszym rozwiązaniem jest pusty plik.
DisgruntledGoat
2
O, rozumiem. Zgadzam się również, że pusty plik jest najlepszy.
Athoxx
2
@PatrikAlienus Ponieważ „Zezwól” nie znajduje się w specyfikacji robots.txt.
user11153,
1
@ user11153: Hę? Co z sekcją „3.2.2 Zezwalaj i nie zezwalaj na wiersze” specyfikacji Internet Draft 1997 z 1997 r. Metoda kontroli robotów sieciowych ?
David Cary
2

Najlepszym minimum robots.txtjest całkowicie pusty plik.

Wszelkie inne „zerowe” dyrektywy, takie jak puste Disallowlub Allow: *są nie tylko bezużyteczne, ponieważ nie działają, ale dodają niepotrzebnej złożoności.

Jeśli nie chcesz, aby plik był całkowicie pusty - lub chcesz, aby był bardziej czytelny dla człowieka - po prostu dodaj komentarz rozpoczynający się od #znaku, na przykład # blank file allows all. Roboty ignorują linie zaczynające się od #.

Maximillian Laumeister
źródło
0

Powiedziałbym to;

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Umożliwi to Googleowi indeksowanie wszystkiego, ale nie zezwoli Google na indeksowanie Twojego panelu administracyjnego. To idealna sytuacja dla Ciebie.

Fahad Ur Rehman Khan
źródło
2
Być może czegoś mi brakuje, ale nie sądzę, że pytający powiedział, że używa Wordpress.
Maximillian Laumeister