Czy sensownie jest zwracać liczbę 410 zamiast 404, gdy pewna strona została trwale usunięta?
16
Czy warto zwracać 410zamiast, 404gdy jakaś strona zostanie trwale usunięta? W tym filmie Matt Cutts mówi, że Google traktuje je tak samo, ale czy istnieją inne powody, aby je wdrożyć 410(oprócz poprawności technicznej)?
Zastanawiałem się nad tym sam. Wygląda na to, że 410 po prostu nie jest już używany.
wogsland,
Odpowiedzi:
7
W naszej witrynie wdrożyliśmy ostatnio 410 błędów dla stron, które zostały trwale usunięte. Mamy około 40 milionów stron w indeksie Google i Googlebot indeksuje je 2 milionami żądań dziennie.
Po wyczyszczeniu naszej bazy danych wykryliśmy dużą liczbę błędów 404, które pojawiały się w błędach indeksowania w Narzędziach dla webmasterów. Kiedy zmieniliśmy na 410 statusów zamiast 404, liczba błędów dziennie zmniejszyła się o połowę, podczas gdy łączna liczba wykonanych żądań pozostała na tym samym poziomie. Więc to bardziej skutecznie indeksuje strony dziennie. Wygląda na to, że strony o statusie 404 są indeksowane wiele razy, zanim zostaną całkowicie usunięte z indeksu.
Powiedziałbym więc, że tak, zdecydowanie warto użyć 410 tam, gdzie jest to właściwe, aby utrzymać budżet Google Crawl.
Na tym świecie jest więcej niż Google. 410 jednoznacznie informuje bota, że plik zniknął. 404 nie. Trwały bot może wciąż próbować znaleźć 404 w nieskończoność, podczas gdy może przestać próbować znaleźć 410 natychmiast, co uczyniłoby twój serwer bardzo szczęśliwym.
Działa to jednak w dwie strony: naprawdę kiepski bot może rozpoznać tylko 200 i 404.
Peter Taylor
4
@Peter nie jest pewny, czy to ma znaczenie - jeśli są gówniani i nie rozumieją kodów HTTP, to co by to zaszkodziło? Jeśli użyjesz 404, zarówno bzdurne, jak i dobre boty będą nadal prosić o stronę, podczas gdy w przypadku 410 tylko bzdurny będzie.
DisgruntledGoat
1
Co powiedział @DisgruntledGoat. Zobacz prawo Postela . Błędne wdrożenia po prostu nie mogą być rozliczane; co zamierzasz zrobić, spróbować wyjaśnić je wszystkie i każde z nich w tym samym czasie? Są rzadkie wyjątki, jak na przykład wieloletnia dominacja przeglądarki IE6, ale generalnie nie jest to warte wysiłku.
Su '
6
Poza tym, że istnieje więcej wyszukiwarek niż Google, nie ma również powodu, aby zakładać, że Google nigdy nie zmieni sposobu, w jaki traktują 410 odpowiedzi. Rzeczywiście wydaje się, że już się to wydarzyło: informacje, które Matt Cutts cytuje w filmie, pochodzą z 2007 roku, podczas gdy ten post z 2009 roku autorstwa Johna Mu na forach Google dla webmasterów mówi inaczej:
„Śledziłem sprawę 404 vs 410 z zespołem tutaj. Jak wspomnieli inni tutaj i gdzie indziej, ogólnie traktowaliśmy ich tak samo w przeszłości.
Jednak po przyjrzeniu się, jak webmasterzy używają ich w praktyce, traktujemy teraz kod wynikowy HTTP 410 jako „bardziej trwały” niż 404. Jeśli więc masz absolutną pewność, że strona już nie istnieje i nigdy więcej nie będzie istnieć, użycie 410 byłoby prawdopodobnie dobrą rzeczą. ”
Wygląda więc na to, że Google rzeczywiście traktuje 410 odpowiedzi inaczej niż 404.
Z mojego doświadczenia wynika, że Google nie rozumie 410 kodów błędów.
Jakiś czas temu zmieniłem pełną witrynę, więc wszystkie stare adresy URL to „410 Gone”. Nie mogę użyć przekierowań 301, ponieważ nie ma bezpośredniego związku z nowym adresem URL.
Użyłem a, .htaccessaby powiedzieć Google, że stare adresy URL zniknęły, ale wciąż mówi mi, że w mojej witrynie jest OGROMNA liczba błędów 404. Sprawdziłem adresy URL w raporcie błędu indeksowania i wszystkie mają 410, a nie 404, jak to stwierdza.
Cytowany za prawdę. Biorąc pod uwagę twoje wymaganie, aby poinformować boty (i prawdopodobnie również ludzi), że strona została trwale usunięta , faktycznie wybrałbym301 przekierowanie do strony wyjaśniającej (jeśli to konieczne), dlaczego treść została usunięta, lub zabrałem bota / użytkownika powrót do strony indeksu.
Mniej znane kody błędów HTTP zwykle nie są tak dobrze obsługiwane, zrozumiałe ani wdrażane we wszystkich obszarach, więc ogólnie trzymam się tych, które mają zapewnić oczekiwane i, mam nadzieję, płynne przeglądanie.
Wybór opcji zależy od tego, ile żądań wciąż przychodzi w przypadku (obecnie) brakującej zawartości.
Dlaczego potrzeba wyjaśnienia usunięcia oznacza, że musisz podać numer 301 pod innym adresem URL z tym wyjaśnieniem? Wyjaśnienie może znajdować się na samej stronie, ze statusem 410, aby wyszukiwarki zrozumiały, że nie żyje.
Odpowiedzi:
W naszej witrynie wdrożyliśmy ostatnio 410 błędów dla stron, które zostały trwale usunięte. Mamy około 40 milionów stron w indeksie Google i Googlebot indeksuje je 2 milionami żądań dziennie.
Po wyczyszczeniu naszej bazy danych wykryliśmy dużą liczbę błędów 404, które pojawiały się w błędach indeksowania w Narzędziach dla webmasterów. Kiedy zmieniliśmy na 410 statusów zamiast 404, liczba błędów dziennie zmniejszyła się o połowę, podczas gdy łączna liczba wykonanych żądań pozostała na tym samym poziomie. Więc to bardziej skutecznie indeksuje strony dziennie. Wygląda na to, że strony o statusie 404 są indeksowane wiele razy, zanim zostaną całkowicie usunięte z indeksu.
Powiedziałbym więc, że tak, zdecydowanie warto użyć 410 tam, gdzie jest to właściwe, aby utrzymać budżet Google Crawl.
źródło
Na tym świecie jest więcej niż Google. 410 jednoznacznie informuje bota, że plik zniknął. 404 nie. Trwały bot może wciąż próbować znaleźć 404 w nieskończoność, podczas gdy może przestać próbować znaleźć 410 natychmiast, co uczyniłoby twój serwer bardzo szczęśliwym.
źródło
Poza tym, że istnieje więcej wyszukiwarek niż Google, nie ma również powodu, aby zakładać, że Google nigdy nie zmieni sposobu, w jaki traktują 410 odpowiedzi. Rzeczywiście wydaje się, że już się to wydarzyło: informacje, które Matt Cutts cytuje w filmie, pochodzą z 2007 roku, podczas gdy ten post z 2009 roku autorstwa Johna Mu na forach Google dla webmasterów mówi inaczej:
Wygląda więc na to, że Google rzeczywiście traktuje 410 odpowiedzi inaczej niż 404.
źródło
Z mojego doświadczenia wynika, że Google nie rozumie 410 kodów błędów.
Jakiś czas temu zmieniłem pełną witrynę, więc wszystkie stare adresy URL to „410 Gone”. Nie mogę użyć przekierowań 301, ponieważ nie ma bezpośredniego związku z nowym adresem URL.
Użyłem a,
.htaccess
aby powiedzieć Google, że stare adresy URL zniknęły, ale wciąż mówi mi, że w mojej witrynie jest OGROMNA liczba błędów 404. Sprawdziłem adresy URL w raporcie błędu indeksowania i wszystkie mają 410, a nie 404, jak to stwierdza.źródło
Cytowany za prawdę. Biorąc pod uwagę twoje wymaganie, aby poinformować boty (i prawdopodobnie również ludzi), że strona została trwale usunięta , faktycznie wybrałbym
301
przekierowanie do strony wyjaśniającej (jeśli to konieczne), dlaczego treść została usunięta, lub zabrałem bota / użytkownika powrót do strony indeksu.Mniej znane kody błędów HTTP zwykle nie są tak dobrze obsługiwane, zrozumiałe ani wdrażane we wszystkich obszarach, więc ogólnie trzymam się tych, które mają zapewnić oczekiwane i, mam nadzieję, płynne przeglądanie.
Wybór opcji zależy od tego, ile żądań wciąż przychodzi w przypadku (obecnie) brakującej zawartości.
źródło