Jak zapobiec wyświetlaniu moich plików map witryn XML w wynikach wyszukiwania Google, takich jak wynik site:
zapytania:
Nie rozumiem, dlaczego Google miałoby na początku wyświetlać pliki map witryn w wynikach wyszukiwania. Te pliki nie są przeznaczone do spożycia przez ludzi.
Google musi być w stanie go zaindeksować, aby móc go przetworzyć, więc nie mogę tego zabronić w pliku robots.txt . Po prostu nie chcę, aby po przetworzeniu umieściły go w wynikach wyszukiwania.
google
sitemap
search-engine-indexing
googlebot
xml-sitemap
Stephen Ostermiller
źródło
źródło
/sitemap.xml
wymieniłem w pliku robots.txt, a następnie linki do innego zestawu innych map witryn, takich jak/sitemap-123.xml
i/sitemap-124.xml
. Regeneruję mapy witryn codziennie, a liczby zmieniają się codziennie. Ten, który jest indeksowany, jest dość stary. Nigdzie na mojej stronie nie prowadzę do niego linku, ale możliwe, że jakaś inna strona ma gdzieś link do niego./sitemap.xml
Zakładam, że ta konkretna mapa witryny wypada teraz z indeksu. Chciałbym również uniemożliwić Google pokazywanie ich użytkownikom w przyszłości.Odpowiedzi:
Google indeksuje mapy witryn XML (jak każdy plik XML). Jeśli Google zna adres URL i zwraca prawidłową odpowiedź, wówczas przekaże reguły włączenia Google i może zostać zindeksowane. Osobiście przesyłam mapę witryny tylko za pośrednictwem GWT i dołączam
Sitemap:
referencję do pliku robots.txt, a to z pewnością wystarczy, aby ją zindeksować.Zalecaną metodą zapobiegania indeksowaniu tych plików przez Google jest dołączenie
X-Robots-Tag
nagłówka odpowiedzi HTTP podczas wyświetlania mapy witryny XML. Na przykład:Podobnie jak w przypadku tagów META robotów w plikach HTML,
X-Robots-Tag
nagłówka można użyć do dowolnego typu pliku.Odniesienie: Wydaje się, że ten dokument (od listopada 2008 r.) Cytuje naszego własnego Johna Muellera (Google) w odniesieniu do użycia
X-Robots-Tag
odpowiedzi w przypadku map witryn XML.Tak, Google zaindeksuje i uszereguje plik mapy witryny XML
Aby uzyskać więcej informacji, zobacz przewodnik dla programistów Google:
Metatag robots i specyfikacje nagłówka HTTP X-Robots-Tag
źródło
X-Robots-Tag: noindex
kod nagłówka? Wewnątrzsitemap.xml
czyrobots.txt
?header('X-Robots-Tag: noindex',true)
) lub, jeśli używasz Apache, to w pliku .htaccess lub konfiguracji serwera. Zobacz odpowiedź Stephena na przykład kod. Zobacz także przewodnik Google dla programistów, do którego prowadzi powyższy link.Odpowiedź MrWhite na temat używania X-Robots-Tag wydaje się być właściwym sposobem na zrobienie tego.
Oto kod, który można w tym celu wykorzystać w plikach konfiguracyjnych .htaccess lub Apache . (Odwołanie: WebmasterWorld - mapy witryn wyświetlane w SERP - jak temu zapobiec? )
W nginx konfiguracja wyglądałaby następująco. (Odnośnik: przykłady Yoast X-Robots-Tag )
źródło
Dlaczego to ma znaczenie?
Jeśli faktycznie możesz znaleźć mapę witryny w SERP, masz większe problemy.
Zamiast tego skupiłbym się bardziej na podnoszeniu stron z przydatną treścią. W ten sposób będziesz miał trudności ze znalezieniem mapy witryny. W każdym razie nie to, że by cię to obchodziło.
PS
Prawie każdy trzyma mapy witryn w tym samym miejscu. Więc jeśli ktoś chciałby znaleźć, gdzie go trzymasz, będzie :)
źródło
umieść następujące w pliku robots.txt
zamiast tego prześlij mapę witryny za pomocą narzędzi Google dla webmasterów.
źródło