Czy powinienem zawrzeć wszystko w mapie witryny czy tylko nowe treści?

13

W przypadku witryny z dynamiczną treścią (ciągle dodawana jest nowa treść), czy powinienem zawierać tylko najnowszą treść w mapie witryny, czy też wszystko (z indeksem mapy witryny)? Jakie są najlepsze praktyki dotyczące map witryn esp. dla dużych witryn?

Ponadto, czy jest tak, że Google (i inne wyszukiwarki) mogą tylko indeksować strony w mapie witryny?

Dzięki

Aktualizacja: Czy
masz jakiś pomysł, jak radzić sobie z przepełnieniem stosu? Chciałbym wiedzieć, ale niestety (również ze zrozumieniem ) zablokowali dostęp do swojej mapy witryny.

Mee
źródło
1
Jak duża jest strona? Istnieje limit rozmiaru zarówno dla pliku robots.txt, jak i mapy witryny. O dziwo, wiele z nich przekracza oba, dlatego pytam.
Tim Post
@Tim, na razie nie jest zbyt duży (wszystko może zmieścić się w jednej mapie witryny), ale staram się planować z wyprzedzeniem.
Mee

Odpowiedzi:

13

Uwzględnij wszystkie strony. Mapa witryny XML ma na celu poinformowanie wyszukiwarek o całej zawartości. Nie tylko nowe rzeczy.

Ze strony sitemaps.org (moje wyróżnienie):

Mapy witryn są łatwym sposobem dla webmasterów na informowanie wyszukiwarek o stronach w ich witrynach, które można indeksować .

Jeśli masz dużo treści, możesz użyć wielu map witryn XML .

Jeśli masz treści, których nie chcesz indeksować ani indeksować, musisz wyraźnie powiedzieć wyszukiwarkom, aby nie indeksowały i nie indeksowały tych stron. Użyj pliku robots.txt , aby zablokować strony lub katalogi, których nie chcesz indeksować. Możesz również użyć do tego metatagu . Nie można jednak określić w mapie witryny XML, aby nie indeksować stron niepublicznych.

John Conde
źródło
Dzięki za odpowiedź, uwzględnię wszystko w mapie witryny.
Mee
Czy masz bibliotekę, która może obsłużyć ponad 50 stron?
Czy te 50k + stron w bazie danych?
John Conde
Nie musisz umieszczać każdej strony witryny w mapie witryny. Mapa witryny jest przydatna do informowania wyszukiwarek o stronach dostępnych do indeksowania. Jeśli wyszukiwarka może już zobaczyć każdą stronę do indeksowania, a Ty nie dodajesz informacji o „ostatniej modyfikacji”, to nie ma żadnego powodu, aby ją mieć.
Django Reinhardt
1
Ta odpowiedź wydaje się nieco sprzeczna z webmasters.stackexchange.com/a/5151/30596 . Cytując @John Mueller z Google,Using a Sitemap file won't reduce our normal crawling of your site. It's additional information, not a replacement for crawling. Similarly, not having a URL in a Sitemap file doesn't mean that it won't be indexed.
użytkownik