Mam mapę witryny, która jest generowana codziennie z wieloma linkami do stron produktów. Produkty te są importowane codziennie z innego źródła danych. Ponieważ aktualizacja polega na wyrzuceniu wszystkich bieżących informacji o produkcie i zastąpieniu go nowymi zaimportowanymi informacjami, data ostatniej modyfikacji zawsze przeskakuje o jeden dzień. Jest to również wykorzystywane w mapie witryny. Nawet w przypadku produktów, które się nie zmieniły. Wszystkie strony produktów udają, że zostały zaktualizowane.
Czy Google będzie karać witrynę za udawanie, że strony zmieniają się z dnia na dzień, a nie zmieniają się?
Moim rozwiązaniem byłoby zmienić wpis tylko wtedy, gdy dane nowego importowanego produktu różnią się od poprzednich danych. Chcę się tylko upewnić, że jest to przydatne ulepszenie, a jednocześnie mogę poświęcić czas na inne ulepszenia.
źródło
Nigdy nie podobał mi się pomysł aktualizowania
<lastmod>
każdego dnia, ponieważ jest to nie tylko złe, to wprowadzające w błąd wyszukiwarki.W poście na SO , Gary Illyes z Google napisał:
Zasadniczo opowiadałem się za albo
<lastmod>
właściwym użyciem , albo wcale. Pozostawienie go (a także<changefreq>
&<priority>
) powoduje nawet, że sam plik jest mniejszy i szybszy do odczytania przez wyszukiwarki.źródło
Nie. Google użyje
lastmod
podpowiedzi (tak samo, jak wszystkich wartości map witryn ), ale jeśli zdecyduje, że treść nie jest aktualizowana codziennie, po prostu zignoruje ją i wróci do stron zgodnie z własnym harmonogramem.źródło
Nie pracuję dla Google i nie mogę powiedzieć z całą pewnością, co faktycznie robią, ale rozsądnym sposobem traktowania
<lastmod>
znaczników czasu byłoby wskazówka, aby nie marnować czasu na ponowne indeksowanie stron, które się nie zmieniły.Jeśli więc codziennie raportujesz wszystkie strony jako zmienione, Googlebot będzie po prostu indeksował wszystkie strony w dowolnej kolejności, zamiast koncentrować się tylko na tych stronach, które się zmieniły. W efekcie wygląda to tak, jakby w ogóle nie zgłaszano znaczników czasu ostatniej modyfikacji.
Głównym powodem zapewnienia prawidłowych
<lastmod>
znaczników czasu jest szybsze wyświetlanie zmian w witrynie w indeksie Google. Jeśli masz w witrynie setki stron, zaindeksowanie ich wszystkich i znalezienie jakichkolwiek zmian zajmie trochę czasu. Jeśli jednak powiesz Googlebotowi, które strony uległy ostatnio zmianie, może najpierw zaindeksować te strony i uniknąć marnowania czasu na resztę.Oczywiście możesz zamiast tego zwiększyć szybkość indeksowania Googlebota w Narzędziach dla webmasterów i mieć nadzieję na najlepsze. Ale tak naprawdę nie powinno być zbyt trudne, aby skrypt aktualizacji zachowywał znaczniki czasu. Na przykład zakładam, że obecnie robisz coś takiego:
Jeśli tak, po prostu zmień go na coś takiego:
źródło
Nie, po prostu ignoruje podane informacje , gdy są niepoprawne. W takim przypadku roboty indeksujące same sprawdzają, jak często powinny indeksować Twoje strony.
źródło
Google nie będzie Cię za to karać. Aby otrzymać karę, naprawdę musisz iść w czarny kapelusz na tyłku Google, więc nie martw się o to. Google wkrótce się dowie, czy Twoje treści mają zmiany (nad tym pracowali od kilku lat) i wykorzysta właściwość lastmod jako wskazówkę.
źródło
Sugeruję przeczytanie tych najlepszych praktyk dotyczących map witryn XML i kanałów RSS / Atom
źródło