Czy Google karze codziennie aktualizowane tagi <lastmod> w mapach witryn, jeśli dane nie są codziennie aktualizowane?

10

Mam mapę witryny, która jest generowana codziennie z wieloma linkami do stron produktów. Produkty te są importowane codziennie z innego źródła danych. Ponieważ aktualizacja polega na wyrzuceniu wszystkich bieżących informacji o produkcie i zastąpieniu go nowymi zaimportowanymi informacjami, data ostatniej modyfikacji zawsze przeskakuje o jeden dzień. Jest to również wykorzystywane w mapie witryny. Nawet w przypadku produktów, które się nie zmieniły. Wszystkie strony produktów udają, że zostały zaktualizowane.

Czy Google będzie karać witrynę za udawanie, że strony zmieniają się z dnia na dzień, a nie zmieniają się?

Moim rozwiązaniem byłoby zmienić wpis tylko wtedy, gdy dane nowego importowanego produktu różnią się od poprzednich danych. Chcę się tylko upewnić, że jest to przydatne ulepszenie, a jednocześnie mogę poświęcić czas na inne ulepszenia.

Wywołać
źródło

Odpowiedzi:

5

Nigdy nie słyszałem o karach z tego powodu. W najgorszym przypadku marnujesz czas pająka, ale to po części dlatego mamy komputery: robienie żmudnych, powtarzalnych czynności. Mimo to powinno być idealnie rozwiązanie tego problemu.

To...

Moim rozwiązaniem byłoby zmienić wpis tylko wtedy, gdy dane nowego importowanego produktu różnią się od poprzednich danych.

... to przede wszystkim powinieneś robić, bez względu na czynniki zewnętrzne, takie jak mapy witryn itp. Jeśli Twoje treści nie są inne (i obejmowałbym usunięcie i zastąpienie identycznymi informacjami w tym opisie), to Twoja lastmoddata nie powinna nie będzie modyfikowany. Tu marnujesz własne zasoby. Nie powiedziałeś, ile produktów jest zaangażowanych, ale będzie moment, w którym proces ten stanie się powolny i kosztowny obliczeniowo.

Su ”
źródło
W pełni się zgadzam. Jestem jednak zależny od innej firmy, która dostarcza dane. Zawsze wysyłają każdy produkt (+200) podczas eksportu danych. Kilka lat temu aktualizacja tego zestawu wydawała się najlepszym rozwiązaniem. Mój klient nie ma budżetu, aby rozwiązać to poprawnie. Te ex-importy odbywają się w nocy, więc dodatkowe wykorzystane zasoby nie stanowią obecnie dużego problemu.
Wywołaj
@Elicit, jeśli nadal masz ten problem, po prostu przechowuj eksport danych z poprzedniego dnia w ich oryginalnym, możliwym do przeanalizowania formacie i wykonaj porównanie w stylu git diff, aby zobaczyć, które produkty się zmieniły. Chociaż jest to miłe, nie potrzebujesz ich, aby wysyłać ci tylko zmienione produkty; powinieneś być w stanie to zrozumieć.
Anonimowy pingwin
3

Nigdy nie podobał mi się pomysł aktualizowania <lastmod>każdego dnia, ponieważ jest to nie tylko złe, to wprowadzające w błąd wyszukiwarki.

W poście na SO , Gary Illyes z Google napisał:

Tag lastmod jest opcjonalny w mapach witryn i w większości przypadków jest ignorowany przez wyszukiwarki, ponieważ webmasterzy wykonują okropną robotę, utrzymując go w ścisłej zgodności.

Zasadniczo opowiadałem się za albo <lastmod>właściwym użyciem , albo wcale. Pozostawienie go (a także <changefreq>& <priority>) powoduje nawet, że sam plik jest mniejszy i szybszy do odczytania przez wyszukiwarki.

Andrew Lott
źródło
2

Nie. Google użyje lastmodpodpowiedzi (tak samo, jak wszystkich wartości map witryn ), ale jeśli zdecyduje, że treść nie jest aktualizowana codziennie, po prostu zignoruje ją i wróci do stron zgodnie z własnym harmonogramem.

DisgruntledGoat
źródło
2

Nie pracuję dla Google i nie mogę powiedzieć z całą pewnością, co faktycznie robią, ale rozsądnym sposobem traktowania <lastmod>znaczników czasu byłoby wskazówka, aby nie marnować czasu na ponowne indeksowanie stron, które się nie zmieniły.

Jeśli więc codziennie raportujesz wszystkie strony jako zmienione, Googlebot będzie po prostu indeksował wszystkie strony w dowolnej kolejności, zamiast koncentrować się tylko na tych stronach, które się zmieniły. W efekcie wygląda to tak, jakby w ogóle nie zgłaszano znaczników czasu ostatniej modyfikacji.

Głównym powodem zapewnienia prawidłowych <lastmod>znaczników czasu jest szybsze wyświetlanie zmian w witrynie w indeksie Google. Jeśli masz w witrynie setki stron, zaindeksowanie ich wszystkich i znalezienie jakichkolwiek zmian zajmie trochę czasu. Jeśli jednak powiesz Googlebotowi, które strony uległy ostatnio zmianie, może najpierw zaindeksować te strony i uniknąć marnowania czasu na resztę.

Oczywiście możesz zamiast tego zwiększyć szybkość indeksowania Googlebota w Narzędziach dla webmasterów i mieć nadzieję na najlepsze. Ale tak naprawdę nie powinno być zbyt trudne, aby skrypt aktualizacji zachowywał znaczniki czasu. Na przykład zakładam, że obecnie robisz coś takiego:

for each product do:
    write new page content into product page file;
end do;

Jeśli tak, po prostu zmień go na coś takiego:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;
Ilmari Karonen
źródło
2

Nie, po prostu ignoruje podane informacje , gdy są niepoprawne. W takim przypadku roboty indeksujące same sprawdzają, jak często powinny indeksować Twoje strony.

Jérôme Verstrynge
źródło
Łącze jest zerwane ...
Victor Schröder
1

Google nie będzie Cię za to karać. Aby otrzymać karę, naprawdę musisz iść w czarny kapelusz na tyłku Google, więc nie martw się o to. Google wkrótce się dowie, czy Twoje treści mają zmiany (nad tym pracowali od kilku lat) i wykorzysta właściwość lastmod jako wskazówkę.

Steven Van Vessum
źródło
1

Sugeruję przeczytanie tych najlepszych praktyk dotyczących map witryn XML i kanałów RSS / Atom

Czas ostatniej modyfikacji

Podaj czas ostatniej modyfikacji dla każdego adresu URL w mapie witryny XML i kanale RSS / Atom. Czas ostatniej modyfikacji powinien być ostatnim znaczącym zmianem zawartości strony. Jeśli zmiana ma być widoczna w wynikach wyszukiwania, to czas ostatniej modyfikacji powinien być czasem tej zmiany.

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

Pamiętaj, aby poprawnie ustawić lub zaktualizować czas ostatniej modyfikacji:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.
Jan
źródło
Dziękuję za aktualizację. Mam nadzieję, że downvoter to zobaczy i cofnie swój głos.
John Conde