Jak sprawdzić, kiedy adres URL został po raz pierwszy zaindeksowany przez Google?

16

Jak sprawdzić, kiedy konkretny adres URL został po raz pierwszy zaindeksowany przez Google? Wolę rozwiązanie, które działa nawet w przypadku adresów URL konkurencji, które nie są własnością mnie.

Matcheek
źródło
1
Całkiem możliwe, że odpowiedź brzmi „nie”. Google może nawet nie przechowywać tych informacji (ponieważ nie ma konkretnego powodu, dla którego musiałyby to robić), a nawet jeśli tak, nie może udostępniać ich osobom trzecim.
Ilmari Karonen,
1
Jak wspomnieli inni, nie możesz uzyskać tych informacji. Jeśli masz dostęp do dzienników serwera, możesz zobaczyć, kiedy został po raz pierwszy zaindeksowany, ale nawet to nie oznacza, że ​​został on następnie zindeksowany.
John Mueller

Odpowiedzi:

15

Aby poznać wiek adresu URL, możesz kliknąć ten link, zastępując www.example.comgo odpowiednim adresem URL:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Na przykład, oto wynik z Google dla witryny Meta Stack Overflow : wprowadź opis zdjęcia tutaj

W przeciwnym razie maszyna Wayback jest również dobrym rozwiązaniem, ale z mojego doświadczenia jest mniej precyzyjna.

Zistoloen
źródło
3
Czy ta funkcja Google jest również dostępna w języku angielskim? Link do wersji francuskiej.
Stephen Ostermiller
1
@StephenOstermiller Wystarczy zmienić tld z .frna .com.
MDMoore313,
2
@Zistoloen +1 za twoją odpowiedź, ale mam wątpliwości w twoim zapytaniu. Tak jak powiedziałeś, szukałem www.stackexchange.com za pomocą twojego przykładowego zapytania, ale nie pokazuje żadnego wyniku. Szukałem, usuwając wwwrównież w tym czasie, pokazuje wynik dla daty, Dec 1, 2014która jest bardzo aktualną datą, która nie może być wiekiem adresu URL. Czy szukam niepoprawnie? czy coś brakuje?
Sathiya Kumar
2
„Ukradłem” tę odpowiedź i dodałem ją do mojej odpowiedzi z lepszym wyjaśnieniem. To świetna sztuczka, Zistoloen.
Stephen Ostermiller
6
@Stephen & Zistoloen: Zazwyczaj nie jest to data pierwszego zaindeksowania strony przez Google. Na podstawie niektórych testów data pokazana za pomocą tej metody wydaje się albo zostać pobrana z zawartości strony (jeśli Google uważa, że ​​widzi coś, co wygląda jak data „opublikowana w dniu” lub „ostatnia modyfikacja w dniu”), lub jeśli nie ma takiej w treści znajduje się data oparta na dacie, kiedy Google ostatnio zaobserwował (istotną?) zmianę strony. Oczywiście, jeśli strona nigdy nie została zmieniona po pierwszej publikacji, może się zdarzyć, że jest taka sama jak data publikacji, ale nie ma na to żadnej gwarancji.
Ilmari Karonen,
8

Zistoloen znalazł sposób, aby Google wyświetlił datę pierwszego zaindeksowania treści strony. Dodaję to również do mojej odpowiedzi, ponieważ myślę, że mogę to wyjaśnić jaśniej.

  1. Wyszukaj w Google coś, co spowoduje wyświetlenie strony, którą chcesz
  2. Użyj „Narzędzi wyszukiwania”
  3. Wybierz „Zakres niestandardowy ...” z menu „W dowolnym momencie”
  4. Umieść w szerokim zakresie dat, takim jak 1/1/1900 do 1/1/2020

W wynikach wyszukiwania Google wyświetli datę wykrycia treści znajdującej się na stronie.

po raz pierwszy zaindeksowany

Jeśli strona zostanie zaktualizowana o nową treść, Google również zaktualizuje tę datę. Jest to raczej data „po raz pierwszy zaindeksował tę treść”, a nie data „po raz pierwszy zindeksował ten adres URL”.


Pamięć podręczna Google dla strony pokazuje, kiedy strona była ostatnio indeksowana. Możesz zobaczyć, że strona główna Stack Exchange została ostatnio zindeksowana dzisiaj:

wprowadź opis zdjęcia tutaj


Inną opcją jest użycie maszyny Wayback z Archiwum Internetowego . To pokazuje, jak strona wyglądała w przeszłości. Możesz dowiedzieć się, kiedy strony zostały po raz pierwszy opublikowane. Zarówno Google, jak i Archiwum Internetowe indeksują się i korzystają ze strony wkrótce po jej opublikowaniu.

Stephen Ostermiller
źródło
1
Czy Twoja pierwsza opcja da dokładny wynik dla wszystkich adresów URL? Szukałem bing.com, jak to wyjaśniłeś, ale nie otrzymałem pierwszej zindeksowanej daty bing.com. Przepraszam, jeśli się mylę?
Sathiya Kumar
1
Wydaje się być dokładny, o ile treść na stronie się nie zmieniła. Google może zresetować tę datę, jeśli strona zostanie poddana przeglądowi. Moja strona główna jest wymieniona na 1 lutego 2002 r., Mimo że strona wewnętrzna jest wymieniona na 1 lutego 2001 r. Strona główna została przeprojektowana mniej więcej w tym czasie, podczas gdy strona wewnętrzna nie zmieniła się znacząco od 2001 r.
Stephen Ostermiller
@SathiyaKumar Bing.com podaje mi datę 19 marca 2014 r. Za pomocą tej metody. Pamiętaj, że nic nie zaindeksowane przez Google (przez robots.txt lub w inny sposób) oczywiście nie zostanie pokazane w ten sposób.
Thebluefish,
4

Może nie być sposobu, aby dowiedzieć się, kiedy dowolna strona internetowa została po raz pierwszy zaindeksowana przez Google - z pewnością nie wiem, jak to zrobić. Możliwe, że Google po prostu nie przechowuje tych informacji, ponieważ nie ma prawdziwego powodu, dla którego musiałyby to robić. Poza tym, nawet jeśli przechowują te informacje, tak naprawdę nie mają szczególnego powodu, aby udostępniać je osobom trzecim.

(Jeśli jest to Twoja strona i masz dostęp do starych dzienników dostępu do serwera, jest to łatwe - wystarczy przeszukać dzienniki podczas pierwszej wizyty Googlebota na tej stronie. Ale w przeciwnym razie nie będzie sposobu, aby się upewnić.)


W każdym razie metoda opisana przez Zistoloena i Stephena Ostermillera w ich odpowiedziach zasadniczo nie ujawnia daty pierwszego zaindeksowania określonego adresu URL przez Google. Pokazuje raczej datę, w której Google uważa, że treść pod adresem URL została opublikowana lub ostatnia aktualizacja, i często opiera się na mniej lub bardziej wiarygodnych próbach „wąchania” dat przez samą treść strony.

W tym filmie Matt Cutts z Google krótko omawia sposób wyboru tych dat. Dla wygody przepisałem odpowiedni fragment filmu (w przybliżeniu od 2:09 do 2:22) poniżej:

„... często zobaczysz datę, tak jak ją wywnioskujemy, lub kiedy ją zobaczyliśmy, za każdym razem, gdy zaindeksowaliśmy tę stronę lub jeśli znajdziemy ją gdzieś na stronie i możemy ją wyodrębnić, Zobaczę to na samym początku fragmentu. ”

W przypadku stron takich jak posty na blogach, strony wiki lub pytania dotyczące wymiany stosów, na których witryna z oprogramowaniem automatycznie zgłasza dokładną datę utworzenia / modyfikacji na samej stronie, data podana przez Google prawdopodobnie będzie zgodna. Jednak w przypadku innych typów stron funkcja wyszukiwania danych Google musi pracować ciężej i nie zawsze działa prawidłowo (cokolwiek „właściwe” może oznaczać w tym kontekście).

W szczególności daty te są zasadniczo bezużyteczne do określania, jak dawno strona została zaindeksowana , z dwóch powodów:

  • Jeśli strona została niedawno zmodyfikowana, a data modyfikacji jest widoczna na stronie, Google może uznać ją za „datę” strony, nawet jeśli modyfikacja była całkowicie trywialna.

    Na przykład ta dość stara strona wiki (która została najpierw zaindeksowana w Archive.org w 2003 r. ) Jest obecnie oznaczona przez Google datą 10 listopada 2014 r. - datą ostatniej edycji, jak pokazano na dole strony. Zmiana, która nastąpiła w tym dniu? Wystarczy usunąć pojedynczy link z dołu strony.

  • I odwrotnie, Google wydaje się chętnie przyjmować bardzo stare „daty publikacji”, jeśli znajdzie je na stronie - nawet te, które poprzedzają uruchomienie World Wide Web .

    Na przykład ta strona w starym konkursie programistycznym jest datowana przez Google na 15 września 1986 r. - w rzeczywistości datę wydarzenia opisaną na stronie. Podobnie ta strona dokumentująca strajk studencki w 1970 r. Jest datowana przez Google na 10 maja 1970 r. (Data zeskanowania dokumentów na stronie), a jeszcze bardziej absurdalnie, ta strona podręcznika systemu Linux jest datowana przez Google na 4 listopada , 1989 (losowa przykładowa data użyta na stronie).

    Możesz znaleźć wiele innych takich przykładów, korzystając z niestandardowego wyszukiwania zakresu dat opisanego przez Stephena i Zistoloena, ale ustawiając górny koniec zakresu na, powiedzmy, 6 sierpnia 1991 roku .

Ilmari Karonen
źródło
W swojej odpowiedzi sprzeciwiłeś się głównie odpowiedziom Stephena i Zistoloena, ale nie znalazłem żadnej właściwej odpowiedzi na pytanie OP „Jak znaleźć, kiedy adres URL został po raz pierwszy zaindeksowany przez Google?” w twojej odpowiedzi !!
Sathiya Kumar,
Może nie być żadnej odpowiedzi, z wyjątkiem tego, że „nie możesz” lub „nikt nie wie jak”. Ale masz rację, pozwól mi to zmienić w mojej odpowiedzi.
Ilmari Karonen,
@llmariKaronen +1 za edycję i dodanie odpowiedzi na rzeczywiste pytanie OP.
Sathiya Kumar,