W Narzędziach Google dla webmasterów zauważyłem, że moja strona główna została zindeksowana dwa razy:
example.com/
example.com/?chocaid=397
Wiem, że mógłbym to naprawić za pomocą typu linku canonical
, ale zastanawiam się: skąd pochodzi ten parametr?
Istnieje wiele witryn, które mają strony zaindeksowane tym samym parametrem / wartością: https://duckduckgo.com/?q=chocaid%3D397 .
Szukałem podobieństw między tymi stronami. ale nie udało się znaleźć rozstrzygającej: często jest to pierwsza strona, ale nie w każdym przypadku. Niektóre są NSFW, ale nie wszystkie. Gdy adres URL jednej domeny ma ten parametr, często mają go także inne subdomeny tej samej domeny.
Przykłady
Wpis w Wikipedii
Microsoft Codeplex
url
url-parameters
unor
źródło
źródło
?chocaid=397
celu zaindeksowania prawdopodobnie coś łączy się z tym, aby Google znalazł link w pierwszej kolejności??chocaid=397
może to być jakaś próba zadzierania z hashami (niewiele o tym wiem, więc nie jestem tego pewien). To także świetne pytanie.Odpowiedzi:
Jak nowa jest Twoja domena? Możliwe, że było to popularne zapytanie w starej domenie, dlatego wciąż otrzymujesz „odwiedzających”. Czy to odwzorowanie na prawidłową stronę lub 404? Jeśli dostajesz tam wiele odsłon i jest to 404, to odwzorowałbym go (użyj .htaccess) na twoją stronę główną lub coś takiego.
źródło
canonical
, ale to pytanie dotyczy bardziej pochodzenia tego parametru.Być może Googlebot próbuje uzyskać dostęp do jQuery / JavaScript i zaindeksować wszystko, co może. Niedawno pojawił się tutaj post z prośbą o pomoc, ponieważ Googlebot indeksował nieprawidłowe adresy URL w swojej witrynie. John M odpowiedział, jak Googlebot może szukać więcej adresów URL do indeksowania ze skryptów w ich witrynie. Pracuje w Narzędziach Google dla webmasterów. Prawie odpowiedziałeś na swoje pytanie, ustawiając kanoniczny znacznik.
źródło
Chociaż nie mam jednoznacznej odpowiedzi, jest kilka rzeczy, które znalazłem, patrząc na to, które mogą pomóc zawęzić to:
Domyślam się, że istnieje / istniała witryna ze zgarniaczem, która dodaje ten adres URL do wszystkich znalezionych linków. Z pewnością linki zewnętrzne wydają się najbardziej prawdopodobnym wyjaśnieniem, skąd pochodzą, a katalogi są mało prawdopodobne, ponieważ są dodawane do dość przypadkowych stron.
źródło
Może to być od dostawcy reklam, który możesz mieć, mam ten sam problem, a jedynym możliwym miejscem, z którego pochodzi, jest dostawca reklam wstrzykujący niektóre złośliwe oprogramowanie za pomocą kodów javascript.
źródło