Dlaczego Google indeksuje strony za pomocą ciągu zapytania utm_campaign

9

Ostatnio zauważyłem, że Google indeksuje adresy URL zawierające argumenty ciągu zapytania utm_campaign, utm_source i utm_medium. W wynikach Google wyświetla adresy URL z tymi ciągami zapytań zamiast kanonicznego adresu URL:

Dodano utm_campaign do adresu URL

Rozumiem, że może to być problem „duplikowania treści”, ale link rel=canonicaltagu używałem w całej witrynie. Jako przykład:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

Zrzut ekranu z kanonicznym znacznikiem

Oczekuję, że Google powinien używać kanonicznego adresu URL do indeksowania. Co ja robię źle?

Brendon
źródło
2
Nawet bez znacznika kanonicznego Googlebot zwykle ignoruje parametry UTM, ponieważ wie, że są one używane tylko do śledzenia. Nigdy wcześniej nie widziałem ich indeksowanych, szczególnie nie z kanoniką.
Stephen Ostermiller
4
FWIW site:stackexchange.com inurl:utm_campaignzwraca również podobne wyniki (w nieco większej skali). Pamiętaj również, że site:wyszukiwania często zwracają niekanoniczne adresy URL w wynikach, które zwykle nie są zwracane w „normalnych” wyszukiwaniach. Jednak powyższe adresy URL również wydają się być zwracane w „normalnych” wyszukiwaniach.
MrWhite

Odpowiedzi:

3

Przeglądając twoją witrynę tak, jak jest teraz, nie jestem zbyt pewien, czy jest to problem już / obecnie.

Problemem nie jest wewnętrzne powiązanie w Twojej witrynie z włączeniem parametrów UTM (jak sugeruje inne pytanie).

Wygląda na to, że proces udostępniania treści witryny w mediach społecznościowych pozostawia parametry UTM w adresach URL i udostępnia te adresy URL, które w pewnym momencie doprowadziły do ​​ich indeksowania.

Zdarza się to rzadko, ale zdarzało się to wcześniej w wielu innych witrynach. Fakt, że indeksowane są tylko trzy strony z tymi parametrami, wskazuje, że nie jest to ani poważny problem, ani sytuacja ogólna.

Oto kroki, które możesz podjąć, aby pomóc temu zaradzić: -

1. Podaj kanoniczny adres URL na swoich stronach

Już to robisz, a implementacja jest poprawna. Zapewni to, że tylko określony kanoniczny adres URL otrzyma wagę w wyszukiwarkach. Prawdopodobnie zawsze tak było, ale jeśli nie, może to wyjaśniać, dlaczego niektóre stare instancje stron są nadal indeksowane za pomocą parametrów UTM.

Prawidłowa implementacja kanonicznych adresów URL

2. Poinstruuj Google, aby nie indeksował parametrów UTM w Search Console

W przypadku indeksowania niektórych adresów URL parametrami UTM (tak jak w Twoim przypadku), parametr URL powinien pojawić się jako wykryty w sekcji „Indeksowanie> Parametry adresu URL” w Google Search Console dla Twojej domeny (patrz poniżej).

Parametry adresu URL UTM Google Search Console

Nawet jeśli parametry UTM nie pojawią się, możesz „dodać parametr”, aby je utworzyć.

Po prostu wybierz No: Doesn't affect page content (ex: tracks usage)(znane jako „parametry pasywne”), a Google zwykle przeszukuje tylko jeden adres URL o określonej wartości parametru .

3 Nie zezwalaj na parametry adresu URL w pliku robots.txt

Spowoduje to zablokowanie przez Google indeksowania treści tych adresów URL, ale nie samych samych adresów URL (mogą one nadal wyświetlać się w wynikach wyszukiwania, ale po prostu pominą opis jak poniżej).

Strona indeksowana jest niedozwolona w pliku robots.txt

Wystarczy dodać coś takiego jak poniżej robots.txt: -

Disallow: /*?utm=*

Wniosek

Kroki # 1 i # 2 powinny być przeprowadzone jako środek ostrożności i "najlepsza praktyka" w każdym razie, a krok # 3 oprócz kroków # 1 i # 2 być może (ponieważ same w sobie nie będą skuteczne).

W Google Search Console istnieje również możliwość (tymczasowego) usuwania adresów URL. Jest to szczególnie przydatne, jeśli niektóre uparte strony są nadal indeksowane, ale wiesz, że źródło problemu zostało rozwiązane i ta funkcja powinna wystarczyć, aby pozbyć się ich raz na zawsze z wyników wyszukiwania.

Nie podałem tego jako powyższego kroku, ponieważ pomimo wcześniejszych badań nie mogę sobie przypomnieć, czy będzie on obsługiwał adresy URL z parametrami [potrzebne cytowanie]. Kiedyś znałem odpowiedź, ale moja pamięć zawodzi mnie przy tej szczególnej okazji.

Więcej informacji na temat usuwania adresów URL z Google .

zigojacko
źródło
1
Ale jeśli zablokujesz indeksowanie tych adresów URL za pomocą robots.txt(# 3), to czy nie zablokujesz również śledzenia tych kampanii ? ... A także uniemożliwić odczytanie kanonicznego znacznika na stronie (# 1)?
MrWhite
Zgadzam się z tym, co w3dk mówi o pliku robots.txt. Jeśli cokolwiek użyj noindex: /*?utm=*w pliku robots.txt.
Stephen Ostermiller
2

Wygląda na to, że używasz tych łączy w treści swojej witryny do łączenia stron.

Aby mieć pewność, że Google nie zaindeksuje, możesz dodać rel="nofollow"do tych linków w swojej witrynie i zablokować te parametry z pliku robots.txt:

Disallow : /*utm_campaign
Nadeem Haddadeen
źródło
Dobry chwyt, że są one używane do linków wewnętrznych. To wyjaśniałoby różnicę w porównaniu z większością witryn, w których są one zazwyczaj używane tylko w linkach przychodzących.
Stephen Ostermiller
W rzeczywistości adresy URL utm_campaign są dodawane przez Buffer.com - np. Wyglądają jak „utm_source = plus.google.com & utm_campaign = bufor”. Nie sądzę, że używam tych łączy w dowolnym miejscu na stronie.
Brendon,
1

Czy sprawdziłeś, czy Twój kanoniczny adres URL został zaindeksowany, czy nie? Jeśli kanoniczny adres URL został zaindeksowany, nie ma się o co martwić.

Możesz wypróbować Narzędzia Google dla webmasterów i zmienić sposób, w jaki Google obsługuje parametry URL tutaj .

Muhammad Usman
źródło
1
W przypadku niektórych adresów URL indeksowany jest tylko adres URL utm_campaign. W przypadku innych stron oba indeksy pokazały się w indeksie. Wczoraj użyłem narzędzia Fetch jako Google do zindeksowania jednego adresu URL (z ciągiem zapytania utm_campaign) - ten adres URL prawdopodobnie zniknął, a kanoniczny adres URL jest teraz indeksowany.
Brendon,
Ponadto statystyki indeksowania ( zrzut ekranu ) pokazują, że strony długo się indeksują (średnio 2,3 s). Nie jestem pewien, czy jest to powszechny problem, ale być może Google ma problemy z indeksowaniem witryny.
Brendon,
Możesz także zrobić małe porządki, gdy odwiedzający wyląduje na Twojej stronie. Użyj łącza Fresh URL skrypt dynamicznie usunąć wszelkie parametry UTM z adresu URL po wyjściu z niego korzystać. Po drugie dodaj parametry adresu URL ...
muhammad usman,