Ostatnio zauważyłem, że Google indeksuje adresy URL zawierające argumenty ciągu zapytania utm_campaign, utm_source i utm_medium. W wynikach Google wyświetla adresy URL z tymi ciągami zapytań zamiast kanonicznego adresu URL:
Rozumiem, że może to być problem „duplikowania treści”, ale link rel=canonical
tagu używałem w całej witrynie. Jako przykład:
[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]
Oczekuję, że Google powinien używać kanonicznego adresu URL do indeksowania. Co ja robię źle?
google
canonical-url
serps
Brendon
źródło
źródło
site:stackexchange.com inurl:utm_campaign
zwraca również podobne wyniki (w nieco większej skali). Pamiętaj również, żesite:
wyszukiwania często zwracają niekanoniczne adresy URL w wynikach, które zwykle nie są zwracane w „normalnych” wyszukiwaniach. Jednak powyższe adresy URL również wydają się być zwracane w „normalnych” wyszukiwaniach.Odpowiedzi:
Przeglądając twoją witrynę tak, jak jest teraz, nie jestem zbyt pewien, czy jest to problem już / obecnie.
Problemem nie jest wewnętrzne powiązanie w Twojej witrynie z włączeniem parametrów UTM (jak sugeruje inne pytanie).
Wygląda na to, że proces udostępniania treści witryny w mediach społecznościowych pozostawia parametry UTM w adresach URL i udostępnia te adresy URL, które w pewnym momencie doprowadziły do ich indeksowania.
Zdarza się to rzadko, ale zdarzało się to wcześniej w wielu innych witrynach. Fakt, że indeksowane są tylko trzy strony z tymi parametrami, wskazuje, że nie jest to ani poważny problem, ani sytuacja ogólna.
Oto kroki, które możesz podjąć, aby pomóc temu zaradzić: -
1. Podaj kanoniczny adres URL na swoich stronach
Już to robisz, a implementacja jest poprawna. Zapewni to, że tylko określony kanoniczny adres URL otrzyma wagę w wyszukiwarkach. Prawdopodobnie zawsze tak było, ale jeśli nie, może to wyjaśniać, dlaczego niektóre stare instancje stron są nadal indeksowane za pomocą parametrów UTM.
2. Poinstruuj Google, aby nie indeksował parametrów UTM w Search Console
W przypadku indeksowania niektórych adresów URL parametrami UTM (tak jak w Twoim przypadku), parametr URL powinien pojawić się jako wykryty w sekcji „Indeksowanie> Parametry adresu URL” w Google Search Console dla Twojej domeny (patrz poniżej).
Nawet jeśli parametry UTM nie pojawią się, możesz „dodać parametr”, aby je utworzyć.
Po prostu wybierz
No: Doesn't affect page content (ex: tracks usage)
(znane jako „parametry pasywne”), a Google zwykle przeszukuje tylko jeden adres URL o określonej wartości parametru .3 Nie zezwalaj na parametry adresu URL w pliku robots.txt
Spowoduje to zablokowanie przez Google indeksowania treści tych adresów URL, ale nie samych samych adresów URL (mogą one nadal wyświetlać się w wynikach wyszukiwania, ale po prostu pominą opis jak poniżej).
Wystarczy dodać coś takiego jak poniżej
robots.txt
: -Wniosek
Kroki # 1 i # 2 powinny być przeprowadzone jako środek ostrożności i "najlepsza praktyka" w każdym razie, a krok # 3 oprócz kroków # 1 i # 2 być może (ponieważ same w sobie nie będą skuteczne).
W Google Search Console istnieje również możliwość (tymczasowego) usuwania adresów URL. Jest to szczególnie przydatne, jeśli niektóre uparte strony są nadal indeksowane, ale wiesz, że źródło problemu zostało rozwiązane i ta funkcja powinna wystarczyć, aby pozbyć się ich raz na zawsze z wyników wyszukiwania.
Nie podałem tego jako powyższego kroku, ponieważ pomimo wcześniejszych badań nie mogę sobie przypomnieć, czy będzie on obsługiwał adresy URL z parametrami [potrzebne cytowanie]. Kiedyś znałem odpowiedź, ale moja pamięć zawodzi mnie przy tej szczególnej okazji.
Więcej informacji na temat usuwania adresów URL z Google .
źródło
robots.txt
(# 3), to czy nie zablokujesz również śledzenia tych kampanii ? ... A także uniemożliwić odczytanie kanonicznego znacznika na stronie (# 1)?noindex: /*?utm=*
w pliku robots.txt.Wygląda na to, że używasz tych łączy w treści swojej witryny do łączenia stron.
Aby mieć pewność, że Google nie zaindeksuje, możesz dodać
rel="nofollow"
do tych linków w swojej witrynie i zablokować te parametry z pliku robots.txt:źródło
Czy sprawdziłeś, czy Twój kanoniczny adres URL został zaindeksowany, czy nie? Jeśli kanoniczny adres URL został zaindeksowany, nie ma się o co martwić.
Możesz wypróbować Narzędzia Google dla webmasterów i zmienić sposób, w jaki Google obsługuje parametry URL tutaj .
źródło