Czy powinienem blokować strony archiwów Wordpress w wyszukiwarkach?

Używam WordPress i /sample-post/adresów URL do moich postów i /yyyy/mm/do archiwów.

Google w pełni zaindeksowało witrynę.

Ponieważ archiwa wyświetlają obecnie pełne posty, pomyślałem, że nie powinienem pozwalać Google indeksować stron archiwów, ponieważ zawierają one pełne posty i będą to duplikaty treści. Zatem mój plik robots.txt zawiera:

Disallow: /2009/
Disallow: /2010/
Disallow: /2011/
Disallow: /2012/
Disallow: /2013/
Disallow: /2014/
Disallow: /2015/

Czy uważasz, że to dobra praktyka, czy może zaszkodziłoby moim rankingom i / lub osiągalności?

seo wordpress robots.txt duplicate-content google-index Cherouvim
źródło

Dobry post, żeby być jasnym, masz na myśli blokowanie wszystkiego oprócz kategorii? Tym, co zwróciło moją uwagę na ten problem, było wyszukiwanie obrazów Google, które pokazało 4 takie same zdjęcia, od tagu / archiwum, strony, posta i strony głównej! Jest w domu jako część suwaka (polecane posty). Jaka byłaby przewaga kategorii nad stronami i postami? A może masz na myśli mix lub wszystkie 3? Używam również Yoast, ale jest to bardzo nowość.

Odpowiedzi:

Rzeczywiście, musisz unikać powielania treści na swojej stronie Wordpress. Wordpress często generuje zduplikowane treści między kategoriami, archiwami i tagami.

Aby rozwiązać ten problem, możesz blokować adresy URL archiwów w pliku robots.txt, ale najlepszą opcją jest umieszczanie <meta name="robots" content="noindex, follow">na stronach archiwów, aby uniknąć indeksowania tych adresów przez Google.

Aby to zrobić, możesz pobrać wtyczkę SEO Wordpress z Yoast . Po zainstalowaniu wtyczki masz możliwość umieszczenia tej meta gdziekolwiek chcesz (na stronach archiwów, na stronach z tagami, na stronach kategorii ...). Możesz następnie przejść do menu wtyczki: SEO => Tytuły i meta .

Moim zdaniem najlepszym rozwiązaniem dla SEO jest umieszczenie tej meta na stronach archiwów i tagów oraz umożliwienie Googleowi indeksowania stron kategorii. Zawsze unikałem powielania treści na stronie Wordpress w ten sposób.

Zistoloen
źródło

Zauważyłem jednak, że mimo to noindex, nofollow, Google czasami nadal indeksuje te strony, więc postanowiłem umieścić te strony w pliku robots.txt. Napisałem wpis na blogu o: vladopandzic.com/search-engine-optimization-seo/…

Vlado Pandžić,