Witryna, nad którą pracuję, zawiera kilkaset plików PDF. Nie sądzę, żebym kiedykolwiek widział jakikolwiek z nich powraca w wyszukiwaniu, ale są one powiązane bezpośrednio z naszej strony. Są również pełne słów kluczowych, ponieważ są dokumentami produktu.
Czy jest coś specjalnego, co musimy zrobić, aby Google lub inne wyszukiwarki zaindeksowały je?
Czy istnieją twarde i szybkie zasady tworzenia plików PDF, które pomogą Google bardziej je polubić? Na przykład czy powinienem je uruchomić przez ghostscript, aby wyczyścić uszkodzone tagi PDF, które Adobe tworzy podczas generowania?
Odpowiedzi:
Google zdecydowanie indeksuje pliki PDF i możesz wyszukiwać tylko pliki PDF, dodając
filetype:pdf
do zapytania ( przykład ).Powiedziałbym, że najważniejsze rzeczy, które należy zrobić, aby zoptymalizować plik PDF, aby można go było łatwo zindeksować:
Aby uzyskać więcej porad, przeczytaj Optymalizowanie dokumentów PDF i Jedenaście Porad dotyczących optymalizacji plików PDF dla wyszukiwarek
źródło
Nie jestem pewien co do innych wyszukiwarek, ale jeśli chodzi o Google, główną zasadą byłoby nie wykluczać ich za pośrednictwem robots.txt
To była ich pierwsza zapowiedź obsługi wyszukiwania PDF.
źródło
Podobnie jak dostosowanie strony internetowej nie może zaszkodzić Twojemu SEO, udostępnienie pliku PDF nie zaszkodzi. Wbudowany moduł sprawdzania dostępności Adobe jest daleki od ideału, ale przynajmniej naprawienie tych obszarów pozwoli Ci zacząć.
Prawdopodobnie spędzam 5 minut na każdym 4 lub 5, głównie tekstowych plikach PDF, które umieszczamy online. Czas rośnie równomiernie w zależności od liczby stron i stopnia złożoności tych stron.
Zakładając, że masz Adobe Acrobat Pro do edycji:
Do bardziej zaawansowanych edycji, takich jak tabele i naprawdę dziwne błędy Adobe, używamy wtyczki o nazwie CommonLook. CommonLook wykonuje zadanie, ale nienawidzę go tak samo, jak nienawidzę narzędzi Adobe.
Zapoznaj się z narzędziem Retusz kolejności czytania, paskiem narzędzi Tagi, paskiem kolejności czytania i paskiem zawartości. Moja praca wymaga w pełni zgodnych dokumentów przed wyjściem do Internetu, ale każdy może skorzystać z prostych tagów i właściwości dokumentu.
źródło