Jak zindeksować dokument pdf?

11

Czytam dokument PDF w Ubuntu 11.04 przy użyciu domyślnej „Przeglądarki dokumentów”. Dokument ma ponad 500 stron i wypełnienie „Znajdź ...” dla określonego tekstu zajmuje trochę czasu. Czy istnieje sposób na indeksowanie dokumentów PDF na wyżej wymienionej platformie? Szukam funkcjonalności wbudowanej w sam czytnik.

Praveen Sripati
źródło

Odpowiedzi:

1

Nie jestem pewien, czy któryś z czytników pdf obsługuje indeksowanie tekstu - prawdopodobnie dlatego, że samo indeksowanie byłoby raczej drogie, a pliki pdf otwierane i zamykane „ad-hoc”

Przeprowadziłem jednak pewne testy i mogę zobaczyć, że okular - domyślna przeglądarka KDE - ma znacznie szybsze wyszukiwanie niż evince (domyślna przeglądarka Ubuntu). To znaczy, że okular może zeskanować cały 500-stronicowy dokument, a evince spędza około 5 sekund na tym samym zadaniu.

Możesz go zainstalować, pisząc

sudo apt-get install okular 

(lub po prostu wyszukaj go w Centrum oprogramowania )

jeśli jest to pierwszy program KDE na twoim komputerze, wymagałoby to zainstalowania sporo zależności, ale może być tego warte - uważam, że programy KDE są ogólnie bardziej zdolne niż ich odpowiedniki Gnome ... Okular obsługuje adnotacje pdf, dla przykład, który czasami jest przydatny.

Siergiej
źródło
Siergiej - używam gnoma. Jak wspomniałeś, należy również zainstalować wiele zależności kde. Jak ryzykowne jest instalowanie zależności kde? Nie chcę mieć kłopotów z instalowaniem całego systemu operacyjnego. Dzięki za pomoc.
Praveen Sripati,
Jest to tak samo ryzykowne jak przejście przez jezdnię - miliony ludzi robią to każdego dnia, ale cóż, istnieje niewielka szansa, że ​​coś pójdzie nie tak - tak jak przy instalowaniu jakiegokolwiek innego oprogramowania. Właściwie myślę, że nawet całkowicie normalne jest jednoczesne instalowanie komputerów stacjonarnych Gnome, KDE i XFCE i przełączanie się między nimi ...
Sergey
Dzięki Sergey - Okular jest fajny - funkcja adnotacji jest naprawdę fajna.
Praveen Sripati,
@PraveenSripati, jeśli martwisz się o zależności Okulara, możesz wypróbować qpdfview. Proszę zobaczyć moją odpowiedź poniżej, aby uzyskać więcej informacji.
Glutanimate
3

Tracker może indeksować twoje dokumenty pdf. Jest bardzo szybki i niezawodny.

Jeśli nie korzystasz jeszcze z tego świetnego narzędzia, możesz je skonfigurować tak, aby indeksowało tylko dokumenty PDF: Alt+ F2następnie wklej tracker-preferencesidź do „Lokalizacji” i wybierz folder swojego pdf.

desgua
źródło
1

Alternatywna przeglądarka plików PDF


Przegląd

Bardzo lekką i szybką alternatywą dla Okulara, która nie jest dostarczana z żadną zależnością KDE, jest qpdfview . Nadal jest w fazie beta, ale okazało się, że jest tak samo stabilny, jak jego duże odpowiedniki. Wyniki wyszukiwania są fantastyczne i przynajmniej na równi z Okularem.

Instalacja

Qpdfview nie jest jeszcze dostępny w oficjalnych repozytoriach, ale można go łatwo zainstalować z PPA dewelopera, wpisując:

sudo add-apt-repository ppa:b-eltzner/qpdfview && apt-get update
sudo apt-get install qpdfview

Indeksowanie plików PDF


Przegląd

Nie mogłem znaleźć alternatywy dla możliwości indeksowania Adobe Acrobat w Linuksie i wygląda na to, że osadzone indeksy wciąż nie są częścią otwartych standardów PDF .

Istnieje jednak wiele bardzo wydajnych wyszukiwarek na komputery, które są zarówno szybsze, jak i bardziej wydajne w indeksowaniu plików PDF niż zastrzeżone narzędzia Adobe. Tracker został już wspomniany, ale są też inne aplikacje. Możesz znaleźć bardzo dokładne porównanie tutaj .

Glutanimate
źródło