Jak wyszukiwać w plikach PDF za pomocą wyrażeń regularnych?

15

Zwykle używam Notepad ++ do wyszukiwania w plikach za pomocą wyrażeń regularnych. Dzisiaj zastanawiam się, czy istnieje program PDF, który robi to samo w przypadku plików PDF. Oczywiście mogę przekonwertować plik PDF na tekst i korzystać z Notepad ++, ale czy jest łatwiejszy sposób bez konwersji?

Michael S.
źródło
1
Z jakiego systemu operacyjnego korzystasz?
Scott McClenning
Windows Developer Preview i Windows 7
Michael S.

Odpowiedzi:

4
  1. Agent Ransack jest darmowy (Lite) i obsługuje PDF, jak potwierdzają informacje o wydaniu.
  2. PowerGREP jest produktem komercyjnym.

Tak jak powiedziałeś, oczywistą alternatywą jest konwersja plików PDF na tekst. Jednym ze sposobów programisty na skonfigurowanie tego do masowego przetwarzania jest użycie pakietu PDFMiner w Pythonie. Agent Ransack używa „pdftotext” z projektu Xpdf (i ty też możesz).

minopret
źródło
sidenote: Agent Ransack to lite wersja FileLocator
akira
Dzięki! Spojrzałem uważniej. Informacje o wersji dostawcy potwierdzają, że File Locator Lite aka Agent Ransack obsługuje pliki PDF. Edycja mojej odpowiedzi.
minopret
Agent Ransack wykonuje to zadanie. Możesz także wypróbować DnGrep.
Michael S.