skrypt, aby pobrać PDFpen do OCR wielu plików PDF jednocześnie

1

Próbuję utworzyć prosty obieg pracy Automatora, aby znaleźć wszystkie pliki PDF, których nie można przeszukiwać, a następnie OCR je za pomocą PDFpen. Nie rozumiem jednego lub dwóch innych postów tutaj (takich jak ten ), ani nie mam Hazel.

Poza Automatorem mogę używać Findera do wyświetlania plików PDF, których nie można przeszukiwać, wyszukując „rodzaj: pdf NIE intext:„ a ””, ale nie wiem, jak to przetłumaczyć na przepływ pracy Automatora, przekazać te pliki, skrypty itp. .

Dzięki za wszelką pomoc!

William
źródło
Nie mam PDFpen, więc nie mogę dostarczyć rozwiązania, ani nie wiem, czego PDFpen oczekuje jako danych wejściowych, pliku jako aliasu lub ścieżki POSIX. Jednak w zakresie znajdowania plików PDF z obrazami, jeśli wyszukiwanie w Finderze kind:pdf NOT intext:"a"jest skuteczne, możesz to zrobić i wybrać wszystko, co znajdzie. Następnie w Workflow możesz pobrać wybrane pliki na więcej niż jeden sposób. W tym momencie możesz kontynuować przetwarzanie. Jeśli chcesz całkowicie zautomatyzować tę kind:pdf NOT intext:"a"funkcję , być może będziesz musiał przekonwertować ją na postać, której mdfindmoże użyć polecenie, a następnie odpowiednio przetworzyć jej dane wyjściowe.
user3439894
Jakiej wersji OS X / macOS i PDFpen używasz?
user3439894,
PDFpen 9.2.3 i 10.13.2 macOS. Właśnie natknąłem się na pół-rozwiązanie tutaj, które tworzy element w menu usług do plików OCR PDF, które wybrałem w Finderze. Wygląda na to, że jest trochę wadliwy w zależności od pliku PDF, ale wydaje się, że wykonał zadanie. Dziękujemy za opinię na ten temat!
william