Niedawno musiałem wydrukować kilka plików PDF, aby wysłać je komuś, ale chciałem zredagować (zaciemnić) kilka małych kawałków tekstu.
Szybkie wyszukiwanie w Google nie wykazało żadnych narzędzi do tego konkretnego celu, więc wróciłem do imagemagick & gimp:
convert document.pdf document.png
gimp document-0.png
- (użyj pędzla, aby zaciemnić tekst)
- wydrukuj zredagowaną stronę z gimp
- wydrukuj pozostałe strony z xpdf
Problemem tej strategii jest to, że proces konwersji (z PDF do PNG lub innego formatu) traci jakość. Próbowałem edytować plik PDF w gimp, ale nie zadziałał od razu.
Czy jest jakieś specjalne narzędzie, które pozwala na redakcję w ten sposób? (Nie musi to być nawet „prawdziwa” redakcja - nie wysyłam wersji papierowej, więc „fałszywa” redakcja zadziała, ponieważ kopii nie można zhakować, aby odsłonić leżący pod nią tekst).
A może jest jakiś sposób na edytowanie plików PDF w gimp?
pdf
gimp
imagemagick
editing
bstpierre
źródło
źródło
Odpowiedzi:
(pierwotnie poleciłem Okulara, ale nie działało tak, jak się spodziewałem)
1. Edytuj dokument w edytorze wektorów
Udało mi się otworzyć plik PDF w Inkscape , narysować prostokąt na kawałku tekstu i wydrukować go. Inkscape to edytor wektorów, więc nie wymaga rasteryzacji. Niektóre czcionki wyglądały jednak nieprawidłowo - prawdopodobnie dlatego, że dokument został utworzony na komputerze z czcionkami, których nie ma w moim.
Pamiętaj, że każda metoda, która nie wymaga rasteryzacji, jest akceptowalna tylko wtedy, gdy zamierzasz wydrukować zredagowany dokument na papierze i nie rozpowszechniać go elektronicznie, ponieważ tekst nadal można odzyskać z powodu braku zasilania.
2. Zwiększ rozdzielczość rasteryzacji podczas otwierania w edytorze map bitowych
Jeśli chodzi o „utratę jakości” podczas otwierania strony w Gimp : możesz bezpośrednio otworzyć plik PDF w Gimp. Proces ten zostanie zrasteryzowany. Wielkość utraty jakości w procesie zależy od rozdzielczości, którą wybierasz podczas importu - 300 dpi powinno dać bardzo przyzwoitą jakość (domyślnie jest to 100).
Możesz również uzyskać dobre wyniki za pomocą
convert
polecenia ImageMagick, jeśli powiesz mu, aby zwiększyć rozdzielczość:źródło
convert
była również dobra: inkantacja, której użyłem, byłaconvert -density 300x300
i nie ma utraty jakości.Zasadniczo to, co próbujesz zrobić, to wyróżnić / opatrzyć adnotacjami plik PDF, ale z pewną elastycznością w odniesieniu do krycia i koloru markera (wspomniałeś, że nie musisz cenzurować / usuwać czegoś, a jedynie redagować). Przyjrzałeś się tutaj odpowiedziom: Jak wyróżnić lub opatrzyć adnotacjami pliki PDF?
Jedna z najwyżej ocenianych odpowiedzi zaleca Xournal , o której tu nie wspomniano i która byłaby moją bronią z wyboru. Jest to narzędzie, które umożliwia tworzenie odręcznych notatek, ale ma dodatkowe funkcje umożliwiające dodawanie adnotacji do pliku PDF. Domyślnie zapisuje Twoje adnotacje jako osobny plik, ale umożliwia także eksportowanie pliku PDF z adnotacjami jako nowego pliku PDF. Powinno to zachować układ, czcionki itp.
W Xournal wybierzesz „Adnotuj PDF”, a następnie użyj jednolitego czarnego markera, aby zamaskować części, które chcesz zredagować, i „Eksportuj do PDF”.
W Internecie jest kilka artykułów sugerujących, że Xournal rasteryzuje tekst w eksportowanym pliku PDF (dzięki za wskazanie tego, MHC). Nie wydaje się to prawdą: w przypadku prostych adnotacji tekst można wybierać i wyszukiwać, a rozmiar pliku nie zwiększa się znacznie (w poniższym przykładzie zwiększył się z 205 kb do 220 kb).
Aby zainstalować, uruchom w terminalu:
sudo apt-get install xournal
lub po prostu wybierz go z Centrum oprogramowaniaźródło
convert
polecenia ImageMajick .Możesz użyć Okulara.
źródło
Codziennie redaguję wiele plików PDF, więc spędzam dużo czasu zastanawiając się, jak to zrobić najlepiej.
Dla mnie najlepszym sposobem jest podzielenie pliku PDF na 1-stronicowy plik PDF, obok edycji za pomocą GIMP, obok połączenia. Nie używam imagemagick na wszystkich plikach (nie używam w ogóle), więc nie tracę warstwy tekstowej na wszystkich stronach, ale tylko po redakcji. Nie ładuj całego pliku PDF naraz, ponieważ powoduje to wyczerpanie pamięci.
Podziel plik PDF na pliki 1-stronicowe
Łatwo dziel pliki PDF na 1-stronicowy PDF, dzięki tej funkcji bash (umieść go w ~ / .bashrc):
Możesz teraz wejść,
split_pdf file.pdf
aby uzyskać dużo plików PDF.Redaguj pliki
Ale teraz musisz edytować wszystkie te pliki. Możesz to zrobić za pomocą
gimp original-filename-*.pdf
. Proponuję skonfigurować skrót w GIMP (okno główne-> Edycja-> Skrót), aby zastąpić plik (używam CTRL + R), filtr rozmycia (np. CTRL + D), zamknąć plik (np. CTRL + W) i wyjść z GIMP ( np. CTRL + Q). Pamiętaj, aby nie ładować GIMP-a do wielu plików jednocześnie, ale GIMP-a jak ładujesz po otwarciu, abyś mógł bezpiecznie korzystaćgimp original-filename-*.pdf
z tysiąca plików.Łącz pliki
Możesz łatwo łączyć pliki za pomocą:
pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";
Połącz to wszystko razem
Te operacje są bardzo powtarzalne i nudne, więc łączę to wszystko w 1 skrypcie:
Najnowsza wersja tego skryptu jest zawsze dostępna pod adresem : http://dostep.jawne.info.pl/it/bashrc
Pamiętaj, aby zamknąć GIMP (CTRL + Q) po całej redakcji, aby kontynuować skrypt.
Poza tym jako ja otwieram zredagowane pliki (lubię czytać, aby sprawdzić, czy wszystkie) oraz przesyłać do Scribd za pomocą mojego drugiego skryptu - scribd_up , dzięki czemu mogę bardzo skutecznie redagować wiele plików PDF.
źródło
Otwórz plik PDF za pomocą bezpłatnego narzędzia PDF-Xchange PDF Viewer . Przyciemnij tekst, który ma zostać zredagowany za pomocą czarnych prostokątów. Wydrukować. To zapewni ci łatwą, „fałszywą” redakcję wysokiej jakości.
źródło
Użyj LibreOffice Draw do szybkiej edycji, której szukasz. Po zakończeniu możesz zapisać go w formacie LibreOffice Draw lub ponownie wyeksportować do formatu PDF (
File
>Export as PDF
)Aby móc importować pliki PDF do programu LibreOffice Draw, musisz najpierw zainstalować pakiet
libreoffice-pdfimport
.Zainstaluj go za pośrednictwem Centrum oprogramowania Ubuntu ( libreoffice-pdfimport ) lub za pomocą terminala
sudo apt-get install libreoffice-pdfimport
.źródło
Możesz także wypróbować to narzędzie: https://launchpad.net/updf
Oto on (ale w każdym razie tekst można wybrać):
źródło
Pamiętam, że pewnego razu ja i mój kolega musieliśmy znaleźć sposób na edycję kilku plików pdf. Skończyło się na Gimpie. Skomentuję ci szczegóły ... otwieramy pdf bezpośrednio z gimp (w terminalu)
Po zakończeniu edycji nie zapisaliśmy zmian, zamiast tego drukujemy do pliku pdf ... Wydawało się, że działa dobrze.
źródło
convert
najpierw przekonwertować za pomocą imagemagick , a następnie edytować przekonwertowany plik. (Zobacz zaakceptowaną odpowiedź.)PDF Studio to oprogramowanie typu non-opensource, które wymaga zakupu.
Pod względem tego pytania, począwszy od wersji 8, ma funkcję ręcznej redakcji. Użytkownicy mogą wybrać obiekt tekstowy i zredagować go. Treść jest usuwana z pliku PDF i zastępowana czarnym prostokątem.
W wersji 9, która pojawi się w trzecim kwartale 2013 roku, adnotacje redakcyjne i wypalanie będą również dostępne dla obrazów i kształtów.
źródło
Ponieważ wiele rozwiązań tutaj zaleca redagowanie / zaciemnianie za pomocą adnotacji (które pozostawiają oryginalną treść w pliku pdf), zalecam później rasteryzację pliku pdf, aby naprawdę usunąć oryginalną zawartość. (Nie bądź tym facetem .)
Oto jeden ze sposobów na zrobienie tego, co jednocześnie utrzymuje wysoką jakość i niski rozmiar pliku (przynajmniej w moim przypadku kilku czarno-białych stron):
Uwaga:
convert
wymaga ImageMagick.Uwaga 2:
convert
nie zachowuje zawartości formularzy, które mogłeś wypełnić. Aby się nie zgubić, możesz wydrukować dokument „do pliku” w czymś takim jakevince
najpierw (lub w dowolnej aplikacji, którą wypełniłeś formularz), a następnie zrasteryzować.źródło
Najlepszym sposobem, jaki udało mi się to zrobić, jest skorzystanie z witryny http://www.pdfescape.com . Możesz dodawać adnotacje, dodawać tekst i obrazy, rysować prostokąt „biały” wokół elementów, które chcesz zredagować, a także możesz szybko pobrać i zapisać. Działa również bardzo dobrze z dokumentami wielostronicowymi, co jest czymś, z czym wiele innych rozwiązań nie działa dobrze. Na przykład, jeśli otworzysz dokument wielostronicowy w Gimp lub Inkscape, będziesz mógł otworzyć tylko jedną stronę na raz. W PDFescape proces jest znacznie szybszy. Cały proces redagowania 2-stronicowego dokumentu zajmuje mniej niż minutę.
źródło
Jeśli nie chcesz pamiętać poprawnej inkantacji
convert
, możesz użyć pdf-redact-tools , skryptu powłoki automatyzującego proces rozbijania pliku PDF na obrazy PNG i scalania ich z powrotem po redakcji (za pomocą wybranego narzędzia, np. Gimp ). Jest konwencjonalnie apt-get do zainstalowania .źródło
Istnieje wiele edytorów do bezpośredniej edycji dokumentów PDF, takich jak
pdfedit
lub konwertuj na inne formaty wektorowe, które mogą być lepiej obsługiwane, takie jakpstoedit
. Jednak nie poleciłbym użycia żadnego z nich, ponieważ ryzyko zrobienia czegoś głupiego, jak na przykład pomalowanie tekstu na czarno przy pozostawieniu wektorów na miejscu, jest łatwe, dzięki czemu redakcja jest trywialna do cofnięcia.Przejście wektora na trasę bitmapową jest najbezpieczniejszym sposobem, najlepiej 1-bitową trasą bitmapową, aby uniknąć potencjalnych problemów z kanałami alfa lub różnic kolorów, które mogłyby pozostawić tekst do odczytu.
Jeśli to możliwe, należy zawsze zredagować oryginalny dokument i po prostu całkowicie usunąć informacje, a nie farbę w pliku PDF, ponieważ nawet kernowanie i odstępy tekstu wokół zredagowanego tekstu mogą go rozdać.
źródło
pdfedit
nie działało: kiedy narysowałem czarny prostokąt nad danym tekstem, niuansowałem resztę strony, pozostawiając mi dokument składający się z pojedynczy czarny prostokąt.Dodaję do listy: Krita . Nie miał utraty jakości, ponieważ podczas importowania pliku PDF możesz zdefiniować dpi (ustaw 300 na, jak powiedział @Sergey). Po edycji naciśnij „Eksportuj jako PDF”. Wreszcie, uważam Kritę za bardziej intuicyjną niż Gimp, po długim czasie korzystania z Photoshopa.
źródło
Jeśli używasz LibreOffice do utworzenia pliku PDF, otwórz dokument w LibreOffice, zaznacz tekst do zredagowania, kliknij prawym przyciskiem myszy i wybierz znak, wybierz Tło i kliknij czarny. Eksportuj do pliku PDF.
źródło