Jak usunąć znak wodny z pdf za pomocą pdftk?

33

Muszę usunąć jakiś głupi znak wodny e-maila, który rozszerza się na wszystkie strony książki publicznej. Spojrzałem na stronę podręcznika użytkownika pdftk i kilka przykładów, ale wciąż nie mogę dowiedzieć się, jak usunąć znaki wodne. Doceniam twoje wskazówki.

hnns
źródło

Odpowiedzi:

35

bardzo proste zadanie do wykonania:

użyj sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

ale potem napraw wynikowy plik pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

wszystko w jednym poleceniu:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

tekstowe znaki wodne to nic innego jak tekst między dwoma znacznikami wewnątrz skompresowanego kodu pdf

Dingo
źródło
1
Fantastyczny! działał jak urok. po prostu zmień nazwę adresu e-mail na fikcyjny. Nie chcę, żeby facet, jak rozpieszczona książka, był celem spamerów. Zwłaszcza, że ​​prawdopodobnie to on stworzył pdf. Wielkie dzięki.
hnns
gotowy! Zmieniono konkretny ciąg na ciąg ogólny
Czy ktoś wie, jak zmodyfikować to rozwiązanie, aby pozbyć się znaku wodnego łącza? Pozbyłem się tekstu, ale w miejscu, gdzie kiedyś był tekst, pozostał mały kwadrat.
425nesp.
pdftk zawiesił się, kiedy to uruchomiłem.
Cerin,
@Dingo, w jaki sposób przetwarzana jest partia? Mam na myśli wiele plików
Clain Dsilva,
49

Tylko mały dodatek do odpowiedzi Dingo, ponieważ dla mnie nie zadziałał:

Musiałem najpierw rozpakować dokument PDF, aby móc znaleźć znak wodny i zastąpić go sed. Pierwszy krok polega na rozpakowaniu dokumentu PDF przy użyciu pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

teraz uncompressed.pdfmożna go użyć jak w odpowiedzi Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

Następnie naprawiłem i ponownie skompresowałem dokument:

pdftk unwatermarked.pdf output fixed.pdf compress
Philippe
źródło
Ratujesz życie! Dziękuję Ci!!! :)
johndodo,
1
To jest naprawdę niesamowite!
qed
4
Podjąłem ten proces, uczyniłem go nieco bardziej fantazyjnym i zawarłem go w skrypcie Python. Jest na github tutaj .
Alexander Garden
@Alexander Garden To nie działa, TypeError: str() takes at most 1 argument (2 given)gdy jest używane zgodnie z podanymi wskazówkami użytkowania
8bitjunkie
2
Nie działało usunięcie znaku wodnego dodanego przez Master PDF Editor.
fccoelho
-2

Aby usunąć www.it-ebooks.info,

otwórz plik PDF w notatniku ++ lub panelu tekstowym

zamień www.it-ebooks.info na nic (puste)

Zapisz plik

Otwórz w standardowym czytniku Adobe

Wyjdź, pojawi się monit o zapisanie pliku

Zapisz to

użytkownik549273
źródło
1
Czy to jest ogólne rozwiązanie? Co to jest www.it-ebooks.info?
Karlo