Mam plik PDF zawierający mapy budynku, w którym pracuję, tutaj:
http://www.libsys.und.edu/dev/FloorPlans_All.pdf
Oryginalne pliki źródłowe zostały utracone i poproszono mnie o wyodrębnienie obrazów map, najlepiej bez tekstu i ikon, które zostały na nich nałożone. Okazało się to denerwująco trudne.
Do tej pory wypróbowałem następujące programy GUI:
- Adobe Reader: pozwala mi zaznaczać tekst, ale nie obrazy tła
- Przeglądarka plików PDF FoxIt: pozwala mi zaznaczać tekst, ale nie obrazy tła
- XPDF w systemie Ubuntu 10.10: pozwala mes wybierać tekst, ale nie obrazy tła
A także następujące programy wiersza polecenia:
- pdfimages: wyodrębnia ikony wskazujące łazienki, ale nie obrazy tła
- pdftohtml: to samo co pdfimages, a ponadto tworzy źle oznakowany dokument HTML
- pdfextract: to samo co pdfimages
- konwersja: pomyślnie zapisane obrazy, ale z wypalonym tekstem
Próbowałem nawet ręcznie otworzyć plik PDF w edytorze tekstu i wyodrębnić obiekty strumienia, wklejając je do nowego pliku i zapisując go z rozszerzeniem .jpg, .png lub .bmp (każdy z kolei). Biorąc pod uwagę, jak mało wiem o wewnętrznej strukturze plików PDF, nic dziwnego, że to nie zadziałało.
Więc ... czy jest jakiś sposób, aby odzyskać obrazy mapy z tej rzeczy bez uzyskiwania tekstu i ikon?
źródło
qpdf
do konwersji części binarnych na ASCII, o ile to możliwe. (2) Użyj edytora tekstu, aby uczynić cały tekst niewidocznym, którego nie chcę widzieć na ekranie ani na wydrukach (można to łatwo i bez uszkodzenia tabeli XRef przełączać niewidzialną flagą). (3) Ponownie destyluj wynik za pomocą Ghostscript, aby maksymalnie zmniejszyć jego rozmiar. - Niestety, nie można już pobrać pliku w celu zademonstrowania procedury ...Odpowiedzi:
Możesz pobrać bibliotekę XPDF ze strony http://www.foolabs.com/xpdf/download.html dla systemów Linux i Windows. Następnie uruchom
pdfimages -j input.pdf output
i powinieneś dostaćoutput-000.jpg
,output-001.jpg
itp. Sprawdź także http://linuxcommand.org/man_pages/pdfimages1.html, aby uzyskać więcej opcji użytkowania.źródło
Ok, po tym, jak bawiłem się tym przez 5 minut, moja analiza jest taka, że PDF jest jeszcze dziwniejszy, niż początkowo myślałem, i to coś mówi.
Nie jestem pewien, jaki jest twój budżet, ale dzięki Acrobat Pro Extended 9 możesz użyć:
A. Narzędzia, edycja zaawansowana, narzędzie do retuszu
B. Narzędzia, edycja zaawansowana, narzędzie Retup Object Tool
-Wybierz obiekt (możesz uzyskać większość, ale nie wszystkie z nich (np. Nie można wybrać ikon komputerów studentów), a następnie usuń
Oto jak wyglądała strona 1 po szybkim czyszczeniu: http://dl.dropbox.com/u/7434256/p1test.pdf
źródło
/AA
operatora (dla akcji automatycznej ), co czyni go potencjalnie niebezpiecznym plikiem PDF. Ghostscript był w stanie sprowadzić go do 60 kB, nie tracąc żadnej widocznej zawartości. (Metadane zawarte w pliku rozciągają się na 17 różnych obiektów. Metadane als sugerują, że istnieje 17 różnych wersji / modyfikacji tego pliku od czasu jego utworzenia w dniuWeź plik PDF utworzony przez Craiga H i zoptymalizuj go nieco, uruchamiając go za pomocą Ghostscript. W systemie Windows wiersz poleceń to:
W systemach Linux / Unix / Mac OS X:
Spowoduje to zmniejszenie rozmiaru pliku z 3,000 kB do około 60 kB bez utraty zawartości. Następnie importowanie go do programu Inkscape (lub InDesign, Illustrator, ...) powinno być znacznie szybsze ....
źródło
... możesz spróbować Photoshopa. Odczytuje pliki PDF i jest „możliwe”, że pochodzi z PS i prawdopodobnie nadal ma warstwy ... ale jest to bardzo długa perspektywa.
źródło
W środowisku Linux użyłem pdfmod do wyodrębnienia wszystkich obrazów za jednym razem. Zobacz https://wiki.gnome.org/Apps/PdfMod lub, dla użytkowników Ubuntu, https://apps.ubuntu.com/cat/applications/pdfmod/
Aby pobrać i zainstalować go w Ubuntu, wystarczy wpisać
sudo apt-get install pdfmod
.pdfmod
desce rozdzielczej lub terminalu wiersza poleceń)export n images
przy n odpowiedniej liczbie). Możesz również uzyskać dostęp do tego polecenia, najeżdżając myszką na zaznaczenie i aktywując menu lokalne (kliknij prawym przyciskiem myszy, aby wyświetlić prawą rękę).Mam nadzieję że to pomoże.
źródło
Otwórz dokument na ekranie, powiększ obraz, aby był jak największy, ale cały jest nadal widoczny. Naciśnij klawisze alt + prnt scrn (lub odpowiednik w systemie operacyjnym), aby wykonać zrzut ekranu programu. Teraz otwórz farbę lub swój ulubiony edytor zdjęć (Photoshop, Gimp itp.) Wklej na obraz i wykadruj wszystko, czego nie chcesz.
źródło