Przeglądaj wewnętrzną strukturę PDF

18

Jak przeglądać wewnętrzną strukturę PDF w Adobe 9.0?

Nie znalazłem menu zaawansowanego, które ma tę opcję.

Czy ktoś może mi pomóc?


źródło

Odpowiedzi:

23

Istnieje kilka sposobów przeglądania wewnętrznej struktury pliku PDF.

Pliki PDF są trochę czytelne dla człowieka

Poza hasłami bezpieczeństwa większość z nich jest czytelna dla ludzi. Jeśli plik PDF ma hasło, wszystkie ciągi i strumienie (które zostaną już skompresowane, bez strat) będą śmieciami pseudolosowymi. Istnieje wiele skompresowanych strumieni danych, ale większość z nich wygląda tak:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Ostrzeżenie: białe znaki są w dużej mierze nieistotne i zwykle usuwane, gdy jest to możliwe. Właśnie sprawiłem, że to ładnie, aby ułatwić zrozumienie.

<< i >> rozpoczynają i kończą „słowniki”. Słowniki składają się z par klucz / wartość. Kluczem jest zawsze „nazwa”: wszystkie nazwy zaczynają się od „/”. Wartość może być dowolna, w tym inna nazwa.

[ i ] rozpoczynają i kończą „tablice”. Tablice mogą składać się z wszystkiego.

Liczby to „liczby”. Zmiennoprzecinkowe lub w inny sposób.

() i <> rozpoczynają i kończą „ciągi”. Łańcuchy <> są wymienione jako wartości szesnastkowe, () są łańcuchami ANSI.

Pet Peeve: / Names i (Strings) używają zupełnie innych systemów ucieczki. Grr.

Odnośniki pośrednie wskazują na inne obiekty w pliku PDF:
<objNum> <generationNum-AlwaysZero> R

W powyższym przykładowym obiekcie strumień treści znajduje się w obiekcie 4, gdzie indziej w pliku PDF. Aby go znaleźć, możesz skorzystać z wyszukiwania tekstowego edytora dla „N 0 obj”, gdzie N jest pożądanym numerem obiektu.
OSTRZEŻENIE: W pliku PDF są setki, a może tysiące obiektów. Wyszukanie „1 0 obj” dostarczy Ci mnóstwo hitów.

Biorąc pod uwagę, że chcesz zobaczyć wewnętrzną strukturę, prawdopodobnie już to wszystko znasz. Inni, którzy chcą wiedzieć to samo, mogą tego nie wiedzieć.

OSTRZEŻENIE: Nie edytuj pliku PDF w edytorze tekstu. Wszystkie te elementy binarne zostaną zniekształcone, przesunięcia bajtów są bardzo ważne w pliku PDF.

Wtyczki Acrobat [s]

Istnieje wtyczka programu Acrobat o nazwie PDF CanOpener firmy Windjack Solutions (bez powiązania). Jest SLICK. Będziesz mógł przeglądać strukturę PDF jako drzewo, przeglądać (i modyfikować) strumienie treści i tak dalej.

Aplikacje Thirdy Party

Dużo. Wielu ludzi tworzy jeden z nich w ramach nauki analizowania plików PDF lub jako narzędzie do debugowania. Są całkiem przydatni.

iText RUPS (część biblioteki iText, biblioteki Java PDF, teraz w GitHub)

Przeglądarka obiektów PDF

PDF Vole

Mark Storer
źródło
1
PDF Volelink wydaje się być teraz zerwany ...
DNA,
5
+1 dla iText RUPS, nie do końca przyjazny interfejs GUI, ale działa, przy okazji, obecnie wydaje się, że adres URL projektu ( sourceforge.net/projects/itextrups )
Jaime Hablutzel
2
iText RUPS został przeniesiony tutaj: github.com/itext/rups
bmaupin
1
Kopia kodu źródłowego pdfvole znajduje się tutaj: github.com/Rossi1337/pdf_vole
yms
1
Jeśli plik PDF ma skompresowane strumienie danych, narzędzie wiersza polecenia qpdf może je dekodować / deflować i wypisać plik PDF z bardziej zrozumiałą zawartością: `qpdf --decode-level = all --stream-data = rozpakuj plik wejściowy.pdf plik rozszerzony. pdf
skierpage
7

O2Solutions oferuje narzędzie kompatybilne z MS Windows do przeglądania wewnętrznej struktury dokumentów PDF. Jest bezpłatny do użytku osobistego i komercyjnego.

http://www.o2sol.com/pdfxplorer/overview.htm

AffineMesh
źródło
2

Darmowy edytor PDF-XChange ma panel Zawartość , który pozwala przeglądać strukturę drzewa pliku PDF.

View -> Panes -> Content
Hüseyin Yağlı
źródło
2

PDF Vole wydaje się być zepsuty. Jeśli ktoś nadal szuka narzędzia, korzystam z bezpłatnego narzędzia PDF Analyzer .

wprowadź opis zdjęcia tutaj

juFo
źródło