Załóżmy, że mam plik PDF i chcę uzyskać wszelkie dostępne metadane dla tego pliku PDF. Jakiego narzędzia należy użyć?
Uważam, że informacje, które najbardziej interesują mnie, to rozmiar papieru, coś, czego przeglądarki plików PDF zwykle nie zgłaszają. Np. Czy jest to format Letter, Legal, A4 czy coś innego? Ale inne dostępne informacje mogą również być interesujące.
EDYCJA: Oto przydatny przewodnik po rozmiarach papieru, dzięki @terdon.
pdf
file-metadata
Faheem Mitha
źródło
źródło
Odpowiedzi:
Jednym z kanonicznych narzędzi do tego jest
pdfinfo
xpdf, o ile pamiętam. Przykładowe dane wyjściowe:źródło
pdfinfo
ją podnieść.if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
?sqrt(2)
s.Innym narzędziem wartym uwagi jest exiftool . Może nie być odpowiednim narzędziem w konkretnym przypadku, ponieważ nie zgłasza żadnych informacji na temat geometrii dokumentu, ale ogólnie jest prawdopodobnie najbardziej kompletnym narzędziem do sprawdzania metadanych PDF.
Oto przykład polecenia, które wyświetli wszystkie dostępne meta informacje (
-a
), posortowane według grup (-G1
):Oficjalna dokumentacja zawiera przegląd obsługiwanych tagów związanych z PDF:
Możesz zainstalować exiftool na Debian / Ubuntu za pomocą:
Jeśli bardziej interesuje Cię GUI, możesz wypróbować mój projekt PDFMtEd . Jest to zestaw narzędzi, które służą jako graficzne nakładki do exiftool i umożliwiają przeglądanie i edycję metadanych PDF.
Oto kilka zrzutów ekranu:
źródło