Przeglądarka metadanych PDF / edytor znaczników dla Ubuntu

26

Istnieje wiele pytań i odpowiedzi dotyczących najlepszej przeglądarki plików PDF dostępnej w systemie Ubuntu, ale chcę przeanalizować plik PDF i poznać szczegóły pliku PDF, takie jak obrazy, czcionki i łącza dostępne w danym pliku PDF.

Czy są dostępne jakieś przeglądarki plików PDF do edycji / edytorów tagów?

Sahil Grover
źródło
2
Bliscy wyborcy: Tylko dlatego, że pytanie brzmi „najlepiej” w tytule, nie jest oparte na opiniach!
Seth

Odpowiedzi:

31
  1. Wyświetl metadane pdf pliku o nazwie Example.pdf:

    pdfinfo Example.pdf  
    
  2. Edytuj istniejące metadane w terminalu za pomocą edytora nano:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. Zaktualizuj metadane:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    

Skróty klawiaturowe edytora Nano
Użyj kombinacji klawiszy Ctrl+, Oa następnie naciśnij, Enteraby zapisać plik w bieżącej lokalizacji.
Użyj kombinacji klawiszy Ctrl+, Xaby wyjść z nano.

Karel
źródło
10

Rozwiązanie CLI

Kolejnym narzędziem wartym uwagi jest exiftool . Zaletą exiftool nad pdfinfo jest to, że obsługuje o wiele więcej typów metadanych (np. Tagi XMP).

Oto przykład polecenia, które wyświetli wszystkie dostępne meta informacje ( -a), posortowane według grup ( -G1):

exiftool -a -G1 "$File"

Przegląd obsługiwanych tagów związanych z PDF:

Możesz zainstalować exiftool na Ubuntu za pomocą:

sudo apt-get install libimage-exiftool-perl

Rozwiązanie GUI

Jeśli szukasz przeglądarki / edytora metadanych PDF z GUI, możesz wypróbować PDFMtEd . Jest to zestaw narzędzi graficznych, które napisałem do zarządzania metadanymi PDF za pomocą exiftool:

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Glutanimate
źródło
1

Odpowiedź „najlepsza” naprawdę zależy od tego, ile szczegółów chcesz i od tego, jak stabilny ma być widz. Istnieje wiele programów do przeglądania, a nawet edytowania post-skryptów i plików pdf w systemie Linux; wszystko, co wydaje się usunięte z obecnych repozytoriów Ubuntu (prawdopodobnie z powodu problemów ze stabilnością).

Na razie polecam wypróbowanie pdfedit. Jeśli używasz Quantal lub wcześniej, można go zainstalować za pośrednictwem

sudo apt-get install pdfedit

W przypadku nowszych wersji musisz pobrać go ze strony projektu , rozpakować i skompilować samodzielnie.

virtualxtc
źródło
Nie chcę widza. Potrzebuję parsera, który może pobrać szczegóły z pliku pdf, takie jak linki dostępne w pliku .... dostępne obrazy ... indeks pliku itp.
Sahil Grover
Niestety, pomylono pdftk z pdfedit, ponieważ usunęli pdfedit z repozytoriów
virtualxtc
0

Aby rozwinąć pdftkmetodę edycji, co jest miłe, ponieważ pokazuje wszystko, co jest ustawione, a jednocześnie pozwala ci zmienić wszystko, co chcesz, oto skrypt (dla twojego .bashrclub innego pliku aliasów), aby to zrobić za pomocą jednego polecenia . Spowoduje to utworzenie nowej wersji pliku, który chcesz edytować, otworzy twój ulubiony edytor z plikiem metadanych, a następnie zaimplementuje zmiany i ustawi czas utworzenia / modyfikacji pliku w zmodyfikowanym pliku PDF na taki sam jak oryginał. Aby z niego skorzystać, po ponownym uruchomieniu .bashrcpliku, po prostu wpisz

editPDFmetadata myfile.pdf

Oto alias:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

Po prostu umieść powyższą definicję w .bashrcpliku w folderze domowym, a następnie otwórz nowy terminal i będzie gotowy do użycia.

CPBL
źródło
0

sudo apt-get install libimage-exiftool-perl

Metadane można usunąć całkowicie za pomocą następującego polecenia

exiftool -all:all= file_name

Na zawsze
źródło