Jak przekonwertować plik PDF na PDF / A

18

Moja uczelnia wymaga złożonych plików PDF być w formacie PDF / formatować .

Próbowałem znaleźć konwerter, ale wszystkie są bardzo drogie i / lub skomplikowane.

Jak przekonwertować istniejący plik PDF na plik PDF / A?

Dziękuję Ci bardzo!

ben
źródło
1
Jeśli są to tylko dokumenty tekstowe z prostym formatowaniem, możesz je otworzyć w OpenOffice i zapisać je jako PDF (OpenOffice ma natywny eksport PDF, ale nie wiem, czy jest zgodny z PDF / A). Poza tym zapytaj swoją szkołę, czy mogą dostarczyć jakieś narzędzia, ponieważ ich obowiązkiem jest to zrobić.
FrustratedWithFormsDesigner
3
@FrustratedWithFormsDesigner: LibreOffice pozwala eksportować dokumenty tekstowe w formacie PDF / A, jak wyjaśniono tutaj .
ThatGuy,
@ThatGuy -100 przeczytaj pytanie: prosił o konwersję PDF !!!
Tomas
1
@Tomas: ¯ \ _ (ツ) _ / ¯ ... Nie odpowiadałem na pytanie OP. Wyraźnie odpowiadałem na FrustratedWithFormsDesigner.
ThatGuy,

Odpowiedzi:

5

Aby zapisać istniejące dokumenty Worda w formacie PDF / A, potrzebujesz tylko najnowszej wersji Microsoft Word. Do tworzenia z innych drukowanych produktów możesz użyć darmowego kreatora PDF / A, takiego jak ten na www.freepdfcreator.org

Jeśli chcesz sprawdzić, czy plik PDF / A jest zgodny, możesz skorzystać z naszej bezpłatnej usługi na www.validatepdfa.com

Konwersja istniejących plików PDF na PDF / A w bezstratny sposób jest nieco trudniejsza i nie zawsze możliwa. Acrobat 9 i 10 mogą to zrobić. Nasza firma, Solid Documents, sprzedaje również produkt, który robi to (i inne popularne funkcje archiwizacji) za 99 USD: Solid PDF Tools

Pragmatyczny
źródło
3
Niestety, darmowy program PDF Creator często powodował zawieszanie się lub awarię programów, z których próbowałem wydrukować, i krótko wyświetlał krótkie wyskakujące okienko na temat „ofert specjalnych”. Kiedy skontaktowałem się z pomocą techniczną Solid Documents, powiedziano mi, że „Darmowa wersja jest wersją pośrednią i nie możemy brać pod uwagę jej problemów”.
Mark Berry
Odpowiedź Kurta Pfeifle poniżej jest znacznie lepsza.
mb21
16

PDF / A jest międzynarodowym standardem ISO dla ciągu PDF rchiving. Standard wymaga ścisłej zgodności z zestawem reguł (takich jak: „osadzaj wszystkie czcionki”, „nie używaj folii”, „nie używaj JavaScript”, „bez szyfrowania”, ...).

Istnieje wiele plików PDF, które twierdzą, że są PDF / A, ale nie przejdą prawdziwego testu dymu. To twierdzenie jest po prostu znacznikiem w metadanych pliku. Ten tag może sprawić, że Acrobat Reader wyświetli specjalną wskazówkę podczas renderowania.

Sprawdzenie prawdziwej zgodności wymaga nieco rozbudowanego komercyjnego oprogramowania do „kontroli wstępnej”. Obecnie nie znam żadnego bezpłatnego narzędzia do wykonania tej pracy. Zobacz także tutaj wyniki niektórych testów: Isartor testsuite .

Możesz użyć Ghostscript do (próby) konwersji plików PDF na PDF / A. Jak to zrobić, jest udokumentowane tutaj ( aktualizacja: dla nowszych wersji tutaj ).

Ale uwaga: ten dokument został zaktualizowany bardzo niedawno [ * ]. Poprzednie wersje pliku Ps2pdf.htm z Ghostscript źle poprowadziły użytkowników do uruchomienia polecenia, które utworzyło pliki PDF podające się za PDF / A, ale które nie przeszły testów rzeczywistego zadymienia.

Jak przekonwertować PDF na PDF / A za pomocą Ghostscript:

Oto linia poleceń:

gswin32c ^
   -dPDFA ^
   -dNOOUTERSAVE ^
   -dUseCIEColor ^
   -sProcessColorModel=DeviceCMYK ^
   -sDEVICE=pdfwrite ^
   -o output_pdfa.pdf ^
   -dPDFACompatibilityPolicy=1 ^
    PDFA_def.ps ^
    input.pdf

[ * ] Uwaga: Problem dotyczy parametru PDFA_def.ps. Jest to plik, który musisz edytować, aby dostosować go do swoich potrzeb. Ghostscript jest dostarczany z jego próbką w /libpodkatalogu. Ta próbka nie będzie działać w obecnej postaci bez jej edycji. Sposób edycji znajduje się w komentarzach próbki.

Kurt Pfeifle
źródło
Czy zatem można bezpiecznie powiedzieć, że PDF / A nie jest formatem jako takim, ale tak naprawdę jest zbiorem wymagań zgodności dotyczących tworzenia pliku PDF przy użyciu istniejącej technologii?
JohnFx
3
@JohnFx: w pewnym sensie tak. Każdy plik PDF / A-1b (lub PDF / A-1a) jest również poprawnym plikiem PDF w sensie ogólnym. Ale nie każdy plik PDF pomyślnie sprawdza się jako plik PDF / A *. Specyfikacje PDF / A- * robią 2 rzeczy: (1) ograniczają zestaw funkcji określonych w ogólnej specyfikacji PDF-1.4 do podzbioru dozwolonych; (2) wymagają ścisłego przestrzegania kilku zasad, które w ogólnej specyfikacji PDF to „rób lub nie rób - jak chcesz” (np. Osadzanie wszystkich używanych czcionek).
Kurt Pfeifle,
7

Użyłem następującego polecenia do konwersji PDF na PDF-A:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf PDFOriginal.ps

Jeśli masz plik PDF, najpierw przekonwertuj go na PS, aby pracować z powyższym kodem. Kilka razy próbowałem z plikiem PDF, aby bezpośrednio przekonwertować na PDF-A. Jednak to nie zadziałało.

Oto sposób przekonwertowania pliku PDF na plik PS:

pdftops PDFOriginal.pdf PDFOriginal.ps
soham
źródło
Niestety, te pliki PDF nie są akceptowane przez mój uniwersytet: /
Tomas
4

Narzędzie „ Zapisz jako PDF ” pakietu Microsoft Office 2007 zapisuje w formacie PDF / A.

Dokument PDF / A to tylko dokument PDF, który wykorzystuje określony podzbiór pliku PDF, który został zaprojektowany w taki sposób, aby był „samodzielny”. Tzn. Nie można polegać na informacjach ze źródeł zewnętrznych (np. Programów czcionek i hiperłączy). Z wikipedii :

Inne kluczowe elementy zgodności z PDF / A to:

* Audio and video content are forbidden.
* JavaScript and executable file launches are forbidden.
* All fonts must be embedded and also must be legally embeddable for
  unlimited, universal rendering. This also applies to the so-called     
  PostScript standard fonts such as Times or Helvetica.
* Colorspaces specified in a device-independent manner.
* Encryption is disallowed.
* Use of standards-based metadata is mandated.

Edytować:

Ponieważ nie ma naprawdę żadnych narzędzi, aby sprawdzić, czy plik PDF jest PDF / A, jest to bezpieczny zakład, że tak samo jak ty, twój uniwersytet nie ma też sposób na sprawdzenie, czy dokument jest je wysłać PDF / A .

Jest prawdopodobne, że jedynym powodem, dla którego wyraźnie o to proszą, jest to, aby mieć pewność, że cała zawartość będzie „tam”, gdy ją otworzą. Po prostu wyrazili ten wymóg raczej tajemniczo (i źle), ponieważ musiał to być plik PDF / A. Tak więc prostym sposobem sprawdzenia, czy plik PDF spełnia swoje prawdziwe wymaganie samodzielnego przechowywania, jest przesłanie pliku PDF i wyświetlenie go z innego (najlepiej offline) komputera i upewnienie się, że wszystko wygląda tak, jak powinno.

imoatama
źródło
2
ah, czy istnieje sposób, aby ustalić, czy istniejący plik PDF to PDF, czy PDF / A?
ben
1
@ben: Nie znam żadnych narzędzi, które określają, czy plik PDF naprawdę jest plikiem PDF / A. PDF / A jest międzynarodowym standardem ISO dla ciągu PDF rchiving. Standard wymaga ścisłej zgodności z zestawem reguł („osadzaj wszystkie czcionki”, „nie używaj folii”). Istnieje wiele plików PDF, które twierdzą, że są PDF / A, ale nie przeszły testów prawdziwego zadymienia. To twierdzenie jest po prostu znacznikiem w metadanych pliku. Ten tag może sprawić, że program Acrobat Reader wyświetli specjalną wskazówkę. Sprawdzenie prawdziwej zgodności wymaga nieco rozbudowanego oprogramowania komercyjnego. Nie znam żadnego bezpłatnego narzędzia do wykonania tej pracy.
Kurt Pfeifle,
Dzięki za informację Pipitas - wydaje się prawdopodobne, że nawet uczelnia nie jest w stanie sprawdzić, czy dokument jest w formacie PDF / A, więc nie jest to trudne wymaganie - zobacz moją edycję.
imoatama
@imoatama: widziałeś moją inną odpowiedź? Wyjaśnia, jak przekonwertować PDF na PDF / A. Jeśli go użyjesz -dPDFACompatibilityPolicy=0, twój plik PDF będzie twierdził, że jest PDF / A, nawet jeśli proces konwersji Ghostscript wykrył rzeczy, które nie są zgodne i których nie można naprawić. Być może stworzyłeś tego rodzaju „fałszywy” plik PDF / jak wspomniałem gdzie indziej ...
Kurt Pfeifle
MS Word „zapisz jako PDF” również twierdzi, że PDF to PDF / A. Nie musisz używać Ghostscript.
imoatama,
2

W macOSX bez użycia, pdftopsktórego nie mogłem zainstalować (jak proponowano @ soham.m17), możesz:

pdf2ps oldPdf.pdf psVersionOfOldps.ps

przekonwertować pdf do formatu ps, a następnie:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf psVersionOfOldps.ps

przekonwertować w pdf / A.

Francesco Pegoraro
źródło
2

Jedynym sposobem, który działał dla mnie w systemie Windows 10, była niewielka modyfikacja odpowiedzi Soham (która dla mnie działała, ale z błędami):

  • konwersja PDFdo ps(z pdf2ps source.pdf temp.ps)
  • konwersję z powrotem psdo PDF/Aza pomocą Ghostscript 9.22 z

gswin64c -dPDFA -dBATCH -dNOPAUSE -dPDFSETTINGS=/prepress -dNOOUTERSAVE -sColorConversionStrategy=UseDeviceIndependentColor -sProcessColorModel=DeviceRGB -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=destination.pdf temp.ps

(Być może trzeba dodać przed gswin64cpełną ścieżką, która była dla mnie C:\Program Files\gs\gs9.22\bin\- taka sama dla pdf2ps, w tym przypadku była dla mnie ścieżka C:\Program Files\gs\gs9.22\lib\)

Jeśli wynikowy plik jest zbyt duży, możesz pominąć tę -dPDFSETTINGS=/prepressopcję. Bez tej opcji wynikowy plik jest mniejszy (nawet mniejszy niż oryginał w moim przypadku), ale można zauważyć pogorszenie jakości obrazu.

Wynikowy PDFwydaje się być zgodny PDF/Anawet bez -dNOOUTERSAVEopcji, chociaż osadzonych jest mniej czcionek (być może ktoś może wyjaśnić różnicę).

Kiedy mówię „odpowiada PDF/A”, mam na myśli nie tylko to, że PDF/A„banner” pojawia się w programie Acrobat Reader, ale że plik przechodzi sprawdzanie poprawności online dostarczone przez https://www.pdf-online.com/osa/validate.aspx

Nie wiem, na ile taka usługa sprawdzania poprawności online jest niezawodna, udało jej się jednak wykryć pliki niezgodne, które pokazywały PDF/A„baner” w programie Acrobat Reader (co w związku z tym nie wydaje się wiarygodne).

mmj
źródło
0

Prosta odpowiedź:

Możesz zainstalować Libre Office , to nic nie kosztuje

Otwórz plik PDF i zapisz jako PDF ... [sprawdź opcję PDF / A]

...Jesteś skończony!

PYK
źródło