Chcę przekonwertować .pdf
plik na .odt
plik, aby móc dalej przekonwertować go na .doc
plik. Czy istnieje oprogramowanie / skrypt, który może to zrobić. Próbowałem skopiować zawartość .pdf
pliku i wkleić ją w programie piszącym liberoffice, formatowanie nie zostało zachowane.
Dokument jest poufny, więc wolałbym nie korzystać z żadnej usługi online do konwersji.
Każda pomoc jest bardzo ceniona.
format-conversion
Ankit
źródło
źródło
Odpowiedzi:
Byłem zirytowany również brakiem darmowego konwertera PDF na ODT. Nie potrzebowałem nawet nic skomplikowanego. Tylko narzędzie, które generuje pliki ODT, które mogę następnie opatrzyć adnotacjami w LibreOffice (np. W celu wypełnienia formularzy).
Wiem, jak to zrobić ręcznie, konwertując dokument PDF na pliki graficzne, a następnie importując je do LibreOffice, ale to dość nużące.
W końcu napisałem krótki skrypt powłoki, który automatycznie wykonuje wszystkie wymagane kroki. Możesz go znaleźć na https://github.com/gutschke/pdf2odt
Może przyjmować dowolną liczbę plików PDF i plików graficznych jako dane wejściowe i generuje plik ODT, który można otworzyć i edytować w LibreOffice. Obrazy są wyświetlane jako tło strony, więc możesz swobodnie nad nimi pisać. Każdy obraz jest powiązany z własnym stylem strony. Pamiętaj o tym, wstawiając podziały stron i dostosowując styl strony, jeśli to konieczne.
Testowałem skrypt zarówno na Linuksie, jak i na Macu. Biorąc pod uwagę, że potrzebuje tylko garści rozsądnie standardowych narzędzi, powinien być dość przenośny.
źródło
pdf2oo
kilka lat temu, ale wydaje się, że teraz produkuje uszkodzone pliki dla LibreOffice. Ten skrypt robi to i wiele więcej - dzięki!Możesz
PDF Utilities
rzucić okiem na (poppler-utils poprzez Synaptic lub apt-get), który zawiera pdftotext :Oczywiście sukces zależeć będzie od sposobu wygenerowania pliku pdf. Jeśli to, co chcesz w postaci pliku tekstowego, można następnie Zapisz że jako plik .odt.
Edycja: Zapomniałem podać źródło wyceny. Pochodzi z zakładki opisu w Synaptic dla
PDF Utilities (based on Poppler).
źródło
pdftohtml
musi najlepiej pasować do zadania, ponieważ HTML może przenosić formatowanie. Następnie HTML można przekonwertować na ODT lub DOC.LibreOffice jest w stanie importować
.pdf
pliki. Wystarczy otworzyć go w bieżącej wersji LibreOffice, aby uzyskać najlepsze wyniki. Dokument zostanie jednak otwarty jako rysunek i będziesz mógł go przekonwertować tylko na jeden z obsługiwanych formatów obrazu, a nie jako dokument Writer.Oczywiście nie wszystkie formatowanie jest zachowane, ale przynajmniej niektóre.
źródło
Jeśli zainstalowany jest pakiet poppler-utils , poniższy skrypt Nautilus (do umieszczenia w folderze ~ / .gnome2 / nautilus-scripts jako plik wykonywalny) pomoże przekonwertować plik PDF na HTML (opcję „-i” można usunąć, aby dołączyć obrazy), które można następnie otworzyć za pomocą LibreOffice Writer i zapisać jako ODT, chociaż powodzenie konwersji formatowania zależy w dużej mierze od sposobu utworzenia pliku PDF.
http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym
źródło
man pdftohtml
):-noframes : generate no frames. Not supported in complex output mode.
Więc-noframes
nie przyniesie żadnego efektu z-c
setem.Spróbuj Calibre. Konwertuje do formatu HTML, a następnie do innych formatów. Wykonał całkiem niezłą robotę na dużym pliku (183 strony), który w innym przypadku musiałbym wydrukować.
W moim przypadku przekonwertowałem go na epub, ale dla zabawy po prostu przekonwertowałem go na .docx, który okazał się bardzo dobrze.
źródło