Mam istniejący plik PDF (bez odpowiedniego pliku źródłowego) oraz plik tekstowy, który jest listą elementów odnoszących się do sekcji w pliku PDF, wraz z numerem strony dla każdego elementu. Chciałbym wygenerować nowy plik PDF, który zaczyna się od wygenerowanego indeksu spisu treści, a następnie treści oryginalnego pliku PDF. Wygenerowany indeks należy połączyć hiperłączem, aby kliknięcie dowolnego elementu automatycznie przeskoczyło na stronę zawierającą odnośną sekcję.
Szukam odpowiedniego zestawu narzędzi (najlepiej zorientowanych na CLI), aby to osiągnąć w systemie Linux; wszystkie narzędzia, na które patrzyłem do tej pory, nie wydają się oferować rozwiązania. Jestem doświadczonym programistą i chętnie piszę kod w razie potrzeby (najlepiej w Ruby / Python / Perl / shell), aby przeanalizować mój plik tekstowy i przekonwertować go na indeks hiperłącza, ale nie mogę znaleźć odpowiednich narzędzi rozwiązać to. Myślę, że część problemu polega na tym, że hiperłącza muszą wskazywać w tym samym pliku, ale ich cele nie będą istniały, dopóki ToC nie zostanie połączone z oryginalnym plikiem PDF.
Znam również różne języki znaczników, np. Markdown, reStructuredText, TeX, LaTeX, org-mode, a idealne rozwiązanie wykorzystałoby jeden z nich jako pośredni krok do wygenerowania hiperłącza ToC.
Odpowiedzi:
Zostało to wzięte w całości z @Herbert odpowiadającego na bardzo podobne pytanie na TeX StackExchange:
Dodawanie spisu treści do istniejącego pliku PDF
użyj pakietu,
pdfpages
a następnie:źródło