Czy są dostępne narzędzia do przycinania marginesów PDF?

44

Mam ebooka, który próbuję czytać w formacie PDF na Kindle. Niestety nagłówki i stopki stron zawierają pewną treść (odpowiednio numer strony i informacje o prawach autorskich), co uniemożliwia urządzeniu skalowanie rzeczywistego tekstu w celu dopasowania do obszaru wyświetlania obszaru użytecznego, co powoduje, że rzeczywista treść jest zbyt mała, aby ją odczytać.

Dostępne są różne narzędzia, które usuwają białe znaki, ale Kindle już to robi; natomiast moim celem jest usunięcie druków poza zdefiniowaną ramkę ograniczającą, a jedynym narzędziem, które znalazłem do tego celu, jest umiarkowanie drogie oprogramowanie komercyjne.

Prawdopodobnie mógłbym wygenerować maskę w Inkscape; podziel poszczególne strony za pomocą pdftk, zastosuj maskę do każdej strony osobno (wyjście do PostScript) i ponownie połącz liczne pliki PostScript w jeden plik PDF. Jednak te kroki dekodowania / ponownego kodowania byłyby dość niefortunne pod względem rozmiaru dokumentu; idealne byłoby coś, co byłoby w stanie działać z nieco większą finezją.

Mam pod ręką wszystkie główne systemy operacyjne (Windows, kilka nowoczesnych dystrybucji Linuksa, Mac itp.), Więc rozwiązania nie muszą być ograniczone przez platformę.

Propozycje?

(Zgłosiłem problem autorowi, który wspomniał o nim swojemu redaktorowi, który przez ponad miesiąc nie zrobił nic na ten temat, dzięki czemu podejście zerowej pracy było ewidentnie nieproduktywne).

Charles Duffy
źródło

Odpowiedzi:

45

Wypróbuj BRISS . Darmowy, open source i wieloplatformowy. Fajna dyskusja na ten temat na forach MobileRead .

frabjous
źródło
4
To piękne oprogramowanie; dzięki!
Charles Duffy,
1
Nierealny! świetny program
Fidel,
Otwarty pdf, automatycznie wybrał obszar do przycięcia, zapisany do nowego pliku z dodaniem _cropped do nazwy pliku, w zasadzie nic nie zrobiłem - świetna aplikacja!
Rush Frisby,
To narzędzie zachowuje całą grafikę wektorową PDF ==> Powiększanie działa podobnie jak przed kadrowaniem. Dokładnie to, czego potrzebowałem.
kiltek
1
Briss jest doskonały, ponieważ działa automatycznie i prawie zawsze wykonuje dobrą robotę. Na maszynach z systemem Linux możesz uzyskać wynik za pomocą jednego krótkiego polecenia w ciągu kilku sekund z „briss myfile.pdf”. Wystarczy dodać następujący wiersz do pliku ~ / .bashrc, dostosowując go do katalogu instalacyjnego briss: briss () {java -jar ~ / bin / briss-0.9 / briss-0.9.jar -s "$ 1"; }
dominecf
10

Jak wspomniano w innej odpowiedzi, BRISS jest świetny. Innym naprawdę przydatnym narzędziem jest k2pdfopt ( http://www.willus.com/k2pdfopt/ ). To narzędzie jest naprawdę świetne, aby pobrać pdf i zoptymalizować je pod kątem Kindle (lub dowolnego urządzenia z mniejszym ekranem). Działa naprawdę świetnie w przypadku naukowego papieru o 2 kolumnach, ponieważ przepuszcza tekst, zachowując równanie i obrazy.

Jean-Philippe Jodoin
źródło
4

Jak już wspomniano, k2pdfopt jest doskonałym narzędziem.

Jeśli nie przeszkadza ci jailbreakowanie Kindle (i być może unieważnienie gwarancji), istnieje również możliwość użycia tego narzędzia bezpośrednio na czytniku. Jest to realizowane przez trzy rozwidlenia tego samego pakietu oprogramowania:

Zajmują się wieloma kolumnami, pozwalają na ponowne wlanie tekstu i zmianę rozmiaru czcionki. Udaje im się nawet nie niszczyć formuł naukowych i obrazów podczas ponownego przepływu.

W tej chwili występują drobne problemy, takie jak brakujące spacje między dwoma słowami przeskoku linii, ale uważam je za nieproblematyczne. Może zostaną naprawione w jednej z kolejnych wersji.

Tim
źródło
3

Możesz użyć ScanTailor jako bardziej wydajnego narzędzia. To narzędzie nie tylko automatycznie przycina marginesy, ale także może dodawać więcej (na wypadek, gdyby ktoś przyszedł do tego pytania po drugie). Poniżej znajduje się treść strony wiki Układ strony :


Na tym etapie możesz dostosować marginesy dodane do pola zawartości. Istnieją dwa rodzaje marginesów - twardy i miękki.

Twardy margines - to ten między liniami ciągłymi. Są ustawiane przez użytkownika. Możesz poruszać się po dowolnej linii ciągłej, wewnętrznej lub zewnętrznej krawędzi, lub ustawiać marginesy za pomocą wartości liczbowych.

Miękki margines - to między linią ciągłą a linią przerywaną. Te marginesy są automatycznie dodawane, aby rozmiar strony był taki sam jak innych stron. Jeśli widzisz linię przerywaną - oznacza to, że gdzieś w projekcie znajduje się strona o tej szerokości (obszar użytkowy Twardy + margines) i (ewentualnie inne) o tej wysokości.

Jest to jedna duża strona powodująca miękkie marginesy na wszystkich innych stronach, choćby po to, by ich nie wyrównywać.

Opcjonalne wyrównanie jest precyzyjnie zdefiniowane, dodaj miękki margines, a jeśli dodasz, to z dowolną częścią.

Ooker
źródło
Wygląda na to, że nie działa z plikami PDF
Oleksiy
Cóż, tak, musisz najpierw wyeksportować go do zdjęć
Ooker
A następnie przekonwertuj je z powrotem do formatu PDF. To przesada, szczególnie w przypadku plików PDF z setkami stron, takich jak książki i podręczniki.
Oleksiy
@Oleksiy dobrze, przesada czy nie zależy jednak od twoich potrzeb. Jeśli potrzebujesz tylko Notatnika, z pewnością Word to przesada. Ale potem niektórzy zdają sobie sprawę, że Notatnik nie jest dla nich wystarczająco dobry. Potrzebuję tego narzędzia z powodu konieczności radzenia sobie z książkami i podręcznikami
Ooker,
1

Ja też miałem ten problem ze zeskanowanym plikiem PDF w formacie 1200 stron (w języku innym niż angielski). Wszystkie narzędzia, w tym Adobe Acrobat (IX – XI), nie potrafiły przyciąć otaczającej białej przestrzeni. Margines strony nieparzystej różnił się od marginesu na stronach parzystych. Co gorsza, wielkość marginesu była niespójna. Jak zauważył @frabjous , Briss pomógł. Jednak gdy wszystkie strony w dokumencie nałożyły się na siebie, zaobserwowano, że kadrowanie nie może być zastosowane, ponieważ nie było w ogóle ogólnej efektywnej białej przestrzeni (z powodu niespójnych marginesów)

Jedynym rozwiązaniem było podzielenie dokumentu PDF na poszczególne strony, przejrzenie go przez Briss, aby usunąć marginesy i połączyć je ponownie. Kroki, które wykonałem to:

  1. Podzieliłem ten dokument na poszczególne strony za pomocą Adobe Acrobat IX, klikając, Document->Split documentktóry otworzył następujące okno dialogowe: wprowadź opis zdjęcia tutaj Ta akcja utworzyła 1200 pojedynczych plików PDF.
  2. Następnie utworzyłem plik wsadowy o następującej treści:for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
  3. Umieściłem ten plik wsadowy w tym samym miejscu, w którym umieszczono 1200 plików PDF, i uruchomiłem plik wsadowy.
  4. Ponownie użyłem Adobe Acrobat IX, aby połączyć wszystkie pliki PDF w jeden plik i voila, miałem PDF ze wszystkimi stronami z minimalnymi białymi marginesami, który teraz był cholernie łatwy do odczytania na tablecie.

Wskazówka: W wyżej wymienionej zawartości pliku wsadowego zasadniczo uruchamiam FORpętlę, biorę każdy plik PDF i przekazuję go do Briss, aby automatycznie przyciąć plik PDF. Zależy od

  1. gdzie jest zainstalowany Briss (i architektura komputera, tj. x86 lub x64).
  2. gdzie jest zainstalowane środowisko wykonawcze Java.
  3. Środowisko wykonawcze Java można pobrać tutaj
Narayanan
źródło
1

Czytanie plików PDF na Kindle nie jest idealne. Idealnym sposobem jest konwersja plików PDF do formatu, który rozpozna Kindle za pomocą MobiCreator do konwersji plików PDF na pliki .prc dla Amazon Kindle.

1. Pobierz i zainstaluj PEŁNĄ wersję Mobipocket Creator z linku poniżej. (Jeśli wybierzesz prostszą wersję, nie będzie ona miała opcji konwersji PDF).

http://www.mobipocket.com/en/DownloadSoft/default.asp?Language=EN

2. Gdy Mobipocket Creator jest uruchomiony, wybierz Adobe PDF w obszarze Importuj z istniejącego pliku

3. Wybierz plik PDF, który chcesz przekonwertować

4. Pozostaw resztę w spokoju, chyba że chcesz zmienić folder docelowy i kliknij przycisk Importuj

5. Wybierz właśnie utworzony plik HTML i kliknij Build na pasku narzędzi u góry Mobipocket Creator

6. Kliknij Build (najprawdopodobniej pojawi się kilka błędów, ale po prostu je ignoruję)

7. Przejdź do folderu docelowego, otwórz folder, który został utworzony wraz z publikacją

8. Skopiuj plik .prc do folderu Dokumenty swojego Kindle za pomocą kabla USB (jeśli chcesz go dostarczyć bezprzewodowo, musisz wysłać go e-mailem i zapłacić 10 centów)

Jedną z głównych trudności w odczytywaniu plików PDF na Kindle jest brak Spisu treści, więc nie można łatwo przeskakiwać.

Istnieje jednak funkcja Mobipocket Creator do tworzenia spisu treści.

Szymon
źródło
Urządzenie to tak naprawdę Kindle DX; to ma mieć wbudowany czytnik PDF, a jest wystarczająco wielkoformatowa, że moje dokumenty są w porządku z ich marże przycięte.
Charles Duffy,
@CharlesDuffy W porządku, więc mniej kłopotów. Dzięki za poinformowanie mnie, miałem nadzieję, że się udało
Simon