Eksportuj: Kopiuj tekst z pdf bez podziałów linii

12

Istnieje kilka plików PDF na wolności, w których każda linia tekstu wydaje się być zakodowana na stałe, więc kiedy kopiuję blok tekstowy, wszystko jest z nim związane: łamanie linii, a nawet separatory „-”.

Moje pytania brzmią: jak utworzyć pliki PDF w programie InDesign, w których takie zachowanie się nie zdarza.

Czy ktoś wie o tym więcej?

KSPR
źródło
2
Chciałbym tylko skomentować, że jest to ogromny problem w wielu artykułach naukowych i nie znalazłem powodu / rozwiązania tego problemu. Mam nadzieję na dobre odpowiedzi!
benteh
... więc winna może być jakaś starożytna funkcjonalność eksportu w jakiejś idiotycznej praktyce z czasów przedambrium.
benteh

Odpowiedzi:

3

To dlatego, że pliki PDF można generować na wiele sposobów z wielu programów i aplikacji internetowych. Każdy z nich traktuje wiersze tekstu inaczej, więc nigdy nie można powiedzieć, w jaki sposób tekst jest faktycznie zawarty, dopóki nie spróbujesz skopiować wklej go z pliku PDF z powrotem do programu InDesign.

Jednak pliki PDF eksportowane przez InDesign zazwyczaj zachowują spacje na końcu każdego wiersza, więc nie musisz się martwić, że po każdym wierszu wstawiany będzie znak akapitu. Aby mieć 100% pewności, Create Tagged PDFzaznacz pole wyboru podczas eksportowania pliku PDF z programu InDesign. Osobiście zawsze zaznaczam to pole i uwzględniam je we wszystkich używanych przeze mnie ustawieniach wstępnych. Więcej informacji na temat tej opcji tutaj .

Jeśli natrafisz na źle wyeksportowany plik PDF i potrzebujesz wyczyścić końcowe znaki akapitu po każdym wierszu tekstu, najszybszą opcją jest Znajdź / Zamień. Wpisz ^pw Find whatpolu i umieścić spację w Change topolu. Wybierz jedną Storylub Selectionponiżej w zależności od sytuacji, a to powinno oczyścić tekst.

znajdź okno dialogowe zmiany

Lucian
źródło
2

Jednym ze sposobów jest wyeksportowanie pliku PDF jako programu Acrobat Pro , otwarcie tego pliku w przeglądarce internetowej, a następnie skopiowanie tekstu z tego miejsca.

W przeciwieństwie do eksportowania jako format tekstowy HTML zwykle nie przerywa linii.

Według mojej wiedzy nie można temu zapobiec w programie InDesign, wydaje się, że jest to zachowanie pochodzące z formatu PDF lub oprogramowania PDF. Możliwe jest, że każde oprogramowanie publikujące, które używa „ramek / ramek tekstowych”, utworzy tego rodzaju teksty w pliku PDF.

go-junta
źródło
-2

To dlatego, że pdf rozpoznaje tekst - każda linia staje się w rzeczywistości akapitem (stąd powrót na końcu). Nie ma odwrotu, musisz to zmienić globalnie w dokumentach, po skopiowaniu, używając opcji Znajdź / Zamień i ukrytych znaków.

Agnieszka Szuba
źródło
1
Ale są pliki pdf, które nie mają takiego zachowania. Pliki PDF, w których można bez problemu skopiować całą zawartość. Zastanawiam się tylko, jak można to osiągnąć podczas eksportu.
KSPR