Ostatnio musiałem przekonwertować niektóre PDF
pliki SVG
i zrobiłem to, otwierając plik PDF w programie Illustrator i zapisując w formacie SVG.
Problem polegał na tym, że gdy program Illustrator otworzył plik pdf, wiele (ale nie wszystkie) obiekty tekstowe zostałyby podzielone na różne obiekty tekstowe. Na przykład słowo „zasada” nie byłoby jednym obiektem tekstowym, a raczej kilkoma obiektami tekstowymi, „po”, „l”, „icy”. Wydawało się, że nie ma w tym żadnego rymu ani powodu.
Jak mogę temu zapobiec?
źródło
Jeśli chcesz scalić zepsuty tekst, zachowując jak najwięcej formatowania, umieszczania, akapitów i innej typografii istniejącego tekstu, zamiast wklejać do nowo utworzonego obszaru tekstowego jako zwykły tekst, możesz wypróbować John Wundesa niesamowity skrypt Dołącz ramki tekstowe .
Robi dokładnie to, co mówi na puszce: łączy fragmenty tekstu w jeden fragment tekstu, dokonując inteligentnych osądów w oparciu o ich wzajemne relacje:
To jest naprawdę dobre!
Pamiętaj, że działa tylko na tekst punktowy, a nie tekstowy (tutaj dobrze, ponieważ pliki PDF są prawie zawsze tekstem punktowym). Jeśli próbujesz scalić tekst obszaru z dowolnego powodu, możesz go przekonwertować za pomocą skryptu Kelso Cartography „Make point text”
Jest także przydatny w połączeniu z AjarProductions' konwertować do obszaru tekstowego skryptu (Kelso Kartografia również mają podobny scenariusz, patrz link powyżej), jeśli chcesz włączyć złamany kręgosłup tekstowy do odpowiednich pól tekstowych z auto-płynący akapitów:
Znajdź / zamień niechciane przerwy na końcu linii. Jeśli istnieje wiele osobnych akapitów, które chcesz zachować: 1) czy jesteś pewien, że nie lepiej byłoby używać programu InDesign? 2) możesz to zrobić w następujący sposób:
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)\|\C.L.O.W.N.H.O.R.R.O.R/|/
\|\C.L.O.W.N.H.O.R.R.O.R/|/
na nowy znak akapitu - który umieszcza jeden akapit tam, gdzie dwa były wcześniej.Skopiuj tekst z powrotem i uruchom na nim skrypt Konwertuj na obszar tekstowy. Jest to teraz jeden płynny obszar tekstowy z podziałami akapitów w odpowiednich miejscach.
Niestety nic nie jest w stanie naprawić zarysowanego tekstu poza powstrzymaniem go od pisania, ponownego wpisania lub zaufaniem potencjalnie podejrzanemu oprogramowaniu OCR.
źródło