Przeczytaj plik MS Word (doc) strona po stronie

1

Czy jest jakiś sposób, aby wvWare (lub inne narzędzie wiersza poleceń lub biblioteka Python) czytało plik doc strona po stronie? Nie mogę znaleźć niczego w instrukcji wvWare, ani w Abiword, Antiword czy catdoc.

Lew
źródło
co to jest Wvware i Wmware?
Prasanna
@Prasanna Przepraszamy, powinien być wvWare. wv to biblioteka do przeglądania starych docplików Microsoft Word ( ). Używają go np. OpenOffice, LibreOffice i Abiword, więc to chyba domyślna biblioteka.
leo
Wiem, że program Adobe Reader może czytać strony na głos. Być może możesz przekonwertować pliki doc do formatu PDF i czytać strona po stronie (nawet słowo po słowie)
Prasanna
1
Niezwykle brzydkim sposobem na to byłoby poszukiwanie ^ L w oryginalnym dokumencie i ustalenie, gdzie w tekście występują (dokumenty Word w formacie innym niż docx to w większości zwykły tekst).
barrycarter
1
^ L to control-L, kod znakowy 12 i czasami nazywany „wysuwem formularza” („znak wysuwu wiersza” to ^ J, dwa znaki wcześniej). Jeśli spojrzysz na surowy dokument Worda w emacs (lub dowolnym edytorze, który pokazuje kody kontrolne), zobaczysz jeden z nich na końcu każdej strony.
barrycarter

Odpowiedzi:

1

Niezwykle brzydkim sposobem na to byłoby poszukiwanie ^ L w oryginalnym dokumencie i ustalenie, gdzie w tekście występują (dokumenty Word w formacie innym niż docx to w większości zwykły tekst: czasami używam stringspolecenia do odczytania zawartości).

^ L to control-L, kod znakowy 12 i czasami nazywany „wysuwem formularza”. Jeśli spojrzysz na surowy dokument Worda w emacs (lub dowolnym edytorze, który pokazuje kody kontrolne), zobaczysz jeden z nich na końcu każdej strony.

bariera
źródło