Potrzebuję sposobu na wyodrębnienie tekstu ze wszystkich typów dokumentów MS Office (Word, Excel, Powerpoint) w Linuksie. Przewiduję, że może istnieć kilka różnych podejść do osiągnięcia tego, na przykład skrypt Bash lub Python, lub konwersja ich do formatu PDF, a następnie wyodrębnianie tekstu za...