CentOS
Czy istnieje prosty sposób na konwersję specjalnych jednostek HTML ze strumienia danych? Przesyłam dane do skryptu bash, a czasem dane te zawierają specjalne byty. Na przykład:
„test” i amp; test $ test! test @ # $% ^ & amp; *
Nie jestem pewien, dlaczego niektóre postacie pokazują się dobrze, a inne nie, ale niestety nie mam kontroli nad napływającymi danymi.
Myślę, że mogę tu użyć SED, ale wydaje się, że byłoby to uciążliwe i prawdopodobnie podatne na fałszywe alarmy. Czy istnieje polecenie dla Linuksa, które specjalizuje się w dekodowaniu tego typu danych?
recode wydaje się dostępne w domyślnych repozytoriach pakietów głównych dystrybucji GNU / Linux. Np. Aby zdekodować encje HTML do UTF-8:
źródło
Z Python 3:
źródło
Pobiera plik tekstowy ze standardowego wejścia:
Prawdopodobnie wymaga bash> = wersja 4
źródło