Pytania oznaczone «text-processing»

36
Jak uświadomić TR, że znaki nie są ascii (Unicode)?

Próbuję usunąć niektóre znaki z pliku (UTF-8). Używam trdo tego celu: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Plik zawiera niektóre obce znaki (np. „Латвийская” lub „àé”). trwydaje się ich nie rozumieć: traktuje je jako inne niż alfa i również je usuwa. Próbowałem zmienić niektóre...

35
Przetwarzanie tekstu - łącz co dwa wiersze przecinkami

Mam w pliku ponad 1000 wierszy. Plik rozpoczyna się w następujący sposób (dodano numery linii): Station Name Station Code A N DEV NAGAR ACND ABHAIPUR AHA ABOHAR ABS ABU ROAD ABR Muszę przekonwertować to do pliku z wpisami oddzielonymi przecinkami, łącząc się co dwa wiersze. Ostateczne dane...

32
Usuń pierwsze n bajtów plików

Mam skrajny problem, a wszystkie rozwiązania, które mogę sobie wyobrazić, są skomplikowane. Zgodnie z moim doświadczeniem w systemach UNIX / Linux musi istnieć łatwy sposób. Chcę usunąć pierwsze 31 bajtów każdego pliku w /foo/. Każdy plik jest wystarczająco długi. Cóż, jestem pewien, że ktoś...

31
Zliczanie wystąpień słowa w pliku tekstowym

Mam plik tekstowy zawierający tweety i muszę policzyć, ile razy słowo jest wspomniane w tweecie. Na przykład plik zawiera: Apple iPhone X is going to worth a fortune The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors? Powiedzmy, że chcę policzyć, ile razy w...

30
Polecenie drukowania tylko ostatnich 3 znaków ciągu

Wiem, że cutpolecenie może wydrukować pierwsze nznaki ciągu, ale jak wybrać ostatnie nznaki? Jeśli mam ciąg ze zmienną liczbą znaków, w jaki sposób mogę wydrukować tylko trzy ostatnie znaki ciągu. na przykład. Wymagana „nieograniczona” moc wyjściowa to „ted” Wymagane wyjście „987654” to...