Mam bardzo długi plik tekstowy ( stąd ), który powinien zawierać 6 znaków szesnastkowych, a następnie „przerwa” (która pojawia się jako jeden znak i wydaje się, że nie wyświetla się poprawnie w poniższym znaczniku kodu), po której następuje kilka słów:
00107B Cisco Systems, Inc
00906D Cisco Systems, Inc
0090BF Cisco Systems, Inc
5080 Cisco Systems, Inc
0E+00 ASUSTek COMPUTER INC.
000C6E ASUSTek COMPUTER INC.
001BFC ASUSTek COMPUTER INC.
001E8C ASUSTek COMPUTER INC.
0015F2 ASUSTek COMPUTER INC.
2354 ASUSTek COMPUTER INC.
001FC6 ASUSTek COMPUTER INC.
60182E ShenZhen Protruly Electronic Ltd co.
F4CFE2 Cisco Systems, Inc
501CBF Cisco Systems, Inc
Rozejrzałem się dookoła i nie widzę czegoś, co zadziałałoby w tej sytuacji. Moje pytanie brzmi: w jaki sposób mogę użyć grep
/ sed
/ awk
/, perl
aby usunąć wszystkie wiersze tego pliku tekstowego, które nie zaczynają się dokładnie 6 znakami szesnastkowymi, a następnie „przerwa”?
PS W przypadku punktów bonusowych, jaki jest najlepszy sposób sortowania pliku alfabetycznie i numerycznie według znaków szesnastkowych (tj. 000000
-> FFFFFF
)? Czy powinienem po prostu użyć sort
?
I dla kompletności możesz to zrobić również za pomocą grep:
To rozszerzone wyrażenie grep wyszukuje dokładnie 6 cyfr szesnastkowych na początku każdej linii, a następnie natychmiast następuje granica spacji do białych znaków (
\b
).źródło